Tema 8: Estadística
1. Se ha hecho una encuesta en el instituto sobre las ocupaciones del alumnado en su tiempo libre, obteniendo las siguientes respuestas:
3 puntos
xi
|
ni
|
pi
|
Ocupación: | Nº de alumnos con: | Porcentaje: |
Cine | 8 | |
Música | 15 | |
Ordenador | 22 | |
Deportes | 11 | |
Lectura | 12 | |
Totales: | n |
a) ¿A cuántos alumnos se ha entrevistado? ¿Qué característica se está estudiando? Escribe si es cualitativa o cuantitativa.
El total de alumnos es igual a la frecuencia total. Lo podemos obtener con el sumatorio de la frecuencia:
$$N=\sum _{ i=1 }^{ n }{ { n }_{ i } } =8+15+22+11+12=68$$
Por ello, el número total de alumnos es 68. Se estudia la ocupación y esta característica es cualitativa, pues los datos no son números (los datos excluyen la frecuencia).
b) Representa la tabla anterior usando un diagrama de barras.
Representamos barras paralelas con una altura dependiendo de un eje de ordenadas, como si de una función se tratara:
c) ¿Cuál es la ocupación de moda entre el alumnado?
Como la moda es el dato cuya frecuencia es la mayor, asimilamos que la moda es la ocupación de ordenadores.
d) Completa todas las columnas de la tabla, haciendo las operaciones necesarias.
La frecuencia total ya la obtuvimos, así que la escribimos como un total.
El porcentaje lo expresamos como el cociente entre la frecuencia y la frecuencia total.
xi
|
ni
|
pi
|
Ocupación: | Nº de alumnos con: | Porcentaje: |
Cine | 8 | 8/68 |
Música | 15 | 15/68 |
Ordenador | 22 | 22/68 |
Deportes | 11 | 11/68 |
Lectura | 12 | 12/68 |
Totales: | n=68 | 1 |
Podemos escribirlo mejor en porcentaje, de forma aproximada:
xi
|
ni
|
pi
|
Ocupación: | Nº de alumnos con: | Porcentaje: |
Cine | 8 | 11,76% |
Música | 15 | 22,06% |
Ordenador | 22 | 32,35% |
Deportes | 11 | 16,18% |
Lectura | 12 | 17,65% |
Totales: | n=68 | 1 |
e) ¿Qué porcentaje de alumnado hace deporte o lee?
Al ser una disyuntiva, hemos de sumar ambos porcentajes de la forma p=16,18%+17,65%=33,83%.
2. El número de bicicletas que ha puesto en alquiler el ayuntamiento de Albacete en la última quincena de mayo se resume en la siguiente tabla estadística:
3 puntos
Intervalos | xi (Marca de clase) | ni |
Ni
| xi ni |
Bicicletas alquiladas | Bicicletas | Nº de días con: | Nº de días hasta: | Media: |
De 0 a 10 | 2 | |||
De 10 a 20 | 4 | |||
De 20 a 30 | 5 | |||
De 30 a 40 | 3 | |||
De 40 a 50 | 1 | |||
---------- | Totales: | n=15 | ---------- |
a) Completa la tabla anterior.
Al tener un intervalo, debemos hacer la media aritmética entre ambos extremos. La frecuencia total acumulada de cada día hasta el siguiente es la suma de ese día más el resto de los transcurridos, hasta llegar a la frecuencia total. Los datos totales son el producto entre cada dato y cada frecuencia:
Intervalos | xi (Marca de clase) | ni |
Ni
| xi ni |
Bicicletas alquiladas | Bicicletas | Nº de días con: | Nº de días hasta: | Datos totales: |
De 0 a 10 | $\frac { 0+10 }{ 2 } =5$ | 2 | 2 | 10 |
De 10 a 20 | $\frac { 10+20 }{ 2 } =15$ | 4 | 6 | 60 |
De 20 a 30 | $\frac { 20+30 }{ 2 } =25$ | 5 | 11 | 125 |
De 30 a 40 | $\frac { 30+40 }{ 2 } =35$ | 3 | 14 | 105 |
De 40 a 50 | $\frac { 40+50 }{ 2 } =45$ | 1 | 15 | 45 |
---------- | Totales: | n=15 | ---------- | 345 |
b) Representa la tabla anterior a través de un histograma.
c) ¿Cuál es el intervalo de bicicletas más demandado?
El más demandado, es decir, el intervalo con mayor frecuencia (moda) es $\left[ 20,30 \right] $.
d) Encuentra el valor central o mediana.
Para ello, obtenemos la mitad de la frecuencia total, es decir $\frac { n }{ 2 } =\frac { 15 }{ 2 } =7'5$. Como no vemos esa frecuencia exacta, miramos la zona de frecuencia acumulada. Como 7'5 se encuentra por encima de 6, está se encontrará en la frecuencia acumulada 11, que corresponde al intervalo $\left[ 20,30 \right] $.
e) ¿Cuál es la media de bicicletas alquiladas por día?
Para la media, hacemos el sumatorio del producto de los datos y las frecuencias de ellos (obtenido en la última casilla de la fila inferior) y dividimos este valor entre la frecuencia total:
$$\overline { x } =\frac { 1 }{ n } \sum _{ i=1 }^{ n }{ { x }_{ i }{ n }_{ i } } $$
$$\overline { x } =\frac { 345 }{ 15 } =23$$
23 bicicletas es la media de bicicletas alquiladas por día.
3. En una partida de dardos, el número de dianas obtenidas por los participantes se organiza en la siguiente tabla:
4 puntos
xi | ni | Ni |
xi ni
|
xi2 ni
|
Dianas | Nº de participantes con: | Nº de participantes hasta: | Datos totales: | Varianza |
7 | 1 | |||
8 | 3 | |||
9 | 6 | |||
10 | 5 | |||
11 | 6 | |||
12 | 3 | |||
Totales: | n=24 | ---------- |
Completa la tabla estadística y responde a los siguientes apartados:
Acumulamos la frecuencia sumando a una toda la anterior. Multiplicamos cada dato con su frecuencia. Para la varianza, multiplicamos el cuadrado del dato entre la frecuencia:
xi | ni | Ni |
xi ni
|
xi2 ni
|
Dianas | Nº de participantes con: | Nº de participantes hasta: | Datos totales: | Varianza |
7 | 1 | 1 | 7 | 49 |
8 | 3 | 4 | 24 | 192 |
9 | 6 | 10 | 54 | 486 |
10 | 5 | 15 | 50 | 500 |
11 | 6 | 21 | 66 | 726 |
12 | 3 | 24 | 36 | 432 |
Totales: | n=24 | ---------- | 237 | 2385 |
a) ¿Cuál es la cantidad de dianas más habitual entre los participantes?
Como la moda se repite, pues la mayor frecuencia es 6 dos veces, consideramos que la cantidad de dianas más habitual son 9 u 11.
b) ¿Cuántas dianas tiene de media cada participante?
Realizamos de nuevo el sumatorio y dividimos entre la frecuencia total:
$$\overline { x } =\frac { 1 }{ n } \sum _{ i=1 }^{ n }{ { x }_{ i }{ n }_{ i } } $$
$$\overline { x } =\frac { 237 }{ 24 } =9'875$$
c) Averigua cuál es el dato central o mediana.
Dividimos la frecuencia total entre dos, lo que nos dará un valor que incluiremos en la frecuencia acumulada, viendo en qué número de dianas coincide:
$$\frac { n }{ 2 } =\frac { 24 }{ 2 } =12$$
La frecuencia 12 se encuentra entre el 10 y el 15 en la acumulada, pero elegimos el 15 por ser mayor a la anterior. Por esto, el dato central son 10 dianas.
d) Calcula la varianza, la desviación típica y el coeficiente de variación:
La varianza se da por:
$$\frac { 1 }{ n } \sum _{ i=1 }^{ n }{ { x }_{ i }{ n }_{ i } } $$
Teniendo en cuenta que el sumatorio es el total de la última columna, tenemos que:
$${ { \sigma }^{ 2 } }_{ n }=\frac { 2385 }{ 24 } -{ 9'875 }^{ 2 }=1'859375$$
La desviación típica es, simplemente, la raíz cuadrada de la varianza:
$${ { \sigma } }_{ n }=\sqrt { { { \sigma }^{ 2 } }_{ n } } $$
$${ { \sigma } }_{ n }=\sqrt { 1'859375 } =1'3636$$
El cociente de variación se obtiene mediante la siguiente expresión:
$${ C }_{ V }=\frac { { { \sigma } }_{ n } }{ \overline { x } } $$
$${ C }_{ V }=\frac { 1'3636 }{ 9'875 } =0'138085$$
e) ¿Es un buen resumen la media? Razona tu respuesta.
Sí, pues se considera buen resume la media cuando el cociente de variación se encuentra por debajo de 0,3.
No hay comentarios.:
Publicar un comentario