Contraste de Hipótesis para la media.
1. Problema
Problema propuesto en la PAEG de Junio de 2015 (El problema ha sido reformulado para que se ajuste a la actividad de GeoGebra que he preparado).
En un aeropuerto, el tiempo de espera de un viajero frente a la cinta transportadora hasta que sale su maleta sigue según la empresa encargada, una distribución normal de media μ = 16 y desviación típica σ=3 minutos. Se tomó una muestra aleatoria de 50 viajeros y se observó que el tiempo medio de espera era de 17 minutos.
¿Se puede admitir que la media poblacional sea μ = 16 con un nivel de confianza del 95%?
2. Resolución.
Este problema se puede resolver mediante un contraste de hipótesis. Las dos hipótesis que vamos a contrastar son:
Los pasos que tendremos que hacer son los siguientes:
- Construir un intervalo característico al 95 % de nivel de confianza (5 % de nivel de significación), tomando como media 16 y la desviación típica sería , que es la que corresponde a la distribución de las medias muestrales de tamaño 50.
- Vemos si el valor de la media de la muestra está dentro del intervalo característico o fuera.
- Toma de decisión:
Actividad de GeoGebra para realizar contrastes de hipótesis para las medias muestrales.
Como vemos el intervalo característico al 95 % es (15.168 , 16.832).
Puesto que la media de la muestra es 17 y queda fuera de dicho intervalo, esto nos lleva a rechazar y aceptamos .
Esto es que los datos de la empresa no son correctos y por tanto la media de espera de los viajeros para recibir sus equipajes no es 16 minutos.
3. Resolviendo con la herraienta de GeoGebra para contrastes de hipótesis.
GeoGebra tiene una herramienta específica para hacer contrastes de hipótesis. La podemos ver si vamos a:
- Menú.
- Vista.
- Calculadora de probabilidad.
- Pestaña estadísticas.
- Opción del menú desplegable "Test Z de una media".
Los valores que nos interesan para el ejercicio son z y p.
Veamos de donde sale el valor de z que aparece en la herramienta de GeoGebra. Vamos a calcular el nivel de confianza que corresponde a la media muestral, con los datos que nos da el problema:
El intervalo de aceptación para una N(0,1) con un 5% de nivel de significación o lo que es lo mismo un 95% de nivel de confianza es (-1,96 , 1,96). Como z=2,357 queda fuera de la zona de aceptación, rechazar y aceptamos .
Ahora veamos que es la p. El valor de la probabilidad que corresponde a z sería:
Hay que tener en cuenta que es un intervalo característico centrado en la media 16. Vamos a sumar la probabilidad que hay a los dos lados del intervalo característico:
1-0,9907=0,0093
0,0093 · 2=0,0186.
Este valor, un poco más exacto en GeoGebra, es el que corresponde al valor p que aparece. Este valor va asociado a un nivel de significación del 1,86%, es decir a un 98,14% de nivel de confianza. Este nivel de confianza es mucho mayor que el que aparecía en el problema, en el que solo nos piden un 95%. Cuanto mayor es el nivel de confianza, mayor es el intervalo característico. Pues bien, este valor p, exige un nivel de confianza mayor que el requerido, por lo que el valor de la media de la muestra se queda fuera del intervalo característico. Una vez más rechazamos y aceptamos .
4. Conclusión y otras posibles contrastes de hipótesis.
Bueno, a la vista del ejercicio, creo que la actividad de GeoGebra que he preparado, permite realizar un contraste de hipótesis de una forma más sencilla, que con la herramienta que lleva el propio GeoGebra.
Ahora, se puede proponer a los alumnos las siguientes preguntas:
- Coln los mismos valores del ejercicio, ¿se podría aceptar la media de 16 minutos que da la compañía, si la media de la muestra fuera 16,6 minutos?
- Con los mismos valores, nos gustaría saber, si la compañía dice que los pasajeros esperan 16 minutos o menos, si aceptaríamos o no lo que ellos dicen, con una media para la muestra de 17 minutos.
- En el ejercicio inicial, ¿qué pasaría si aumentamos el nivel de confianza al 99%?¿Y si lo disminuimos al 90%?
- En el ejercicio inicial, ¿qué pasaría si aumentamos el tamaño de la muestra a 200 individuos? ¿Y si lo disminuimos a 30?