sábado, 5 de marzo de 2011

R: Medias

En este apartado, se explicará la función existente en R para obtener resultados para el estudio de interválos de confianza y pruebas de hipótesis para la Media de una muestra.

Ya que aquí sólo se expondrá cómo es el manejo de las funciones, se recomienda que se visite el capítulo: Estimación y Pruebas de Hipótesis, para una mayor información.

Para obtener un estudio completo sobre la media de una muestra, en R, tenemos una función:

R: Estudio de la Media de una muestra.
t.test(x, mu, conf.level, alternative)Devuelve estudio de la media.

Los argumentos que podemos pasar a las funciones expuestas en la anterior tabla, son:
  • x: Vector numérico que recoge la muestra a estudio.
  • mu: Valor numérico que indica el valor real de la media.
  • conf.level: Nivel de confianza para el estudio.
  • alternative: Indica el tipo de la hipótesis alternativa. Existen tres modos: Hipótesis alternativa distinta: "two.sided" (por defecto seleccionada), Hipótesis alternativa mayor: "greater" o Hipótesis alternativa menor: "less".
Para comprobar el funcionamiento de estas funciones, usaremos un par de ejemplos de aplicación.

El primero será para obtener un interválo de confianza, para tal fin, nos basaremos en el Ejercicio 23: Estimación y Pruebas de Hipótesis.

Introduciomos la muestra en una variable:

> muestra <- c(2.216, 2.237, 2.249, 2.204, 2.225, 2.301, 2.281, 2.263, 2.318, 2.255, 2.275, 2.295)

Una vez introducida la muestra a estudio para el interválo de confianza, pasamos a obtenerlo a un nivel de confianza del 95%:

> t.test(muestra, conf.level = 0.95)

Y por consola nos ofrece el resultado:

...One Sample t-test

data: muestra
t = 220.0938, df = 11, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
...2.237317...2.282516
sample estimates:
mean of x
...2.259917


Como podemos observar, nos ofrece bastante información sobre el estudio, lo que nos interesa en este caso, es el interválo de confianza al 95%:

[2.237317, 2.282516]

Podemos comprobar fácilmente con el ejercicio propuesto, que las soluciones coinciden.


Para el segundo ejemplo, vamos a realizar un estudio de prueba de hipótesis para la media de una muestra. Emplearemos el Ejercicio 18: Estimación y Pruebas de Hipótesis.

Introduciomos la muestra en una variable:

> muestra <- c(16.8, 17.2, 17.4, 16.9, 16.5, 17.1)

Configuramos la función para realizar el estudio de si la media de la muestra planteada es 17 o no, a un nivel de confianza del 99%:

> t.test(muestra, mu= 17, conf.level = 0.99, alternative = "two.sided")

Y por consola nos ofrece el resultado:

...One Sample t-test

data: muestra
t = -0.128, df = 5, p-value = 0.9031
alternative hypothesis: true mean is not equal to 17
99 percent confidence interval:
...16.45847...17.50820
sample estimates:
mean of x
...16.98333


¿Cómo interpretamos los datos obtenidos por consola para el estudio de la prueba de hipótesis? Es fácil, nos basamos en el p-valor, en este caso es 0.9031.

Es un p-valor alto en comparación al nivel de significación α = 0.01 (al 99%), por lo que aceptamos la hipótesis nula y rechazamos la hipótesis alternativa.

Esto queire decir que existen evidencias significativas de que la media es de valor 17.

Es fácil de comprobar que los resultados coinciden con el ejercicio planteado y resuelto a mano.

Como hemos podido comprobar, R dispone de la función correspondiente al estudio y realización de interválos de confianza y pruebas de hipótesis de manera sencilla y rápida..

Por supuesto, se recomienda que se emplee la ayuda de R para ampliar conocimientos sobre las funciones expuestas en este capítulo.

> ?t.test

1 comentarios:

Anónimo dijo...

"Chapeaux" por introducir R en la resolución de los problemas. saludos.