sábado, 5 de marzo de 2011

R: Diferencia Medias Independientes

En este apartado, se explicará la función existente en R para obtener resultados para el estudio de interválos de confianza y pruebas de hipótesis para la Diferencia de Medias Independientes de dos muestras.

Ya que aquí sólo se expondrá cómo es el manejo de las funciones, se recomienda que se visite el capítulo: Estimación y Pruebas de Hipótesis, para una mayor información.

Para obtener un estudio completo sobre la diferencia de medias independientes de dos muestras, en R, tenemos una función:

R: Estudio de la Diferencia de Medias Independientes.
t.test(x, y, mu, conf.level, alternative, var.equal)Estudio diferencia medias independientes.

Los argumentos que podemos pasar a las funciones expuestas en la anterior tabla, son:
  • x: Vector numérico que recoge la primera muestra a estudio.
  • y: Vector numérico que recoge la segunda muestra a estudio.
  • mu: Valor numérico que indica el valor real de la media.
  • conf.level: Nivel de confianza para el estudio.
  • alternative: Indica el tipo de la hipótesis alternativa. Existen tres modos: Hipótesis alternativa distinta: "two.sided" (por defecto seleccionada), Hipótesis alternativa mayor: "greater" o Hipótesis alternativa menor: "less".
  • var.equal: Valor lógico, indica si ambas varianzas son iguales (True) o no (False)

Para comprobar el funcionamiento de esta función, usaremos un par de ejemplos de aplicación.

El primero será obtener un interválo de confianza, para tal fin, nos basaremos en el Ejercicio 14: Estimación y Pruebas de Hipótesis.

Introduciomos las dos muestras en dos variables:

> blancas <- c(120, 132, 123, 122, 140, 110, 120, 107)
> amarillas <- c(126, 124, 116, 125, 109, 130, 125, 117, 129, 120)


Configuramos la función a un nivel del 95% y con varianzas iguales cómo nos indica el enunciado del problema:

> t.test(blancas, amarillas, conf.level = 0.95, var.equal= TRUE)

Y por consola nos ofrece el resultado:

...Two Sample t-test

data: blancas and amarillas
t = -0.0857, df = 16, p-value = 0.9328
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
...-9.008911... 8.308911
sample estimates:
mean of x mean of y
...121.75...122.10


Como podemos observar, nos ofrece bastante información sobre el estudio, lo que nos interesa en este caso, es el interválo de confianza:

[-9.008911, 8.308911]

Podemos comprobar fácilmente con el ejercicio propuesto, que las soluciones coinciden.


El segundo será estudiar una prueba de hipótesis, para tal fin, nos basaremos en el Ejercicio 28: Estimación y Pruebas de Hipótesis.

Introduciomos las dos muestras en dos variables:

> antes <- c(265, 240, 258, 295, 251, 245, 287, 314, 260, 279, 283, 240)
> despues <- c(229, 231, 227, 240, 238, 241, 234, 256, 247, 239, 246, 218)


Antes de realizar el estudio, necesitamos saber si poseen la misma varianza ambas muestras, para tal fin se recomienda ver el ejemplo del capítulo de Estudio de Varianzas.

Una vez que determinamos que ambas varianzas son distintas, podemos continuar y concluir con nuestro estudio principal, el estudio de hipótesis a un nivel del 95% y con varianzas distintas:

> t.test(antes, despues, conf.level = 0.95, alternative = "greater", var.equal = FALSE)

Y por consola nos ofrece el resultado:

....Welch Two Sample t-test

data: antes and despues
t = 4.1709, df = 14.972, p-value = 0.0004114
alternative hypothesis: true difference in means is greater than 0
95 percent confidence interval:
...17.92072....Inf
sample estimates:
mean of x mean of y
...268.0833...237.1667


Como podemos observar, nos ofrece bastante información sobre el estudio, lo que nos interesa en este caso, es el p-valor que en este caso es de 0.0004114.

Es un p-valor muy bajo comparado con el valor de significación α = 0.05 (al nivel de 95%), por lo que rechazamos la hipótesis nula y aceptamos la hipótesis alternativa.

Esto quiere decir que existen evidencias significativas de que la diferencia de medias es mayor que cero.

Podemos comprobar fácilmente con el ejercicio propuesto, que las soluciones coinciden.

Como hemos podido comprobar, R dispone de la función correspondiente al estudio y realización de interválos de confianza y pruebas de hipótesis de manera sencilla y rápida.

Por supuesto, se recomienda que se emplee la ayuda de R para ampliar conocimientos sobre las funciones expuestas en este capítulo.

> ?t.test

1 comentarios:

Unknown dijo...

Salvaste mi vida, gracias.