martes, 8 de marzo de 2011

R: Diferencia proporciones

En este apartado, se explicará la función existente en R para obtener resultados para el estudio de interválos de confianza y pruebas de hipótesis para la Diferencia de Proporciones de dos muestras.

Ya que aquí sólo se expondrá cómo es el manejo de las funciones, se recomienda que se visite el capítulo: Estimación y Pruebas de Hipótesis, para una mayor información.

Para obtener un estudio completo sobre la diferencia de proporciones de dos muestras, en R, tenemos una función:

R: Estudio de la Diferencia de Proporciones.
prop.test(x, n, conf.level, alternative, correct)Estudio diferencia proporciones.

Los argumentos que podemos pasar a las funciones expuestas en la anterior tabla, son:
  • x: Vector numérico que recoge la primera muestra a estudio.
  • y: Vector numérico que recoge la segunda muestra a estudio.
  • n: Vector númerico que recoge el número total de elementos de las muestras.
  • conf.level: Nivel de confianza para el estudio.
  • alternative: Indica el tipo de la hipótesis alternativa. Existen tres modos: Hipótesis alternativa distinta: "two.sided" (por defecto seleccionada), Hipótesis alternativa mayor: "greater" o Hipótesis alternativa menor: "less".
  • correct: Valor lógico, indica si se aplica corrector de continuidad, por defecto TRUE.

Para comprobar el funcionamiento de esta función, usaremos un par de ejemplos de aplicación.

El primero será obtener un interválo de confianza, para tal fin, nos basaremos en el Ejercicio 48: Estimación y Pruebas de Hipótesis.

Introduciomos las dos muestras en la variable x y el tamaño en la variable n:

> x <- c(40, 57)
> n <- c(200, 200)


Configuramos la función a un nivel del 95%:

> prop.test(x, n, conf.level = 0.95, correct = FALSE)

Y por consola nos ofrece el resultado:

...2-sample test for equality of proportions without continuity
...correction

data: x out of n
X-squared = 3.9332, df = 1, p-value = 0.04734
alternative hypothesis: two.sided
95 percent confidence interval:
...-0.168589075...-0.001410925
sample estimates:
prop 1
...prop 2
.0.200...0.285

Como podemos observar, nos ofrece bastante información sobre el estudio, lo que nos interesa en este caso, es el interválo de confianza:

[-0.168589075, -0.001410925]

Podemos comprobar fácilmente con el ejercicio propuesto, que las soluciones coinciden.


El segundo será estudiar una prueba de hipótesis, para tal fin, nos basaremos en el Ejercicio 41: Estimación y Pruebas de Hipótesis, concretamente en el Apartado b)

Introduciomos las dos muestras en la variable x y el tamaño en la variable n:

> x <- c(301, 345)
> n <- c(350, 400)


Configuramos la función a un nivel del 95%:

> prop.test(x, n, conf.level = 0.95, correct = FALSE)

Y por consola nos ofrece el resultado:

...2-sample test for equality of proportions without continuity
...correction

data: x out of n
X-squared = 0.0098, df = 1, p-value = 0.9213
alternative hypothesis: two.sided
95 percent confidence interval:
...-0.05210236...0.04710236
sample estimates:
prop 1
...prop 2
0.8600...0.8625

Como podemos observar, nos ofrece bastante información sobre el estudio, lo que nos interesa en este caso, es el p-valor que en este caso es de 0.9213.

Es un p-valor muy alto comparado con el valor de significación α = 0.05 (al nivel de 95%), por lo que aceptamos la hipótesis nula y rechazamos la hipótesis alternativa.

Esto quiere decir que existen evidencias significativas de que la diferencia de proporciones es cero.

Podemos comprobar fácilmente con el ejercicio propuesto, que las soluciones coinciden.

Como hemos podido comprobar, R dispone de la función correspondiente al estudio y realización de interválos de confianza y pruebas de hipótesis de manera sencilla y rápida.

Por supuesto, se recomienda que se emplee la ayuda de R para ampliar conocimientos sobre las funciones expuestas en este capítulo.

> ?prop.test

0 comentarios: