Este capítulo es, a mi parecer, uno de los más interesantes de este curso, ya que se expondrán las funciones estadísticas básicas y no tan básicas que trae incorporada R.
Es por ello, que se estructurará, para mayor claridad, en apartados:
- Funciones Estadísticas Básicas.
- Distribuciones Discretas de Probabilidad.
- Distribuciones Continuas de Probabilidad.
- Interválos de Confianza y Pruebas de Hipótesis Paramétricos.
- Análisis de Regresión.
- Control Estadístico de la Calidad: Cartas de Control.
Funciones Estadísticas Básicas.
Las funciones estadísticas básicas, entre otras, son: Media, Mediana, Quantiles, Varianza y Desviación típica.
Usaremos un ejemplo de aplicación para observar como obtener éstos datos estadísticos.
> datos <- c(2710, 2850, 2755, 2880, 2890, 2880, 2920, 2950, 2940, 3050, 3325, 3130)
R: Funciones Estadísticas Básicas. | ||
mean() | Devuelve la media. | > mean(datos) [1] 2940 |
var() | Devuelve la cuasi varianza. | > var(datos) [1] 27440.91 |
sd() | Devuelve la cuasi desviación típica. | > sd(datos) [1] 165.6530 |
median() | Devuelve la mediana. | > median(datos) [1] 2905 |
quantile() | Devuelve los quantiles 0%, 25%, 50%, 75% y 100%. | > quantile(datos) .....0%.....25%.......50%.....75%.......100% 2710.0..2872.5...2905..0.2975.0...3325.0 |
fivenum() | Devuelve los quantiles 0%, 25%, 50%, 75% y 100%. | > fivenum(datos) [1] 2710 2865 2905 3000 3325 |
boxplot.stats() | Entre otras cosas, devuelve los quantiles 0%, 25%, 50%, 75% y 100%. | > boxplot.stats(datos) $stats [1] 2710 2865 2905 3000 3130 $n [1] 12 $conf [1] 2843.426 2966.574 $out [1] 3325 |
summary() | Devuelve el mínimo y el máximo valor, los quantiles 1 y 3, la mediana y la media. | > summary(datos) Min....1stQu.....Median....Mean....3rdQu.....Max. 2710..2872......2905.......2940....2975....3325 |
Como se puede observar, existen varias funciones para calcular los cuantiles, quizás la función que más se asemeja cuando se calcula a mano, es la: boxplot.stats(), y la función que se puede usar como un resumen de datos por excelencia, es: summary().
Distribuciones Discretas de Probabilidad.
Las funciones discretas de probabilidad que tiene incorporada R por defecto, se resumen a continuación:
R: Distribuciones Discretas de Probabilidad. | |
1. Distribución Binomial | Distribución Binomial en R. |
2. Distribución de Poisson | Distribución de Poisson en R. |
3. Distribución Geométrica | Distribución Geométrica en R. |
4. Distribución Hipergeométrica | Distribución Hipergeométrica en R. |
5. Distribución Binomial Negativa | Distribución Binomial Negativa en R. |
Distribuciones Continuas de Probabilidad.
Las funciones continuas de probabilidad que tiene incorporada R por defecto, se resumen a continuación:
R: Distribuciones Continuas de Probabilidad. | |
1. Distribución Normal | Distribución Normal en R. |
2. Distribución t-Student | Distribución de t-Student en R. |
3. Distribución ji-cuadrado | Distribución ji-cuadrado en R. |
4. Distribución F de Snedecor | Distribución F de Snedecor en R. |
5. Distribución Exponencial | Distribución Exponencial en R. |
6. Distribución Uniforme | Distribución Uniforme en R. |
7. Distribución Beta | Distribución Beta en R. |
8. Distribución de Cauchy | Distribución de Cauchy en R. |
9. Distribución logística | Distribución logística en R. |
10. Distribución logarítmica Normal | Distribución lognormal en R. |
11. Distribución Gamma | Distribución Gamma en R. |
12. Distribución Weibull | Distribución Weibull en R. |
13. Distribución Gumbel | Distribución Gumbel en R. |
14. Distribución Wilcoxon | Distribución Wilcoxon en R. |
15. Distribución Tukey | Distribución Tukey en R. |
Interválos de Confianza y Pruebas de Hipótesis Paramétricos.
Con el programa estadístico R, podemos realizar estudios paramétricos mediante interválos de confianza y pruebas de hipótesis de manera sencilla, las herramientas para tal propósito se muestran a continuación:
R: Interválos de Confianza y Pruebas de Hipótesis. | |
· Muestra Unidimensional | |
1. Media | Estudio para la media. |
2. Proporción | Estudio para la proporción. |
· Dos Muestras | |
1. Diferencia medias dependientes | Estudio dos muestras dependientes. |
2. Diferencia medias independientes | Estudio dos muestras independientes. |
3. Estudio de varianzas | Varianzas iguales o no. |
4. Diferencia de proporciones | Estudio dos muestras independientes. |
Análisis de Regresión.
En R es posible realizar varios tipos de análisis de regresión, todo depende de la fórmula especificada y los parámetros a definir.
En nuestro caso, vamos a centrarnos en los modelos de análisis de regresión lineal, que son los que utilizamos en el apartado Estadística, concretamente en el capítulo: Análisis de Regresión Lineal.
Dicho modelo se explica en profundidad en el enlace mostrado a continuación:
R: Análisis de Regresión Lineal. | |
1. Análisis de Regresión Lineal | Modelos del tipo: y = b0 + b1·x. |
Control Estadístico de la Calidad: Cartas de Control.
En R no existe función o funciones específicas para tal propósito, pero este blog, Aqueronte, dispone de una que satisfaga nuestras necesidades.
Dicha función, se comenta detalladamente en el siguiente enlace:
R: Control Estadístico de la Calidad: Cartas de Control. | |
1. Cartas de Control | Estudio de las Cartas de Control estudiadas. |
3 comentarios:
Estoy haciendo un trabajo y esta información me está resultando muy útil. Muy claro y bien explicado. Muchas gracias por la aportación.
Me alegro de que te sea útil.
Gracias por tu comentario, un saludo.
a mi a parte de ayudarme mucho,mañana tengo un examen y estoy estudiando de aqui...gracias!!!
Publicar un comentario