sábado, 9 de mayo de 2009

R: Funciones Estadísticas.

Este capítulo es, a mi parecer, uno de los más interesantes de este curso, ya que se expondrán las funciones estadísticas básicas y no tan básicas que trae incorporada R.

Es por ello, que se estructurará, para mayor claridad, en apartados:

  • Funciones Estadísticas Básicas.
  • Distribuciones Discretas de Probabilidad.
  • Distribuciones Continuas de Probabilidad.
  • Interválos de Confianza y Pruebas de Hipótesis Paramétricos.
  • Análisis de Regresión.
  • Control Estadístico de la Calidad: Cartas de Control.
Empezamos pues, la descripción de cada capítulo.


Funciones Estadísticas Básicas.

Las funciones estadísticas básicas, entre otras, son: Media, Mediana, Quantiles, Varianza y Desviación típica.

Usaremos un ejemplo de aplicación para observar como obtener éstos datos estadísticos.

> datos <- c(2710, 2850, 2755, 2880, 2890, 2880, 2920, 2950, 2940, 3050, 3325, 3130)

R: Funciones Estadísticas Básicas.
mean()
Devuelve la media.
> mean(datos)
[1] 2940
var()
Devuelve la cuasi varianza.
> var(datos)
[1] 27440.91
sd()
Devuelve la cuasi desviación típica.
> sd(datos)
[1] 165.6530
median()Devuelve la mediana.
> median(datos)
[1] 2905
quantile()
Devuelve los quantiles 0%, 25%, 50%, 75% y 100%.
> quantile(datos)
.....0%.....25%.......50%.....75%.......100%
2710.0..2872.5...2905..0.2975.0...3325.0
fivenum()
Devuelve los quantiles 0%, 25%, 50%, 75% y 100%.> fivenum(datos)
[1] 2710 2865 2905 3000 3325
boxplot.stats()
Entre otras cosas, devuelve los quantiles 0%, 25%, 50%, 75% y 100%.> boxplot.stats(datos)
$stats
[1] 2710 2865 2905 3000 3130

$n
[1] 12

$conf
[1] 2843.426 2966.574

$out
[1] 3325
summary()
Devuelve el mínimo y el máximo valor, los quantiles 1 y 3, la mediana y la media.> summary(datos)
Min....1stQu.....Median....Mean....3rdQu.....Max.
2710..2872......2905.......2940....2975....3325


Como se puede observar, existen varias funciones para calcular los cuantiles, quizás la función que más se asemeja cuando se calcula a mano, es la: boxplot.stats(), y la función que se puede usar como un resumen de datos por excelencia, es: summary().


Distribuciones Discretas de Probabilidad.


Las funciones discretas de probabilidad que tiene incorporada R por defecto, se resumen a continuación:

R: Distribuciones Discretas de Probabilidad.
1. Distribución Binomial
Distribución Binomial en R.
2. Distribución de Poisson
Distribución de Poisson en R.
3. Distribución Geométrica
Distribución Geométrica en R.
4. Distribución Hipergeométrica
Distribución Hipergeométrica en R.
5. Distribución Binomial Negativa
Distribución Binomial Negativa en R.



Distribuciones Continuas de Probabilidad.


Las funciones continuas de probabilidad que tiene incorporada R por defecto, se resumen a continuación:

R: Distribuciones Continuas de Probabilidad.
1. Distribución Normal
Distribución Normal en R.
2. Distribución t-Student
Distribución de t-Student en R.
3. Distribución ji-cuadrado
Distribución ji-cuadrado en R.
4. Distribución F de Snedecor
Distribución F de Snedecor en R.
5. Distribución Exponencial
Distribución Exponencial en R.
6. Distribución UniformeDistribución Uniforme en R.
7. Distribución BetaDistribución Beta en R.
8. Distribución de Cauchy
Distribución de Cauchy en R.
9. Distribución logísticaDistribución logística en R.
10. Distribución logarítmica Normal
Distribución lognormal en R.
11. Distribución Gamma
Distribución Gamma en R.
12. Distribución Weibull
Distribución Weibull en R.
13. Distribución GumbelDistribución Gumbel en R.
14. Distribución WilcoxonDistribución Wilcoxon en R.
15. Distribución Tukey
Distribución Tukey en R.


Interválos de Confianza y Pruebas de Hipótesis Paramétricos.


Con el programa estadístico R, podemos realizar estudios paramétricos mediante interválos de confianza y pruebas de hipótesis de manera sencilla, las herramientas para tal propósito se muestran a continuación:

R: Interválos de Confianza y Pruebas de Hipótesis.
· Muestra Unidimensional

1. Media
Estudio para la media.
2. Proporción
Estudio para la proporción.
· Dos Muestras

1. Diferencia medias dependientes
Estudio dos muestras dependientes.
2. Diferencia medias independientes
Estudio dos muestras independientes.
3. Estudio de varianzas
Varianzas iguales o no.
4. Diferencia de proporciones
Estudio dos muestras independientes.


Análisis de Regresión.

En R es posible realizar varios tipos de análisis de regresión, todo depende de la fórmula especificada y los parámetros a definir.

En nuestro caso, vamos a centrarnos en los modelos de análisis de regresión lineal, que son los que utilizamos en el apartado Estadística, concretamente en el capítulo: Análisis de Regresión Lineal.

Dicho modelo se explica en profundidad en el enlace mostrado a continuación:

R: Análisis de Regresión Lineal.
1. Análisis de Regresión Lineal
Modelos del tipo: y = b0 + b1·x.


Control Estadístico de la Calidad: Cartas de Control.

En R no existe función o funciones específicas para tal propósito, pero este blog, Aqueronte, dispone de una que satisfaga nuestras necesidades.

Dicha función, se comenta detalladamente en el siguiente enlace:

R: Control Estadístico de la Calidad: Cartas de Control.
1. Cartas de Control
Estudio de las Cartas de Control estudiadas.

3 comentarios:

Anónimo dijo...

Estoy haciendo un trabajo y esta información me está resultando muy útil. Muy claro y bien explicado. Muchas gracias por la aportación.

Manuel Caballero dijo...

Me alegro de que te sea útil.

Gracias por tu comentario, un saludo.

Anónimo dijo...

a mi a parte de ayudarme mucho,mañana tengo un examen y estoy estudiando de aqui...gracias!!!