martes, 12 de mayo de 2009

Estimación y Pruebas de Hipótesis.

En este capítulo se abordará las expresiones matemáticas básicas para la Estimación y Pruebas de Hipótesis.

Normalmente, se suele denominar: Inferencia Estadística, que no es más que, los métodos utilizados para tomar decisiones o para sacar conclusiones sobre una población. Para ello, se utilizan la información contenida en una muestra de la población.


Estimación Puntual.

Sea θ, un parámetro desconocido de la población de interés, y sea X1, X2, ..., Xn una muestra aleatoria de tamaño n de dicha población. Se llama estimador puntual θ, al estadístico que se usa para estimar el valor del parámetro θ.

Por lo tanto, un estimador puntual del parámetro θ de una población, es un valor numérico del estimador puntual .

· Estimador Insesgado para el parámetro θ: .

· Sesgo del estimador : .

· Error Cuadrático Medio: .

Sean y dos estimadores puntuales para el parámetro θ. Se define la eficiencia relativa de con respecto a como el cociente:



Si dicha cantidad es menor que 1, entonces decimos que es más eficiente que .

· Estimador de Máxima Verosimilitud de θ: Sea X una variable aleatoria con función de probabilidad (o densidad de probabilidad) f(x, θ), donde θ es un parámetro desconocido. Sean x1, x2, ..., xn los valores observados de una muestra aleatoria de tamaño n de X.

La función de verosimilitud de la muestra es:



El estimador de máxima verosimilitud de θ, es el valor de θ que maximiza la función de verosimilitud.


Teoría Central del Límite.

Sea X1, X2, ..., Xn una muestra aleatoria de tamaño n de una distribución con media μ y varianza σ2. Entonces, el límite de la distribución de:



Cuando n -> ∞, es la distribución normal estándar.

Sean X1 y X2 dos poblaciones normales independientes con medias μ1 y μ2, y varianzas σ21 y σ22. Si y son las medias muestrales de dos muestras aleatorias independientes de tamaños n1 y n2 de estas poblaciones, entonces:



Teoría Central del Límite para Dos Variables.

Si en las condiciones de la Teoría Central del Límite, las variables X1 y X2 no siguen distribuciones normales, entonces, el límite de la distribución es:



Cuando n1 y n2 -> ∞, es la distribución normal estándar.


Error Estándar.

El error estándar de un estadístico es la desviación típica de su distribución muestral. Si el error estándar involucra parámetros desconocidos de la población, cuyos valores pueden estimarse, entonces la sustitución de los parámetros por estas estimaciones en el error estándar, da como resultado el error estándar.

Por ejemplo: X ~ N(μ, σ), el error estándar de es .

Y el error estándar estimado de es .


Distribución Ji-Cuadrada.

Sean Z1, ..., Zk variable aleatorias normales independientes, con media μ = 0, y varianzas σ2 = 1. Entonces, la variable aleatoria:

X = Z21 + ... + Z2k

Tiene una función de densidad de probabilidad:



Y se dice que sigue una distribución ji-cuadrada con k grados de libertad. Se representa por X ~ X2k.

· Esperanza: E(X) = k

· Varianza: V(X) = 2k.

· Puntos Críticos: X2α, k es tal que: P(X > X2α, k) = α.


Distribución t-Student.

Sean las variables aleatorias Z ~ N(0, 1) y V ~ X2k. Si Z y V son independientes, entonces, la variable aleatoria es:



Tiene una función de densidad de probabilidad:



Para -∞ < . x < . ∞. Y se dice que sigue una distribución t-Student con k grados de libertad. Se representa por T ~ tk.

Dicha función posee una curva simétrica y sus colas son más amplias que las de la distribución normal.

· Esperanza: E(X) = 0, para k > 2.

· Varianza: V(X) = k/(k-2), para k > 2.

· Puntos Críticos: tα, k es tal que: P(T > tα, k) = α.


Distribución F de Snedecor.

Sean X1 y X2 variables aleatorias ji-cuadradas independientes con grados de libertad k1 y k2 respectivamente. Entonces, la variable aleatoria es:



Tiene una función de densidad de probabilidad:



Para x > 0. Y se dice que sigue una distribución F de Snedecor con k1 grados de libertad en el numerador y k2 grados de libertad en el denominador. Se representa por F ~ Fk1,k2.

· Esperanza: , para k2 > 2.

· Varianza: , para k2 > 4.

· Puntos Críticos: fα, k1, k2 es tal que: P(F > fα, k1, k2) = α.

Hay que tener en cuenta que: .


Estimación Por Intervalos.

Una estimación por intervalos de un parámetro desconocido θ, es un intervalo de la forma [l, u], donde los extremos l y u, dependen de la estimación puntual para una muestra particular, y de la distribución muestral de .

Los extremos l y u son valores de las variables aleatorias L y U respectivamente y reciben el nombre de límites de confianza inferior y superior.


Pruebas de Hipótesis.

Una prueba de hipótesis estadística es un procedimiento que conduce a una decisión sobre una hipótesis. Esta decisión se toma a partir de una muestra aleatoria de la población de interés.

Si la información contenida en la muestra es consistente con la hipótesis, se concluye que ésta es verdadera. En otro caso, se concluye que ésta es falsa.

· H0 es la hipótesis que se desea probar.

· El rechazo de H0 conduce a la aceptación de H1.

· H0 se plantea siempre de modo que especifique un valor exacto del parámetro.

· La prueba de hipótesis involucra la toma de una muestra aleatoria, el cálculo de un estadístico a partir de la muestra aleatoria, y el uso del mismo para tomar una decisión sobre H0.

· Error Tipo I: Rechazo de H0 cuando H0 es verdadera.

· Error Tipo II: Aceptación de H0 cuando H0 es falsa.

· Nivel de significación α: Probabilidad de error del Tipo I.

· Nivel de significación β: Probabilidad de error del Tipo II.

DecisiónH0 es Verdadera
H0 es Falsa
Aceptar Ho
No hay Error
Error del Tipo II
Rechazar Ho
Error del tipo I
No hay Error

Los errores Tipo I y Tipo II están relacionados, una disminución en la probabilidad de uno, produce un aumento de la probabilidad del otro, siempre que el tamaño de la muestra no cambie, en general, un aumento de n reduce tanto a α como a β.

· p-Valor: Es el nivel de significación más pequeño que conduce al rechazo de H0.


Las distintas pruebas de hipótesis, se resumen en el fichero en formato .pdf, que se muestra a continuación:

Estimación y Pruebas de Hipótesis

Se puede descargar el formulario de este tema: Estimación, Intervalos de Confianza y Pruebas de Hipótesis, anteriormente mostrado, en el siguiente enlace:

Estimación, Intervalos de Confianza
y Pruebas de Hipótesis

Estimación, Intervalos de Confianza
y Pruebas de Hipótesis



A continuación, se disponen de una colección de problemas resueltos.

Problemas: Estimación, I.C. y Pruebas de Hipótesis.
Problema 1
Problema 11
Problema 21
Problema 31
Problema 41
Problema 51
Problema 61
Problema 71
Problema 81
Problema 2
Problema 12
Problema 22
Problema 32
Problema 42
Problema 52
Problema 62
Problema 72
Problema 82
Problema 3
Problema 13
Problema 23
Problema 33
Problema 43
Problema 53
Problema 63
Problema 73
Problema 83
Problema 4
Problema 14
Problema 24
Problema 34
Problema 44
Problema 54
Problema 64
Problema 74
Problema 84
Problema 5
Problema 15
Problema 25
Problema 35
Problema 45
Problema 55
Problema 65
Problema 75

Problema 6
Problema 16
Problema 26
Problema 36
Problema 46
Problema 56
Problema 66
Problema 76

Problema 7
Problema 17
Problema 27
Problema 37
Problema 47
Problema 57
Problema 67
Problema 77

Problema 8
Problema 18
Problema 28
Problema 38
Problema 48
Problema 58
Problema 68
Problema 78

Problema 9
Problema 19
Problema 29
Problema 39
Problema 49
Problema 59
Problema 69
Problema 79

Problema 10
Problema 20
Problema 30
Problema 40
Problema 50
Problema 60
Problema 70
Problema 80


Como caso particular, pongo aparte una colección de problemas para obtener el estimador de máxima verosimilitud de una función:

Problemas: Estimador de Máxima Verosimilitud.
Problema 1
Problema 6
Problema 2
Problema 7
Problema 3
Problema 8
Problema 4
Problema 9
Problema 5
Problema 10

21 comentarios:

Anónimo dijo...

Muy buena pagina! me fue de gran ayuda para elavorar mi formulario de un examen de estadistica

Manuel Caballero dijo...

Buenas:

Me alegro muchísimo de que te haya sido de utilidad el contenido que este blog, Aqueronte, ofrece.

Anónimo dijo...

Gracias por los ejercicios resueltos me fueron de gran ayuda

Anónimo dijo...

Hola Manuel,
Primeramente felicitarte por tu blog, me está siendo de mucha ayuda.
Las imagenes no se ven bién.
Un saludo

Anónimo dijo...

Buenas,
Tengo unas dudas:
Me parece que anteriormente la parte de Contraste de hipótesis estaba más detallado.
La primera es:
- Cuando utilizo alpha, cuando alpha/2, y cuando 1-alpha/2 ???
- Cuando es unilateral acepto si el valor de la media (Muestral o poblacional) es menor/Mayor a la obtenida??
- Cuando es bilateral acepto si el valor de la media (Muestral o poblacional) pertenece a intervalo obtenido??

Grácias
-

Manuel Caballero dijo...

Buenas:

No es que estuviera más detallado, sólo que estaba ciertos intervalos de confianza expuestos. Los he quitado ya que están en la tabla todos y aparte están también disponible para su descarga.

Las preguntas que planteas están detalladas en el formulario de este capítulo que se puede observar en esta página o bien, está disponible para su descarga.

Gracias por tu comentario y un saludo.

novata en estadisitica dijo...

MENUDO PEDAZO DE BLOG!!! DE VERDAD QUE ES DE GRAN UTILIDAD!! MUCHISIMAS GRACIAS POR EL TRABAJO QUE TE HAS TOMADO Y TE ESTARAS TOMANDO
UN ABRAZO

Manuel Caballero dijo...

Buenas:

Me alegro que te sea de utilidad el contenido que aquí exponemos.

Un slaudo y gracias por tu comentario.

Anónimo dijo...

Hola manuel:
Quisiera que sepas que a los estudiantes que dan Estadística en la Ugr les estas haciendo un favor incalculable. Yo como uno de ellos quiero darte la gracias.

Manuel Caballero dijo...

Buenas:

Me alegro que estudiantes y miembros de la Universidad de Granada les sea de ayuda el contenido que aquí exponemos.

Gracias por tu comentario.

Anónimo dijo...

Excelente pagina Sr.Manuel, usted cree que le es posible por favor ayudarme a resolver un ejercicio, estoy echo un lio tratando de resolverlo. Se selecciono una muestra aleatoria de 26 granos de arroz de un arrozal de un pueblo de Guadalajara. La desviacion estandar de la muestra de picados por aves por grano fue de 3. Determinar un intervalo de confianza del 95% para la varianza de la poblacion de las picaduras de ave a los granos de arroz de Guadalajara al suponer que estas mediciones siguen una distribucion normal.

Gracias por su ayuda

Anónimo dijo...

Buenas Tardes:
Me encanta este blog, explican los temas en forma mas clara que algunos maestros, me gustaria me ayudaran con un ejercicio o me indicaran algun ejemplo similar, La asistencia promedio a una película de estreno en 59 salas de proyección es de 82 personas. Encuentre el intervalo de confianza al 95% para la asistencia media de espectadores a esta película. Suponga que la desviación estándar de la población es 21.

Agradecere eternamente su ayuda.

atte

Ana Lucia

Manuel Caballero dijo...

Buenas:

Para el ejercicio que planteas sobre la obtención del intervalo de confianza sobre la varianza, tienes cantidad de problemas resueltos, por ejemplo: Problema 12.


----------------------------

Buenas Lucía:

El ejercicio que propones es relativamente fácil, tienes uno similar en los problemas resueltos, concretamente: Problema 73.

Un saludo y gracias por tu comentario.

Juan Pablo Quevedo dijo...

Buenas tardes,
te agradezco por la informacion ,es de mucha utilidad.
puedes ayudarme con este ejemplo?

En una central de mezclas de concreto se desea comparar dos procesos de fraguado en relación con la variabilidad de la resistencia a la compresión del concreto. Para este estudio se toma una muestra al azar de 7 cilindros producidos con el método de fraguado A y una muestra al azar de 10 cilindros
producidos con el método de fraguado B. Para tomar una decisión al respecto se adopta la siguiente regla: si el cociente entre las dos varianzas muestrales insesgadas es mayor a un valor crítico F se determina que uno de los procesos de fraguado produce mayor variabilidad en la resistencia a la compresión que el otro proceso. Calcular el valor de F de tal manera que se tenga una probabilidad de 0.05 de tomar una decisión incorrecta.

Anónimo dijo...

Buenas,
estoy resolviendo un problema sobre intervalos de confianza y me he quedado un poco atascada con uno de los apartados. El problema me dice:
Un proceso distribuido normalmente, tiene las especificaciones LIT= 75 (limite inferior de tolerancia) y LST = 85. Una muestra aleatoria de tamano 25 indica que el proceso está centrado. La cuasidesvidesviación típica de esa muestra es Sc = 1,5.
Halle una estimación puntual del CCP (o Cp, coeficiente de capacidad)
Halle un intervalo de confianza del 95% para CCP
El apartado a) se resolverlo y para el apartado b) tengo la formula pero no se como se calcula (o donde debo mirar) el valor de X_(1- ∝ /2,n-1)^2 y X_( ∝ /2,n-1)^2 . No se si son unas tablas o unas fórmulas.
He mirado tods los ejercicios que teneis sobre este tema pero no encuentro ninguno donde me den los mismos datos.
Gracias.

Anónimo dijo...

Perdona, no me salen bien las fórmulas. La X esta elevada al cuadrado y lo que aparece entre paréntesis es un subíndice.

Gracias

A. Bella dijo...

Hola! soy quien escribio los dos comentarios anteriores. Podeis ayudarme???
Gracias

Manuel Caballero dijo...

Buenas A. Bella:

Para obtener los valores de las fórmulas que expones, te dejo, como ejemplo (podrás encontrar más en los problemas) el siguiente ejercicio:

· Problema 80.

Concretamente, el Apartado b), donde verás cómo se obtienen los valores con las expresiones que mencionas y acudiendo a la tabla ji-cuadrada.

· PD: Lamento el retraso, pero estoy de vacaciones y me es difícil conectarme.

Un saludo.

A. Bella dijo...

Sin problema! muchisimas gracias! me estas ayudando muchisimo.

Un saludo

Anónimo dijo...

Hola, lo siento por haber colocado una duda en otro apartado pero es que voy bastante perdida, la verdad es que sin un profesor cuesta bastante, he seguido tu consejo y me he fijado en el ejercicio 4 , me gustaria que me dijeras si voy por buen camino.
muestra: 300
media: 4 Kg de organica
desviacion estandard: 23
me pide la probabilidad producir mas de 6 Kg de organica.
Me da de probabilidad 0,0668= 6,68%
Me gustaria que me dijeras si esta bien, ya que tengo muchas dudas. Gracias.

Manuel Caballero dijo...

Buenas:

Te lo resuelvo paso a paso:

Hacemos una recopilación de los datos del problema:

· Tamaño de la muestra: n = 300.
· Media muestral: x1 = 4
· Desviación estándar: σ1 = 23

Definimos la variable aleatoria continua:

· X ≡ 'Cantidad de materia orgánica, en kilogramos'

Dicha variable aleatoria continua, sigue una distribución Normal: X ~ N(4, 23)

El problema nos pide obtener la siguiente probabilidad:

· P(X > 6) = 1 - P(X ≤ 6)

Tipificamos a la Normal (mediante el Teorema Central del Límite):

· P(X > 6) = 1 - P(X ≤ 6) = 1 - P[Z ≤ √300·(6 - 4)/23]

Simplificamos:

· P(X > 6) = 1 - P[Z ≤ √300·(6 - 4)/23] ≈ 1 - P(Z ≤ 1.51)

Operamos:

· P(X > 6) ≈ 1 - P(Z ≤ 1.51) = 1 - [0.5 + Φ(1.51)] = 0.5 - Φ(1.51)

Buscamos en la Tabla de la Normal y sustituimos valores:

· P(X > 6) ≈ 0.5 - Φ(1.51) = 0.5 - 0.4345 = 0.0655

En tu caso, has redondeado a la baja, es decir:

· P(X > 6) ≈ 1 - P(Z ≤ 1.50) = 1 - [0.5 + Φ(1.50)] = 0.5 - Φ(1.50) = 0.5 - 0.4332 = 0.0668

Por lo tanto está bien. Deberías consultar el tipo de redondeo que aplica tu profesor, así no tendrás problemas cuando te examines.

Por otro lado, mi consejo es que en este tipo de problemas, en vez de redondear, apliques interpolación lineal, ya que el resultado será mas preciso.

Un saludo.