jueves, 15 de mayo de 2008

Problema 3. MED.

Ej3. Los datos numéricos que siguen son las clasificaciones obtenidas por 80 personas a las que se ha sometido a cierta prueba.


Calcule la media, la mediana y cuasi desviación típica, agrupándolos previamente. Los datos en cinco clases.


5357
59
60
60
60
61
61
62
62
62
62
63
63
65
65
65
66
67
67
68
68
68
69
71
71
71
72
72
73
73
73
73
74
74
74
75
75
75
75
75
75
75
76
76
76
76
77
77
78
78
78
78
78
79
79
79
80
81
82
82
83
84
85
85
85
86
87
88
88
88
89
90
93
93
94
95
95
96







· Sugerencia: Para facilitar el agrupamiento en cinco clases, amplíe el intervalo a [53, 97] que contiene los datos originales al intervalo [50, 100].


El enunciado nos indica que ampliemos el intervalo ligeramente, por lo tanto, los límites quedan definidos de la siguiente manera:


· a = 50
· b = 100

Tomamos las clases que nos indica el enunciado: p = 5.

Una vez dispuesto los límites del intervalo, calculamos la longitud:




No hace falta redondear el valor de h ya que es igual al número de cifras decimales que poseen los datos de la muestra, por lo tanto,



· d = 0


Y ya se está listo para realizar los intervalos y las marcas del mismo:


Primer Intervalo.


Subintervalo Inferior: e1 = a = 50

Subintervalo Superior: e2 = a + h - 10-d = 50 + 10 - 10-0 = 59

Marca: x1 = (e1 + e2)/2 = (50 + 59)/2 = 54.5



· Segundo Intervalo.


Subintervalo Inferior: e2 = a + h = 50 + 10 = 60

Subintervalo Superior: e3 = a + 2h - 10-d = 50 + 2·10 - 10-0 = 69


Marca: x2 = (e2 + e3)/2 = (60 + 69)/2 = 64.5


· Tercer Intervalo.


Subintervalo Inferior: e3 = a + 2h = 50 + 2·10 = 70

Subintervalo Superior: e4 = a + 3h - 10-d = 50 + 3·10 - 10-0 = 79


Marca: x3 = (e3 + e4)/2 = (70 + 79)/2 = 74.5


Cuarto Intervalo.


Subintervalo Inferior: e4 = a + 3h = 50 + 3·10 = 80

Subintervalo Superior: e5 = a + 4h - 10-d = 50 + 4·10 - 10-0 = 89


Marca: x4 = (e4 + e5)/2 = (80 + 89)/2 = 84.5


Quinto Intervalo.


Subintervalo Inferior: e5 = a + 4h = 50 + 4·10 = 90

Subintervalo Superior: e6 = a + 5h - 10-d = 50 + 5·10 - 10-0 = 99


Marca: x5 = (e5 + e6)/2 = (90 + 99)/2 = 94.5



Para hallar la media, la mediana y la cuasi desviación típica, es conveniente obtener las frecuencias absolutas (fi) y las frecuencias absolutas acumulativas (Fi).


La frecuencia absoluta será el número de veces que aparecen datos en los respectivos intervalos calculados anteriormente.


Para ello, empezamos a contar cuantos datos están dentro de cada intervalo de la tabla de datos original del problema, obteniéndose la siguiente tabla:



SubintervalosMarcaFrecuencia Absoluta, fi

50 – 59

54.53

60 – 69

64.521

70 – 79

74.533

80 – 89

84.515

90 – 99

94.58

Una vez obtenidas las frecuencias absolutas, se obtienen las frecuencias absolutas acumuladas.


Las frecuencias absolutas acumuladas se obtienen aplicando la siguiente expresión:



· Fi = Σfi


Es decir, la frecuencia absoluta acumulada del primer subintervalo será igual a su frecuencia absoluta.


En cambio, la frecuencia absoluta acumulada del segundo subintervalo, será la suma de la frecuencia absoluta del intervalo anterior más la frecuencia absoluta suya.


Y así será la forma de proceder, obteniéndose la siguiente tabla:


SubintervalosMarcaFrecuencia Absoluta, fiFrecuencia Absoluta Acumulativa, Fi

50 – 59

54.533

60 – 69

64.52124

70 – 79

74.53357

80 – 89

84.51572

90 – 99

94.5880


Se puede observar, que las clases construidas de la manera que se ha descrito con anterioridad, están separadas unas de otras, es decir, entre una clase y la siguiente hay un espacio que no pertenece a ninguna de las dos, en el que no hay (precisamente se ha construido así) ningún dato.


Vamos a realizar una pequeña modificación para evitar dicha separación entre clases pero manteniendo el hecho de que cada dato pertenezca a una y sólo una clase.

La metodología consiste en dividir por la mitad el espacio entre cada dos clases consecutivas, y tomar así, el punto medio como extremo superior para una clase e inferior para la siguiente.


Dado que la longitud de este espacio entre clases es 10-d, la mitad será 0.5·10-d.


Aplicando lo anterior, los extremos de las clases quedan de la siguiente manera:


· Primer Intervalo.


Subintervalo Inferior: e1 = a = 50

Subintervalo Superior: e2 = a + h - 0.5·10-d = 50 + 10 - 0.5·10-0 = 59.5



· Segundo Intervalo.


Subintervalo Inferior: e2 = a + h = 50 + 10 = 60

Subintervalo Superior: e3 = a + 2h - 0.5·10-d = 50 + 2·10 - 0.5·10-0 = 69.5



· Tercer Intervalo.


Subintervalo Inferior: e3 = a + 2h = 50 + 2·10 = 70

Subintervalo Superior: e4 = a + 3h - 0.5·10-d = 50 + 3·10 - 0.5·10-0 = 79.5



· Cuarto Intervalo.


Subintervalo Inferior: e4 = a + 3h = 50 + 3·10 = 80

Subintervalo Superior: e5 = a + 4h - 0.5·10-d = 50 + 4·10 - 0.5·10-0 = 89.5



· Quinto Intervalo.


Subintervalo Inferior: e5 = a + 4h = 50 + 4·10 = 90

Subintervalo Superior: e6 = a + 5h - 0.5·10-d = 50 + 5·10 - 0.5·10-0 = 99.5


Por su puesto, las marcas siguen siendo de igual valor, por lo tanto, la tabla definitiva queda de la siguiente manera:



SubintervalosMarca

49.5 – 59.5

54.5

59.5 – 69.5

64.5

69.5 – 79.5

74.5

79.5 – 89.5

84.5

89.5 – 99.5

94.5


Hay que decir, que los intervalos sin espacios no es necesario calcularlo ya que no lo pide el enunciado, pero se exponen ya que no es una técnica difícil.


Una vez obtenidos los datos agrupados, nos piden calcular la media, la mediana y la cuasi desviación típica.


El número total de datos es N = 80.


· Datos Agrupados.


La media para datos agrupados se calcula mediante la siguiente expresión:




Calculamos lo que nos piden. La media es:


Para la mediana, es preciso localizar aquella clase que cumple las desigualdades siguientes:


· Fk > N/2
· Fk-1 < N/2


La clase que cumple dicha desigualdad, es la del subintervalo, Fk, 70 – 79 con una frecuencia absoluta de f = 33 y el subintervalo, Fk-1, 60 – 69, con una frecuencia absoluta acumulativa de Fk = 24.


Y la expresión de la mediana para datos agrupados es la siguiente:



Lo último que nos queda por calcular, es la cuasi desviación típica, para ello aplicamos la expresión siguiente para su cálculo:




Se obtiene:



6 comentarios:

Anónimo dijo...

Creo que el enunciado esta equivocado, pues solo cuento 79 datos

Unknown dijo...

Buenas:

Si te das cuenta, en el enunciado te aconsejan que se amplíe el intervalo a [53, 97].

Y es ese precisamente 97, el que hace que sean en total 80 datos.

Un saludo.

Anónimo dijo...

Lo que no entiendo es porque se aconseja que se amplie un dato mas.¿porque no hacerlo con 79 datos?

Unknown dijo...

Buenas:

Generalmente se suele hacer para facilitar los cálculos. Es por ello, que es en el enunciado donde se indica que se amplíe el intervalo.

En caso de que el enunciado no mencione nada, pues no se amplia.

Un saludo.

Anónimo dijo...

lo que no entiendo es porque amplia hasta el 100 y el 50,en otros problemas se amplia solo una unidad por debajo y otra por arriba.Gracias!

Unknown dijo...

Buenas:

Se amplía simplemente para facilitar los cálculos numéricos, es más, es una sugerencia del enunciado del problema por lo tanto, no tiene mucha más ciencia.

Al ser algo que te dice el enunciado se hace sin más, en este caso concreto, es una sugerencia, por lo tanto, de ti depende si quieres seguirla o no.

Como curiosidad, puedes realizar este problema tomando la sugerencia y después sin hacerle caso a la sugerencia, a ver si es más complicado o no.


Un saludo.