martes, 19 de mayo de 2009

R: Distribución Geométrica

En este apartado, se explicarán las funciones existentes en R para obtener resultados válidos que se basen en la distribución Geométrica de variables aleatorias discretas.

Ya que aquí sólo se expondrá cómo es el manejo de las funciones, se recomienda que se visite el capítulo: Variables Aleatorias Discretas y Distribuciones de Probabilidad, para determinar en qué consiste dicha distribución.

Para obtener valores que se basen en la distribución Geométrica, R, dispone de cuatro funciones:

R: Distribución Geométrica.
dgeom(x, prob, log = F)Devuelve resultados de la función de densidad.
pgeom(q, prob, lower.tail = T, log.p = F)Devuelve resultados de la función de distribución acumulada.
qgeom(p, prob, lower.tail = T, log.p = F)Devuelve resultados de los cuantiles de la Geométrica.
rgeom(n, prob)Devuelve un vector de valores de la Geométrica aleatorios.


Los argumentos que podemos pasar a las funciones expuestas en la anterior tabla, son:
  • x, q: Vector de cuantiles que representa el número de fallos antes del primer éxito.
  • p: Vector de probabilidades.
  • n: Números de valores aleatorios a devolver.
  • prob: Probabilidad de éxito en cada ensayo.
  • log, log.p: Parámetro booleano, si es TRUE, las probabilidades p son devueltas como log (p).
  • lower.tail: Parámetro booleano, si es TRUE (por defecto), las probabilidades son P[X ≤ x], de lo contrario, P [X > x].

Hay que indicar, que todas las funciones que emplea R para el estudio de la distribución Geométrica, x y q es el número de fallos hasta el primer éxito, contenido en el conjunto { 0, 1, 2, 3,...}, su expresión es:

P(Y = y) = p·(1 - p)y

Esto es importante ya que la expresión dada en Aqueronte, la x y q la definimos cómo el ensayo de Bernoulli necesaria para obtener un éxito, contenido en el conjunto { 1, 2, 3,...}, cuya expresión es:

P(X = x) = p·(1 - p)x-1

Ambas son perfectamente válidas y sus resultados son iguales, teniendo en cuenta que: Y = X -1.

Para comprobar el funcionamiento de estas funciones, usaremos un ejemplo de aplicación.

Imaginemos el siguiente problema: Un contador público halla que en nueve de diez auditorías empresariales se cometieron errores de importancia.

Si en consecuencia, revisa una serie de compañías, determinar la probabilidades siguientes:

a) La primera cuenta que contiene errores serios, sea la tercera contabilidad revisada.

b)
La primera cuenta con errores serios se encontrará después de revisar la tercera.


Sea la variable aleatoria discreta X, los errores graves que se cometen en auditorías empresariales.

Dicha variable aleatoria, sigue una distribución Geométrica: X ~ G(0.9)


Apartado a)

Para resolver este apartado, necesitamos resolver: P( X = 3), por lo tanto, sólo necesitamos el valor que toma X en el punto 3 de la función de densidad:

> dgeom(2, 0.9)
[1] 0.009

Por lo tanto, la probabilidad de que la primera cuenta que contiene errores serios sea la tercera revisada es: 0.009.


Apartado b)

Para resolver este apartado, necesitamos resolver: P( X > 3), usamos la función de distribución acumulada indicando que el área de cola es hacia la derecha:

> pgeom(2, 0.9, lower.tail = F)
[1] 0.001

Comprobamos el resultado obtenido operando en la desigualdad:

P( X > 3) = 1 - P( X ≤ 3) = 1 - [P( X = 1) + P( X = 2) + P( X = 3)]

> 1 - (dgeom(0, 0.9) + dgeom(1, 0.9) + dgeom(2, 0.9))
[1] 0.001

Como hemos podido comprobar, R dispone de varias funciones que satisfacen cualquier cálculo y operación que se desee realizar sobre distribución Geométrica discreta.

Por supuesto, se recomienda que se emplee la ayuda de R para ampliar conocimientos sobre las funciones expuestas en este capítulo.

> ?stats::Geometric

0 comentarios: