viernes, 8 de marzo de 2013
Distribución Hipergeométrica.
Distribución Hipergeométrica.
En estadística, la distribución
hipergeométrica es una de las distribuciones de probabilidad discreta. Esta
distribución se utiliza para calcular la probabilidad de una selección
aleatoria de un objeto sin repetición. Aquí, el tamaño de la población es el
número total de objetos en el experimento.
La distribución Binomial se
generó al estudiar el comportamiento de repetir n veces un
experimento de Bernoulli, en el cual hay dos resultados posibles, las
repeticiones son independientes y la probabilidad asociada a cada repetición
permanece constante. Para cumplir la última característica, es indispensable
que cuando hay extracción de elementos se debe realizar con reemplazo, esto es,
regresar el elemento extraído antes de realizar la siguiente extracción.
En el caso de la
distribución Hipergeométrica, a diferencia de la
distribución Binomial, los elementos se extraen simultáneamente, o si es
uno a uno, sin devolverlos antes de realizar la siguiente extracción, de forma
que un elemento no puede aparecer dos veces en una muestra. A esta manera de
obtener la muestra se le llama muestreo sin reemplazo.
De esta forma, la probabilidad del
segundo elemento depende o estácondicionada al elemento que se haya sacado
en la primera extracción o sea que existe dependencia. Este concepto también se
aplica en la extracción del tercero, cuarto y demás elementos, dependiendo del
tamaño de la muestra, donde la probabilidad depende de los elementos obtenidos
en las extracciones anteriores. Obsérvese que el muestreo sin reemplazo origina la dependencia probabilística, a
diferencia del modelo binomial que no la tiene.
Para efectos de esta distribución,
llamemos población al conjunto de elementos disponibles para realizar un
experimento y muestra a un subconjunto de dichos elementos seleccionados en
forma aleatoria.
La distribución hipergeométrica es
especialmente útil en todos aquellos casos en los que se extraigan muestras o
se realizan experiencias repetidas sin devolución del elemento extraído o sin
retornar a la situación experimental inicial.
Modeliza , de hecho,
situaciones en las que se repite un número determinado de veces una prueba
dicotómica de manera que con cada sucesivo resultado se ve alterada la
probabilidad de obtener en la siguiente prueba uno u otro resultado. Es una
distribución .fundamental en el estudio de muestras pequeñas de poblaciones
.pequeñas y en el cálculo de probabilidades de, juegos de azar y tiene grandes
aplicaciones en el control de calidad en otros procesos experimentales en los
que no es posible retornar a la situación de partida.
La distribución
hipergeométrica puede derivarse de un proceso experimental puro o de Bernouilli
con las siguientes características:
·
El proceso
consta de n pruebas, separadas o separables de entre un conjunto de N pruebas
posibles.
·
Cada una de
las pruebas puede dar únicamente dos resultados mutuamente excluyentes: A y no
A.
·
En la primera
prueba las probabilidades son: P(A)= p
y P(A)= q ;con p+q=l.
Características:
a) Al realizar un experimento con este tipo de
distribución, se esperan más de dos tipos de resultados.
b) Las probabilidades asociadas a cada uno de
estos resultados no son constantes.
c) Los ensayos o repeticiones del experimento no
son independientes entre sí.
d) El número de repeticiones del experimento n,
es constante.
Función
de Probabilidad
Supongamos que se tiene una población
finita de tamaño N, en donde los elementos sólo tienen dos
características, digamos éxito y fracaso, hombres y mujeres, aprobados y
reprobados, buenos y malos, empleados y desempleados, enfermos y sanos,
etc. Esto significa que de acuerdo a las características, la
población se puede dividir en dos subconjuntos disjuntos: los que cumplen y los
que no cumplen con la característica estudiada. Supongamos también que en esta
población existen a elementos de cierta característica que nos
interesa analizar, por lo que N – a elementos no la tienen.
Distribución
hipergeométrica en
la industria.
La
distribución hipergeométrica suele aparecer en procesos muéstrales sin
reemplazo, en los que se investiga la presencia o ausencia de cierta
característica. Piénsese, por ejemplo, en un procedimiento de control de
calidad en una empresa farmacéutica, durante el cual se extraen muestras de las
cápsulas fabricadas y se someten a análisis para determinar su composición.
Durante
las pruebas, las cápsulas son destruidas y no pueden ser devueltas al lote del
que provienen. En esta situación, la variable que cuenta el número de cápsulas
que no cumplen los criterios de calidad establecidos sigue una distribución
hipergeométrica. Por tanto, esta distribución es la equivalente a la binomial,
pero cuando el muestreo se hace sin reemplazo.
Esta
distribución se puede ilustrar del modo siguiente: se tiene una población
finita con N elementos, de los cuales R tienen una determinada característica
que se llama “éxito” (diabetes, obesidad, hábito de fumar, etc.). El número de
“éxitos” en una muestra aleatoria de tamaño n, extraída sin reemplazo de la
población, es una variable aleatoria con distribución hipergeométrica de
parámetros N, R y n.
Cuando
el tamaño de la población es grande, los muestreos con y sin reemplazo
sonequivalentes, por lo que la distribución hipergeométrica se aproxima en tal
caso a la binomial.
La distribución
hipergeométrica sigue el siguiente modelo:
Donde:
Vamos
a tratar de explicarlo:
N:
es el número total de casos.
N1
y N2
representan los objetos que
complementan la variable “N”, es decir que es el resultado de sumar las dos
variables anteriores.
k:
representa el número de éxitos de las muestras.
n: es el número de ensayos que se realiza.
n: es el número de ensayos que se realiza.
Suscribirse a:
Entradas (Atom)