Está en la página 1de 5

Distribucin de Probabilidad

En teora de la probabilidad y estadstica, la distribucin de probabilidad de una


variable aleatoria es una funcin que asigna a cada suceso definido sobre la
variable aleatoria la probabilidad de que dicho suceso ocurra. La distribucin de
probabilidad est definida sobre el conjunto de todos los sucesos, cada uno de los
sucesos es el rango de valores de la variable aleatoria.

La distribucin de probabilidad est completamente especificada por la funcin de


distribucin, cuyo valor en cada x real es la probabilidad de que la variable
aleatoria sea menor o igual que x.

Una distribucin de probabilidad indica toda la gama de valores que pueden


representarse como resultado de un experimento si ste se llevase a cabo.

Es decir, describe la probabilidad de que un evento se realice en el futuro,


constituye una herramienta fundamental para la prospectiva, puesto que se puede
disear un escenario de acontecimientos futuros considerando las tendencias
actuales de diversos fenmenos naturales. Toda distribucin de probabilidad es
generada por una variable (porque puede tomar diferentes valores) aleatoria x
(porque el valor tomado es totalmente al azar), y puede ser de dos tipos:

VARIABLE ALEATORIA DISCRETA (x).


Porque solo puede tomar valores enteros y un nmero finito de ellos. Por ejemplo:
X Variable que nos define el nmero de alumnos aprobados en la materia de
probabilidad en un grupo de 40 alumnos (1, 2 ,3 los 40).

VARIABLE ALEATORIA CONTINUA (x).


Porque puede tomar tanto valores enteros como fraccionarios y un nmero infinito
de ellos dentro de un mismo intervalo. Por ejemplo:
x es la Variable que nos define la concentracin en gramos de plata de algunas
muestras de mineral (14.8 gr, 12.1, 10.0, 42.3, 15.0, 18.4, 19.0, 21.0, 20.8, , n)

Teora del Muestreo


La teora del muestreo es el estudio de las relaciones existente entre una
poblacin y muestras extradas de la misma. Tiene gran inters en muchos
aspectos de la estadstica. Por ejemplo permite estimar cantidades desconocidas
de la poblacin (tales como la media poblacional, la varianza, etc.),
frecuentemente llamada parmetros poblacionales o brevemente parmetros, a
partir del conocimiento, de las correspondientes cantidades muestrales (tales
como la media muestral, la varianza, etc.), a, menudo llamadas estadsticos
muestrales o brevemente estadsticos.

La teora de muestreo es tambin til para determinar si las diferencias que se


puedan observar entre dos muestras son debidas a la aleatoriedad de las mismas
o si por el contrario son solamente significativas. Tales preguntas surgen por
ejemplo, al ensayar un nuevo suero para el tratamiento de una enfermedad, o al
decir si un proceso de produccin es mejor que otro. Estas decisiones envuelven a
los llamados ensayos e hiptesis de significacin, que son de gran importancia en
la teora de la decisin.

En general, un estudio de inferencias, realizados sobre una poblacin mediante


muestras extradas de la misma, junto con las indicaciones de la exactitud de tales
inferencias aplicadas a la teora de la probabilidad, se le conoce como inferencia
estadstica.
Cada sistema de muestreo se usa para obtener estimaciones de ciertas
propiedades de la poblacin objeto de estudio, y ser tanto ms adecuado cuanto
mejores sean las estimaciones que proporcione. Las estimaciones individuales
pueden ser, por casualidad, muy aproximadas o diferir considerablemente del
verdadero valor, dando una prueba deficiente de los mritos del sistema. Un mal
sistema de muestreo puede dar a veces algunas estimaciones muy exactas, as
como tambin un buen sistema dar alguna muy alejada del verdadero valor. La
mejor manera de juzgar un sistema de muestreo consiste en observar la
distribucin de frecuencias de las estimaciones que se obtienen por muestreos
repetidos. Un buen sistema proporciona estimaciones cuya distribucin de
frecuencias posee una pequea variancia y su valor medio est muy prximo al
valor verdadero. La diferencia entre la estimacin media y el valor verdadero se
denomina sesgo. (El trmino sesgo se usa tambin refirindose al proceso por
el cual se producen las diferencias.) Las magnitudes del sesgo y la variancia de un
sistema de muestreo son, en una gran extensin, independientes entre s; un
sistema puede dar estimaciones con una pequea variancia, es decir, difiriendo
poco entre ellas, pero con un gran sesgo, esto es, quedando todas las
estimaciones muy lejos del valor verdadero. (Un ictimetro con las cifras de la
escala casi ilegibles introducir cierta variancia extra; y un medidor con la escala
desplazada producir un sesgo.)

Muestreo Aleatorio
En esta tcnica, cada miembro de la poblacin tiene la misma probabilidad de ser
seleccionado como sujeto. Todo el proceso de toma de muestras se realiza en un
paso, en donde cada sujeto es seleccionado independientemente de los otros
miembros de la poblacin.

El muestreo aleatorio siemple se puede aplicar en muchos mtodos. El ms


primitivo y mecnico sera el de la lotera. A cada miembro de la poblacin se le
asigna un nmero. Todos los nmeros se colocan en un recipiente o un sombrero
y se mezclan. Con los ojos vendados, el investigador va sacando las etiquetas con
nmeros. Todos los individuos que tengan los nmeros sacados por el
investigador son los sujetos del estudio. Otra forma sera que una computadora
haga la seleccin al azar de la poblacin. En el caso de poblaciones con pocos
miembros, es aconsejable utilizar el primer mtodo, pero si la poblacin tiene
muchos miembros, es preferible una seleccin aleatoria por computadora.
a) Simple
El procedimiento empleado es el siguiente: 1) se asigna un nmero a cada
individuo de la poblacin y 2) a travs de algn medio mecnico (bolas dentro de
una bolsa, tablas de nmeros aleatorios, nmeros aleatorios generadas con una
calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario para
completar el tamao de muestra requerido.
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad prctica
cuando la poblacin que estamos manejando es muy grande.

b) Sistemtico
Este procedimiento exige, como el anterior, numerar todos los elementos de la
poblacin, pero en lugar de extraer n nmeros aleatorios slo se extrae uno. Se
parte de ese nmero aleatorio i, que es un nmero elegido al azar, y los elementos
que integran la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k,
es decir se toman los individuos de k en k, siendo k el resultado de dividir el
tamao de la poblacin entre el tamao de la muestra: k= N/n. El nmero i que
empleamos como punto de partida ser un nmero al azar entre 1 y k.
El riesgo este tipo de muestreo est en los casos en que se dan periodicidades en
la poblacin ya que al elegir a los miembros de la muestra con una periodicidad
constante (k) podemos introducir una homogeneidad que no se da en la poblacin.
Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos
en los que los 5 primeros son varones y los 5 ltimos mujeres, si empleamos un
muestreo aleatorio sistemtico con k=10 siempre seleccionaramos o slo
hombres o slo mujeres, no podra haber una representacin de los dos sexos.

c) Estratificado
Trata de obviar las dificultades que presentan los anteriores ya que simplifican los
procesos y suelen reducir el error muestral para un tamao dado de la muestra.
Consiste en considerar categoras tpicas diferentes entre s (estratos) que poseen
gran homogeneidad respecto a alguna caracterstica (se puede estratificar, por
ejemplo, segn la profesin, el municipio de residencia, el sexo, el estado civil,
etc.). Lo que se pretende con este tipo de muestreo es asegurarse de que todos
los estratos de inters estarn representados adecuadamente en la muestra. Cada
estrato funciona independientemente, pudiendo aplicarse dentro de ellos el
muestreo aleatorio simple o el estratificado para elegir los elementos concretos
que formarn parte de la muestra. En ocasiones las dificultades que plantean son
demasiado grandes, pues exige un conocimiento detallado de la poblacin.
(Tamao geogrfico, sexos, edades,...).

d) De conglomerados
Los mtodos presentados hasta ahora estn pensados para seleccionar
directamente los elementos de la poblacin, es decir, que las unidades mustrales
son los elementos de la poblacin.
En el muestreo por conglomerados la unidad muestral es un grupo de elementos
de la poblacin que forman una unidad, a la que llamamos conglomerado. Las
unidades hospitalarias, los departamentos universitarios, una caja de determinado
producto, etc., son conglomerados naturales. En otras ocasiones se pueden
utilizar conglomerados no naturales como, por ejemplo, las urnas electorales.
Cuando los conglomerados son reas geogrficas suele hablarse de
"muestreo por reas".
El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto
nmero de conglomerados (el necesario para alcanzar el tamao muestral
establecido) y en investigar despus todos los elementos pertenecientes a los
conglomerados elegidos.

Muestreo no Aleatorio
Es aqul para el que no puede calcularse la probabilidad de extraccin de una
determinada muestra. Las unidades muestrales no se seleccionan al azar, sino
que son elegidas por el responsable de realizar el muestreo. Se busca seleccionar
a individuos que se juzga de antemano, tienen un conocimiento profundo del tema
bajo estudio, por lo tanto, se considera que la informacin aportada por esas
personas es vital para la toma de datos.
Estos muestreos comparten las caractersticas siguientes:
La seleccin de la muestra no es al azar, se basa en el criterio del investigador.
No se pueden incluir por lo tanto ecuaciones de probabilidad, ya que no aplica
ninguna teora de dicha disciplina.
Por consecuencia no pueden calcularse datos como margen de error o nivel de
confianza.
El costo de dichos muestreos es ms barato comparado con un muestreo
probabilstico.

Teorema del Lmite Central


El teorema del lmite central o teorema central del lmite indica que, en condiciones
muy generales, si Sn es la suma de n variables aleatorias independientes y de
varianza no nula pero finita, entonces la funcin de distribucin de Sn se
aproxima bien a una distribucin normal (tambin llamada distribucin gaussiana,
curva de Gauss o campana de Gauss). As pues, el teorema asegura que esto
ocurre cuando la suma de estas variables aleatorias e independientes es lo
suficientemente grande.

El teorema del lmite central es un teorema fundamental de probabilidad y


estadstica. El teorema establece que la distribucin de que es la media de una
muestra aleatoria de una poblacin con varianza finita, tiene una distribucin
aproximadamente normal cuando el tamao de la muestra es grande,
independientemente de la forma de la distribucin de la poblacin. Muchos
procedimientos estadsticos comunes requieren que los datos sean
aproximadamente normales, pero el teorema del lmite central le permite aplicar
estos procedimientos tiles a poblaciones que son marcadamente no normales. El
tamao que debe tener la muestra depende de la forma de la distribucin original.
Si la distribucin de la poblacin es simtrica, un tamao de muestra de 5 podra
generar una aproximacin adecuada; si la distribucin de la poblacin es
marcadamente asimtrica, se requiere un tamao de muestra de 50 o ms. Las
siguientes grficas muestran ejemplos de cmo la distribucin afecta el tamao de
la muestra que usted necesita.
Distribucin uniforme Medias de las muestras

Una poblacin que sigue una distribucin uniforme es simtrica, pero


marcadamente no normal, como lo indica el primer histograma. Sin embargo, la
distribucin de 1000 medias de la muestra (n=5) de esta poblacin es
aproximadamente normal debido al teorema del lmite central, como lo demuestra
el segundo histograma. Este histograma de medias de la muestra incluye una
curva normal superpuesta para ilustrar esta normalidad.

Distribucin exponencial Medias de las muestras

Una poblacin que sigue una distribucin exponencial es asimtrica y no normal,


como lo demuestra el primer histograma. Sin embargo, la distribucin de medias
de la muestra de 1000 muestras de tamao 50 de esta poblacin es
aproximadamente normal, debido al teorema del lmite central, como lo demuestra
el segundo histograma. Este histograma de medias de la muestra incluye una
curva normal superpuesta para ilustrar esta normalidad.