Está en la página 1de 16
MODELOS DE DISTRIBUCIONES DE PROBABLLIDADES Introduccion Uno de tos conceptos fundamentales de la estadistion es ef de “distribucién de freowencias”. Ei efecto, es -de interés para el investigador conocer qué valores de la variable bajo estudio son mds (o menos) frecuentes, con qué frecuencia suelen darse ciertos valoregide interés, u otras caracteristicas de la distribucién que ya hemos mencionadd. como las medidas de tendencia central, de variabilidad, ete, Hay muchas variables que, siendo totalmente diferentes entre si, son milares desde cl punto de vista de su distribudién de frectencias, Piénsese, por ejemplo, que se arroja una moneda equilibrada un cierlo mimero de veces, Aproximadamente la mitad de las veces se observara cada lado de Ja moneda Supdngase ahora que los alumnos que se inscriben en una cétedra pueden optar entre dos comisiones simultaneas acerca div las cuales no tienen ninguna informacién a priori y, por tanto, ninguna jpreforencia cn particular, Cabe esperar que también aproximadamente 1a mjlad opie por cada comisién. El resultado obtenido al arrojar uiia moneda y Id comisién elegida por tn alumno son variables que, en s{-ismas, nada ticnén que ver Una con la otra: sin embargo ambas toman dos valores, y cada uno con la misma frecuencia: Lado de la moneda | cara coca Comisién clegida | A B recuencia relativa | 1/2 V2 Frecuencia relativa | 1/2 1/2 esporada esperada Este hecho de que, independientenicnte de la naturaleza ‘particular de las variables, exista un comportamiento o estructura similar entre distintas distribuciones de frecuencias, conduce a la vonceptualizacién de las migmas como modelos. Un modelo es una construccién teérica, una formulacién simplificada de la realidad que es Wil para comprender mejor cierios aspectos de la misma: facilita su andlisis ¢ interpretacién y perinite artibar a conclusioncs y prediccione: 36 Distribucion de probabilidades Una distribucién de probabilidades es un modelo de distribucién de frecuencias rclativas ledricas; esto es, uma variable que toma cierlos valores ya cada tno de estos valores se les asigna una cierta frecuencia relativa que no proviene de la observacién de tin hecho realizado sino que es deducida a partir de ciertas condiciones tedricas. Fin_el ejemplo de la moneda estamos suponiendo que es idcalmente equilibrada. 1a probabilidad de un valor de Ja variable puede interpretarse ‘como una medida de la posibilidad de que dicho valor sea observado. En los ejemplos anteriores % es In medida asignada tanto a la posibilicdad de que un alumno elija In comision A, como de que salga cara cuando se arroja una moneda. La probabilidad de un valor de ta variable verifica las propiedades de la ficonencia relativa, es decir es una cantidad no negativa y Ia suma de las probabilidades asignadas al conjunto de fos valores de la variable es wio. Algunas distribuciones particulares Modelo Bernoulli Una variable se distribuye segiin el modelo Bernoulli, cuando toma sélo dos valores. La comisién elegida por un alumno o fa cara que queda hacia arriba al arrojar una moneda son variables Bernoulli Otras variables Bernoulli pueden ser - la respuesta de un sujeto a un item, cuando esta es evaluada como correcta o incorrecta - cl resultado de un alumno en un examen, cuando se lo clasifica en aprobado o desaprobade. - el resultado del andlisis elinico de un paciente si es registrado como positive o negativo. - el resultado al arrojar un dado, cuando se registra si salié as o no. at Nomenclaturas y notaciones — _ Los dos valores de una variable Bornolilli suclen denominarse “éxito” © “fracaso” y codificarse tespectivamente con 1 YO La probabilidad asignada al éxito'se la.dlenota oon la Jetra “p”, por fo que 4a del fracaso con “J-p” ya que deben sumar J. En efecto, si las probabilidades S¢ conceptualizan como frecuencias relativas (odricas, deben reunir las mismas propiedades. Asi, la estructura de una tabla que representa Ia distribucién de probabilidades de una variable Bernoulli es x Oo oL Probabilid Observacién: Una variable Bernoulli queda totalmente caracterizada conociondo cl parémetro py, es decir, la probabilidad de éxitb o, equivalementemente, la probabilidad de fracdso. Modelo Binomial La distribucién binomial depende de dos valores fijos 0 pardmetros a saber: un nitmero natural ny una probabilidad p cuya interpretacion daremos después, Una variable binomial es aquélla cuyos valores son 0, 1, 2, ... por tanto es un modelo para una variable discreta- y las probabilidades asociadas a cada uno de ellos resultan de fa aplicacién de wna formula matomélica que invelucra a ny a p. Los resultados de aplicar esta férmfifa estin tabulados para algunos valores de n y de p,.por lo que no ser necesario usarla en este curso sino buscar adccuadamente en ta tabla, Por ejomplo, si una variable sigué la distritivcién binomial con pardimetros = 4, p= 0,30 tomard los valores 0, 1, 2, 3 v-4, cuyas probabilidades pueden lecrse en fa tabla I de le pagina 367 de Botella. Valores de la variable Probabilidades 0.24 0,412 0,265 0,076 0,008 Notacién: PCX=1) © 0.412 significa que la probabilidad de que la variable X tome e! valor Tes 0.412 P(Xo-1) es fa probabilidad de que la variable tome valores mayores que 1 es decir 2, 3,4 luego POX 1) P(X2) 1 POK*3)4 P(X) = 0.265 1 0,076 4 0,008 = 0,349 P(X<2) es la probabilidad de que la variable tome valores menores que 2, es decir 061 luego POX=2) = P(X=O) + PCX*1) = 0,24 +0,412 = 0,652 P(X2 3) es la probabilidad de que la variable tome valores mayores o iguales que 3, es decir 3.64 luego P(X 23) = P(X=3) + P(X™4) = 0,076 + 0,008 =0,084 Relacién entre ef modelo Binomial y el modelo Bernoulli variable binomial de parémetios ny p puede generarse, bajo ciertas condiciones que mencionaremos después, @ partir den observaciones de ana variable Bernoulli de parametro p. Fjemplos ~ Se arroja un dado cinco veces y se registia on cada ca resultado obtenide cn cada lanzumiento puede considerarse una variable Bernoulli con probabilidad de éxito igual a 1/6, Luego, la variable “caitidad de ases on los 5 lanzamientos del dado” es una variable Binomial de parmetros wy p16 34 si salid as. ~ Una prueba con: do 10 itemes de eléccidn nittiple coir 4 opciones, donde sélo una es cor cla. ‘Las respuestas son calilicadas como eotreclas 0 incorrectas, por Jo que la probabilidad de responder-correctamente por azar recta ¢s 0,25. Entonces la variable “cantidad de respuestas correctas por azar entre | 10” sigue el modelo Binemial de parimetros n= 10 y p= 0,25. Nétese que cn un ejemplo anterior mostranios que la respuesta a ua item calificada como correcta © incortecta es Bernolilli. La cantidad de respuestas correctas 4 10 itemes puede pensarse como 10 ‘cbservaciones de una variable Bernoulli Interpretacion de los Metros ny p De Jos ejemplos anteriores se sigue que n es Ia cantidad de observaciones de una variable Bernoulli y pla probabilidad dé éxito en cada observacion de la variable Bernoulli Condiciones necesarias para la relacién entre los modelos Binomial y Bernoulli. Condicién de estabilidad: la probabilidad de éxito debe permanecer constante en fas n observaciones de la variable Bernoulli. En los ejemplos anteripros se verifica esta condicion porque: - la probabilidad de obtener un as es 1/6, en cada una de las 5 veces que se arroja la moneda ~ la probabilidad de responder correctamente éadla uno de fos 10 ftemes es 0.25. Notemos que si entre fos 10 itemes hubicta alguno con probabilidad de ser respondido correctamente por: azar distinta de 0,25 no se verificaria la condicidn de estabilidad, por ejemplo, si alguno tuviera ma HO © menos opcione: on de independencia: La probabilidad de obtener éxito en und observacién no aumenta ni disminuye si se conoce el res ulladg de otra abservacién En Jos ejemplos anteriore verifica esia condicién, pues . probabilidad de obtener as en un § se sabe que en el lanzamiento anterior hubo as gundo lanzamiento no aumenta si ~Asi también Ja probabilidad de responder correctamente por azar un item de Ja prueba de 15 itemes no aumenta ni disminuy anterior lo contest incorrectamente, se sabe que el item Resumicndo: Una variable Binomial de pardimetros n y p se define como Et nitimero de éxitos obtenidos en las n observaciones. Cuando se efectian * n ebservaciones de una variable Bernonlli * que son independientes *y con la misma probabilidad de éxito p 44 DISTRIBUCION NORMAL Muchas variables cuantilativas continuas presentan la siguiente particularidad: a la mayor parte de los individuos les coiresponden valores préximos a la media y cuanto mas se alejan los valores de la media , mas dificil encontrar individuos que adopten esos valores El modelo al que se ajustan muchas de tales variables es Ja distribucién normal, su representacién gralica es Esta curva se denomina curva normal, o distribucion de Gauss o haciendo referencia a su forma se la llama “campana de Gauss” Muchas variables de interés para los psicdlogos, asi como otras procedentes de la biologia o la fisica tienen distribuciones que se asemejan a la normal lo suficiente como trabajar “como si” fueran normales sin cometer grandes errores, Por éjemplo: el cociente intelectual, la extraversi6n, el razonamiento espacial tienen distribucién. normal, asi como el peso, la altura, la fuerza, la agudleza visual se.ajustan a dicho modelo, Las variables-cuya distribucion se ajusta al modelo normal adoptan una representacién gréfica en las que se pueden apreciar las propiedades que enumeramos a continuacién: @) Es simétrica con respecto a un valor central (4). ¥ en ese valor central coinciden la media (o valor esperada), la mediana (divide a la curva en dos zonas de igual yea a su izquierda y a su derecha) y la moda (es el valor con maxima ordenada) 5) Es asintética con respecto al eje de abscisas; es decir por mucho que se extienda nunca Hlega a tocar el eje, y sdlo en te Ia altura de la curva Iogaria a s a cc) Hay toda una familia de curvas normales, dependiendo de Jos valores de los valores sry o. De entre ellas, Ja ni4s importante es aquella que tiene media 0 y desviacién tipica | a la que Hamamos disiribucién norinal estandar. d) Los puntos de inflexién (donde la curva caimbia de céncava a convexa y viceversa) se cncuentran en los puntos correspondicntes a la inedia mas/menos una desviacion Lipica (yr +o) e)Cualquier combinacién lineal de variables aleatorias normales se ajusta también al. modelo normal Con el fin de poder oblener prubabilidades asociadas a valores de una variable con distribucién normal se han construide tablas con. las areas ya calculadas y cuyo uso se basa en Ja aplicacion de un teorema que Namaremos feorema de tipificacién . Seguti este teorema, la probabilidad de los valores menores que une dado (0 area a izquierda de ese valor) en una distribucién normal es la misma que para el valor Upificade en la normal estindar. a= Por eso las lablas se han construido s6lo para Ja distribucién normal estindar. Para obtener las areas asociadas a un valor de cualquier otra distribucién normal basta con tipificar ese valor y acudir con la z obtenida a la tabla correspondiente. Resumiendo donde lo Segun el feorema de tipificacién pata variables normales Sia) YoM(p,0),y b) formamos la variable 2; = (\j- 4/0 | entonces PUY N= Pte gz) donde 2» N(0,J) Para yeterimos a cualquier valor’concreto de la normal esténdar utilizaremos Ta letra zy a su dérecha cl-subindice correspondiente a Ia probabilidad acumulada para exe valor (0 area a izquierda), Asi Zoa7 = Odd porque segin la tabla P(e <0,44) = 0,67 (Cul ¢s,el valor de la probabilidad.acumulada (0 area a izquierda) para 1,46 on la distribucién normal ostandar? Segtin la tabla P@ <1,46)=0,9279 luego zpg2% = 1,46 Asi también y cualquier valor z con subindice menor de U5 send negative, por ejemplo: 29.9247 = 0,19 44 CUADRO 13.2 Ejemplos de obtencién de probabilidades asociadas a variables normales i Supongamas qus la variable Y s distribuye N'(50, 8), y queremas obtener las siguicotes probabilidades: al la de observar un va : como mucho jgual a $6; b) la de observer uo valor come minimo igual 2 $2,S, y ¢) la de observar un va 855, jor comprendido tnue 40.6 y ol En el primer caso ¢ tata de obtener Ia probabiddad acumulada del valor 56, ¥ pa clic basta con wpifear y acudis con ese valor tipificado a ta tabla dz l2 nonmal Esta nos proporciona directaspevte Jas Areas izquierdas. Es decir unnana dado que 50 6] En el segundo caso se trata dé obtener el complementasio dt la probabilidad acumula- G2 del valor 52,8. Una via para elo consiste én hallar 1a ‘acumulada del valor 52,8 por e! procedimicato descrito ep el apartado a}, y después restarla de Ii es decir. = 1 = P22 < 0,35) = 1 ~ 0.6368 = 0.3632 cl En el tercer caso se trata dé obtener ¢) area acotada éntré los valores 40.8 y 48.3. Tal y como vimos en ¢) capitulo avterior, #] procedimiento mds apropiade para ello consiste en hallar Ja diferencie tore la probabilidad acuipulade dei vaior mayor y Ja del vaior menor: es decir, PIAS < X < 4835) = CUADRO 133 Ejemalos ds objenciin &e ias'pur uaciones de una variadie normal con prooabiti¢ntes concretas asociadas Supongamos dz nuevo que la variable ¥ se dis valores de esta variable pare los cuales para el que Ja probabil aquel para ef q stribuye N(S0. §) y quetemos obtener los ¢ curnplen las dad de observa? un guienles condiaones: a) aquel wor como mucho igual 2 él es 0.1736: A) = Ja probabilidad de observar un valor como minime igual a éi ¥ 08207, y 6) aquellos Gos valores que acoien cl SQ por 100 central del dre 9) Encl primer caso s: Wata de obtener el valor que Geja un area 2 su izauicrda igual 2 0.1736, Por él teorema de tipificacion, y acudiendo a la tabla. comprobainos que Se trata de} valor cuya tipica sea igual 2 0.94 Basté con destipificar ese valor con especto aia media y Ja desviacidi tipica oe Ja distribucion Zariae = —0,94 despejando, ~0.94-8 4 50 4) Enel segundo caso se trata de obtener +l valor que deja un area a su dtrecba ivual 2°0.9207, Como la tabla asocia a cada vaior su area izquierda, y dado que la puntuacién gue dee a su derecha un arez igual a 0.9207 es el mi Youierda un valor igual a} -- 0.9207 dad ém la t 0 gue deia eau + 0.0793, buscamos tste valor de provabiii. abla y aplicamos cl mismo procedimiento aut antes x = 50 toors = ~ 1d) = ~1Al Sc itrata de obtener aquellas dos puntuncionss qut, tal y come apalecs en la figura, Gejen a sv izquierda y derech fespectivamente, areas iguales a 0.25. Seetio Ia Isola, esas puntuaciones tendrin como tipieas los valores 0.67 » 067, De mos Esos dos valores v obienttios Jo sipuients 0.50, TT 2o2$ = 0,87 = despsiando, » 0.25 067-8 + 30 = 4464 0.25 a . Oe my, 7 Dm, Forp = 067 dsspejande, 067-8 + 50 = 55.36 Uipidi X50 DISTRIBUCION DE LA MEDIA MUESTRAL La media y la varianza muestrates son estadisticos pues se calculan en funciéri de las observaciones muestrdles. Por tal motivo tienen un caracter variable ya que cada muestra de valores de una variable X afrojara un determinado valor medio y-variahza, EJEMPLO Consideremos la poblacién de los alumnos de la Catedra Il de Estadistica desde 1994 hasta la actualidad. Sean X = Calificacién de los alumnos en el primer parcial de estadistica 4, = promedio de todas las calificaciones en el primer parcial. «° = varianza de las calificaciones. Supongamos que }1 =.6,5 y que sorteamos 100 calificaciones para una muestra de fa que obtendremos el prdmedio. No sabemos cual sera pero podemos intuir que no sera un valor tan alto como 9 0 tan bajo come 3. Es decir que ciertos valores de la media muestral son “poco probables” de ser observados si la media poblacional es un determinado valor. Hablar de valor "poco probable" para la media muestral, la varianza muestral o cualquier estadistico implica que tiene sentido pensar en una cierta distribucién de probabilidades para tales estadisticos. Preguntas para el alumno: Si la media poblacional es 6,5 1) Qué medias les parece que son mas probables de ser observadas en muestras de 100 calificaciones? Respuesta, Seran mas probables medias muestrales préximas ala media poblacional 6,5 y menos probables las mas distantes. 2) {Qué variable es “mas variable" X 0 X? Respuesta, X es mas variable que X ya que el promediar los valores muestrales tiene el efecto de “empareiarlos”. Por tanto, parece razonable esperar una dis muestral del siguiente tipo: J. 65 10 Valores de X vibucion para la media Esto se formaliza en el siguiente \ TEOREMA CENTRAL DEL LIMITE Si X es una variable, 11 la media de todos sus valores y s su varianza co, la media X de muestras de n observaciones tiene distribucién aproximadamente normal con la misma media jy la n-6sima parte de la varianza, La distribucion de X serd tanto mas normal cuanto mayor sea el tarmafio de la muestra. [> laces de® Por tanto, estandarizando X se liene que Xen tiene, aproximadamente, distribucién normal esténdar. oldn siya @s el desvio estandar de X, Cuando o no se conoce se reemplaza por su estimador s' (el cuasi desvio estandar ) y se obtiene s'/vn que se denomina "error estandar dle X’ Cuando X se estandariza utiizando su error estandar, su distribucién -suponiendo que X sea normal- sigue otro modelo llamado t de Student con n-1 grados de libertad Esta distribucién es similar a la normal en cuanto a la forma acampanada pero tiene mas varianza. Cuanto mayores son los grados de libertad mas se asemejan ambos modelos, 4 oO pose de ihe doc ix ur INFERENCIA ESTADISTICA Consiste en extraer conclusiones acerca de las poblaciones a partir de muestra, conelusiones que no son certeras sino que estén asociadas a algtin grado de confianza o de probabilidad de error. Entre los métodos de inferencia estadtistica se encuentran * la estimacién de parametros por intervalos de confianza las pruebas 0 contrastes de hipstesis. PRUEBA © CONTRASTE DE-HIPOTESIS Una hipétesis estadistica es una afirmacién referida a la distribucién de probabilidades de una o més veriables, ya sea en cuanto a su forma, ya ‘sea en cuanto a sus pardmetros. Ejemplos de hipétesis estadiisticas. 1. Los puntajes en un test de habilidades numéricas se distribuyen normalmente entre los alunos del tiltimo afio de la EGB. 2. El puntaje medio de los alunos en dicho test es de 60 puntos. En simbolos jt = 60. 3. Més del 70% de los alunos tiene un puntaje superior a 45 puntos, 11>0,70, No hay que confundir hipétesis estadistica con una_hipétesis cientifica en general. Una hipdtesis cientifica es una afirrnacién que se formula eri el marco de una teoria, generalmente para dar una solucion provisional a problemas que se plantean én el seno de la misma, y es verificable empiricamente; esto es, que debe ser contrastada con la experiencia. Una hipdtesis cientifica puede 0 no ser susceptible de ser formulada en términos estadisticos. Si io ¢s, puede ponerse a prueba mediante el pracedimiento llamado prueba de hipétesis. Ejemplo Hipétesis cientifica; Determinado programa de entrenamiento es eficaz para mejorar el desempefio en cierto tipo de tareas numéricas, Hipétesis estadistica: el puntaje medio de los sujetos en un test de habilidades numéricas aumenta después de recibir el entrenamiento. En simbolos: —jiy> Hg” donde jg y Ite son las medias de fos puntajes después del entrenamiento y antes respectivamente. Las pruebas o contrast#s de hipdtesis son procedimientos que proporcionan un ariterio, basado en la observacién muestral, de decision acerca de la “tazonabilidad” de una hipétesis estadistica, Mediante un contraste de hipdtesis no se “demuestra” la verdad de una hipétesis sino que se decide si fos datos observaos son consistentes con ella (no la - a 4 contradicen) 0 dan suficientes indicios en contra de odo que lo mas tazonable es rechazarla. Resumiendo Un contraste de hipétesis es un proceso de decisién en el que una hipétesis formulada en términos estadisticos es puesta en relacién con los datos empiricos para determinar si es o no compatible con ellos Todo contraste de hipétesis se basa en la formulacién de dos hipdiesis 1. La hipétesis nula, representada por Ho 2. La hipétesis alternativa, representada por H). Estas hipotesis deben ser mutuamente excluyentes y colectivamente exhaustivas; es decir, que una y sdlo una es verdadera En el ejemplo anterior la hipotesis nula afirmaria que no hay diferencia entre los puntajes de los sujetos antes y después del entrenamiento, lo que podria interpretarse como que el efecto de dicho entrenamiento es nulo. Lo que interesa es contrastar esta hipotesis con la alternativa: el puntaje aumenta en promedio después del examen. Ho: Ha = fa He ba > fla El procedimiento proporcionara un criterio para decidir sia partir de lo observado en una muestra se rechdza la hipdtesis nula y, por consiguienle se acepta [a alternativa o si los datos muestrales no da suficiente evidencia en contra de la hipdtesis nula, por lo que se la Basicamente, el criterio se fundamenta en el siguiente razonamiento Suponiendo que sea verdadera la hipétesis nula es “poco probable” observar ciertos resultados muestrales. Si al tomar una muestra se observa uno de tales resultados, puede deberse a: * que ocurrié algo que era poco probable de ocurrir. que la hipétesis nula no es verdadera Pregunta para los alumnos: {Por cual de las dos opciones se inclinarian? Respuesta: Cuando en la vida_nos encontramos ante situaciones en las que tenemos que arriesgarnos a una decisién bajo incertidumbre. nos parece que es mas razonable pensar que se partié de una hipotesis falsa antes que pensar que ocurrié algo que tenia baja probabilidad de ocutrir. 0. Ejemplo no estadistico, Federico es un chico que ha mostrado ser lo suficientemente capaz como para fener un desemperio escolar satisfactorio. Sin embargo en los Uiltimos tiempos el futbol, pasin compartida con su mejor amigo, lo ha absorbicio y sus calificaciones dejan bastante que desear. Ha prometido a su madre mejorar en adelante reuniéndose con su amigo a estudiar con mas dedicacién. Sin embargo los resultados fueron negativos a pesar de lo cual 6! asegura que con su amigo ha estudiada mucho. Qué pensarian en lugar de la mama de Federico? Si hubiera estudiado y bajo la informacién disponible (p.ej. se sabe que la maestra no tiene ahimosidad contra Federico; ni es arbitraria y la prueba es de nivel adecuado, etc.) es muy poco probable que un chico de su capacidad que se retine asiduarnente a estudiar obtenga resultados tan magros, luego: 0 bien estudid pero ocurrié algo muy poco probable: fracasé o bien no se reunia para estudiar Parece razonable optar por lo segundo. Consecuencias que pueden seguirse de las decisiones tomadas: Hp Verdacera Ho Falsa Se rechaza Ho Error de tipo | Decisién correcta Nose rechaza Ho Decision correcta Error de tipo Il La Ho se rechazaré equivocadamente cada vez que oaurra uno de fos resultados que son “poco probables” de ser observados cuando es verdadera por lo que es poco probable cometer el error de tipo |. Esta expresién “poco probable"debe ser precisada: suele considerarse poco probable 0,01; 0,05; 0,10. Esta probabilidad de cometer error de tipo | se denomina nivel de significecién de la prueba. y se anota con la letra a. La probabilidad de combter error de tipo I! se designa con al letra (} y 1-8 es la potencia de la prueba’y designa la probabilidad de rechazar la hipdtesis nula cuando es false. $4

También podría gustarte