Está en la página 1de 11

Variabilidad Unidad 1

Unidad 2 Unidad 4

tiene sentido por que existe


Constructo Unidad 3 Unidad 5

Permite determinar el nivel de significación en


Variable
modelizada
Variable Distribución con Distribuciones de Permite asignar
observable de frecuencias Probabilidades confianza en

Susceptible de

representada
resumida en
permite el
Conjunta

por
estudio de
Estimación por
Relación entre ESTADÍSTICA Intervalos de
variables Confianza
Medición Gráficos

aludida
como
Medidas Posición,
Tendencia Central,

de la que se
Escalas Variabilidad y

obtienen
otras.
DESCRIPTIVA organiza, resume, analiza utiliza INFERENCIAL
Datos
Puntajes Matriz

de
Muestra es parte de Población
UNIDAD 4 de

caracterizan
proporciona
Grupo Individuos Toma de decisiones:
Normativo Pruebas de Hipótesis

a la
Primera Parte

generan
Métodos de

Propor-
muestreo

ciona
Estadísticos Valores Parámetros
Baremos permiten inferir sobre

Modelización La noción de distribución de frecuencias de una variable


Variables Bernoulli y Binomial estadística, la información que este concepto brinda acerca de
La distribución Normal valores destacados de la variable, acerca de sus medidas de
Las distribuciones c2 (Ji cuadrado) y t de Student tendencia central y de su variabilidad es fundamental en el
tratamiento de fenómenos que dependen de factores que no se
pueden conocer o controlar totalmente.

Los fenómenos resultan en parte imprevisibles y para aludir


a esta imprevisibilidad se apela al concepto de azar o
aleatoriedad.

172 ESTADISTICA I GALIBERT MATERIAL DE CATEDRA


En este marco de la aleatoriedad hay variables que siendo El hecho de que pueda salir cara o ceca al
de distinta naturaleza son similares en cuanto a su lanzar una moneda o elegir inscribirse en la
distribución de frecuencias como lo ilustran estas dos
comisión A o B de trabajos prácticos sin que se
ejemplos sencillos:
tenga ninguna información previa y, por tanto,
¿Qué resultará de lanzar una moneda al aire (equilibrada)
ninguna preferencia hacia alguna de ellas hace
o de elegir una comisión entre dos posibles en el mismo
horario (sin tener recomendación ninguna)? pensar en la existencia de un modelo de asignación
de frecuencias relativas esperadas o teóricas que
Lado de la moneda cara ceca Comisión elegida A B

Frecuencia relativa 1/2 1/2 Frecuencia relativa 1/2 1/2


describe ambas situaciones y otras similares.
esperada esperada

➢Un modelo es una construcción teórica, una formulación


simplificada de la realidad que es útil para comprender ciertos
aspectos de la misma, facilitar su análisis e interpretación, ➢ En una variable discreta, la probabilidad de cada valor se
arribar a conclusiones e, inclusive, hacer predicciones. interpreta como la medida de la posibilidad de que dicho
valor sea observado. En los ejemplos presentados ½ es la
➢Así, un modelo para una variable es una distribución de medida asignada tanto a la posibilidad de que un alumno
frecuencias relativas teóricas llamadas probabilidades. A la elija la comisión A como de que salga cara cuando se
variable vinculada con experiencias en las que interviene el arroja una moneda.
azar se la denomina variable aleatoria, aunque en lo sucesivo
se hablará simplemente de variable. ➢ Las características de la variable empírica u observada
tales como media, varianza, etcétera pueden definirse en
➢Dichas probabilidades no provienen de la observación directa el modelo para la variable.
de un hecho realizado sino que son postuladas a partir de la
experiencia previa o de ciertas condiciones teóricas. En el
ejemplo de la moneda estamos suponiendo que es idealmente
equilibrada.

173 ESTADISTICA I GALIBERT MATERIAL DE CATEDRA


Hay modelos de probabilidad para variables discretas y Gráficamente:
para variables continuas. Función de Curva de la
Probabilidad Función de
La diferencia esencial entre ambos casos es que, Puntual Densidad de
mientras que en las variables discretas las probabilidades se Probabilidad
concentran en puntos individuales: cada punto se lleva un
“pedacito” de la probabilidad total que es 1, en las continuas
cada punto aisladamente “no se lleva nada” sino que la
probabilidad total de 1 “se desparrama” a lo largo de todo un
intervalo de valores de números reales (un continuo), de modo
que la probabilidad de cada punto individualmente considerado
es cero. En síntesis: en los modelos de probabilidad para
variables discretas las probabilidades son de los puntos y en las Caso Discreto Caso Continuo
continuas de los intervalos.

Un modelo para una variable discreta consiste en una Función de Un modelo para una variable continua consiste en una función cuya
gráfica es una curva que encierra un área total igual a 1. Las probabilidades
Probabilidad Puntual, que se exhibe en una tabla totalmente análoga a
que se le asignan a los intervalos son las áreas bajo la curva sobre el
la de distribución de frecuencias relativas o se genera a partir de una
intervalo.
fórmula. A cada valor 𝑥𝑖 se le asigna su correspondiente probabilidad. La función de se denomina Función de Densidad de Probabilidad f(x)
➢ P(X = xi) es la probabilidad de que la variable X tome el valor xi. y sus propiedades son:
➢ Las probabilidades asignadas a los valores de la variable verifican las
propiedades de la frecuencia relativa, a saber:
➢ f(x)  0 xR

0 ≤ P(X = 𝑥𝑖 ) ≤ 1 Es un número no negativo y menor o igual a 1.


➢‫׬‬−∞
+∞
𝑓 𝑥 𝑑𝑥 = 1

σ𝑛𝑖=1 P(X = xi) = 1 La suma de todas las probabilidades es 1. ➢𝑃 𝑏


𝑎 < 𝑋 < 𝑏 = ‫𝑥𝑑 𝑥 𝑓 𝑎׬‬

174 ESTADISTICA I GALIBERT MATERIAL DE CATEDRA


Los resúmenes estadísticos que se computan a partir de
una tabla de frecuencias también se pueden considerar en un Bernoulli de Parámetro p
DISCRETAS
modelo de probabilidad. Binomial de Parámetros n y p
Son de particular interés la media y la varianza porque
Normal de Parámetros  y 
modelizan los correspondientes parámetros poblacionales.
t de Student CONTINUAS
➢La Media en el modelo es llamada la Esperanza de la variable
Ji Cuadrado: c2
y se simboliza con E(X) o también con .
➢La Varianza se expresa con V(X) o con 2 .

Una variable se distribuye según el modelo Bernoulli ▪ El resultado del análisis clínico de un paciente si es registrado
cuando toma sólo dos valores. como positivo o negativo. Así, la estructura de una tabla que
representa la distribución de probabilidades de una variable
Estos dos valores se denominan “éxito”, que se codifica Bernoulli es:
con 1 y “fracaso”, que se codifica con 0. La probabilidad
asignada al éxito se denota con “p” y la de fracaso con q = 1-p . Valores 𝑥𝑖 𝑑𝑒 𝑋 1 0
Notación: X  B(p) 𝑃(𝑋 = 𝑥𝑖 ) 𝑝 𝑞 = 1−𝑝
➢Ejemplos: 1 → éxito P 𝑋 = 1 = 𝑝 → Probabilidad de éxito
▪ La cara que queda hacia arriba al arrojar una moneda arroja 0 → fracaso P 𝑋 = 0 = 1 − 𝑝 → Probabilidad de fracaso
dos resultados cara o ceca.
෍ P 𝑋 = 𝑥𝑖 = P 𝑋 = 1 + P 𝑋 = 0 = 𝑝 + 1 − 𝑝 = 1
▪ La respuesta de un sujeto a un ítem, cuando es evaluada como 𝑖
correcta o incorrecta.
Observación: una variable Bernoulli queda totalmente caracterizada
▪ El resultado de un alumno en un examen, cuando se lo clasifica conociendo el parámetro 𝑝; es decir, la probabilidad de éxito o
en aprobado o desaprobado. equivalentemente, la probabilidad de fracaso.

175 ESTADISTICA I GALIBERT MATERIAL DE CATEDRA


Una variable sigue un modelo de probabilidad Binomial de
parámetros n, p (y se denota X  B(n,p)) si cuenta la cantidad de éxitos
que ocurren en 𝑛 observaciones de una variable Bernoulli de parámetro Se lanza 3 veces una moneda al aire y se registra el
𝑝, que son independientes y con la misma probabilidad de éxito 𝑝. número de veces que sale cara en los 3 lanzamientos.

▪ Losvalores de una variable binomial son 0, 1, 2, … , 𝑛, es decir, el El resultado obtenido en cada lanzamiento puede
recorrido de dicha variable consta de n+1 valores.
considerarse una variable Bernoulli con probabilidad de
▪ Las probabilidades asociadas a cada uno de los valores de la variable éxito ½. Luego, la variable “Cantidad de caras en 3
Binomial resultan de la aplicación de la fórmula:
𝑛 𝑥
lanzamientos de la moneda” es una variable Binomial
𝑃 𝑋 = 𝑥𝑖 = 𝑝 𝑖 (1 − 𝑝)𝑛−𝑥𝑖
𝑥𝑖 de parámetros 𝑛 = 3 y 𝑝 = 1/2.
Los cómputos a partir de dicha fórmula son facilitados por las
aplicaciones o softwares que devuelven la probabilidad informándoles
los parámetros.

Una prueba consiste de 10 ítems de elección múltiple ➢ Condición de Estabilidad: la probabilidad de éxito
debe permanecer constante en las n observaciones de la
con 5 opciones, donde sólo una es correcta. La variable Bernoulli.
probabilidad de responder correctamente cada ítem En el primer ejemplo la probabilidad de que salga
por azar es 1/5. La respuesta a un ítem calificada cara en cada lanzamiento de la moneda es ½.
En el segundo ejemplo la probabilidad de responder
como correcta o incorrecta es una variable Bernoulli.
correctamente cada uno de los 10 ítems es 1/5. Si en algún
Entonces la variable “Cantidad de respuestas correctas ítem se modificara la cantidad de opciones; por ejemplo,
en lugar de ser cinco, fueran tres las opciones de
por azar entre los 10 ítems” sigue el modelo Binomial respuesta, la probabilidad de éxito cambiaría y no se
de parámetros 𝑛 = 10 y 𝑝 = 1/5= 0,20. mantendría la condición de estabilidad.

176 ESTADISTICA I GALIBERT MATERIAL DE CATEDRA


Si se considera la variable del segundo ejemplo que
cuenta la cantidad de ítems correctamente respondidos por
➢ Condición de Independencia: la probabilidad de azar entre los 10 presentados es, según se afirmó, Binomial
obtener éxito en una observación no aumenta ni de parámetros 𝑛=10 y 𝑝 = 0,20; en símbolos X~B(10;0,20).
disminuye si se conoce el resultado de otra observación. Los valores de X son: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10.
La probabilidad de que salga cara en la tercera
tirada no cambia si se sabe que en los lanzamientos La asignación de probabilidades a los valores de una
anteriores salió cara, por ejemplo. variable con distribución Binomial de parámetros 𝑛 y
𝑝, puede efectuarse con aplicaciones como, por ejemplo,
La probabilidad de responder correctamente un Probability Distributions o EXCEL, entre otras.
ítem, por ejemplo el quinto, no varía si se sabe que el
ítem anterior se contestó mal.

177 ESTADISTICA I GALIBERT MATERIAL DE CATEDRA


X~ Probabi- Probabi-
Sea X la cantidad de ítems correctamente B(10;0,20) lidad lidad Solución
respondidos al azar entre los 10 presentados. puntual acumulada
P(X = 𝑥𝑖 ) P(X ≤ 𝑥𝑖 ) a) P(X = 2) = 0,3020
X ~B(10;0,20)
Se quiere obtener la probabilidad de responder 0 0,1074 0,1074 Con los programas informáticos las probabilidades acumuladas se
a) exactamente 2 ítems bien. 1 0,2684 0,3758 obtienen de forma directa. Internamente, dichos programas tienen que sumar las
En símbolos: P(X = 2) 2 0,3020 0,6778
probabilidades individuales como se muestra a continuación:
b) a lo sumo 4 ítems bien. 3 0,2013 0,8791 b) P(X ≤ 4) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4) =
En símbolos: P(X ≤ 4) 4 0,0881 0,9672 = 0,1074 + 0,2684 + 0,3020 + 0,2013 + 0,0881= 0,9672
c) por lo menos 8. 5 0,0264 0,9936
En símbolos: P(X ≥ 8) c) P(X ≥ 8) = P(X = 8) + P(X = 9) + P(X = 10) = 0,0001 + 0,0000 + 0,0000 = 0,0001
6 0,0055 0,9991
d) más de la mitad bien. O también P(X ≥ 8) = 1 - P(X ≤ 7) = 1 - 0,9999 = 0,0001
10 7 0,0008 0,9999
En símbolos: P(X > 2 ) = P(X > 5) 8 d) P(X > 5) = P(X ≥ 6) = (P(X = 6) + P(X = 7) + P(X = 8) + P(X = 9) + P(X = 10)
0,0001 1,0000
e) entre 3 y 7 ítems (inclusive) bien. 9 0,0000 1,0000 = 0,0055 + 0,0008 + 0,0001 + 0,0000 + 0,0000 = 0,0064
En símbolos: P(3 ≤ X ≤ 7) 10 0,0000 1,0000 O también P(X > 5) = 1 - P(X≤ 5) = 1- 0,9936 = 0,9936
La probabilidad de X = 𝑥0 , en símbolos, P(X = 𝑥0 ), se denomina Para el siguiente caso hay que sumar las probabilidades individuales o
probabilidad puntual. La probabilidad acumulada hasta el valor 𝑥0 denotada por combinar mediante la diferencia de dos acumuladas:
P(X ≤ 𝑥0 ) es la suma de las probabilidades puntuales desde X = 0 hasta X = 𝑥0 .
e) P(3 ≤ X ≤ 7) = P(X = 3) + P(X = 4) + P(X = 5) + P(X = 6) + P(X = 7) =
La tabla precedente se puede generar con EXCEL o bien se puede sustituir
por el uso de Probability Distributions. = 0,2013 + 0,0881 + 0,0264 + 0,0055 + 0,0008 = 0,3221
O también P(X ≤ 7) - P(X ≤ 2) = 0,9999 - 0,6778 = 0,3221

a) P(X = 2) = 0,30199 b) P(X ≤ 4) = 0,96721 c) P(X ≥ 8) = 0,00008


Resúmenes estadísticos de una variable Binomial X de parámetros 𝑛 y 𝑝

Esperanza o Media de X :  = 𝑛 𝑝 Para X~B(10;0,20)


 = 10.0,2= 2
Varianza de X : 2 = 𝑛 𝑝(1- 𝑝) 2 = 10.0,2.(0,8)= 1,6
𝛼3 = 0,47
Coeficiente de Asimetría de X :
Distribución de Probabilidades para
cantidad de items correctos entre 10
1− 2 p
3 = 0,3500

np(1 − p) 0,3000
0,3020

Probabilidad puntual P(X)


0,2684

0,2500
0,2013
0,2000

0,1500
0,1074
0,1000 0,0881

0,0500 0,0264
0,0055 0,0008 0,0001 0,0000 0,0000
0,0000
0 1 2 3 4 5 6 7 8 9 10

X cantidad de ítems correctos entre 10

178 ESTADISTICA I GALIBERT MATERIAL DE CATEDRA


Es un Modelo de Variable Continua para la cual son más
Curva Normal (Campana de Gauss)
frecuentes los valores próximos a la media y menos frecuentes los
La ecuación de la curva (función de densidad de probabilidad) normal es:
valores alejados de ella.
1 𝑥−𝜇 2
−0,5
Ejemplos: cociente intelectual, extraversión, el razonamiento 𝑓 𝑥 = 𝑒 𝜎
2.  donde:
espacial y variables biológicas tales como el peso, la altura, la
fuerza, la agudeza visual.  y  son los  es la media poblacional
parámetros del  es el desvío poblacional
Histograma de áreas y Polígono de frecuencias Histograma de áreas y Polígono de frecuencias
Modelo Normal. e es el número irracional
2,71828....
250 150
Frec relativa / ancho del intervalo

Frec relativa / ancho del intervalo


 es el número irracional
2
200

100
3,14159....
150

100
50

-3 -2 -  + +2 +3


68,3 %
50

95,4 %
0 0 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
2 4 6 8 10 12 14 16 18
99,7 %
Variable X Variable X

Notación: X~𝑵(;2) en Bologna o también


X~𝑵(;); esta última, por ser la más
▪ Tiene un único máximo en x = , ➢Para cada par de valores  y  tenemos una curva normal
extendida, es la que utilizaremos en adelante. por lo que es unimodal siendo  la distinta, aunque existen características comunes a todas ellas.
Moda.
Donde  = E(X) y 2 = V(X) ▪ Es simétrica respecto del eje
De todas las curvas normales
vertical x = ; por eso  es la
se destaca la que tiene media
Mediana.
cero y desviación estándar
▪  es también la Media de la
X3~ 𝑁 𝜇3 , 𝜎3 uno. Se denomina Normal
2 distribución.
X1~ 𝑁 𝜇1 , 𝜎1 Estándar y se simboliza
Z ~ 𝑁 0,1
Por tanto en  coinciden Media,
Mediana y Moda.
-3 -2 -  + +2 +3
▪ Tiene dos puntos de inflexión,
68,3 % X2~ 𝑁 𝜇2 , 𝜎2
donde cambia la concavidad, en
95,4 % =1
99,7 % los puntos correspondientes a la
media más/menos una desviación
Características de la curva normal de parámetros  y 
estándar: en x = - cambia de
▪ Se acerca asintóticamente al eje de abscisas tanto por cóncava hacia arriba a cóncava 𝜇1= 𝜇2 𝜇3
=0 Puntaje Z
la derecha como por la izquierda sin llegar a cortarlo. hacia abajo. En x = + cambia de
cóncava hacia abajo a cóncava A la variable normal estándar
▪ El área total bajo la curva indica la probabilidad hacia arriba. 𝜇1= 𝜇2 < 𝜇3 𝜎1 < 𝜎2 𝜎1 = 𝜎3 se la simboliza con Z
correspondiente a la totalidad de los valores y vale 1. (mayúscula) y a sus valores
Bajo la curva normal están comprendido el 100% de los  es la Desviación Estándar. con 𝑧𝑖 (minúscula)
casos.
179 ESTADISTICA I GALIBERT MATERIAL DE CATEDRA
▪ La probabilidad asignada a un intervalo de valores de X es el área debajo de la curva
normal que se apoya sobre dicho intervalo.
▪ De todas las curvas normales, se han calculado las áreas de la normal estándar. A partir El Cociente Intelectual se distribuye normalmente en la
de estas áreas se pueden conocer las probabilidades asignadas a cualquier intervalo de
valores de una variable normal X con media  y desviación estándar .
población general con una media de 100 y una desviación
estándar de 15.
X~𝑁(;)
P(X ≤ 𝑥𝑖 ) = P(Z ≤ 𝑧𝑖 )
Z ~ 𝑁 0,1
Hallar
a) El porcentaje de la población con un CI superior a 110.
b) La probabilidad de que una persona elegida al azar tenga
𝑥𝑖  𝑧𝑖 0
un CI inferior a 95.
Los programas informáticos la utilizan internamente para computar las probabilidades c) El porcentaje de la población con un CI entre 85 y 115
que el usuario requiere, dándoles como entrada los valores de  y de . lo hacen (menos de una desviación estándar de la media).
mediante la transformación que se indica en el siguiente teorema.
d) El porcentaje de personas con CI entre 110 y 120.
Teorema de la tipificación para variables normales. e) El CI mínimo de una persona que pertenece al 2% de
Sea X~𝑁(;) y sea 𝑧𝑖 = (𝑥𝑖 - )/ entonces P(X ≤ 𝑥𝑖 ) = P(Z ≤ 𝑧𝑖 ) donde Z ~ 𝑁 0,1 mayores CI de la población.
es la normal estándar.
Esta propiedad se muestra gráficamente en las figuras de arriba.

X = Cociente Intelectual (CI) de una persona elegida al azar de la X = Cociente Intelectual (CI) de una persona elegida al azar de la
población general. población general.
X N(100,15)
Hallar X N(100,15)
a) El porcentaje de la población con Hallar
un CI superior a 110. b) La probabilidad de que una
Hay que hallar P(X > 110) y persona elegida al azar tenga
multiplicarla por 100. un CI inferior a 95.
En la App Probability se elige la Hay que hallar P(X < 95)
distribución Normal, se indican los
parámetros, se pone x = 110 y se elige En la App Probability se pone x = 95, se
la primera ventana y se lee la elige la segunda ventana y se lee la
probabilidad a la derecha (puede probabilidad a la derecha. En este caso
redondearse a 4 decimales). En este es 0,36944.
caso es 0,25249.
Respuesta: La probabilidad es 0,3694
Respuesta: 25,25% de la población
tiene un CI superior a 110.

180 ESTADISTICA I GALIBERT MATERIAL DE CATEDRA


X = Cociente Intelectual (CI) de una persona elegida al azar de la X = Cociente Intelectual (CI) de una persona elegida al azar de la
población general. población general.
X N(100,15) X N(100,15)
Hallar Hallar
c) El porcentaje de la población con un CI entre 85 y d) El porcentaje de personas con CI entre 110 y 120.
115 (menos de una desviación estándar de la Corresponde al área bajo la curva entre 110 y 120.
media).
Hay que hallar P(85<X<115), lo cual es equivalente a
P(-1<Z<1). Por tanto pueden utilizarse cualesquiera de
las dos. La App abre por default la Z, ya que entra con Para hallarla es necesario hacer la
=0 y =1, con lo cual se puede aprovechar la diferencia entre las dos
estándar para no ingresar los parámetro 100 y 15. probabilidades acumuladas hasta
En este caso se trata de un intervalo simétrico con 120 y 110:
respecto a cero y la tercera opción da la probabilidad P(110<X<120)=P(X<120)–P(X<110)=
de las colas; por lo que se puede utilizar y restar a 1 = 0,90879 – 0,74751 = 0,16128
así:
P(-1<Z<1) = 1 – 2P(Z>IzI) (En la aplicación aparece X
Respuesta: 16,13%
en lugar de Z porque no hace la diferencia de
notación).
P(-1<Z<1) = 1 – 0,31731 = 0,68269
El 68,27% de la población tiene un CI entre 85 y 115.

X N(100,15)
Hallar Otro modelo de variables por ser utilizado en este curso
e) El CI mínimo de una persona que para variables continuas será la distribución Ji Cuadrado
pertenece al 2% de mayores CI de
la población. (𝝌𝟐 ).
Es un problema inverso a los Entre sus varios usos se destacan:
anteriores: se da una probabilidad
(dato que se carga en la ventana de la ➢Inferencia sobre una varianza
derecha) y se pide obtener el valor de ➢Test de bondad de ajuste
la variable, percentil, que el programa
devuelve en la ventana de la ➢Test de independencia
izquierda.
Sus probabilidades se buscan con programas estadísticos.
Debe hallarse el percentil 98. Es decir,
el valor de la variable que supera al A diferencia de la distribución normal, la 𝜒 2 no es
98% y es superado por el 2%. Por tanto simétrica. Uno de los parámetros de los que depende son
pueden usarse tanto la segunda
ventana con P(X≤x) = 0,98 o la primera los “grados de libertad” que, en los problemas aplicados,
con P(X≥x) = 0,02. están en relación con el tamaño de muestra.
El cociente intelectual mínimo para
pertenecer al 2% de mayores CI es, 181 ESTADISTICA I GALIBERT MATERIAL DE CATEDRA
redondeado a un valor entero, 131.
Es similar a la normal estándar: simétrica con respecto a cero pero
Distribución Ji (Chi) Cuadrado con n grados de libertad :
con más varianza, más “cargada en las colas”.
X  𝝌𝟐
Depende del parámetro n, los grados de libertad que, cuanto mayor
es, la curva se asemeja más a la Normal.
Se utiliza para hacer inferencias sobre una media, sobre una
n = 1 diferencia de medias y sobre parámetros de regresión.
n = 2
n = 3
n = 4
n = 5

182 ESTADISTICA I GALIBERT MATERIAL DE CATEDRA

También podría gustarte