Está en la página 1de 36

ALGUNOS TEMAS DE

ESTADÍSTICA
Recordando lo aprendido

Compilación de temas básicos de estadística


Encontrará una compilación de temas básicos de estadística que le ayudarán en su curso actual

marivasq@ucab.edu.ve
María Carolina Vásquez

Algunas distribuciones de  Distribución uniforme discreta


 Distribución binomial
probabilidades discretas  Distribución Poisson

¿Cómo se obtuvieron? Existen muchas otras, sin embargo, se


focalizará la atención en estas tres (3) por
Cualquier distribución de probabilidades, su importancia y utilidad.
bien que describa el comportamiento de
una variable aleatoria discreta o continua, ¿Cómo se diferencian?
tiene asociado un experimento aleatorio,
que dio origen al espacio muestral y por Las distribuciones de probabilidades, están
ende a sus sucesos elementales. definidas por “parámetros” que hacen que,
una distribución de una mismo tipo, sea
Las distribuciones de probabilidades, diferente a otra, de ese tipo.
pueden representarse bien, de forma
gráfica, mediante un histograma de Así mismo, dependiendo del tipo que se
frecuencia o bien, de forma analítica trate puede tener uno (1) o varios
mediante una función matemática f(x) que parámetros para definirla.
describe la relación entre la variable
aleatoria y su probabilidad. Distribución de probabilidades
La probabilidad representada en los uniforme discreta
histogramas de frecuencias coincide con la La distribución de probabilidades uniforme
frecuencia relativa, para el valor discreta, es una de las distribuciones más
correspondiente de la variable aleatoria. sencillas que existe, sin embargo, permite
Así mismo, se puede representar la describir muchos sucesos.
frecuencia relativa acumulada, o lo que es Por ejemplo, para el experimento aleatorio
lo mismo, que la probabilidad acumulada “lanzamiento de un dado”, definiendo la
de la variable aleatoria X, hasta un valor variable aleatoria X=”valor en la cara
dado 𝑥𝑖 ; constituyendo la función de superior del dado”; la distribución de
distribución acumulada F(X). probabilidades que se obtiene es una

Existen millones de distribuciones de Distribución uniforme discreta


probabilidades, sin embargo, unas pocas Sea una variable aleatoria discreta X que
representan muchos de los sucesos que toma los valores:
ocurren en la vida diaria.
𝑋 = 𝑥1, 𝑥2 , 𝑥3 , 𝑥4 … … 𝑥𝑘
Dentro de las distribuciones de
probabilidades discretas que describen
Con idénticas probabilidades 1/k, se dice
muchos sucesos más comunes, se
entonces que la distribución de
encuentran:

1
María Carolina Vásquez

probabilidades está definida por el La varianza se calcula como la diferencia


parámetro k, tal que: cuadrática de cada valor xi con respecto a
la media o esperanza matemática,
1 multiplicada por la correspondiente
𝑓(𝑥, 𝑘) = para 𝑥1, 𝑥2 , 𝑥3 , 𝑥4 … … 𝑥𝑘
𝑘 probabilidad 1/k, quedando la expresión
como:
En este caso al denotar la función como
f(x,k) se está expresando que depende del 𝒌
𝟏
parámetro k, debiendo siempre ser mayor 𝑽𝒂𝒓(𝒙) = 𝝈𝟐 = ∑(𝒙𝒊 − µ)𝟐
𝒌
que cero; ya que, la probabilidad para 𝒊=𝟏

cualquier variable aleatoria se encuentra


Para el ejemplo del lanzamiento de un
entre 0 y 1.
dado, la media y la esperanza serían:

Al representar gráficamente el histograma 𝟏+𝟐+𝟑+𝟒+𝟓+𝟔


µ= = 𝟑, 𝟓
de frecuencias de esta distribución queda 𝟔
de la siguiente forma: 𝟏
𝝈𝟐 = [(𝟏 − 𝟑, 𝟓)𝟐 + (𝟐 − 𝟑, 𝟓)𝟐 + ⋯ . ]
𝟔
= 𝟐, 𝟗𝟐
Distribución de probabilidades
f(x,k)=1/k uniforme discreta
Distribución de probabilidades
Binomial
La distribución de probabilidades binomial
x1 x2 x3 xk es la representación de las probabilidades
Gráfico 1. Distribución uniforme discreta para una variable aleatoria discreta,
denominada “binomial” que resulta de
Media y varianza de una distribución repetir “n” veces un
uniforme discreta
La media o esperanza matemática para una
Experimento Bernoulli
variable aleatoria discreta viene dada por la
sumatoria de los valores que toma la
El experimento aleatorio de Bernoulli, es
variable aleatoria, multiplicado por la
aquel que tiene dos posibles resultados:
probabilidad de ocurrencia de cada valor xi,
de la variable aleatoria discreta: Éxito
Experimento
𝒌 Bernoulli
𝟏 Fracaso
𝑬(𝒙) = µ = ∑ 𝒙𝒊
𝒌
𝒊=𝟏 Figura 1. Resultados de un experimento Bernoulli

2
María Carolina Vásquez

La repetición de “n” veces el experimento Será una variable binomial si cumple las
de Bernoulli, se denomina: propiedades de un proceso Bernoulli. El
objetivo de esta distribución de
𝑷𝒓𝒐𝒄𝒆𝒔𝒐 𝒅𝒆 𝑩𝒆𝒓𝒏𝒐𝒖𝒍𝒍𝒊 probabilidades, es conocer la probabilidad
que se produzca cierta cantidad de éxitos.
El proceso de Bernoulli tiene las siguientes
propiedades: Por ejemplo, se lanzan cinco (5) monedas;
 Experimento aleatorio que tiene dos existiendo dos (2) posibles resultados
posibles resultados, por lo que su
espacio muestral sería
Lanzar una moneda
Ω = {é𝐱𝐢𝐭𝐨, 𝐟𝐫𝐚𝐜𝐚𝐬𝐨}
 Se realiza “n” veces
 La probabilidad de tener éxito se denota Cara Sello
como “p” y de fracaso como “q”, siendo
una el complemento de la otra; por lo Figura 2. Resultados del lanzamiento de una moneda
que q=1-p
 Los ensayos que se realizan “n” veces Los resultados del experimento son dos (2):
son independientes cara o sello, que son incompatibles y
complementarios entre sí. El experimento
A partir del proceso de Bernoulli se puede se está repitiendo n veces y las
definir para una variable aleatoria binomial probabilidades de cada posible resultado
pueden ser definidas como p y q=1-p.
𝑿 = 𝒄𝒂𝒏𝒕𝒊𝒅𝒂𝒅 𝒅𝒆 é𝒙𝒊𝒕𝒐𝒔
Si se define la variable aleatoria
Al realizar “n” ensayos independientes, la X = Obtener cara
distribución de probabilidades binomial
Es posible afirmar entonces que, X se
que se denota como:
comporta según una distribución de
probabilidades binomial, ya que, cumple
Distribución Binomial con las condiciones necesarias que
𝒏
𝑩(𝒏, 𝒑) = 𝑷(𝑿 = 𝒙𝒊 ) = ( ) 𝒑𝒙𝒊 ∗ 𝒒(𝒏−𝒙𝒊 ) suponen las variables con este
𝒙𝒊
comportamiento.

Esta distribución es denominada binomial, Para este caso, la cantidad de posibles


no porque tenga dos (2) posibles resultados que se pueden obtener al lanzar
resultados, sino por el binomio de Newton, las cinco monedas, es equivalente a 𝟐𝟓 =
o número combinatorio. 𝟑𝟐; este resultado se podría obtener aún y
cuando, no se conociese el concepto de la
Para la variable aleatoria binomial se dice
distribución binomial.
que:
𝑿~𝑩(𝒏, 𝒑)

3
María Carolina Vásquez

Se podría utilizar un diagrama de árbol Luego, procediendo a su evaluación para


decir, se tienen dos (2) posibilidades, que se cada valor que toma X, se construye la
repiten 5 veces, de forma independiente. función de probabilidades o distribución de
Se puede construir un árbol par contar probabilidades; que permite obtener
estas posibilidades, luego se podrían cualquier probabilidad posterior que se
identificar los casos favorables de ese total requiera:
de casos, para así hallar la probabilidad que
se pide.
X B(xi,5,0.5)
Sin embargo, en muchos casos optar por
esta solución, podría no ser práctico, es por 0 1/32
ello que, es tan relevante el uso de la 1 5/32
distribución binomial; ya que, cumplidas las 2 10/32
condiciones referidas a:
3 10/32
 Dos (2) resultados excluyentes,
 Una probabilidad de éxito y fracaso 4 5/32
fijas 5 1/32
 Repetición n veces del experimento Tabla 1. Distribución binomial para el lanzamiento de cinco (5)
monedas
Permite encontrar las probabilidades de
éxito una cantidad dada de repeticiones La gráfica de la distribución de
menores a n. probabilidades tendría la siguiente forma:

Retomando la resolución del ejercicio, con


base en la distribución binomial, se tiene
que, posibles valores que puede tomar X,
serían:

X= 0,1,2,3,4,5

La distribución de probabilidades se
obtiene evaluando los posibles valores que
toma X, en:

𝟓 Gráfica 2. Distribución binomial de parámetros n=5, p=0,5,


𝑿~𝑩(𝒙𝒊 𝟓, 𝟎, 𝟓) = ( ) 𝒑𝒙𝒊 𝒒(𝟓−𝒙𝒊 ) correspondiente al lanzamiento de una moneda cinco (5) veces.
𝒙𝒊
Media y varianza de una distribución
El experimento se repite 5 veces, es decir binomial
n=5; la probabilidad de éxito p=0,5, por
Para una variable aleatoria con
ende la de fracaso será su complemento
comportamiento binomial, su esperanza
q=0,5.
viene dada por la expresión:

4
María Carolina Vásquez

Distribución de probabilidades
𝑬𝒔𝒑𝒆𝒓𝒂𝒏𝒛𝒂 𝑬(𝑿) = 𝒏𝒑 Poisson

Y su varianza está definida como:


Procesos Poisson
(Simeon Denis Poisson)
𝑽𝒂𝒓 (𝑿) = 𝝈𝟐 = 𝒏𝒑𝒒
Un proceso Poisson es un experimento
aleatorio en el que se observa la aparición
Propiedades de una variable aleatoria de sucesos puntuales (variable discreta)
binomial sobre un soporte continuo (variable
1. SI 𝑿~𝑩(𝒏, 𝒑) entonces, X es la suma de continua), estos soportes continuos
n variables Bernoulli, independientes de pueden ser del tipo: tiempo, longitud,
parámetro p superficie, entre otros.

Cumpliendo las siguientes condiciones:


2. Si 𝒙𝟏 , 𝒙𝟐 , 𝒙𝟑 , 𝒙𝟒 … … . . 𝒙𝒌 son variables
binomiales independientes entre sí, de 1. La cantidad de resultados que ocurren
parámetros 𝒏𝒊, , 𝒑 , para 𝒊 = 𝟏, 𝟐, 𝟑, … , 𝒌 , en un intervalo de tiempo, longitud,
entonces la suma de esas variables xi, es región o superficie, no depende de la
decir 𝒙𝟏 + 𝒙𝟐 + 𝒙𝟑 + ⋯ … . . 𝒙𝒌 tiene cantidad de resultados que ocurren
distribución binominal de parámetros fuera de él.
𝑩(𝒙𝟏 + 𝒙𝟐 + 𝒙𝟑 + ⋯ 𝒙𝒌 , 𝒏𝒌 , 𝒑)
2. La probabilidad que un suceso ocurra
3. Si 𝑿~𝑩(𝒏, 𝒑) entonces si se define otra en un “intervalo o región” muy
variable 𝒀 = 𝒏 − 𝑿 ~𝑩(𝒏, 𝟏 − 𝒑) pequeña es proporcional a la longitud
del intervalo o área de la región.
4. La distribución es simétrica, sí y solo sí
p=1/2, si p<1/2, existe asimetría a la 3. La probabilidad que ocurra más de un
derecha; es decir tiene una cola larga a resultado en un intervalo corto de
la derecha, y si p>1/2 existe asimetría a tiempo es “despreciable”
la izquierda.
Como consecuencia de las propiedades
5. La esperanza matemática para una anteriores, el promedio de sucesos por
variable binomial, se puede deducir a cantidad de tiempo o de soporte, se
partir de la propiedad 1, siendo igual mantiene constante y se denota por la letra
𝑬𝒔𝒑𝒆𝒓𝒂𝒏𝒛𝒂 𝑬(𝑿) = 𝒏𝒑 griega λ = lambda
6. La varianza para una variable aleatoria La variable aleatoria X que modela la
binomial es igual a 𝑽𝒂𝒓 (𝑿) = 𝝈𝟐 = 𝒏𝒑𝒒 cantidad de “sucesos” en una “unidad de
soporte“ para un procesos Poisson, tiene

5
María Carolina Vásquez

una distribución de probabilidades que se Propiedades de una variable aleatoria


denomina Poisson
Distribución Poisson 1. Para una variable aleatoria con
Se denota como 𝑿~ℙ(𝝀) con la siguiente comportamiento Poisson, su esperanza
función de probabilidades viene dada por la expresión:

𝝀𝒙𝒊 𝒆−𝝀 𝑬𝒔𝒑𝒆𝒓𝒂𝒏𝒛𝒂 𝑬(𝑿) = 𝝀


𝑷(𝑿 = 𝒙𝒊 ) =
𝒙𝒊 !
2. Y su varianza está definida como:

Se tiende a relacionar las variables 𝑽𝒂𝒓 (𝑿) = 𝝈𝟐 = 𝝀


discretas del tipo Poisson, con eventos por
unidad de tiempo, sin embargo, existen
3. Si 𝒙𝟏 , 𝒙𝟐 , 𝒙𝟑 , 𝒙𝟒 … … . . 𝒙𝒌 son variables
muchos casos descritos por este tipo de
Poisson independientes entre sí, de
distribuciones que no necesariamente la
parámetros 𝝀𝒊, para 𝒊 = 𝟏, 𝟐, 𝟑, … , 𝒌 ,
variable continua sobre la que se desplaza
entonces la suma de esas variables xi, es
la variable discreta, es tiempo.
decir 𝒙𝟏 + 𝒙𝟐 + 𝒙𝟑 + ⋯ … . . 𝒙𝒌 tiene
Por ejemplo, la cantidad de errores en una distribución Poisson de parámetro
base de datos puede considerarse una 𝒌
variable aleatoria del tipo Poisson, o la ∑ 𝝀𝒊
cantidad de defectos por metro de tela,
𝒊=𝟏
entre otros.

Por ejemplo, una distribución Poisson con Aproximación Poisson a la


λ=4, tiene una gráfica aproximadamente
distribución binomial
como esta:
Para una distribución binomial en la que el
Distribución Poisson λ=4
valor de “n” sea grande; podría ser
laborioso el cálculo de las probabilidades.

En estos casos es posible aproximar la


distribución binomial a través de una
distribución Poisson, debiéndose cumplir
las siguientes condiciones:
X1 X2 X3 X4 X5 X6 X7
Gráfica 3. Distribución de probabilidades Poisson λ=4
𝑿~𝑩(𝒏, 𝒑)

6
María Carolina Vásquez

Para la 𝒏 ≥ 𝟓𝟎 𝒚 𝒑 ≤ 𝟎, 𝟏 entonces se puede 3. Suponga que un comercio en el que se ha


aproximar a una distribución Poisson de estudiado el ingreso de clientes a la tienda,
parámetro λ=np encontrando que llega un (1) cliente cada
veinte (20) minutos.

(𝒏𝒑)𝒙𝒊 𝒆−𝒏𝒑 i. ¿Cuál es la probabilidad de que


𝑷(𝑿 = 𝒙𝒊 ) = lleguen cuatro (4) clientes en una
𝒙𝒊 ! hora?

ii. ¿De qué tipo de distribución de


Chequeando lo aprendido probabilidades se trata?

Ejercicios propuestos iii. Grafique la distribución de


1. Un experimento consiste en lanzar tres veces probabilidades
una moneda. Sea la variable aleatoria:
iv. ¿Cómo se comporta la tasa de
X="número de sellos que se obtienen". Se
llegadas?
pide:
1. Distribución de probabilidad de X 4. Investigue los usos y aplicaciones de las
2. Función de distribución de X. distribución de probabilidades Poisson, con
Representación gráfica cuál otra distribución de probabilidades
3. Media, varianza y desviación típica de guarda o tiene relación ¿por qué? ¿cómo se
X relacionan?
4. Probabilidad de que salgan a lo sumo
5. La cantidad de estudiantes que llegan a la
dos caras biblioteca de la UCAB, por minuto, es de tres
5. Probabilidad de que salgan al menos (3), se desea conocer:
dos caras
6. Definir una variable aleatoria i. La probabilidad que no llegue un
Y=n-X estudiante en un minuto
2. En los registros de una empresa fabricante de ii. ¿Cuál es la probabilidad que lleguen
baterías para laptop, indican que con una diez (10) estudiantes en un minuto
probabilidad del 0,05 se presenta una batería
defectuosa. Considerando que las baterías iii. ¿Cuál es la probabilidad que lleguen
producidas constituyen un conjunto de como máximo dos (2) estudiantes en
ensayos independiente: un minuto

i. ¿Cuál es la probabilidad que entre 10 6. Los cuatro motores de un avión cuatrimotor


baterías dos se encuentren (dos en cada ala) fallan, cada uno con
defectuosas? probabilidad 0,04, en forma independiente,
durante un trayecto de 20.000 kilómetros. El
ii. ¿Es simétrica la distribución? avión no entra en emergencia mientras
funcionen sin fallar por lo menos dos
iii. Dibuje la gráfica de la distribución de
motores:
probabilidades

7
María Carolina Vásquez

i. 1. ¿Cuál es la probabilidad de que el


avión no entre en emergencia?

ii. ¿Cuál será esa probabilidad si se


agrega la restricción de que, al menos
debe funcionar un motor en cada ala?

IMPORTANTE. Se aprende más enfrentándose a la


resolución de los ejercicios, que leyendo su resolución.

8
María Carolina Vásquez

Algunas distribuciones de  Distribución uniforme


 Distribución normal
probabilidades continuas  Distribución exponencial

¿Cómo se obtuvieron? Existen muchas otras, sin embargo, se


focalizará la atención en estas tres (3) por
Cualquier distribución de probabilidades, su importancia y utilidad.
bien que describa el comportamiento de
una variable aleatoria discreta o continua, ¿Cómo se diferencian?
tiene asociado un experimento aleatorio,
que dio origen al espacio muestral y por Las distribuciones de probabilidades, están
ende a sus sucesos elementales. definidas por “parámetros” que hacen que,
una distribución de una mismo tipo, sea
Las distribuciones de probabilidades, diferente a otra, de ese tipo.
pueden representarse bien, de forma
gráfica, mediante un histograma de Así mismo, dependiendo del tipo que se
frecuencia o bien, de forma analítica trate puede tener uno (1) o varios
mediante una función matemática f(x) que parámetros para definirla.
describe la relación entre la variable
aleatoria y su probabilidad. Distribución de probabilidades
La probabilidad representada en los uniforme continua
histogramas de frecuencias coincide con la
La distribución de probabilidades uniforme
frecuencia relativa, para el valor
continua, es una de las distribuciones más
correspondiente de la variable aleatoria.
sencillas que existe, sin embargo, permite
Así mismo, se puede representar la describir muchos sucesos, al igual que
frecuencia relativa acumulada, o lo que es sucede con la distribución del mismo
lo mismo, que la probabilidad acumulada nombre pero discreta.
de la variable aleatoria X, hasta un valor
Por ejemplo, al decir que el precio de la
dado 𝑥𝑖 ; constituyendo la función de
gasolina se encuentra entre 1$ y 3$,
distribución acumulada F(X).
significa que dentro de ese intervalo
Existen millones de distribuciones de cerrado, el precio podría tomar cualquier
probabilidades, sin embargo, unas pocas valor, con la misma probabilidad.
representan muchos de los sucesos que
En ese caso, la gráfica de la función de
ocurren en la vida diaria.
densidad de probabilidades, tendría la
Dentro de las distribuciones de forma de un rectángulo, para el que su área
probabilidades continuas que describen sería igual a 1, ya que sería la probabilidad
muchos sucesos más comunes, se acumulada entre 1 y 3.
encuentran:

1
María Carolina Vásquez

Si se considera como h la probabilidad Generalizando quedaría como:


uniforme que tienen todos los puntos 𝟏
dentro del intervalo [1,3]; la función de 𝑭(𝑿) = {𝟐 (𝒙 − 𝟏), 𝟏≤𝒙≤𝟑
densidad de probabilidades se podría 𝟎, 𝒐𝒕𝒓𝒐 𝒗𝒂𝒍𝒐𝒓
escribir como:
Una forma más sencilla de obtener las dos
𝒉, 𝟏≤𝒙≤𝟑
𝒇(𝒙) = { funciones anteriores es considerando que
𝟎 𝒐𝒕𝒓𝒐 𝒄𝒂𝒔𝒐
el área bajo la curva de esta distribución de
El área bajo esa curva debe ser igual a 1,
probabilidades, es el área de un rectángulo.
entonces se podría obtener el valor de h,
como Con base en ese ejemplo es posible definir
𝟑
𝟑 la llamada:
∫ 𝒉𝒅𝒙 = 𝟏 = 𝒉𝒙⌋ → 𝟏 = 𝟐𝒉 → 𝒉 = 𝟏/𝟐
𝟏 𝟏 Distribución uniforme continua
La función de densidad de probabilidades Sea una variable aleatoria continua X que
se podría re-escribir como: toma los valores dentro del intervalo
𝟏
𝒇(𝒙) = { ⁄𝟐 , 𝟏≤𝒙≤𝟑 [𝑨, 𝑩]
𝟎 𝒐𝒕𝒓𝒐 𝒄𝒂𝒔𝒐
Con la misma probabilidad de ocurrencia,
Al representar gráficamente la función de su tomando como base el ejemplo anterior,
distribución de probabilidades sería algo generalizándolo, quedaría como:
similar a:
𝟏
, 𝑨≤𝒙≤𝑩
𝒇(𝒙, 𝑨, 𝑩) = {(𝑩 − 𝑨)
𝟎 𝒐𝒕𝒓𝒐 𝒄𝒂𝒔𝒐

Esta función está definida por dos


parámetros A y B; por ello se escribe de esa
forma.

La gráfica de esta distribución es similar a


Figura 1. Distribución de probabilidades uniforme continua
entre [1,3] la que se dibujó para el ejemplo del precio
de la gasolina:
Recordando que la función de distribución
representa la probabilidad acumulada
hasta un punto 𝒙𝒊 , es decir el área bajo la
curva desde 1 hasta un punto cualquiera 𝒙𝒊 ,
se obtendría como:
𝒙𝒊
𝟏 𝟏 𝒙 𝟏
∫ 𝒅𝒙 = 𝒙⌋ 𝒊 → (𝒙𝒊 − 𝟏)
𝟏 𝟐 𝟐 𝟏 𝟐
Figura 2. Gráfica de la distribución de probabilidades uniforme
continua en el intervalo [A,B]

2
María Carolina Vásquez

Su función de distribución viene dada por: Una de las aplicaciones más comunes de la
distribución de probabilidades uniforme
(𝒙 − 𝑨) continua, es para la generación de los
𝑭(𝑿 ≤ 𝒙) = {(𝑩 − 𝑨) , 𝑨≤𝒙≤𝑩 números aleatorios, en el intervalo [0,1], o
𝟎 𝒐𝒕𝒓𝒐 𝒄𝒂𝒔𝒐 los llamados “random”. A su vez estos
números aleatorios son usados para la
La gráfica de la distribución uniforme selección de valores al azar para una
continua tiene la siguiente forma: muestra a fin de estimar alguna de las
características de la población.

En este caso, esa variable aleatoria X con


comportamiento uniforme en el intervalo
0,1, se escribe como:

𝑿 ~ 𝑼(𝟎, 𝟏)

Figura 3. Gráfica de la función de distribución uniforme


continua en el intervalo [A,B]
Distribución normal

Para la variable aleatoria X que tiene


¿Es lo más normal que pase?
comportamiento uniforme en el intervalo
La distribución de probabilidades normal, o
[A,B], se dice:
también llamada campana de Gauss, ayuda
a representar
𝑿 ~ 𝑼(𝑨, 𝑩)
La mayoría de los sucesos cotidianos
La esperanza matemática y la varianza para
una distribución uniforme continua vienen Cuando por ejemplo, dentro de un grupo
dadas por las expresiones: de personas adultas se registra su altura, se
encontrará que algunas personas son muy
La esperanza o media: bajas, otras en estatura promedio y otras
son muy altas. Si estos valores se grafican,
(𝑨 + 𝑩) colocando en el eje de las equis una
𝑬(𝑿) = µ =
𝟐 variable aleatoria “estatura” y en el eje y se
coloca la frecuencia relativa; es decir, su
probabilidad, con bastante seguridad la
La varianza:
curva que se dibuja se asemeja a una
campana, como esta figura:
(𝑩 − 𝑨)𝟐
𝑽𝒂𝒓(𝑿) = 𝝈𝟐 =
𝟏𝟐

3
María Carolina Vásquez

Es una curva que es simétrica, teniendo la


siguiente apariencia de campana:

Figura 4. Gráfica aproximada de las estaturas de un grupo de


personas

Distribución normal
Figura 5. Distribución normal de parámetros µ y σ
Esta distribución es la más importante
dentro del de la estadística y en especial Existe una curva normal diferente para
para las inferencias estadísticas. La cada par de parámetros µ y σ. El valor de σ
ecuación de su función de densidad fue perite identificar que tan abierta es la
desarrollada por Abraham DeMoivre en campana, para dos curvas normales con
1733. En muchas ocasiones se le llama igual desviación estándar σ, pero con
distribución gaussiana en honor a Karl diferentes medias 𝝁𝟏 y 𝝁𝟐 , su gráfica sería
Friedrich Gauss, que al igual que DeMoivre algo similar a la siguiente figura:
obtuvo una ecuación para esta distribución
de probabilidades, a través de un estudio
de los errores en las mediciones repetidas
de la misma cantidad.

La variable aleatoria X que tiene


comportamiento según esta distribución
de probabilidades, es llamada “variable
normal”, definida por dos parámetros, su Figura 6. Distribuciones normales con igual desviación σ pero
media µ y su desviación σ, siendo su medias diferentes

distribución de densidad de probabilidades


Propiedades de la distribución normal
la siguiente:
1. Es simétrica con respecto a la media µ
𝟏 𝟏 𝒙−𝝁 𝟐
𝒇(𝒙, 𝝁, 𝝈) = 𝒆 𝟐 𝝈 )
− ( 2. Su moda se encuentra en el punto más
𝝈√𝟐𝝅 alto de la curva siendo igual a µ

Se dice para la variable aleatoria X que tiene 3. Tiene dos (2) puntos de inflexión en
comportamiento normal, que: 𝑿=𝝁±𝝈

4. Es cóncava hacia abajo si


𝑿 ~ 𝑵(𝝁, 𝝈)
𝝁−𝝈<𝑿<𝝁+𝝈

4
María Carolina Vásquez

Y cóncava hacia arriba en cualquier otro


caso.

5. Se aproxima al eje de las X de forma


asintótica, mientras más alejada se
encuentre de la media µ, en cualquiera
de las dos (2) direcciones.

6. El área bajo la curva es 1

7. Su media µ, su Me y Mo se encuentran
en el mismo punto Figura 8. Representación de la regla empirica

Distribución normal estándar

La distribución normal estándar es tal que


su µ = 0 y σ = 1, la variable aleatoria con
estas características es denotada como Z,
estando tabulados en la Tabla de la
Normal Estándar, los valores de Z y su
respectiva probabilidad, hasta tres (3)
Figura 7. Algunas propiedades de la distribución normal desviaciones estándar.

Regla empírica Se denota como:

La regla empírica establece que alrededor 𝒁 ~ 𝑵(𝟎, 𝟏)


de la media µ y conforme se va alejando el
valor de la variable aleatoria X, en función Esta variable Z con comportamiento
de tantas desviaciones estándar, la normal de µ = 0 σ = 1, facilita los cálculos
cantidad de datos que se encuentran bajo para las situaciones que los datos puedan
la curva son aproximadamente de: ajustarse a una distribución normal, ya que,
 El 68.3% de los datos se encuentra a una como existe una curva normal para cada
(1) desviación estándar de la media posible combinación de µ y σ.
 El 95.5% de los datos se encuentran a
Para referir cualquier variable aleatoria con
dos (2) desviaciones estándar de la
comportamiento normal a la curva normal
media
estándar hay que realizar un proceso
 El 99,7% se encuentra a tres (3)
llamado tipificación. En el que se expresa la
desviaciones estándar.
variable en términos de la desviación
La representación gráfica de esta regla de estándar de la curva normal original.
validación, es de la siguiente forma:

5
María Carolina Vásquez

Tipificación de variables aleatorias con F (b) – F (a)


comportamiento normal

Para tipificar una variable aleatoria con Si a y b se encuentran a la misma distancia


comportamiento normal, es necesario, de la media, es decir de µ, la gráfica sería
como ya se dijo, expresar la variable en equivalente a lo representado en la figura 9
función de unidades de desviación:

(𝒙 − 𝝁)
𝒁=
𝝈
En la práctica es un cambio de variable para
trasladar la media con su correspondiente
desviación a curva normal con parámetros
µ=0 yσ=1
Figura 9. Área bajo de la curva ocupada por los valores de la
variable aleatoria entre –a y a
Tabla 1, Relación entre una normal de media µ y desviación σ,
con la distribución normal estándar
X Z Por ejemplo, se sabe que el peso de los
Media µ 0 estudiantes de una clase, se comporta
Una µ±σ ±1 según una distribución normal de media
desviación µ=50 y desviación estándar σ=10; se desea
Dos µ±2σ ±2 estimar la probabilidad que al seleccionar
desviaciones un estudiante al azar, su peso se encuentre
Tres µ±3σ ±3 entre 45 y 62 kilogramos.
desviaciones
Si se define una variable aleatoria X = peso
Como la curva normal es una distribución
de los estudiantes; la probabilidad que se
de probabilidades continuas no hay que
necesita es equivalente a;
olvidar que solo es posible calcular la
probabilidad en un intervalo [a,b], ya que la 𝑷(𝟒𝟓 ≤ 𝑿 ≤ 𝟔𝟐)
probabilidad en un punto específico, por
Dado que las probabilidades de la
ejemplo a, será igual a cero. Siendo igual a:
distribución normal están tabuladas, es
𝑷(𝒂 ≤ 𝑿 ≤ 𝒃) = 𝑷(𝑿 ≤ 𝒃) − 𝑷(𝑿 ≤ 𝒂) recomendable a fin de aligerar los cálculos
y disminuir el porcentaje de error; tipificar
la variable y trabajar con la tabla de la
Recordando las propiedades de una
normal estándar.
función de distribución, la probabilidad que
la variable aleatoria se encuentre entre a y Hoy día, existen innumerables aplicaciones
b, también se puede calcular como: que ayudan en los cálculos de las

6
María Carolina Vásquez

probabilidades; sin embargo, siempre es Al localizar el valor de la probabilidad en la


recomendable conocer el procedimiento tabla normal para Z=-0,5 y Z=1,2, la
de cálculo de las probabilidades a través de probabilidad solicitada sería:
la tabla de la distribución normal estándar. 𝟏 𝟔
𝑷 (− ≤ 𝑿 ≤ ) = 𝟎, 𝟖𝟖𝟒𝟗 − 𝟎, 𝟑𝟎𝟖𝟓
Prosiguiendo con el ejemplo, la tipificación 𝟐 𝟓
= 𝟎, 𝟓𝟕𝟔𝟒
de la variable quedaría de la siguiente
forma: Es decir, la probabilidad sería de 57,64%
(𝟒𝟓 − 𝟓𝟎) 𝟏
𝒛𝟏 = =−
𝟏𝟎 𝟐
Distribución de probabilidades
(𝟔𝟐 − 𝟓𝟎) 𝟔
𝒛𝟐 = = exponencial
𝟏𝟎 𝟓
Luego de haber realzado la tipificación, es La distribución de probabilidades
decir trasladar la distribución a una exponencial, a pesar de ser una
distribución 0,1; la probabilidad que se distribución de probabilidades continua,
requiere calcular sería; está directamente relacionada con la
distribución de probabilidades discreta
𝟏 𝟔
𝑷(− ≤𝑿≤ ) Poisson
𝟐 𝟓
Siempre es recomendable para el cálculo ¿Cómo se relaciona con la
de las probabilidades, preparar un gráfico
Poisson?
representativo de la función, de forma de
ubicar dentro de la misma, la probabilidad En la distribución Poisson se estudia el
que se necesita calcular. comportamiento de una variable discreta
que se desarrolla a lo largo de una variable
continua. Usualmente la variable continua
se refiere, no siendo exclusivo, a tiempo.

De forma general se puede resumir que la


distribución Poisson refleja las
probabilidades de una variable aleatoria
definida como:
Figura 10. Área bajo de la curva ocupada por los valores de la
variable aleatoria entre –0,5 y 1,2 𝒗𝒂𝒓𝒊𝒂𝒃𝒍𝒆 𝒅𝒊𝒔𝒄𝒓𝒆𝒕𝒂 (𝒆𝒗𝒆𝒏𝒕𝒐𝒔)
𝑷𝒐𝒊𝒔𝒔𝒐𝒏 =
𝒗𝒂𝒓𝒊𝒂𝒃𝒍𝒆 𝒄𝒐𝒏𝒕𝒊𝒏𝒖𝒂 (𝒆𝒔𝒑𝒂𝒄𝒊𝒐𝒔)

Una de las aplicaciones directas de la


Poisson es la llamada tasa de llegadas, cuya
medición de la variable discreta se hace a

7
María Carolina Vásquez

través del tiempo como variable continua, Con esta distribución interesa conocer el
de la forma siguiente: tiempo que transcurre hasta que ocurre
determinado evento, sabiendo que:
𝒆𝒗𝒆𝒏𝒕𝒐𝒔 𝒅𝒆 𝒍𝒍𝒆𝒈𝒂𝒅𝒂
𝑻𝒂𝒔𝒂 𝒅𝒆 𝒍𝒍𝒆𝒈𝒂𝒅𝒂𝒔 =
𝒖𝒏𝒊𝒅𝒂𝒅 𝒅𝒆 𝒕𝒊𝒆𝒎𝒑𝒐 El tiempo que puede ocurrir desde
cualquier instante dado de tiempo “t”, hasta
Ahora si se quisiese calcular el tiempo que
transcurre entre un evento y otro, esa que ocurre ese evento en un instante 𝒕𝒇
𝒊
variable aleatoria ya no sería “discreta”,
no depende del tiempo transcurrido
pasaría a ser “continua”. En este caso, el
anteriormente en el que no haya ocurrido
comportamiento de esa variable aleatoria,
nada; es decir, en otras palabras:
es el que refleja la
El tiempo que transcurre desde que
Distribución exponencial
sucedió el evento anterior hasta que
Es el equivalente continuo de la sucede el nuevo evento no guardan
distribución de probabilidades discreta del relación, se dice entonces que
tipo geométrico, como por ejemplo la
La distribución exponencial no tiene
variable aleatoria de procesos tipo Poisson.
memoria
En términos generales, la distribución
exponencial la variable continua está La función de densidad de probabilidades
referida a tiempo, es decir: para una variable aleatoria continua con
comportamiento exponencial es:
𝒗𝒂𝒓𝒊𝒂𝒃𝒍𝒆 𝒄𝒐𝒏𝒕𝒊𝒏𝒖𝒂
𝑬𝒙𝒑𝒐𝒏𝒆𝒏𝒄𝒊𝒂𝒍 = 𝟏 − 𝜷𝒙
𝒗𝒂𝒓𝒊𝒂𝒃𝒍𝒆 𝒅𝒊𝒔𝒄𝒓𝒆𝒕𝒂 𝒆 , 𝒙≥𝟎
𝒇(𝒙, 𝜷) = {𝜷
Se dice que la distribución exponencial es la 𝟎, 𝒐𝒕𝒓𝒐 𝒄𝒂𝒔𝒐
inversa de la distribución Poisson,
midiendo para el caso por ejemplo de la La gráfica de la distribución exponencial,
tasa de llegadas, el llamado, tiempo entre tiene la siguiente forma:
llegadas. EL parámetro que define a una
distribución exponencial es denotado
como 𝜷, siendo:
𝒖𝒏𝒊𝒅𝒂𝒅 𝒅𝒆 𝒕𝒊𝒆𝒎𝒑𝒐
𝜷=
𝒄𝒂𝒏𝒕𝒊𝒅𝒂𝒅 𝒅𝒆 𝒆𝒗𝒆𝒏𝒕𝒐𝒔
Relación parámetros Poisson – Exponencial

𝜷 = 𝟏⁄𝝀
Figura 11. Distribución de densidad de probabilidades
exponencial

8
María Carolina Vásquez

Esa misma distribución de densidad de Propiedades distribución exponencial


probabilidades puede ser expresada en
términos de la tasa λ, como: 1. No tiene memoria

2. 𝑬(𝑿) = 𝟏⁄
𝝀𝒆− 𝒙𝝀 , 𝒙>𝟎 𝝀
𝒇(𝒙, 𝝀) = {
𝟎, 𝒐𝒕𝒓𝒐 𝒄𝒂𝒔𝒐 3. 𝑽𝒂𝒓(𝑿) = (𝟏⁄ )𝟐
𝝀
La función de distribución, es decir la La distribución exponencial es usada para
probabilidad acumulada hasta un punto el cálculo de “tiempos de vida” o “tiempos
cualesquiera, se obtiene integrando la entre fallas”, es una de las distribuciones
función de densidad de probabilidades, de probabilidades más usadas en
desde cero hasta ese punto: ingeniería a la hora de programar el
𝒙𝒊 mantenimiento de equipos.
𝑭(𝑿 ≤ 𝒙𝒊 ) = ∫ 𝝀𝒆− 𝒙𝝀 𝒅𝒙 Por ejemplo, se tiene que el tiempo de vida
𝟎
útil de un tractor sigue una distribución
Resultando, al integrar y evaluar quedaría exponencial con media de 8 años, se desea
igual a: conocer ¿cuál es la probabilidad que se
tenga que remplazar antes de los 12 años?
𝑭(𝑿 ≤ 𝒙𝒊 ) = 𝟏 − 𝒆− 𝒙𝒊 𝝀
En este caso, se sabe que sigue una
Y para 𝑿 > 𝒙𝒊 distribución exponencial, para la que su
media o esperanza matemática es de 8
𝑭(𝑿 > 𝒙𝒊 ) = 𝒆− 𝒙𝒊 𝝀 años, es decir es su parámetro β. En el caso
de la exponencial se puede usar bien su
La gráfica de la función de distribución función de densidad de probabilidades en
exponencial, tiene la siguiente forma: función de ese parámetro o en función de
λ, sabiendo que

𝜷 = 𝟏⁄𝝀 → 𝝀 = 𝟏⁄𝜷
La probabilidad que el tractor falle antes de
los 12 años sería:

𝝀 = 𝟏⁄𝟖
𝟏𝟐⁄
𝑷(𝑿 ≤ 𝒙𝒊 ) = 𝟏 − 𝒆− 𝟖 = 𝟎, 𝟕𝟕 → 𝟕𝟕%
Figura 12. Función de distribución exponencial

9
María Carolina Vásquez

Visto de forma gráfica sería equivalente al


área bajo la curva desde cero hasta 12
años, cuya apariencia sería la siguiente:

Figura 14. Función de distribución exponencial con valor


medio8 años, para un tiempo de vida menor o igual a 15 años,
sabiendo que ya ha trabajado 3 años

Figura 13. Función de distribución exponencial con valor medio Chequeando lo aprendido
8 años, para un tiempo de vida menor o igual a 12 años
Ejercicios propuestos.
1. Un autobús pasa por cierta parada cada 15
Ahora para poner en evidencia la
minutos, ¿cuál es la probabilidad que si tú
propiedad “no tiene memoria”, se pregunta
llegas a la parada en momento dado, tengas
¿cuál es la probabilidad de reemplazar el
que esperar el autobús más de cinco (5)
motor antes de los 15 años, si se sabe que
minutos?
ya lleva 3 años funcionando?
2. Deduzca las fórmulas de la esperanza
matemática y la varianza para una
Dado que el comportamiento es de tipo
distribución uniforme continua.
exponencial, el tractor “no recuerda que ya
3. La nota promedio para un examen es 74 y la
tiene 3 años funcionando”; ese tiempo ya
desviación estándar es 7. Si 12% de la sección
pasó; por lo que, para calcular que falle
obtiene A y las calificaciones siguen una curva
antes de los 15 años sabiendo que ya tiene
que tiene una distribución normal, ¿cuál es el
3 funcionando, sería equivalente a calcular
valor de A más baja posible y el valor de B
la probabilidad que falle antes de los 12
más alto posible?
años siguientes a los 3 primeros años; es
4. Una empresa de material eléctrico fabrica
decir, cada día es como si la cuenta de los
bombillos fluorescentes circulares que tienen
años se iniciase de nuevo. Lo que es
una duración, antes de quemarse (fundirse),
exactamente igual a la probabilidad
que se distribuye normalmente con media
calculada anteriormente, es decir 77%
igual a 800 horas y una desviación estándar
de 40 horas. ¿Cuál será la probabilidad que
Visto de forma gráfica sería equivalente a;
un bombillo se queme entre 778 y 834 horas?
5. Cierto tipo de batería de almacenamiento
dura, en promedio, 3.0 años, con una
desviación estándar de 0.5 años. Suponiendo

10
María Carolina Vásquez

que las duraciones de la batería se


distribuyen normalmente, encuentre la
probabilidad de que una batería dada dure
menos de 2.3 años
6. Se sabe que los tiempos de carga y descarga
de un sitio web, comportan como una
distribución normal cuya media es de 7
minutos y desviación 2 minutos ¿cuál es la
probabilidad que cuando un usuario al azar
intente descargar información sea al menos
de 6 minutos?
7. Suponga que necesita ir a una agencia de
encomiendas para enviar un paquete. Al
llegar al centro comercial, de da cuenta que
hay dos (2) agencias d envíos, pero ambas
tiendas cierran en veinte (20) minutos, debe
decidir por cuál agencia enviará su paquete.
Al observar se da cuenta de lo siguiente:
 Agencia 1 hay tres (3) personas
pendientes de atención, con tiempos
promedios de espera de 5 minutos
por cliente
 Agencia 2 hay dos (2) personas
pendientes de atención, con tiempos
promedios de 7 minutos por cliente.
 Se puede suponer que el
comportamiento de los tiempos de
espera son exponenciales

11
María Carolina Vásquez

Inferencia estadística de un estudio, conforman lo que es llamada


la:
Clasificación de la estadística
A través de la estadística, se espera
Población
obtener conclusiones a partir de los
datos recopilados, es por ello que, es Por ejemplo se espera estudiar el
posible dividirla en dos grandes tipos: desempeño de un grupo de atletas, que
participan en una competencia de saltos.
En este caso, la población, podría estar
Inferencial constituida por todos los atletas de un país,
pero se podría ampliar la cantidad de
Descriptiva atletas que conforman ese conjunto, a los
atletas de un continente, o podría reducirse
para referirse a los atletas de una ciudad
Figura 1. Clasificación de la estadística específica. En todos los casos, siempre es
necesario acotar el conjunto al que se
En la estadística descriptiva, se resume el
hace referencia, a fin de evitar dudas en
comportamiento bien, de un conjunto de
cuanto a, cuáles son los objetos, personas
datos, de forma puntual y específica.
o situaciones que conforman el total o el
En la inferencial, se toma un sub- conjunto de datos de la población.
conjunto de los datos para resumir el
Las características más relevantes de una
comportamiento de todo el conjunto de
población, que la resumen son llamados:
datos.

El conjunto de los datos se le llama Población  Parámetros


población y al sub-conjunto se le llama En algunas oportunidades, cuando se
muestra. Ambos deben ser definidos con desea conocer, para el ejemplo de los
precisión, en el caso de la población, se atletas de un país, el color de su cabello,
debe delimitar los elementos que podría ocurrir por diferentes razones, que
pertenecen a ese grupo y en el caso de la no es posible acceder a la información del
muestra, debe ser seleccionada con color del cabello, para todos los atletas, por
criterios tales que representen de forma ello se recurre a lo que se le denomina
adecuada, a la población a la que se espera
resumir su comportamiento. Muestra
Población y muestra La muestra se define como un sub
El conjunto de objetos, personas o conjunto representativo, de la población
situaciones que comparten una
característica común, y a su vez, son objeto

1
María Carolina Vásquez

Se toman muestras cuando hay expresiones numéricas, en la recta de los


imposibilidades de algún tipo, bien sea por reales, de los eventos o sucesos
razones económicas, geográficas o de
AL establecer relaciones entre las variables
accesibilidad para obtener la información
aleatorias y sus probabilidades, se
de todos los sujetos que conforman la
establecen los llamados modelos de
población.
comportamiento de los datos.
Las características más relevantes de una
Esos modelos de comportamiento son
muestra, que la resumen son llamados:
usados para suponer que las poblaciones
Muestra  Estadísticos se comportan como alguna o varias
muestras de esa población.
Cuando se accede a la información de
todos los miembros de una población, se Se tiene entonces que la estadística tiene
tres (3) grandes divisiones:
dice que es un CENSO, en cuyo caso

quedan definidas las características de sus


integrantes de forma inequívoca. Estadística Modelos de Estadístcia
descriptiva comportamiento inferencial
¿Cómo realizar las inferencias
estadísticas?
Para ir de la estadística descriptiva a la Figura 3. Los modelos de comportamiento conectan la
inferencial, es decir a la estadística de las estadística descriptiva con la inferencial

generalizaciones, es necesario contar con La estadística descriptiva se conecta con la


tres (3) elementos: inferencial a través de los modelos de
comportamiento que representan el
Probabilidades comportamiento de los datos.

¿Cómo se concluye a través de


Variables aleatorias una muestra?
Para realizar una inferencia sobre una la
Modelos de
población dada, se parte de una muestra
comportaieonto de esa población, para luego, haciendo uso
de los modelos de comportamiento de los
datos de la muestra, llegar a conclusiones
Figura 2. Bases de los modelos de comportamiento
que describan esa población.
Recordando los conceptos, se tiene que: la
Se puede representar como un ciclo que
probabilidad, es la posibilidad de que algo
inicia con una población objeto de estudio:
suceda. Las variables aleatorias, son las

2
María Carolina Vásquez

suficientemente grande, a una distribución


normal.
Inferencia Población
Es decir, se tiene una población con
parámetros µ y σ, de las que se extraen de
forma sucesiva k muestras, de tamaño n;
haciendo el promedio de los valores de
cada muestra:
Modelos de
Muestra
comportamiento

Figura 4. La muestra como base para inferir sobre la


población.

¿Qué ayuda a las inferencias?


Para realizar las inferencias estadísticas es
necesario construir los modelos de
comportamientos, a fin de reflejar las
posibilidades de ocurrencia de los sucesos,
así como su representación como números
reales, a través de las variables aleatorias. Figura 5. Teorema del límite central, se toman k
muestras de tamaño n para estimar los parámetros de la
Ahora bien, partiendo de una de las población
distribuciones de probabilidades es decir
de la distribución de probabilidades Al graficar esas k medias de las muestras,
normal, se logró establecer un teorema se encuentra que la forma de la
que quizás es el más importante de la distribución de probabilidades es
estadística, el llamado: aproximadamente normal, sin importar la
forma original de la distribución, ni del tipo
Teorema del límite central de variable aleatoria que se trate, siempre
El teorema establece que, dada una y cuando el tamaño n de cada muestra
variable aleatoria, bien sea discreta o sea mayor que 30 datos.
continua, cuya distribución de El teorema del límite central se puede
probabilidades puede ser de cualquier resumir como:
forma; al tomar muestras sucesivas de esa
distribución y obtener el promedio de los Sea una variable aleatoria cualesquiera,
valores de cada una de esas muestras, al con distribución de probabilidades, sea
graficar las “medias de esas muestras”, la discreta o continua, de cualquier forma, la
forma de la distribución se aproximará, “media de la muestra”, cuando se toman
cuando el tamaño de las muestras es lo muestras de tamaño n>30 datos, se

3
María Carolina Vásquez

comportará como una distribución normal promedio de los valores de cada muestra y
de parámetros: se prepara su histograma de frecuencias.
Lo relevante no que se tomen 100
𝜎
𝑋̅~𝑁(µ, ) muestras, es el tamaño de cada muestra lo
√𝑛
que hace la diferencia. La gráfica de la
Al tipificar la media de la muestra, para distribución de probabilidades para la
referirla a una distribución normal de “media de la muestra”, tiene la siguiente
media µ=0 y σ=1, quedaría de la siguiente forma:
forma:

̅ − 𝝁)
(𝑿
𝒁= 𝝈 ~ 𝑵(𝟎, 𝟏)
√𝒏
Por ejemplo, se tienen los datos de las
edades de las personas que tienen
registrada una cuenta en un sitio web; en
este caso se considerará como población a:
Figura 7. Distribución de la media de la muestra para
“personas que tienen registrada una cuenta n=10
en el sitio web XXX, al mes de julio de 2020”
Al observar la gráfica el valor promedio es
Esta población tiene la siguiente aproximadamente 𝑋̅ = 15,11, no se podría
distribución de probabilidades, con media decir que se aproxima a una distribución
µ=14,9 y desviación estándar σ=3,9. La normal, sin embargo los valores se
forma de la distribución es distribuyen aproximadamente alrededor
aproximadamente igual a: de ese valor de 15,11.

Tomando ahora, igualmente 100 muestras


de tamaño n=20 datos:

Figura 6. Distribución de probabilidades de las personas


registradas en un sitio web XXX al mes de julio de 2020

Ahora bien, se tomarán 100 muestras de


Figura 8. Distribución de la media de la muestra para
tamaño n=10, para las que se hace el n=20

4
María Carolina Vásquez

Al observar la gráfica, la edad promedio se


acerca a 15,06; aproximándose a la media
de la población, y cuya forma se va
pareciendo más a una campana de Gauss o
distribución normal.

Haciendo un ejercicio similar al anterior, se


toman 100 muestras de tamaño n=30, la
gráfica de las medias de la muestra tiene la
siguiente forma: Figura 10. Distribución de la media de la muestra para
n=52

Tomando como referencia lo que indica el


teorema del límite central en cuanto a la
desviación estándar de las media de las
muestras; esta es igual a:

𝑆𝑥 = 𝜎/√𝑛

Evaluando para la muestra cuando n=52,


sería:
Figura 9. Distribución de la media de la muestra para
n=30 𝜎 3,9
𝑆𝑥 = = = 0,54
√𝑛 √52
En este caso, se puede observar que la
media de la muestra se va aproximando Al comparar con el obtenido directamente
más a la media de la población, es decir se de la muestra, es decir con 0,53; de alguna
encuentra en 14,93; presentando una forma se comprueba lo establecido por el
forma bastante parecida a un distribución teorema del límite central.
normal. Así mismo, la media de la muestra a medida
que se incrementa el valor de su tamaño, es
Ahora se tomarán igualmente 100
decir, el valor de n, se acerca más y más a la
muestras pero de tamaño n=52 datos; la
media poblacional.
forma de distribución de probabilidades
que se muestra en la figura 10. Véase la simulación del teorema del límite
central en https://www.geogebra.org/m/u6fY9uS8
En este caso la media de la muestra es
14,99, llegando casi al valor de la media de
la población; con una desviación es de 0,53.
Cuidado
La media de la muestra es la que tiene ese
comportamiento normal; la variable
aleatoria origen de los datos, es decir X, se
5
María Carolina Vásquez

sigue comportando como su distribución Los estimadores deben tener como mínimo
original, eso no cambia. tres (3) características principales:
La mayor parte de las inferencias Consistencia
estadísticas se basa en este teorema, ya
• Su valor, a mayor tamaño de la
que, permite tener un modelo de muestra, se aproxima más al valor de la
comportamiento para la media de las población
muestras, para inferir que la población se
comporta como esa muestra. Eficiencia
• Su varianza es reducida. Se selecciona
Tipos de inferencia estadística siempre el de menor varianza
Las inferencias estadísticas se pueden Insesgadez
dividir en dos (2) grandes grupos; los
• Su esperanza matemática es igual al
llamados estimadores o estadísticos que se parámetro que se desea estimar
obtienen de las muestras y las llamadas
pruebas de hipótesis en las que se parte de
Figura 12. Características de los estimadores
un supuesto sobre el comportamiento de
una muestra, para inferir que la población Estimadores puntuales
tiene ese mismo comportamiento. Los Los estimadores puntuales consideran que
tipos de inferencias se pueden resumir la población se comporta igual que la
como: muestra, es decir, el parámetro de la
población es directamente el estadístico
Inferencias estadísticas

Puntuales obtenido de la muestra:


Estimadores
Intervalos
𝑬𝒔𝒕𝒊𝒎𝒂𝒅𝒐𝒓𝒆𝒔 𝒑𝒖𝒏𝒕𝒖𝒂𝒍
𝝁=𝑿̅
media
Pruebas de 𝝈 = 𝑺𝒙
hipótesis
desviación
Para estos estimadores no es posible
conocer su grado de precisión.
Figura 11. Tipos de inferencias estadísticas
Estimadores por intervalos
Estimadores En los estimadores por intervalos, se parte
Como bien se dijo antes, los estimadores se al igual que en los estimadores puntuales,
obtienen a partir de las muestras que se del valor del estadístico de la muestra, pero
toman de las poblaciones; pueden se establece un rango de valores dentro de
calcularse de forma puntual o por los que se encuentra el parámetro de la
intervalos. población.

6
María Carolina Vásquez

Para establecer el intervalo para el Intervalo de confianza para la


estimador, se parte de un media
𝟏 − 𝜶 = 𝒏𝒊𝒗𝒆𝒍 𝒅𝒆 𝒄𝒐𝒏𝒇𝒊𝒂𝒏𝒛𝒂 Para estimar el intervalo de confianza para
la media poblacional, partiendo del
El nivel de confianza representa la teorema del límite central, se tiene que:
probabilidad que el parámetro de la
• Se establece un
población se encuentre dentro de ese
rango de valores señalado en el intervalo 𝐧𝐢𝐯𝐞𝐥 𝐝𝐞 𝐜𝐨𝐧𝐟𝐢𝐚𝐧𝐳𝐚 = 𝟏 − 𝜶
de confianza.
• Usualmente se toma como 𝜶 = 1%,5% o
10%
Estadístico de Intervalo de
la muestra confianza • Dado que la media de la muestra tiene
comportamiento normal, se tipifica:
̅ − 𝝁)
(𝑿
1-𝜶 = Nivel de −𝒁𝜶⁄ = 𝝈
𝟐
confianza ⁄ 𝒏

̅ − 𝝁)
(𝑿
Figura 13. Elementos para el establecimiento de un 𝒁𝜶⁄ = 𝝈
𝟐
⁄ 𝒏
intervalo de confianza √
En los intervalos de confianza, se considera De allí se despeja el valor de 𝝁 para
la posibilidad que el estadístico calculado a determinar dentro de que valores se
partir de la muestra, tenga error. encuentra, considerando que se tiene una
confianza de 𝟏 − 𝜶, que se encuentre
dentro de ese rango de valores:

̅ − 𝒁𝜶⁄ 𝝈⁄ ≤ 𝝁 ≤ 𝑿
𝑿 ̅ + 𝒁𝜶⁄ 𝝈⁄
𝟐 √ 𝒏 𝟐 √𝒏
De las relaciones anteriores se dice que el
error que se puede cometer al decir que la
media de la población se encuentra dentro
de ese rango es igual a:

Error = 𝜽 = 𝝈⁄
√𝒏
Figura 14. Consideraciones para el establecimiento de
un intervalo de confianza

Se pueden construir intervalos de


Importante
confianza para: 1) la media poblacional, 2)
para la proporción poblacional y 3) para la Cuando el tamaño de la muestra n es
desviación de la población. menor a 30 datos, la estimación del valor de

7
María Carolina Vásquez

𝒁𝜶⁄ se obtiene mediante la distribución de propiedades de las variables aleatorias


𝟐
probabilidades normales, se seguirá comportando como
una normal:
𝒕 𝒅𝒆 𝑺𝒕𝒖𝒅𝒆𝒏𝒕 𝒑𝒒
𝒀 ~ 𝑵(𝒑, √ )
𝒏
Cuya forma es similar a la forma de la
normal, definida por los grados de libertad: Considerando un error igual a

𝒑𝒒
(𝒏 − 𝟏) 𝒈𝒓𝒂𝒅𝒐𝒔 𝒅𝒆 𝒍𝒊𝒃𝒆𝒓𝒕𝒂𝒅 Error = 𝜽 = √
𝒏

Sustituyéndose 𝒁𝜶⁄ por Considerando que se tiene una confianza


𝟐
de 𝟏 − 𝜶, que se encuentre dentro de ese
𝒕(𝜶⁄𝟐,(𝒏−𝟏)) rango de valores:

𝒑𝒒 𝒑𝒒
Intervalo de confianza para una 𝒑𝒎 − 𝒁𝜶⁄ √ ≤ 𝒑 ≤ 𝒑𝒎 + 𝒁𝜶⁄ √
𝟐 𝒏 𝟐 𝒏
proporción
Para estimar el intervalo de confianza para Valores más usuales de Z en la normal
una proporción se parte que la variable estándar en función de ⍺
aleatoria tiene comportamiento de
acuerdo a una distribución binomial:

𝑿 ~ 𝑩(𝒏, 𝒑)
Ahora bien, considerando que para valores
grandes de n, en los que:

𝒏𝒑 > 𝟎. 𝟓 𝒏𝒑 > 𝟎. 𝟓
La variable aleatoria se puede aproximar a
una normal de media y desviación: Figura 15. Valores más usuales de Z en función del nivel
de significación ⍺
𝝁 = 𝒏𝒑
𝝈 = √𝒏𝒑𝒒 Intervalo de confianza para la
varianza
Por tanto, será entonces
Para estimar un intervalo de confianza para
𝑿 ~ 𝑵(𝒏𝒑, √𝒏𝒑𝒒) la varianza de la población 𝝈𝟐 se parte de
Ahora como lo que interesa es establecer la varianzas de la muestra o “cuasi-
𝟐
un intervalo de confianza para la varianza” 𝑺𝒙 ; estimar un intervalo de
proporción “p”, no para np, se define una confianza para la varianza
nueva variable Y= X/n,, que por

8
María Carolina Vásquez

Para realizar esta estimación se acude a


una distribución de probabilidades del tipo
Chequeando lo aprendido
Chi-cuadrado, Ejercicios propuestos.
1. Considerando una posibilidad de error 𝜃
Esta distribución siempre es positiva ya que
halle la fórmula para el tamaño de la
se trata de variables cuadráticas. Cuando el
valor de n se hace más grande se dice que muestra n, para estimar la media
la Chi-cuadrado tiene a una distribución poblacional y la proporción poblacional,
normal, véase la simulación de la partiendo de los conceptos estudiados y
distribución en consideraciones de los intervalos de
https://www.geogebra.org/m/pePn49eW confianza para estos estimadores por
intervalos-
Definiendo una variable aleatoria del tipo
𝟐 2. Las puntuaciones obtenidas por los
Chi-cuadrado 𝑿(𝒏−𝟏) que represente a las estudiantes de estadística en un curso a
diferencias cuadráticas de los valores 𝑥𝑖 de distancia, siguen una distribución normal de
con respecto a su media. Con un nivel de media 90 y desviación estándar de 12, en
confianza de 1-⍺ puntuaciones de 1 al 100. Si son
seleccionados 30 estudiantes al azar, se pide
𝑵𝒊𝒗𝒆𝒍 𝒅𝒆 𝒄𝒐𝒏𝒇𝒊𝒂𝒏𝒛𝒂 = 𝟏 − 𝜶
construir un intervalo de confianza al 90% de
El intervalo de confianza para la varianza confiabilidad para la desviación de la
poblacional de una variable aleatoria población.
distribuida “normalmente”, queda definido Respuesta: 𝟗, 𝟗𝟎 ≤ 𝝈 ≤ 𝟏𝟓, 𝟕𝟓

dentro de los límites en la Chi-cuadrado: 3. El departamento comercial de una empresa


de consumo masivo sabe que 2 de cada 10
consumidores en una prueba a ciegas
reconocen el sabor de su producto estrella. Si
se toma una muestra al azar de 165 personas,
se desea conocer con una probabilidad del
80% de éxito dentro de cuáles valores estaría
la cantidad de consumidores que pueden
reconocer su marca.
Respuesta: 𝟏𝟔% ≤ 𝒑 ≤ 𝟐𝟒&
Figura 16. Límites para el intervalo de confianza de la 4. Se selecciona aleatoriamente una muestra de
varianza poblacional para una variable aleatoria
600 estudiantes en una universidad y se les
distribuida normalmente
pregunta si consideran que los estudios a
El intervalo quedará definido como: distancia son una buena opción. Responden
(𝒏 − 𝟏)𝑺𝒙 𝟐 (𝒏 − 𝟏)𝑺𝒙 𝟐 afirmativamente 250 estudiantes. ¿Cuál es el
𝟐
≤𝝈 ≤ intervalo de confianza de la proporción de
𝑿𝟐(𝒏−𝟏, 𝜶⁄ ) 𝑿𝟐(𝒏−𝟏, 𝟏−𝜶⁄ ) estudiantes de esa ciudad que consideran
𝟐 𝟐

9
María Carolina Vásquez

que los estudios a distancia son una buena


opción, con un nivel de confianza del 90 % ?
Respuesta entre el 38,36% y el 44,98%
5. Un estudio realizado en 100 propietarios de
vehículos arrojó que su carro recorre en
promedio 15200 km con una desviación de
2250 km, determine un IC al 99% para la
media poblacional. ¿Tamaño de la muestra
para que el error no sea más de 500km?
Respuesta: (14621,15779) - n>134

10
María Carolina Vásquez

Inferencia estadística Se tiene entonces que la estadística tiene


tres (3) grandes divisiones:
Pruebas de hipótesis

¿Cómo realizar las inferencias Estadística Modelos de Estadístcia


estadísticas? descriptiva comportamiento inferencial

Para ir de la estadística descriptiva a la


inferencial, es decir a la estadística de las
generalizaciones, es necesario contar con Figura 2. Los modelos de comportamiento conectan la
estadística descriptiva con la inferencial
tres (3) elementos:
La estadística descriptiva se conecta con la
inferencial a través de los modelos de
Probabilidades
comportamiento que representan el
comportamiento de los datos.
Variables aleatorias
¿Cómo se concluye a través de
una muestra?
Modelos de
comportaieonto Para realizar una inferencia sobre una la
población dada, se parte de una muestra
de esa población, para luego, haciendo uso
Figura 1. Bases de los modelos de comportamiento
de los modelos de comportamiento de los
Recordando los conceptos, se tiene que: la datos de la muestra, llegar a conclusiones
probabilidad, es la posibilidad de que algo que describan esa población.
suceda. Las variables aleatorias, son las
expresiones numéricas, en la recta de los Se puede representar como un ciclo que
reales, de los eventos o sucesos inicia con una población objeto de estudio:

AL establecer relaciones entre las variables


aleatorias y sus probabilidades, se Inferencia Población
establecen los llamados modelos de
comportamiento de los datos.

Esos modelos de comportamiento son


usados para suponer que las poblaciones
Modelos de
se comportan como alguna o varias Muestra
comportamiento
muestras de esa población.

Figura 3. La muestra como base para inferir sobre la


población.

1
María Carolina Vásquez

Tipos de inferencia estadística variable, se verifica una afirmación sobre


Las inferencias estadísticas se pueden ese comportamiento.
dividir en dos (2) grandes grupos; los
Las pruebas de hipótesis se dividen en dos
llamados estimadores o estadísticos que se
tipos:
obtienen de las muestras y las llamadas
pruebas de hipótesis en las que se parte de
un supuesto sobre el comportamiento de Pruebas de
hipótesis
una muestra, para inferir que la población
tiene ese mismo comportamiento. Los
tipos de inferencias se pueden resumir Parámeticas No paramétricas
como:
Figura 4. Tipos de pruebas de hipótesis
Inferencias estadísticas

Puntuales
En las pruebas paramétricas, es conocida la
Estimadores
distribución de probabilidades, y para las
Intervalos
no paramétricas, en la mayoría de los
casos, a través de la prueba de hipótesis, se
media
Pruebas de espera establecer cuál es la distribución de
hipótesis probabilidades a la que se ajusta la variable
desviacióon
aleatoria.

En este curso, se estudiará dos (2) tipos de


Figura 4. Tipos de inferencias estadísticas
pruebas paramétricas, de las muchas que
Habiendo estudiado en el tema anterior los existen, las pruebas de hipótesis para la
intervalos de confianza, como una forma de media y para la varianza.
estimar el comportamiento de una
población, se estudiarán a continuación, las ¿Cómo se realiza una prueba de
inferencias a través de las pruebas de hipótesis?
hipótesis.
En una prueba de hipótesis se espera
¿Qué es una prueba de aceptar o rechazar una afirmación acerca
de una población, con base en la evidencia
hipótesis? proporcionada por una muestra de datos
de esa población.
Una pruebas de hipótesis, es un
procedimiento estadístico que se utiliza El procedimiento general para realizar una
para comprobar si es cierta, una afirmación prueba de hipótesis puede dividirse en
sobre el comportamiento de una variable cuatro (4) pasos, iniciando siempre con lo
aleatoria de cualquier tipo. En estos casos,
no se estima el comportamiento de la

2
María Carolina Vásquez

que se espera probar, planteando dos (2) Según lo anterior, las hipótesis nulas
hipótesis: una nula y una alternativa siempre contienen la igualdad y las
hipótesis alternas son el complemento de
Con base en los datos de una muestra de la la hipótesis nula.
población, se calcula el llamado “estadístico
de pruebas”. ¿Qué puede pasar con las hipótesis?

En paralelo se determina la “regla de 1. Rechazar Ho, y aceptar H1 debido a


validación” con base en una distribución de que existen suficientes evidencias en la
probabilidades conocida. muestra que permiten afirmar que H1
es cierta
Luego se comparan el estadístico de
pruebas con la regla de validación, para 2. No rechazar Ho debido a que no se
posteriormente concluir sobre la tiene suficiente evidencia en la muestra
afirmación planteada en la hipótesis nula. para rechazarla

El procedimiento puede resumir de la 3. El rechazo de la hipótesis nula es


siguiente forma: “categórico” por lo que se procede a
aceptar la hipótesis alterna
Planteamiento de las Ho Hipótesis nula
hipótesis H1 Hipótesis alternativa 4. Las hipótesis nulas no se aceptan,
solo no se rechazan
Cálculo estadístico de Con base en la muestra de la
población
pruebas
Se dice que, al plantear la hipótesis nula se
Determinación de la Con base en una distribución de
probabilidades conocida
parte de la “presunción de inocencia”, por
regla de validación
ello siempre contiene la igualdad.
Conclusiones Se rechaza o no se rechaza la
hipótesis nula
Por ejemplo, se parte que el peso
promedio de los estudiantes de estadística
Figura 5. Pasos para una prueba de hipótesis es de 55 kg, en este caso las hipótesis
serían:
Planteamiento de las hipótesis
𝑯𝟎 : 𝝁 = 𝟓𝟓
Se plantean dos (2) hipótesis, la Hipótesis
Nula (Ho) y la Hipótesis Alternativa (H1), que 𝑯𝟏 : 𝝁 ≠ 𝟓𝟓
son complementarias.
Se podrían tener otras dos (2) situaciones,
Hipótesis nula: es la afirmación que se se podría plantear que 𝑯𝒐 ≤ 𝟓𝟓 𝒐 𝑯𝒐 ≥ 𝟓𝟓 ,
intentará probar pero en todos los casos la hipótesis nula
siempre contiene la igualdad.
Hipótesis alternativa: es la afirmación que
se desea poder concluir que es verdadera.

3
María Carolina Vásquez

Ahora bien, podría suceder que, dado que que se estudiarán en el curso, los
la decisión en la prueba de hipótesis se estadísticos de prueba son los siguientes:
toma con base en una “muestra” de la
población, podría haberse cometido algún Estadístico de pruebas para la media
error, dependiendo si Se espera probar que una muestra
proviene de una población dada, a través
del contraste de la media de esa muestra,
Ho Verdadera Falsa con la media de la población de la que se
supone proviene.

No rechazar Correcto Error Tipo II Por teorema del límite central se sabe que
la media de la muestra tiene el siguiente
comportamiento:
Rechazar Error Tipo I Correcto
𝝈
̅ ~𝑵(𝝁,
𝑿 )
√𝒏
Figura 6. Tipos de errores al no rechazar y rechazar una
hipótesis nula Al tipificar esa variable aleatoria X para
referirla a una normal 𝑿~𝑵(𝟎, 𝟏), se toma
El error tipo I, también llamada nivel de
como estadístico de pruebas para una
significancia ⍺, es la probabilidad de
prueba de hipótesis para la media:
rechazar la hipótesis nula aún y cuando
podría ser verdadera. Para cualquier ̅ − 𝝁)
(𝑿
prueba, debe establecerse el valor de ⍺ 𝒁𝒎𝒖𝒆𝒔𝒕𝒓𝒂 = 𝝈
La probabilidad de no rechazar Ho siendo √𝒏
falsa se denota como ß
Estadístico de pruebas para la varianza
Para esta prueba no hay que olvidar que se
Ratificando lo mencionado anteriormente,
no se debe olvidar que al realizar una parte al igual que para el intervalo de
confianza de una población normal (𝝁,𝝈)
prueba de hipótesis siempre es necesario
establecer el
Se asume que como estadístico de pruebas:

𝒏𝒊𝒗𝒆𝒍 𝒅𝒆 𝒔𝒊𝒈𝒏𝒊𝒇𝒊𝒄𝒂𝒄𝒊ó𝒏 𝜶 (𝒏 − 𝟏)𝑺𝒙 𝟐


𝑿𝟐𝒆𝒔𝒕𝒂𝒅í𝒔𝒕𝒊𝒄𝒐 =
Cálculo estadístico de pruebas 𝝈𝟐

Dependiendo de la prueba de hipótesis los Una vez calculado el estadístico de pruebas,


estadísticos cambian. Para los dos (2) casos bien para la media o para la varianza, según
corresponda a la prueba de hipótesis que

4
María Carolina Vásquez

se desea realizar, es necesario continuar Regla de validación para la media


con la determinación de la regla de Dependiendo de la cantidad de datos de la
validación, o área de no rechazo. muestra, es decir n, la regla de validación se
obtiene de curvas de distribución de
Determinación de la regla de probabilidades diferentes:
validación
Regla de validación para
¿Qué es la regla de validación? la media

Es un rango de valores dentro de los que se Menos de 30


Más de 30 datos
debe encontrar el estadístico de pruebas datos
para no rechazar la hipótesis nula, se
t de Student
traduce en un área de no rechazo y un área Normal estándar N(0,1)
(n-1 grados de libertad)
de rechazo, en la curva estándar contra la
que se comparará los valores obtenidos de
la muestra. Figura 8. Curva de distribución de probabilidades
estándar que se usa para la regla de validación
Se obtiene de las distribuciones de dependiendo de la cantidad de datos

probabilidades teóricas o estándar en Pruebas bilaterales o a dos (2) colas


función del nivel de significación ⍺

Cada prueba de hipótesis tiene su regla de


validación

Dependiendo de la hipótesis nula que se


plantee, se pueden tener pruebas de
hipótesis bilaterales o a dos (2) colas o
unilaterales o a una (1) cola. La diferencia Figura 9. Áreas de aceptación y rechazo para una prueba
entre estos tipos de prueas son las áreas de de media a dos (2) colas o bilateral
no rechazo y rechazo para la regla de Pruebas unilaterales o a una (1) cola
validación:
Un área de no
rechazo
Bilateral
Dos (2) áreas de
rechazo
Pruebas de
hipótesis
Un área de no
rechazo
Unilaterales
un (1) área de
rechazo Figura 10. Áreas de aceptación y rechazo para una
prueba de media a una (1) cola o unilateral

Figura 7. Tipos de pruebas de hipótesis según las áreas


de no rechazo y rechazo

5
María Carolina Vásquez

Regla de validación para la varianza


La regla de validación para la varianza se
obtiene de la Chi-Cuadrado para n-1 grados
de libertad, del tamaño de la muestra n.

Pruebas bilaterales o a dos (2) colas

Figura 11. Áreas de aceptación y rechazo para una prueba


varianza a dos (2) colas o bilateral

Pruebas unilaterales o a una (1) cola

Figura 12. Áreas de aceptación y rechazo para una prueba


varianza a una (1) cola o unilateral

Chequeando lo aprendido
Ejercicios propuestos.
Proyecto de fin del curso

También podría gustarte