Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADÍSTICA
Recordando lo aprendido
marivasq@ucab.edu.ve
María Carolina Vásquez
1
María Carolina Vásquez
2
María Carolina Vásquez
La repetición de “n” veces el experimento Será una variable binomial si cumple las
de Bernoulli, se denomina: propiedades de un proceso Bernoulli. El
objetivo de esta distribución de
𝑷𝒓𝒐𝒄𝒆𝒔𝒐 𝒅𝒆 𝑩𝒆𝒓𝒏𝒐𝒖𝒍𝒍𝒊 probabilidades, es conocer la probabilidad
que se produzca cierta cantidad de éxitos.
El proceso de Bernoulli tiene las siguientes
propiedades: Por ejemplo, se lanzan cinco (5) monedas;
Experimento aleatorio que tiene dos existiendo dos (2) posibles resultados
posibles resultados, por lo que su
espacio muestral sería
Lanzar una moneda
Ω = {é𝐱𝐢𝐭𝐨, 𝐟𝐫𝐚𝐜𝐚𝐬𝐨}
Se realiza “n” veces
La probabilidad de tener éxito se denota Cara Sello
como “p” y de fracaso como “q”, siendo
una el complemento de la otra; por lo Figura 2. Resultados del lanzamiento de una moneda
que q=1-p
Los ensayos que se realizan “n” veces Los resultados del experimento son dos (2):
son independientes cara o sello, que son incompatibles y
complementarios entre sí. El experimento
A partir del proceso de Bernoulli se puede se está repitiendo n veces y las
definir para una variable aleatoria binomial probabilidades de cada posible resultado
pueden ser definidas como p y q=1-p.
𝑿 = 𝒄𝒂𝒏𝒕𝒊𝒅𝒂𝒅 𝒅𝒆 é𝒙𝒊𝒕𝒐𝒔
Si se define la variable aleatoria
Al realizar “n” ensayos independientes, la X = Obtener cara
distribución de probabilidades binomial
Es posible afirmar entonces que, X se
que se denota como:
comporta según una distribución de
probabilidades binomial, ya que, cumple
Distribución Binomial con las condiciones necesarias que
𝒏
𝑩(𝒏, 𝒑) = 𝑷(𝑿 = 𝒙𝒊 ) = ( ) 𝒑𝒙𝒊 ∗ 𝒒(𝒏−𝒙𝒊 ) suponen las variables con este
𝒙𝒊
comportamiento.
3
María Carolina Vásquez
X= 0,1,2,3,4,5
La distribución de probabilidades se
obtiene evaluando los posibles valores que
toma X, en:
4
María Carolina Vásquez
Distribución de probabilidades
𝑬𝒔𝒑𝒆𝒓𝒂𝒏𝒛𝒂 𝑬(𝑿) = 𝒏𝒑 Poisson
5
María Carolina Vásquez
6
María Carolina Vásquez
7
María Carolina Vásquez
8
María Carolina Vásquez
1
María Carolina Vásquez
2
María Carolina Vásquez
Su función de distribución viene dada por: Una de las aplicaciones más comunes de la
distribución de probabilidades uniforme
(𝒙 − 𝑨) continua, es para la generación de los
𝑭(𝑿 ≤ 𝒙) = {(𝑩 − 𝑨) , 𝑨≤𝒙≤𝑩 números aleatorios, en el intervalo [0,1], o
𝟎 𝒐𝒕𝒓𝒐 𝒄𝒂𝒔𝒐 los llamados “random”. A su vez estos
números aleatorios son usados para la
La gráfica de la distribución uniforme selección de valores al azar para una
continua tiene la siguiente forma: muestra a fin de estimar alguna de las
características de la población.
𝑿 ~ 𝑼(𝟎, 𝟏)
3
María Carolina Vásquez
Distribución normal
Figura 5. Distribución normal de parámetros µ y σ
Esta distribución es la más importante
dentro del de la estadística y en especial Existe una curva normal diferente para
para las inferencias estadísticas. La cada par de parámetros µ y σ. El valor de σ
ecuación de su función de densidad fue perite identificar que tan abierta es la
desarrollada por Abraham DeMoivre en campana, para dos curvas normales con
1733. En muchas ocasiones se le llama igual desviación estándar σ, pero con
distribución gaussiana en honor a Karl diferentes medias 𝝁𝟏 y 𝝁𝟐 , su gráfica sería
Friedrich Gauss, que al igual que DeMoivre algo similar a la siguiente figura:
obtuvo una ecuación para esta distribución
de probabilidades, a través de un estudio
de los errores en las mediciones repetidas
de la misma cantidad.
Se dice para la variable aleatoria X que tiene 3. Tiene dos (2) puntos de inflexión en
comportamiento normal, que: 𝑿=𝝁±𝝈
4
María Carolina Vásquez
7. Su media µ, su Me y Mo se encuentran
en el mismo punto Figura 8. Representación de la regla empirica
5
María Carolina Vásquez
(𝒙 − 𝝁)
𝒁=
𝝈
En la práctica es un cambio de variable para
trasladar la media con su correspondiente
desviación a curva normal con parámetros
µ=0 yσ=1
Figura 9. Área bajo de la curva ocupada por los valores de la
variable aleatoria entre –a y a
Tabla 1, Relación entre una normal de media µ y desviación σ,
con la distribución normal estándar
X Z Por ejemplo, se sabe que el peso de los
Media µ 0 estudiantes de una clase, se comporta
Una µ±σ ±1 según una distribución normal de media
desviación µ=50 y desviación estándar σ=10; se desea
Dos µ±2σ ±2 estimar la probabilidad que al seleccionar
desviaciones un estudiante al azar, su peso se encuentre
Tres µ±3σ ±3 entre 45 y 62 kilogramos.
desviaciones
Si se define una variable aleatoria X = peso
Como la curva normal es una distribución
de los estudiantes; la probabilidad que se
de probabilidades continuas no hay que
necesita es equivalente a;
olvidar que solo es posible calcular la
probabilidad en un intervalo [a,b], ya que la 𝑷(𝟒𝟓 ≤ 𝑿 ≤ 𝟔𝟐)
probabilidad en un punto específico, por
Dado que las probabilidades de la
ejemplo a, será igual a cero. Siendo igual a:
distribución normal están tabuladas, es
𝑷(𝒂 ≤ 𝑿 ≤ 𝒃) = 𝑷(𝑿 ≤ 𝒃) − 𝑷(𝑿 ≤ 𝒂) recomendable a fin de aligerar los cálculos
y disminuir el porcentaje de error; tipificar
la variable y trabajar con la tabla de la
Recordando las propiedades de una
normal estándar.
función de distribución, la probabilidad que
la variable aleatoria se encuentre entre a y Hoy día, existen innumerables aplicaciones
b, también se puede calcular como: que ayudan en los cálculos de las
6
María Carolina Vásquez
7
María Carolina Vásquez
través del tiempo como variable continua, Con esta distribución interesa conocer el
de la forma siguiente: tiempo que transcurre hasta que ocurre
determinado evento, sabiendo que:
𝒆𝒗𝒆𝒏𝒕𝒐𝒔 𝒅𝒆 𝒍𝒍𝒆𝒈𝒂𝒅𝒂
𝑻𝒂𝒔𝒂 𝒅𝒆 𝒍𝒍𝒆𝒈𝒂𝒅𝒂𝒔 =
𝒖𝒏𝒊𝒅𝒂𝒅 𝒅𝒆 𝒕𝒊𝒆𝒎𝒑𝒐 El tiempo que puede ocurrir desde
cualquier instante dado de tiempo “t”, hasta
Ahora si se quisiese calcular el tiempo que
transcurre entre un evento y otro, esa que ocurre ese evento en un instante 𝒕𝒇
𝒊
variable aleatoria ya no sería “discreta”,
no depende del tiempo transcurrido
pasaría a ser “continua”. En este caso, el
anteriormente en el que no haya ocurrido
comportamiento de esa variable aleatoria,
nada; es decir, en otras palabras:
es el que refleja la
El tiempo que transcurre desde que
Distribución exponencial
sucedió el evento anterior hasta que
Es el equivalente continuo de la sucede el nuevo evento no guardan
distribución de probabilidades discreta del relación, se dice entonces que
tipo geométrico, como por ejemplo la
La distribución exponencial no tiene
variable aleatoria de procesos tipo Poisson.
memoria
En términos generales, la distribución
exponencial la variable continua está La función de densidad de probabilidades
referida a tiempo, es decir: para una variable aleatoria continua con
comportamiento exponencial es:
𝒗𝒂𝒓𝒊𝒂𝒃𝒍𝒆 𝒄𝒐𝒏𝒕𝒊𝒏𝒖𝒂
𝑬𝒙𝒑𝒐𝒏𝒆𝒏𝒄𝒊𝒂𝒍 = 𝟏 − 𝜷𝒙
𝒗𝒂𝒓𝒊𝒂𝒃𝒍𝒆 𝒅𝒊𝒔𝒄𝒓𝒆𝒕𝒂 𝒆 , 𝒙≥𝟎
𝒇(𝒙, 𝜷) = {𝜷
Se dice que la distribución exponencial es la 𝟎, 𝒐𝒕𝒓𝒐 𝒄𝒂𝒔𝒐
inversa de la distribución Poisson,
midiendo para el caso por ejemplo de la La gráfica de la distribución exponencial,
tasa de llegadas, el llamado, tiempo entre tiene la siguiente forma:
llegadas. EL parámetro que define a una
distribución exponencial es denotado
como 𝜷, siendo:
𝒖𝒏𝒊𝒅𝒂𝒅 𝒅𝒆 𝒕𝒊𝒆𝒎𝒑𝒐
𝜷=
𝒄𝒂𝒏𝒕𝒊𝒅𝒂𝒅 𝒅𝒆 𝒆𝒗𝒆𝒏𝒕𝒐𝒔
Relación parámetros Poisson – Exponencial
𝜷 = 𝟏⁄𝝀
Figura 11. Distribución de densidad de probabilidades
exponencial
8
María Carolina Vásquez
2. 𝑬(𝑿) = 𝟏⁄
𝝀𝒆− 𝒙𝝀 , 𝒙>𝟎 𝝀
𝒇(𝒙, 𝝀) = {
𝟎, 𝒐𝒕𝒓𝒐 𝒄𝒂𝒔𝒐 3. 𝑽𝒂𝒓(𝑿) = (𝟏⁄ )𝟐
𝝀
La función de distribución, es decir la La distribución exponencial es usada para
probabilidad acumulada hasta un punto el cálculo de “tiempos de vida” o “tiempos
cualesquiera, se obtiene integrando la entre fallas”, es una de las distribuciones
función de densidad de probabilidades, de probabilidades más usadas en
desde cero hasta ese punto: ingeniería a la hora de programar el
𝒙𝒊 mantenimiento de equipos.
𝑭(𝑿 ≤ 𝒙𝒊 ) = ∫ 𝝀𝒆− 𝒙𝝀 𝒅𝒙 Por ejemplo, se tiene que el tiempo de vida
𝟎
útil de un tractor sigue una distribución
Resultando, al integrar y evaluar quedaría exponencial con media de 8 años, se desea
igual a: conocer ¿cuál es la probabilidad que se
tenga que remplazar antes de los 12 años?
𝑭(𝑿 ≤ 𝒙𝒊 ) = 𝟏 − 𝒆− 𝒙𝒊 𝝀
En este caso, se sabe que sigue una
Y para 𝑿 > 𝒙𝒊 distribución exponencial, para la que su
media o esperanza matemática es de 8
𝑭(𝑿 > 𝒙𝒊 ) = 𝒆− 𝒙𝒊 𝝀 años, es decir es su parámetro β. En el caso
de la exponencial se puede usar bien su
La gráfica de la función de distribución función de densidad de probabilidades en
exponencial, tiene la siguiente forma: función de ese parámetro o en función de
λ, sabiendo que
𝜷 = 𝟏⁄𝝀 → 𝝀 = 𝟏⁄𝜷
La probabilidad que el tractor falle antes de
los 12 años sería:
𝝀 = 𝟏⁄𝟖
𝟏𝟐⁄
𝑷(𝑿 ≤ 𝒙𝒊 ) = 𝟏 − 𝒆− 𝟖 = 𝟎, 𝟕𝟕 → 𝟕𝟕%
Figura 12. Función de distribución exponencial
9
María Carolina Vásquez
Figura 13. Función de distribución exponencial con valor medio Chequeando lo aprendido
8 años, para un tiempo de vida menor o igual a 12 años
Ejercicios propuestos.
1. Un autobús pasa por cierta parada cada 15
Ahora para poner en evidencia la
minutos, ¿cuál es la probabilidad que si tú
propiedad “no tiene memoria”, se pregunta
llegas a la parada en momento dado, tengas
¿cuál es la probabilidad de reemplazar el
que esperar el autobús más de cinco (5)
motor antes de los 15 años, si se sabe que
minutos?
ya lleva 3 años funcionando?
2. Deduzca las fórmulas de la esperanza
matemática y la varianza para una
Dado que el comportamiento es de tipo
distribución uniforme continua.
exponencial, el tractor “no recuerda que ya
3. La nota promedio para un examen es 74 y la
tiene 3 años funcionando”; ese tiempo ya
desviación estándar es 7. Si 12% de la sección
pasó; por lo que, para calcular que falle
obtiene A y las calificaciones siguen una curva
antes de los 15 años sabiendo que ya tiene
que tiene una distribución normal, ¿cuál es el
3 funcionando, sería equivalente a calcular
valor de A más baja posible y el valor de B
la probabilidad que falle antes de los 12
más alto posible?
años siguientes a los 3 primeros años; es
4. Una empresa de material eléctrico fabrica
decir, cada día es como si la cuenta de los
bombillos fluorescentes circulares que tienen
años se iniciase de nuevo. Lo que es
una duración, antes de quemarse (fundirse),
exactamente igual a la probabilidad
que se distribuye normalmente con media
calculada anteriormente, es decir 77%
igual a 800 horas y una desviación estándar
de 40 horas. ¿Cuál será la probabilidad que
Visto de forma gráfica sería equivalente a;
un bombillo se queme entre 778 y 834 horas?
5. Cierto tipo de batería de almacenamiento
dura, en promedio, 3.0 años, con una
desviación estándar de 0.5 años. Suponiendo
10
María Carolina Vásquez
11
María Carolina Vásquez
1
María Carolina Vásquez
2
María Carolina Vásquez
3
María Carolina Vásquez
comportará como una distribución normal promedio de los valores de cada muestra y
de parámetros: se prepara su histograma de frecuencias.
Lo relevante no que se tomen 100
𝜎
𝑋̅~𝑁(µ, ) muestras, es el tamaño de cada muestra lo
√𝑛
que hace la diferencia. La gráfica de la
Al tipificar la media de la muestra, para distribución de probabilidades para la
referirla a una distribución normal de “media de la muestra”, tiene la siguiente
media µ=0 y σ=1, quedaría de la siguiente forma:
forma:
̅ − 𝝁)
(𝑿
𝒁= 𝝈 ~ 𝑵(𝟎, 𝟏)
√𝒏
Por ejemplo, se tienen los datos de las
edades de las personas que tienen
registrada una cuenta en un sitio web; en
este caso se considerará como población a:
Figura 7. Distribución de la media de la muestra para
“personas que tienen registrada una cuenta n=10
en el sitio web XXX, al mes de julio de 2020”
Al observar la gráfica el valor promedio es
Esta población tiene la siguiente aproximadamente 𝑋̅ = 15,11, no se podría
distribución de probabilidades, con media decir que se aproxima a una distribución
µ=14,9 y desviación estándar σ=3,9. La normal, sin embargo los valores se
forma de la distribución es distribuyen aproximadamente alrededor
aproximadamente igual a: de ese valor de 15,11.
4
María Carolina Vásquez
𝑆𝑥 = 𝜎/√𝑛
sigue comportando como su distribución Los estimadores deben tener como mínimo
original, eso no cambia. tres (3) características principales:
La mayor parte de las inferencias Consistencia
estadísticas se basa en este teorema, ya
• Su valor, a mayor tamaño de la
que, permite tener un modelo de muestra, se aproxima más al valor de la
comportamiento para la media de las población
muestras, para inferir que la población se
comporta como esa muestra. Eficiencia
• Su varianza es reducida. Se selecciona
Tipos de inferencia estadística siempre el de menor varianza
Las inferencias estadísticas se pueden Insesgadez
dividir en dos (2) grandes grupos; los
• Su esperanza matemática es igual al
llamados estimadores o estadísticos que se parámetro que se desea estimar
obtienen de las muestras y las llamadas
pruebas de hipótesis en las que se parte de
Figura 12. Características de los estimadores
un supuesto sobre el comportamiento de
una muestra, para inferir que la población Estimadores puntuales
tiene ese mismo comportamiento. Los Los estimadores puntuales consideran que
tipos de inferencias se pueden resumir la población se comporta igual que la
como: muestra, es decir, el parámetro de la
población es directamente el estadístico
Inferencias estadísticas
6
María Carolina Vásquez
̅ − 𝒁𝜶⁄ 𝝈⁄ ≤ 𝝁 ≤ 𝑿
𝑿 ̅ + 𝒁𝜶⁄ 𝝈⁄
𝟐 √ 𝒏 𝟐 √𝒏
De las relaciones anteriores se dice que el
error que se puede cometer al decir que la
media de la población se encuentra dentro
de ese rango es igual a:
Error = 𝜽 = 𝝈⁄
√𝒏
Figura 14. Consideraciones para el establecimiento de
un intervalo de confianza
7
María Carolina Vásquez
𝒑𝒒
(𝒏 − 𝟏) 𝒈𝒓𝒂𝒅𝒐𝒔 𝒅𝒆 𝒍𝒊𝒃𝒆𝒓𝒕𝒂𝒅 Error = 𝜽 = √
𝒏
𝒑𝒒 𝒑𝒒
Intervalo de confianza para una 𝒑𝒎 − 𝒁𝜶⁄ √ ≤ 𝒑 ≤ 𝒑𝒎 + 𝒁𝜶⁄ √
𝟐 𝒏 𝟐 𝒏
proporción
Para estimar el intervalo de confianza para Valores más usuales de Z en la normal
una proporción se parte que la variable estándar en función de ⍺
aleatoria tiene comportamiento de
acuerdo a una distribución binomial:
𝑿 ~ 𝑩(𝒏, 𝒑)
Ahora bien, considerando que para valores
grandes de n, en los que:
𝒏𝒑 > 𝟎. 𝟓 𝒏𝒑 > 𝟎. 𝟓
La variable aleatoria se puede aproximar a
una normal de media y desviación: Figura 15. Valores más usuales de Z en función del nivel
de significación ⍺
𝝁 = 𝒏𝒑
𝝈 = √𝒏𝒑𝒒 Intervalo de confianza para la
varianza
Por tanto, será entonces
Para estimar un intervalo de confianza para
𝑿 ~ 𝑵(𝒏𝒑, √𝒏𝒑𝒒) la varianza de la población 𝝈𝟐 se parte de
Ahora como lo que interesa es establecer la varianzas de la muestra o “cuasi-
𝟐
un intervalo de confianza para la varianza” 𝑺𝒙 ; estimar un intervalo de
proporción “p”, no para np, se define una confianza para la varianza
nueva variable Y= X/n,, que por
8
María Carolina Vásquez
9
María Carolina Vásquez
10
María Carolina Vásquez
1
María Carolina Vásquez
Puntuales
En las pruebas paramétricas, es conocida la
Estimadores
distribución de probabilidades, y para las
Intervalos
no paramétricas, en la mayoría de los
casos, a través de la prueba de hipótesis, se
media
Pruebas de espera establecer cuál es la distribución de
hipótesis probabilidades a la que se ajusta la variable
desviacióon
aleatoria.
2
María Carolina Vásquez
que se espera probar, planteando dos (2) Según lo anterior, las hipótesis nulas
hipótesis: una nula y una alternativa siempre contienen la igualdad y las
hipótesis alternas son el complemento de
Con base en los datos de una muestra de la la hipótesis nula.
población, se calcula el llamado “estadístico
de pruebas”. ¿Qué puede pasar con las hipótesis?
3
María Carolina Vásquez
Ahora bien, podría suceder que, dado que que se estudiarán en el curso, los
la decisión en la prueba de hipótesis se estadísticos de prueba son los siguientes:
toma con base en una “muestra” de la
población, podría haberse cometido algún Estadístico de pruebas para la media
error, dependiendo si Se espera probar que una muestra
proviene de una población dada, a través
del contraste de la media de esa muestra,
Ho Verdadera Falsa con la media de la población de la que se
supone proviene.
No rechazar Correcto Error Tipo II Por teorema del límite central se sabe que
la media de la muestra tiene el siguiente
comportamiento:
Rechazar Error Tipo I Correcto
𝝈
̅ ~𝑵(𝝁,
𝑿 )
√𝒏
Figura 6. Tipos de errores al no rechazar y rechazar una
hipótesis nula Al tipificar esa variable aleatoria X para
referirla a una normal 𝑿~𝑵(𝟎, 𝟏), se toma
El error tipo I, también llamada nivel de
como estadístico de pruebas para una
significancia ⍺, es la probabilidad de
prueba de hipótesis para la media:
rechazar la hipótesis nula aún y cuando
podría ser verdadera. Para cualquier ̅ − 𝝁)
(𝑿
prueba, debe establecerse el valor de ⍺ 𝒁𝒎𝒖𝒆𝒔𝒕𝒓𝒂 = 𝝈
La probabilidad de no rechazar Ho siendo √𝒏
falsa se denota como ß
Estadístico de pruebas para la varianza
Para esta prueba no hay que olvidar que se
Ratificando lo mencionado anteriormente,
no se debe olvidar que al realizar una parte al igual que para el intervalo de
confianza de una población normal (𝝁,𝝈)
prueba de hipótesis siempre es necesario
establecer el
Se asume que como estadístico de pruebas:
4
María Carolina Vásquez
5
María Carolina Vásquez
Chequeando lo aprendido
Ejercicios propuestos.
Proyecto de fin del curso