Está en la página 1de 15

Estadística Inferencial 1091

Corte 1 35%
Taller 1: 10% ------- Grupos máx. 3 personas
Taller 2: 10%
Parcial 1: 15%

Corte 2 35%
Taller 3: 10%
Taller 4: 10%
Parcial 2: 15%

Corte 3 30%
Taller 5 (opcional): 10%
Parcial 3: 20%

Parcial 3: 30%

Contenidos Temáticos

• Conceptos básicos en estadística: Definiciones


• Definición y características de la distribución de probabilidad Normal. Cálculo de
probabilidades.
• Definición y características de la distribución de probabilidad Binomial. Cálculo de
probabilidades.
• Definición y características de la distribución de probabilidad Hipergeométrica.
Cálculo de probabilidades.
• Estimación de parámetros estadísticos (media y proporción) a través de intervalos
de confianza.
• Pruebas de hipótesis (intervalos de confianza): Contrastes bilaterales y unilaterales
Toma de decisión.
Conceptos básicos

Población (N): Conjunto de elementos que tienen una característica en común.

Muestra (n): Subconjunto de la población objeto de estudio que debe guardar las mismas
características que N

Muestreo: Es la forma o técnica en la cual se seleccionan los elementos de n.


Existen dos formas de llevar acabo un muestreo:

a) Muestreo no aleatorio (no probabilístico)


El criterio usado es el del investigador: Conveniencia o intencional (voluntario)

b) Muestreo Aleatorio (probabilístico)

1. Aleatorio simple: Usar los números aleatorios


2. Aleatorio Sistemático: Se genera un patrón de selección de los elementos: k
3. Aleatorio por estratos: N está divido en grupo o estratos. La cantidad de elementos
a seleccionar es proporcional al tamaño del estrato

Ejemplo

Supóngase que se tiene la siguiente población organizada como:

𝑵𝟏 = 𝟏𝟐𝟎
𝑵𝟐 = 𝟑𝟎𝟎
𝑵𝟑 = 𝟒𝟎𝟎
𝑵𝟒 = 𝟏𝟓𝟎

Se van a seleccionar 80 elementos

Para N1

120 𝑥1
=
970 80

80 ∗ 120
𝑥1 = = 9,89 ≈ 10
970

Para N2
24,74 ≈ 25

Para N3
32,98 ≈ 33
Para N4
12,37 ≈ 12

Del grupo N1 se escogen 10, Del grupo N2 se escogen 25, Del grupo N3 se escogen 33, Del
grupo N4 se escogen 12

Tamaño de la muestra

• Cuando se conoce el tamaño de N

𝑧8 ∗ 𝑝 ∗ 𝑞 ∗ 𝑁
𝑛=
𝑁 ∗ 𝑒8 + 𝑧8 ∗ 𝑝 ∗ 𝑞

N = población
P y q = Proporción de variabilidad de la población
P = 0,5
q = 0,5
z = Valor crítico que depende del nivel de confianza

Nivel de confianza Valor crítico z


90% 1,645
95% 1,96
99% 2,575

e = error muestral

A cuantas personas se tendrían que encuestar para conocer la preferencia en el mercado


en cuanto a marcas de productos de higiene personal si se sabe que la cantidad de personas
de una población en particular es de 15000. Para esto usar una confianza del 90% y un error
del 3%

𝑧8 ∗ 𝑝 ∗ 𝑞 ∗ 𝑁
𝑛=
𝑁 ∗ 𝑒8 + 𝑧8 ∗ 𝑝 ∗ 𝑞

(1,645)8 ∗ 0,5 ∗ 0,5 ∗ 15000 10147,5937


𝑛= = = 715,8038 ≈ 716
15000 ∗ (0,03) + (1,645) ∗ 0,5 ∗ 0,5
8 8 14,1765

(1.645)^2*0.5*0.5*15000
15000*(0.03)^2+(1.645)^2*0.5*0.5

Se deben encuestar a 2716 personas de las 15000


2716

• Cuando NO se conoce el tamaño de N

A cuantas personas se tendrían que encuestar para conocer la preferencia en el mercado


en cuanto a marcas de productos de higiene personal. Para esto usar una confianza del 90%
y un error del 3%

𝑧8 ∗ 𝑝 ∗ 𝑞
𝑛=
𝑒8

1,6458 ∗ 0,5 ∗ 0,5 0,67650


𝑛= = = 751,666
0,038 0,0009

Se deben encuestar a 752 personas

Distribución de probabilidad Normal

Ejercicio

Se ha recolectado la información sobre la altura en cm de 1400 personas, obteniendo lo


siguiente:

Estatura en cm Frecuencia
absoluta: Cantidad
141 30
146 130
151 250
156 360
161 300
166 200
171 90
176 40
400

350

300

250

200

150

100

50

0
Con 141 Con 146 Con 151 Con 156 Con 161 Con 166 Con 171 Con176

Media: aprox. 157


Mediana: 156
Moda: 156

Si tenemos información que presenta dicha tendencia, se va a decir que los datos se
comportan aproximadamente de forma normal. Su simbología se representa como:

𝑋~𝑁 (𝜇 , 𝜎)

Gráficamente está modelado por una curva llamada campana de Gauss y presenta las
siguientes características:

• Es una curva simétrica con respecto a la media


• Presenta asíntota con respecto a una horizontal
• Tiene dos puntos de inflexión que ocurren en: 𝜇 − 𝜎 y 𝜇 + 𝜎

Esta curva servirá para el calculo de probabilidades. Sin embargo, es importante mencionar
que la cantidad de gráficos de la normal se puede extender según las poblaciones que se
estén analizando y por ende el cálculo probabilístico puede diferir.

Es así que, para evitar dicha situación, existe un gráfico de la norma estándar que tiene
como características:
𝑋~𝑁 (𝜇 , 𝜎)

𝑋~𝑁 (0 , 1) y se suele representar con la letra Z

Si para el calculo de la probabilidad la variable está en X, entonces debemos estandarizarla


usando:
GHI
𝑧= J
0,0987

Distribución de probabilidad Binomial

Ejercicio
Suponga que se lanza un dado 7 veces y se hace el conteo de la cantidad de veces que sale
el numero 4. ¿Cuál es la probabilidad de obtener 3 veces el número 4?

Es una distribución discreta que mide la cantidad de éxitos en n ensayos. Se caracteriza por:

• Siempre se esperan dos tipos de resultados: Éxito y fracaso.


• Las probabilidades asociadas a cada uno de los resultados son siempre constantes.
• Cada intento o ensayo es independiente entre si

Su función de distribución se describe como:

Sea 𝑋~𝐵𝑖𝑛 (𝑥, 𝑛, 𝑝) y su función es:

𝑛
𝑝(𝑋 = 𝑥 ) = M N ∙ 𝑝 G ∙ 𝑞 PHG
𝑥
Donde:

n = Cantidad de intentos o ensayos: 7


p = Probabilidad de éxito: 1/6
q = Probabilidad de fracaso: 5/6
x = Cantidad de éxitos que esperamos que ocurra: 3

7
𝑝(𝑋 = 3) = M N ∙ (1/6)R ∙ (5/6)SHR
3
7 1 R 5 V
𝑝(𝑋 = 3) = M N ∙ T U ∙ T U = 0,0781
3 6 6

Estudios demuestran que en las vías de una cierta ciudad en Colombia el 72% de los
conductores usa el cinturón de seguridad. Si se selecciona una muestra aleatoria de 10
conductores:

a) Prob. De que exactamente 6 conductores lleven el cinturón de seguridad puesto

𝑛
𝑃(𝑋 = 𝑥 ) = M N ∙ 𝑝 G ∙ 𝑞 PHG
𝑥
Donde:
n = Cantidad de intentos o ensayos: 10
p = Probabilidad de éxito: 0,72
q = Probabilidad de fracaso: 0,28
x = Cantidad de éxitos que esperamos que ocurra: 6

10
𝑃 (𝑋 = 6) = M N ∙ (0,72)X ∙ (0,28)YZHX
6

10 (
𝑃 (𝑋 = 6) = M N ∙ 0,72)X ∙ (0,28)V = 0,1798
6

La Prob. de que exactamente 6 conductores lleven el cinturón de seguridad puesto es de


17,98%

b) Prob. De que al menos 8 conductores lleven el cinturón de seguridad puesto

Donde:

n = Cantidad de intentos o ensayos: 10


p = Probabilidad de éxito: 0,72
q = Probabilidad de fracaso: 0,28
x = Cantidad de éxitos que esperamos que ocurra: 8 , 9 ,10
𝑛
𝑃(𝑋 = 𝑥 ) = M N ∙ 𝑝 G ∙ 𝑞 PHG
𝑥

10 (
𝑃 (𝑋 = 8) = M N ∙ 0,72)[ ∙ (0,28)YZH[ = 0,2547
8

10 (
𝑃 (𝑋 = 9) = M N ∙ 0,72)\ ∙ (0,28)YZH\ = 0,1455
9

10 (
𝑃 (𝑋 = 10) = M N ∙ 0,72)YZ ∙ (0,28)YZHYZ = 0,0374
10

= 0,2547 + 0,1455 + 0,0374 = 0,4376

La Prob. De que al menos 8 conductores lleven el cinturón de seguridad puesto es 43,76%

c) Prob. De que no mas de 2 conductores lleven el cinturón de seguridad puesto

Donde:

n = Cantidad de intentos o ensayos: 10


p = Probabilidad de éxito: 0,72
q = Probabilidad de fracaso: 0,28
x = Cantidad de éxitos que esperamos que ocurra: 2 , 1 , 0
𝑛
𝑃(𝑋 = 𝑥 ) = M N ∙ 𝑝 G ∙ 𝑞 PHG
𝑥

10
𝑃(𝑋 = 2) = M N ∙ (0,72)8 ∙ (0,28)YZH8 = 8,8133 ∗ 10HV = 0,00088133
2

10
𝑃 (𝑋 = 1) = M N ∙ (0,72)Y ∙ (0,28)YZHY = 7,6164 ∗ 10H] = 0,000076164
1

10 (
𝑃 (𝑋 = 0) = M N ∙ 0,72)Z ∙ (0,28)YZHZ = 2,9619 ∗ 10HX = 0,000002961
0

= 0,00088133 + 0,000076164 + 0,000002961 = 0,000960

Ejercicio

El 20% de las baterías de litio para celular sufre algún tipo de recalentamiento cuando se
conecta al cargador. Si de un lote se escogen aleatoriamente 200 baterías ¿Cuál es la
probabilidad de que a lo sumo 50 baterías sufran recalentamiento?

𝑛
𝑃(𝑋 = 𝑥 ) = M N ∙ 𝑝 G ∙ 𝑞 PHG
𝑥

n = Cantidad de intentos o ensayos: 200


p = Probabilidad de éxito: 0,2
q = Probabilidad de fracaso: 0,8
x = Cantidad de éxitos que esperamos que ocurra: 50 , 49 ,48 , 47 , 46 ,…3 ,2 ,1 , 0

200
𝑃 (𝑋 = 0) = M N ∙ (0,2)Z ∙ (0,8)8ZZ
0

Debido al tamaño de n (“grande”) y los valores de toma x , entonces se puede aproximar la


binomial por una normal. Para esto se debe cumplir lo siguiente:

𝑛∗𝑝≥ 5
𝑛∗𝑞 ≥ 5

Además, el tamaño de n se considera “grande” cunado es mayor o igual que 15


El 20% de las baterías de litio para celular sufre algún tipo de recalentamiento cuando se
conecta al cargador. Si de un lote se escogen aleatoriamente 200 baterías ¿Cuál es la
probabilidad de que a lo sumo 50 baterías sufran recalentamiento?

La probabilidad de que a lo sumo 50 baterías sufran recalentamiento es de 96,78%

Distribución Hipergeométrica

Es una distribución discreta que se caracteriza por:

• Siempre se esperan dos tipos de resultados


• Las probabilidades asociadas a cada evento No son constantes
• Cada intento o ensayo No es independiente

Su función de distribución esta dada por:

𝑅 𝑁−𝑅
M NM N
𝑃 (𝑋 = 𝑥 ) = 𝑥 𝑛 − 𝑥
𝑁
M N
𝑛
N = Población
R = Éxitos en la población
n = Muestra
x = Éxitos en la muestra

Se pone a la venta un conjunto de 75 artículos de los cuales se sabe que 10 están


defectuosos. Si se toma una muestra aleatoria de 5 artículos,

A. calcular la probabilidad de que aparezca un artículo defectuoso.

𝑅 𝑁−𝑅
M NM N
𝑃 (𝑋 = 𝑥 ) = 𝑥 𝑛 − 𝑥
𝑁
M N
𝑛
N = Población = 75
R = Éxitos en la población 10 o 65
n = Muestra = 5
x = Éxitos en la muestra 1
10 75 − 10
M NM N
𝑃 (𝑋 = 1) = 1 5 − 1
M75N
5

10 65
M NM N
𝑃 (𝑋 = 1) = 1 4 = 0,3922
75
M N
5

La probabilidad de que aparezca un artículo defectuoso es de 39,22%

B. Calcular la probabilidad de que aparezca al menos 3 artículos defectuoso.

𝑅 𝑁−𝑅
M NM N
( )
𝑃 𝑋 = 𝑥 = 𝑥 𝑛 − 𝑥
𝑁
M N
𝑛
N = Población = 75
R = Éxitos en la población 10 o 65
n = Muestra = 5
x = Éxitos en la muestra = 3 , 4 y 5

𝑝(𝑥 ≥ 3) = 𝑝(𝑥 = 3) + 𝑝(𝑥 = 4) + 𝑝(𝑥 = 5)

10 65
M NM N
𝑃 (𝑋 = 3) = 3 2 = 0,0144
75
M N
5

10 65
M NM N
𝑃 (𝑋 = 4) = 4 1 = 7,90 × 10HV = 0,000790
75
M N
5

10 65
M NM N
𝑃 (𝑋 = 5) = 5 0 = 1,46 × 10H] = 0,00001460
75
M N
5

𝑝(𝑥 ≥ 3) = 0,0144 + 0,000790 + 0,00001460 = 0,01520


La probabilidad de que aparezca al menos 3 artículos defectuosos es de 1,52%

ESTIMACIÓN EN ESTADISTICA

Para realizar la estimación de un parámetro (poblacional) estadístico se pueden usar dos


tipos de procesos:

• Estimación Puntual
• Estimación por intervalos de confianza

Estimación por intervalos de confianza

Es el proceso utilizado para conocer las características de un parámetro poblacional a partir


del conocimiento del comportamiento del parámetro en la muestra. Los parámetros a
estimar son:

• Media (promedio) poblacional


• Proporción poblacional

A partir de esto se definen:

Intervalo de confianza
Se llama así al rango de valores donde se espera que esté el parámetro poblacional a
estimar.

Nivel de confianza
Probabilidad de que el parámetro poblacional a estimar esté dentro del intervalo de
confianza.

Error de estimación
Hace referencia al radio del intervalo.

Para esto se manejará la tabla de valores críticos para realizar la estimación:

Nivel de confianza Nivel de significancia 𝜶 Valor crítico z


𝟏−𝜶 𝜶b 𝒁𝜶b𝟐
𝟐
0,90 0,05 1,645
0,95 0,025 1,96
0,99 0,005 2,575
Se van a generar dos tipos de intervalos: Uno para media y el otro para proporción

1. Intervalo de confianza para una media

El intervalo de confianza para una media de una población (𝜇) con un nivel de confianza
1 − 𝛼 a partir de una muestra de tamaño n con una media muestral 𝑥̅ y una desviación 𝜎 ,
se calcula como:

𝜎 𝜎
T𝑥̅ − 𝑍𝛼b2 ∙ , 𝑥̅ + 𝑍𝛼b2 ∙ U
√𝑛 √𝑛

Ejemplo:

El tiempo que tardan los cajeros de un autoservicio en atender a sus clientes se distribuye
aprox. de forma normal con media desconocida y una desviación de 0,5 minutos. Para una
muestra aleatoria de 30 clientes se obtuvo un tiempo promedio de 5,2 min. Generar un
intervalo de confianza al 95% para estimar el tiempo promedio que tardan los cajeros en
atender a los clientes.

𝜎 𝜎
T𝑥̅ − 𝑍𝛼b2 ∙ , 𝑥̅ + 𝑍𝛼b2 ∙ U
√𝑛 √𝑛

0,5 0,5
T5,2 − 1,96 ∙ , 5,2 + 1,96 ∙ U
√30 √30

( 5,0210 , 5,3789 )

Esto significa que en el 95% de las muestras de tamaño 30, el tiempo que tardan los cajeros
en atender a sus clientes está entre 5,0210 y 5,3789 min

Intervalo al 90%
0,5 0,5
T5,2 − 1,645 ∙ , 5,2 + 1,645 ∙ U
√30 √30

(5,0498 , 5,3501 )

Intervalo al 99 %
0,5 0,5
T5,2 − 2,575 ∙ , 5,2 + 2,575 ∙ U
√30 √30

( 4,9649 , 5,4350 )

Intervalo al 90% (5,0498 , 5,3501 )


Intervalo al 95% ( 5,0210 , 5,3789 )
Intervalo al 99 % ( 4,9649 , 5,4350 )

2. Intervalo de confianza una proporción

El intervalo de confianza para una proporción poblacional (p) con un nivel de confianza 1 −
𝛼 a partir de una muestra de tamaño n que presenta una característica distinguible, se
calcula como:

𝑝 ∙ 𝑞 𝑝 ∙ 𝑞
h𝑝 − 𝑍𝛼b2 ∙ i , 𝑝 + 𝑍𝛼b2 ∙ i j
𝑛 𝑛

Ejemplo

Durante cierto tiempo, las ventas de una cadena de establecimiento de comidas rápidas
han venido disminuyendo. Para suplir esta situación, los socios han contratado una empresa
consultora determinado que el 30% encontrado en una muestra de tamaño 95 ha sido por
mala administración. Generar un intervalo de confianza al 90% para estimar la proporción
de establecimientos que han disminuido sus ventas por mala administración

𝑝 ∙ 𝑞 𝑝 ∙ 𝑞
h𝑝 − 𝑍𝛼b2 ∙ i , 𝑝 + 𝑍𝛼b2 ∙ i j
𝑛 𝑛

0,3 ∙ 0,7 0,3 ∙ 0,7


k0,3 − 1,645 ∙ l , 0,3 + 1,645 ∙ l m
95 95

(𝟎, 𝟐𝟐𝟐𝟔 , 𝟎, 𝟑𝟕𝟕𝟑 )

La proporción de establecimientos que han disminuido sus ventas por mala administración
está entre 22,26 % hasta 37,73%.
Pruebas de hipótesis

Es un test estadístico en el que a partir de una muestra de tamaño n, nos permite extraer
conclusiones para Aceptar o Rechazar una hipótesis previamente establecida sobre el valor
de un parámetro estadístico desconocido.

Los parámetros son:

• Media
• Proporción

Para establecer una prueba de hipótesis se plante lo siguiente:

• Hipótesis Nula (𝑯𝒐 ): Es la hipótesis que se va a someter a verificación, es decir es


sobre la que se concluye si se acepta o es rechazada
• Hipótesis Alterna(𝑯𝟏 ):

También podría gustarte