Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística Inferencial
Christian Mejía
cimejia@uce.edu.ec
Marzo, 2017
1
Estadística inferencial
Contenido
1 Introducción
2 Elementos y Cálculo de Probabilidad
3 Variables aleatorias: discretas y continuas
1 Función de Probabilidad
2 Función de Densidad de Probabilidad
3 Función de Probabilidad y Densidad Acumuladas
4 Esperanza y Varianza de una variable aleatoria
4 Distribuciones de Probabilidad: discretas y continuas
5 Inferencia Estadística
1 Procedimiento de Estimación
2 Estimadores y Parámetros
3 Teorema Central del Límite
4 Métodos de Estimación: Puntual e Intervalos de Conanza
5 Tamaño Muestral
2
Estadística inferencial
Introducción
3
Estadística inferencial
Elementos de Probabilidad
Conceptos básicos:
4
Estadística inferencial
Elementos de Probabilidad
Hecho o fenómeno aleatorio
Aquella experiencia que trae consigo un resultado que no se sabe a
ciencia cierta cuál será; es decir, no hay certeza del resultado, es
impredecible.
Ejemplos:
Ω = {C , S}
Ω = {SSS, SSC , SCS, CSS, SCC , CSC , CCS, CCC }
Ω = {(rojo, verde, negro, blanco), (rojo, negro, blanco, azul), . . . }
Ω = {6, x 6, xx 6, xxx 6, xxxx 6, xxxxx 6, . . . }
Ω = {1200.35, 34564.17, 0, 17.18, 272634.0, . . . }
Ω = {22o C , 22.2o C , 23.17o C , 22.8o C , . . . }
Estadística inferencial
Elementos de Probabilidad
Evento o suceso
Un suceso es cualquier evento observable tras la realización de un
experimento. Cualquier subconjunto del espacio muestral.
Ejemplos:
S = {C } si el resultado de lanzar una moneda es cara
S = {3, 5, 6, 6, 5, 2, 3, 2} si se tira un dado 8 veces
S = {2.0; 3.3; 2.1; 2.5; 2.9} si se miden 4 cristales de
feldespato de un granito
S = {0.39; 1.02; 0.50; 0.30; 0.89} si se analizan 5 muestras por
cobre
7
Estadística inferencial
Elementos de Probabilidad
La PROBABILIDAD es una forma numérica de medir la
incertidumbre. Es decir, una forma de medir la facilidad o
dicultad de que un suceso ocurra.
La Teoría de la Probabilidad nos dirá que para medir la ocurrencia
de un evento existen tres formas equivalentes:
Mediante el concepto de probabilidad clásica
Mediante el concepto de frecuencia relativa
Ejemplos:
Para la experiencia aleatoria tirada de una moneda perfecta, cada
uno de los dos resultados posibles posee una probabilidad de 1/2.
Para la experiencia aleatoria tirada de un dado perfecto, cada uno
de los resultados posibles posee una probabilidad de 1/6.
La probabilidad de que al sacar dos naipes consecutivos de una
baraja, los dos sean reyes es:
Si se sacan con restitución los resultados de las dos
extracciones son independientes:
4 4 1
P(S) = 40
x 40 = 100
10
Estadística inferencial
Elementos de Probabilidad
Axiomas de Probabilidad:
Sea ξ un experimento aleatorio, que genera un espacio muestral Ω,
compuesto por eventos. La probabilidad de un evento S es un
número real, P(S), que se le asigna a cada uno de los eventos, tal
que cumplen con los siguientes axiomas:
1 P(S) ≥ 0
No existen probabilidades negativas
Si P(S) = 0 entonces el suceso es imposible
Si P(S) = 1 entonces el suceso es seguro
2 P(Ω) = 1
3 Si A ∩ B = ∅, entonces P(A ∪ B) = P(A) + P(B)
11
Estadística inferencial
Elementos de Probabilidad
12
Estadística inferencial
Elementos de Probabilidad
13
Estadística inferencial
Elementos de Probabilidad
nS
P(S) = lim
n→∞ n
15
Estadística inferencial
Elementos de Probabilidad
Ejemplo:
Variable aleatoria
Cualquier hecho que proveniente de un experimento o
fenómeno aleatorio.
Propiedades:
No es posible conocer con certeza el valor que tomará al ser
medida o determinada.
Debido al azar, puede tomar valores diferentes.
Se caracteriza porque si se repite sucesivamente el experimento
en las mismas condiciones, el resultado puede ser distinto.
Representación:
Se utilizan letras mayúsculas para representar variables aleatorias:
X ,Y ,W ; mientras que los valores de la variable aleatoria se notarán
con minúsculas, x , y , w , respectivamente.
17
Estadística inferencial
Variable aleatoria
Cuando se analiza una variable aleatoria, se desearía conocer con
exactitud el valor que tomaría la variable si se realizara el
experimento. Sin embargo, esto es imposible y genera
incertidumbre.
Ejemplo:
Sea ξ el fenómeno aleatorio: lanzar al aire una moneda tres veces.
El espacio muestral es:
Ω = {SSS, SSC, SCS, CSS, SCC, CSC, CCS, CCC}
RX = {0, 1, 2, 3}
18
Estadística inferencial
Variable aleatoria
Otros ejemplos:
Tiempo de vida útil de una computadora
Dureza de una probeta de hormigón
Número de accidentes laborales diarios en una ciudad
Cotización diaria en bolsa de un valor
Número de mensajes diarios recibidos en un teléfono móvil
El tamaño de cristales de feldespato
El contenido metálico de un mineral
Clasicación:
Variable aleatoria discreta (v.a.d.)
Variable aleatoria continua (v.a.c.)
19
Estadística inferencial
Variable aleatoria
Ejemplos:
Las puntuaciones otorgadas por los jueces a los deportistas de
gimnasia como: 7.2, 8.7, 9.7, no puede ser la puntuación 8.74
u 8.747.
El número de terremotos al mes que se producen en una
región.
El número de bloques encima de la ley de corte en un
yacimiento.
20
Estadística inferencial
Variable aleatoria
Función de Probabilidad
Asigna a cada uno de los resultados posibles xi de la v.a.d. X , la
probabilidad de obtener dicho valor:
f (xi ) = P(X = xi )
Propiedades:
f (xi ) ≥ 0 para cualquier valor posible de X .
Siempre existe un valor de probabilidad para cada xi que pertenezca
al dominio de la variable.
P(X = xi ) = P(X = x1 ) + · · · + P(X = xn ) = 1
P P
f (xi ) =
21
Estadística inferencial
Variable aleatoria
Función de Probabilidad Acumulada
Sea X una v.a.d., la función de probabilidad acumulada Pac es:
xj
X
Pac (xj ) = P(X = x)
x=x1
Ejemplo:
Al lanzar dos monedas, el espacio muestral original es:
Ω = {SS, SC , CS, CC }
23
Estadística inferencial
Variable aleatoria
Esperanza matemática de una v.a.d.
E (X ) = 1
24
Estadística inferencial
Variable aleatoria
σ 2 = V (X ) = E (X 2 ) − µ2
Estadística inferencial
Variable aleatoria
26
Estadística inferencial
Variable aleatoria
27
Estadística inferencial
Variable aleatoria
Función de Densidad de Probabilidad
Sea X una v.a.c., f (x) es función de densidad de probabilidad si:
1 f (x) ≥ 0, ∀x ∈ R
R∞
−∞ f (x) dx = 1
2
Rb
3 P(a ≤ X ≤ b) = f (x) dx a, b ∈ R
a
28
Estadística inferencial
Variable aleatoria
29
Estadística inferencial
Variable aleatoria
Propiedades:
∀x ∈ R, F (x) ∈ [0, 1]
Si a < b → P(a < X < b) = F (a) − F (b)
lim F (x) = P(X < ∞) = 1
x→∞
P(X ≥ a) = 1 − P(X ≤ a) a ∈ R
Estadística inferencial
Variable aleatoria
Notas:
P(X = a) = 0 a ∈ R
P(a ≤ X ≤ b) = P(a < X < b) a, b ∈ R
31
Estadística inferencial
Variable aleatoria
35
Estadística inferencial
Distribuciones Probabilísticas
Distribuciones de Probabilidad
Objeto matemático descrito a través de ecuaciones, que cumple
ciertas propiedades y que permite precisar:
Los posibles valores de una variable aleatoria;
Las probabilidades con las que la variable toma cualquier valor,
o conjunto de valores.
Ω = {Exito, Fracaso}
Variable aleatoria
Se dene a la variable aleatoria X como 1 si el resultado es éxito y
0 si el resultado es fracaso.
X ∼ B(p)
37
Estadística inferencial
Distribuciones Probabilísticas
Función de probabilidad
Toma el valor de 1 para la probabilidad de éxito p y para la
probabilidad de fracaso q = 1 − p toma el valor de 0.
P(X = x) = p x q 1−x
V (X ) = p (1 − p) = p q
38
Estadística inferencial
Distribuciones Probabilísticas
39
Estadística inferencial
Distribuciones Probabilísticas
Distribución Binomial
Cuándo se aplica?
Surge de repetir n veces una experiencia aleatoria binaria.
Variable aleatoria
X = número de resultados favorables que se obtienen en n pruebas:
X ∼ Bi(n, p)
Función de Probabilidad
n x n−x
P(X = x) = p q
x
donde:
n n!
=
x x!(n − x)!
Esperanza y Varianza
E (X ) = n p
40
Estadística inferencial
Distribuciones Probabilísticas
41
Estadística inferencial
Distribuciones Probabilísticas
Distribución Poisson
Cuándo se aplica?
Para contar el número de veces que ocurre un cierto fenómeno
durante un período de tiempo o región del espacio jos.
La probabilidad de un éxito es proporcional al tamaño de
espacio y período de tiempo. Tiende a cero a medida que se
reduce el período de tiempo o las dimensiones de la región en
estudio.
Cuenta la ocurrencia de sucesos llamados raros, los cuales se
identican con una probabilidad de éxito sumamente pequeña
y un número grande de observaciones.
Es la distribución límite de una distribución binomial cuando n
es muy grande y la probabilidad muy pequeña.
Por tanto, halla la probabilidad de ocurrencia de cualquier
número de éxitos X por unidad de medición (minuto, hora,
día, cm, metro, etc.).
42
Estadística inferencial
Distribuciones Probabilísticas
Ejemplos:
Número de personas que llegan a un almacén, banco o aeropuerto
en un tiempo determinado; número de llamadas por minuto;
número de defectos en piezas similares en el material, ya sea por
cm2 o cm; número de bacterias en un cultivo; número de
accidentes por día; reclamaciones en un período de tiempo.
También se aplica a las ocurrencias con respecto a un campo
continuo (área o tiempo), para describir el número de fallos en un
lote de materiales o la cantidad de llegadas por hora a un centro de
servicios.
Estadística inferencial
Distribuciones Probabilísticas
Variable aleatoria
X signica el "número de hechos que se producen en un intervalo
de tiempo o de espacio":
X ∼ Po(λ)
donde λ es el promedio de ocurrencias del hecho o fenómeno.
Función de Probabilidad
λx e −λ
P(X = x) =
X!
donde e = 2.71828, base de los logaritmos neperianos; y λ = np
Esperanza y Varianza
E (X ) = λ
V (X ) = λ
44
Estadística inferencial
Distribuciones Probabilísticas
X ∼ Unif (a, b)
Función de densidad
Todos los valores de X son igualmente posibles, por lo que:
1
f (x) = a≤x ≤b
b−a
47
Estadística inferencial
Distribuciones Probabilísticas
Función de distribución
Si x ∈ [a, b]:
x
1 x −a
Z
F (x) = P(X ∈ [a, x]) = dt =
a b−a b−a
Esperanza y varianza
a+b
E (X ) =
2
(b − a)2
V (X ) =
12
48
Estadística inferencial
Distribuciones Probabilísticas
49
Estadística inferencial
Distribuciones Probabilísticas
Distribución Normal
Cuándo aplicarla?
Se debe al matemático Gauss y su estudio sobre los errores de
medición, donde observó que eran muy comunes los errores de
poca magnitud, mientras que eran poco frecuentes los errores
grandes. Es aplicable a un amplio rango de problemas, lo que la
convierte en la distribución más utilizada en Estadística.
Representación
X ∼ N(µ; σ 2 )
Función de densidad
1 1 x−µ )2
f (x) = √ e − 2 ( σ
σ 2π
La forma de esta distribución es la denominada campana de
Gauss .
50
Estadística inferencial
Distribuciones Probabilísticas
Ejemplos:
Algunos asociados a fenómenos naturales que siguen el modelo de
la Distribución Normal son: características morfológicas de
individuos, como la estatura; características sociológicas, como el
consumo de cierto producto por un mismo grupo de individuos;
características psicológicas, como el cociente intelectual; nivel de
ruido en telecomunicaciones, etc.
Esperanza y varianza
E (X ) = µ
V (X ) = σ 2
51
Estadística inferencial
Distribuciones Probabilísticas
Distribución Normal
52
Estadística inferencial
Inferencia Estadística
Objetivo
La inferencia es la parte de la estadística que tiene como objetivo
obtener conocimiento acerca del comportamiento de una población
a través de la información obtenida por una muestra.
53
Estadística inferencial
Inferencia Estadística
Procedimiento Inferencial
54
Estadística inferencial
Inferencia Estadística
Denir la población de estudio
Población: conjunto de individuos a estudiar y sobre los que
se desea información.
De la población se extrae un subconjunto que se denomina
muestra.
La muestra debe ser representativa de la población, debe
tener una composición similar en cuanto a la proporción de
distintas características.
La representatividad de la muestra queda garantizada con la
aleatoriedad como método de muestreo.
Sobre cada uno de los individuos (casos de estudio) medimos
una o varias características que denominamos variables.
Así a cada población le corresponde una variable aleatoria
que denotaremos con X .
55
Estadística inferencial
Inferencia Estadística
Proceso de Muestreo
Dada una población, consiste en obtener, al azar, un valor de la
variable X , llamada x1 . El valor obtenido puede ser cualquiera de
los de la población, luego los posibles valores para x1 son todos los
de X , y por tanto, x1 puede considerarse como una realización
particular (observación) de una variable aleatoria X1 con la misma
distribución que X .
A continuación obtenemos, independientemente de la primera
observación, un valor x2 que puede considerarse como una
realización particular de una variable aleatoria X2 con la misma
distribución que X e independiente de X1 .
El proceso continúa hasta obtener una muestra de tamaño n, n
observaciones x1 , x2 , ..., xn de n variables aleatorias X1 , X2 , ..., Xn
independientes e idénticamente distribuidas.
Estadística inferencial
Inferencia Estadística
Estadístico y estimador
Una vez obtenida la muestra la describimos en términos de algunas
de sus características fundamentales. Las medidas más importantes
a considerar: media aritmética, varianza y desviación estándar o
típica.
La primera tiene como n primordial, calcular un solo valor para
representar a ese conjunto de observaciones. La desviación típica
para determinar la dispersión o variabilidad entre esos datos. A
menor variabilidad mayor será la representatividad del promedio.
A tales características las solemos denominar estadísticos. El
estadístico que se utiliza para estimar un parámetro poblacional se
llama estimador, mismo que en forma genérica se simboliza θ̂ en
tanto el parámetro a estimar con θ.
57
Estadística inferencial
Inferencia Estadística
58
Estadística inferencial
Inferencia Estadística
El Teorema del Límite Central constituye una justicación de la
presencia de la normalidad en la naturaleza.
60
Estadística inferencial
Inferencia Estadística
Ejemplo:
Supongamos que el no de barriles de petróleo que produce un pozo
al día es una v.a. con distribución no especicada. Si se observa la
producción en 64 días y se sabe que la desviación típica del no de
barriles por día es 16, obtener la probabilidad de que la media
muestral se encuentre a no más de 4 barriles del verdadero valor de
la producción media diaria.
Estadística inferencial
Inferencia Estadística
62
Estadística inferencial
Inferencia Estadística
A partir del Teorema del Límite Central se puede concluir:
La media de las medias muestrales coincide con la media de la
población:
µX̄ = µ
La varianza de las medias muestrales es igual a la varianza de
la población dividido el tamaño de la muestra n:
σ2
σX̄ 2 =
n
La desviación estándar de la distribución de medias muestrales,
llamado error estándar, es:
σ
σX̄ = √
n
La distribución de las medias muestrales es simétrica, aunque
la distribución de la variable no lo sea.
63
Estadística inferencial
Estimadores
Estimación
Consiste en elegir un valor que represente el parámetro poblacional.
A partir de una muestra (reducida) de valores queremos calcular
con una buena aproximación el valor correcto (inevitablemente con
error) así como una estimación del error en la aproximacion.
64
Estadística inferencial
Inferencia Estadística
65
Estadística inferencial
Inferencia Estadística
Estimación puntual
Utiliza el valor de un estadístico de muestra para inferir el
parámetro poblacional, por ejemplo X̄ para estimar µ.
Consecuencias:
La estimación puntual de un parámetro siempre será
aproximada, puesto que depende del azar a través de la
muestra.
En todo caso se cometerá un error al estimar un parámetro
puntualmente.
Es necesario conocer alguna cota del error cometido en la
estimación del parámetro.
Para acotar el error cometido se utilizan los intervalos de
conanza
66
Estadística inferencial
Inferencia Estadística
Intervalo de confianza
P[Li ≤ θ ≤ Ls] = 1 − α
68
Estadística inferencial
Estadística Inferencial
Ejemplo:
Si α = 10%, entonces 1 − α = 90%, se tiene un intervalo de
conanza del 90%. Signica que la probabilidad de que el intervalo
contenga al verdadero valor del parámetro es del 90%.
El Coeciente de Conanza (CC ) lo elige el investigador. En los
trabajos geológicos se utilizan CC de 90%, 95% y 99%.
En conclusión, la estimación de cualquier parámetro poblacional por
el método de los intervalos de conanza requiere:
1 Fijar el coeciente de conanza
2 Extraer la muestra y calcular el estadístico
3 Conocer la distribución que tiene el estimador del parámetro
69
Estadística inferencial
Estadística Inferencial
X̄ − µ
Z=p
σ 2 /n
Si se ja el CC como 1 − α, entonces la probabilidad α se divide en
dos partes, una parte se asocia con el límite inferior, α/2, y la otra
con el superior, α/2. Si −Zα/2 y Zα/2 son los valores de la
distribución normal estándar que tienen probabilidades acumuladas
α/2 y 1 − α/2, respectivamente.
70
Estadística inferencial
Estadística Inferencial
Entonces cuando se calcula el intervalo de conanza de µ conocida
σ 2 , la expresión toma la forma:
Tamaño muestral
La longitud del intervalo de conanza disminuye al aumentar el
tamaño muestral, lo que signica que se obtienen estimaciones más
precisas cuanto mayor sea el tamaño muestral.
Debido a consideraciones prácticas de coste y tiempo, en general no
es posible aumentar indenidamente el tamaño muestral para
obtener estimaciones más precisas, es por ello que en la práctica se
selecciona el tamaño muestral necesario para obtener una
determinada precisión, establecida a priori.
73
Estadística inferencial
Estadística Inferencial
74
Estadística inferencial
Estadística Inferencial