Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Cap 4
Cap 4
4. ESTADISTICA INFERENCIAL
4.1.1 Conceptos
La población puede ser finita tal como las estaturas de 15000 estudiantes o infinita
tal como los resultados de concentración en un proceso continuo de fabricación.
Una muestra aleatoria se toma de modo que toda unidad elemental disponible
para observación tenga la misma probabilidad de ser incluida en la muestra y por
tanto toda muestra aleatoria de igual tamaño tomada de una población dada ha de
tener la misma probabilidad de ser escogida.
N!
CN,n = ------------
(N-n)! n!
N * N * ... * N = Nn
el conjunto de las medias de las muestras el cual genera una distribución muestral
de medias
Para una distribución muestral de medias tomadas de una población se tienen las
siguientes relaciones, las cuales son demostrables y consideradas como
teoremas.
x
x x
E( X ) = X =
-------------------------------------------
-------
√N - n
X = ------- --------
---- ------
n √N - 1
-------------------------------------------
p
p p
P = p
______
√p (1-p)
P = -----------
√n
----------- -------
√ P(1- P) √ N-n
P = --------- ----------
√n √N-1
EJEMPLO : Los artículos fabricados por una empresa en una línea de cristalería
han presentado tradicionalmente un 5 % de elementos con defectos menores
visibles. Si un potencial comprador inspecciona una muestra de 200 artículos,
¿Cuál es la probabilidad de que encuentre 4 o menos artículos con el defecto?
N: n : 200
P : 0,05 P : 0,05
_________ _____________
P : P(1-P)/n = (0,05x0,95)/200 = 0,0154
Pr [(0/200) P (4/200)]
z2 -0,0025 - 0,05
= f(z)dz z1 = -------------------- = -3,41
z1 0,0154
0,0225 - 0,05
z2 = ------------------- = -1,79
0,0154
TEORIA DE MUESTREO
(estimador insesgado)
PROPORCIONES
Estadístico Parámetro __________
p = P p = P (1- P) / n
p P
(estimador sesgado)
DESV. NORMALES
Estadístico Parámetro ___
s
s S = / 2 n
VARIANZAS (estimador sesgado) _____
Estadístico Parámetro
s2 = 2 (n-1) / n s 2 = 2
2/n
s2 2
(XA XB) ( A B) (XA XB) = XA XB (XA XB) = 2XA +2XB
XA = A / nA
__
SUMAS O DIFERENCIAS DE XB = B / nB
PROPORCIONES
Estadístico Parámetro (estimador insesgado)
4.2.1 Estimadores.
Los criterios que se tienen en cuenta para evaluar un estadígrafo como estimador
son: consistencia, sesgo, eficiencia y suficiencia.
E( estadístico ) = Parámetro
_
Por ejemplo, para la media aritmética ( X ) y para la proporción muestral ( P ),
_
E( X ) = E( p ) = P
Por lo cual, tanto la media muestral como la proporción muestral son estimadores
insesgados de la media poblacional y de la proporción poblacional
respectivamente.
E( s ) ≠ E( s2 ) ≠ 2
Por lo cual, tanto la desviación normal muestral como la varianza son estimadores
sesgados de la desviación normal poblacional y de la varianza poblacional
respectivamente.
138
Por ejemplo, para una población que se sabe distribuida normalmente, la media, la
mediana y la moda coinciden, es decir que los tres estadísticos muestrales podrían
ser estimadores de la media poblacional, no obstante la distribución muestral de
medias posee una varianza menor que la de las otras, por lo tanto la media
muestral se considera un estimador más eficiente de la media poblacional que las
otras.
Si ésta distribución muestral del estadístico e es normal (lo cual es cierto para
muchos estadísticos, si el tamaño de la muestra es grande n =30 ).
Cabe esperar que cualquier valor obtenible del estadístico e se encuentre en los
intervalos determinados por:
A B C C B A
68,27%
(e-3e) e (e+3e)
Nivel de confiabilidad Zc
50 % 0,6745
68,27 % 1,0
80 % 1,28
90 % 1,65
95 % 1,96
95,45 % 2,0
99 % 2,58
99,73 % 3,0
INTERVALOS DE CONFIABILIDAD
Para medias
_ _
X ± Zc X ===> X ± Zc ------ Población infinita
n
_____
_ _ √ N-n
X ± Zc X ===> X ± Zc --- ------------- Población finita
n √ N-1
Para proporciones
__________
p ± Zc P ===> p ± Zc P(1-P)/n Población infinita
_______ _____
√ p(1-p) √ N-n
p ± Zc P ===> p ± Zc ------------ x ---------- Población finita
√n √N-1
S
s ± Zc S ===> s ± Zc ------ s ± Zc ----
2n 2n
(ẋA + ẋB) ± Zc
(ẋA - ẋB) ± Zc
(PA + PB) ± Zc
(PA - PB) ± Zc
143
N : 1800 n : 120
p : 0,82 (proporción en la muestra)
Zc= 1,96 1-p = 0,18
p ± Zc P ===> p ± Zc
0,82 ± 0,03389 Zc
0,82 ± 0,0664
0,82 ± 0,03389 Zc
N: n: 30
_
X: 1640 N
s: 58 N
_ _
X ± Zc X ===> X ± Zc ---
n
_ 59
: X ± Zc ----- 1,96 ---- 50
n n
n 2,31 n 5,36
Para la media x = ----
n
146
________
P(1-P)
Para la proporción P = -----------------
n
_
EXACTITUD | -X | = d
CONFIABILIDAD Zc
__
VARIABILIDAD x = / n
Zc22
d = Zc ----- = n = --------
n d2
Zc22
____ -----
N-n d2
d = Zc ---- --------- = n= ---------------
n N-1 (N+1) Zc22
----- + --------
N d 2N
______
P(1-P) Zc2 P(1-P)
d = Zc ---------- = n = ---------------
n d2
Zc2 P(1-P)
____ ----------------
P(1-P) N-n d2
d = Zc --------- -------- = n = -------------------------
n N-1 (N+1) Zc2 P(1-P)
------- + ------------
N d 2N
EJEMPLO : Se desea tomar muestras del suelo de una finca de 100 hectáreas
destinada a la siembra de café, para caracterizarla antes de aplicar los fertilizantes
de mantenimiento. El terreno está localizado en zona cafetera del Risaralda.
Determinar el tamaño de la muestra para una confiabilidad del 90 %.
Zc22
____ --------
N-n d2
d = Zc ---- ------ ===> n = ---------------
n N-1 (N+1) Zc2 2
-------- + -------
N d 2N
Para el potasio
Al aplicar la fórmula para las dos vías consideradas se tiene para el tamaño de la
muestra
150
2,706 * 22,91
------------------ 32,97
1,88
n = ------------------------- = ---------------- = 24,61 25
101 2,706 *22,91 1,01 + 32,97
----- + ---------------- ------
100 1,88 * 100 100
2,706 * 0,078
-----------------
0,0021 100,51
n = ----------------------= --------------------- = 49,9 50
101 2,706*22,91 1,01 + 100,51
----- + ----------- ------
100 1,88*100 100
En esta parte de la teoría de muestreo se abordan situaciones que tienen que ver
con decisiones sobre poblaciones con base en la información muestral de las
mismas. Estas decisiones son del siguiente tipo: ¿ existe una diferencia real entre
dos poblaciones? Un cambio introducido en un proceso ¿realmente tiene por
consecuencia un mejoramiento significativo ? , ¿es realmente más efectivo un
procedimiento que otro ?
Hipótesis inicial (H). Es una afirmación inicial que se hace sobre la población; se
debe presentar en una forma cuantitativa y ligada a alguna medida estadística.
Esta hipótesis se plantea ya sea con el propósito de demostrarla o de invalidarla.
Hipótesis nula (Ho). Es la forma más utilizada para plantear la hipótesis inicial;
supone que no existe diferencia entre una situación dada y una nueva situación.
Esto es, que el parámetro referente a la situación dada no difiere
significativamente del parámetro referente a la nueva situación. Puede plantearse
nuevo = antiguo
Una vez estudiados los resultados muestrales se debe concluir si ellos difieren
marcadamente de los que cabría esperar según la hipótesis básica, es decir si la
diferencia es significativa.
Existen unas reglas para decidir si se acepta o se rechaza una hipótesis dada y
ellas constituyen la llamada prueba de hipótesis o de significatividad; estas reglas
se apoyan en la teoría de probabilidades y especialmente en las propiedades de la
distribución normal. Se sabe que al tomar una decisión se corren riesgos de error
clasificados en dos grupos:
Error de tipo II. Aceptar una hipótesis cuando debió ser rechazada.
= 0.05 Cinco posibilidades entre 100 de Rechazar una hipótesis que debió
ser Aceptada (o cometer error de tipo I). Lo cual implica una confiabilidad de 95 %
de que la decisión fue correcta.
= 0.01 Una posibilidad entre 100 de Rechazar una hipótesis que debió ser
Aceptada. Lo cual implica una confiabilidad de 99 % de que la decisión fue
correcta.
Pr (Error de tipo I) =
153
e - e
Ze = --------
e
e
e e
Ho : e = H1 : e ≠
f(z)
R A R
0,95
0,025 0,025
Z = -1,96 Zc =1,96 Z
154
Ho : e = H1 : e >
Ho : e = H1 : e <
f(z)
A R
0,95
0,05
Z =1,645 Z
f(z)
R A
0,95
0,05
Z = -1,645 Z
Ensayo bilateral:
Se concluye por lo tanto que la decisión que se tome depende de varios factores:
Hipótesis nula :
Hipótesis alterna:
_
R > = 84 ensayo unilateral cola superior
Nivel =0,05
f(z)
A R
0,95
0,05
Zc =1,65 Ze =1,83 Z
R- 85,6 - 84
Ze = ------- = -------------- = 1,83 = Ze = 1,83 > 1,65
R 0,875
f(z)
A R
0,99 0,01
Ze=1,83, Zc=2,33
A : B :
nA = 100 nB = 80
_ _
XA = 292,11 g/L XB = 305,42 g/L
Hipótesis nula.
( B - A) = 10 g/L
Hipótesis alterna.
f(z)
A R
(1-)
zc Z
160
_ _
(XB - XA) - (B -A) (305,42 - 292,11) - (10)
Ze = ----------------------- = ------------------------------------- = 5,37
EJEMPLO: Para probar los efectos de un nuevo fertilizante sobre una producción de
cereales, un lote de terreno se divide en 60 cuadros de igual área, todas las
porciones tienen idénticas condiciones de suelo, exposición a la luz del sol etc. El
nuevo fertilizante se aplicó a 30 cuadros y el antiguo se aplicó a los restantes. El
número promedio de cargas cosechadas por cuadro de terreno empleando el nuevo
fertilizante fue de 18,2 con una desviación normal de 0,63 cargas. Los
correspondientes valores de media y desviación normal empleando el fertilizante
antiguo fueron de 17,8 y 0,54 cargas.
Evaluar la hipótesis de que el nuevo fertilizante es mejor que el antiguo,
empleando un nivel de significancia de: a) 0,05 (Zc:1,65) b) 0,01 (Zc: 2,33)
_ _
(XB - XA) (18,2 – 17,8)
Ze = ----------------------- = ---------------------------- = 2,64
Ho: B = A
H1: B > A
161
_ _
(Xniñas – Xniños) (75 – 72)
Ze = ----------------------- = ---------------------------- = 1,73
1,73 > 1,65 se rechaza la hipótesis nula de igualdad y se acepta a una significancia
de 0,05 que las niñas son mejores en deletreo que los niños.
1,73< 2,33 se acepta la hipótesis nula de igualdad ya que no hubo evidencia a una
significancia de 0,01 que las niñas son mejores en deletreo que los niños.