Documentos de Académico
Documentos de Profesional
Documentos de Cultura
AUTOR
BOGOTÁ D.C.
MAYO 2008
1
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
COMITE DIRECTIVO
Gloria Herrera
Vicerrectora Académica
Inferencia Estadística
Primera Versión
Copyright
Universidad Nacional Abierta y a Distancia
ISBN
2008
2
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
OBJETIVO GENERAL:
OBJETIVOS ESPECÍFICOS:
Conocer los criterios técnicos que hay que tener en cuenta antes de
seleccionar un tamaño de muestra.
3
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
4
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
UNIDADES DIDÁCTICAS:
5
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
6
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
INTRODUCCIÓN
El material esta estructurado en dos unidades que son las temáticas macro del
curso académico.
El contenido de cada una de las partes fue seleccionado, teniendo en cuenta los
saberes mínimos que se esperaría debe alcanzar un estudiante de la
Universidad Nacional Abierta y a Distancia en el campo de la Inferencia
estadística.
7
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
UNIDAD UNO
MUESTREO, DISTRIBUCIÓN MUESTRAL E
INTERVALOS DE CONFIANZA
8
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Introducción
Otro aspecto que justifica la decisión de tomar una muestra es en casos donde se
debe destruir los elementos de ésta, por ejemplo cuando se desea identificar
el grado de vacío de un producto enlatado, la resistencia de un material y otros.
Objetivo general
Objetivos específicos
9
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Población y muestra
Existe una serie de términos estadísticos básicos, que son muy utilizados y se
requiere sean comprendidos para avanzar en otros temas o unidades, en
esta sección se trataron los conceptos de población y muestra.
10
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
POBLACIÓN O UNIVERSO
MUESTRA
Entre los motivos que inducen a tomar una muestra aleatoria están:
11
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
n = Tamaño de la muestra
X = Promedio de muestra
S 2 Varianza Muestra
S Desviación estándar Muestra
à Total Estimado
p = Proporción Muestra
UNIDAD DE OBSERVACION:
Son los elementos que se miden; es decir, sobre los que se toman los datos de
las variables a medir. En el caso de los hogares, la unidad de observación serán
las personas y en el caso de las llantas del automóvil, cada una serán las
unidades de observación.
MARCO DE MUESTREO:
12
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
ERROR DE MUESTREO:
à
Es el parámetro y à es el estadístico.
ERROR TOLERABLE:
error
à B
ERROR ESTANDAR
13
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
ESTADSTICO
PARAMETRO
Una parámetro es una medida usada para describir alguna característica de una
población, tal como una media aritmética, una mediana o una desviación estándar
de una población.
Cuando los dos nuevos términos de arriba son usados, por ejemplo, el proceso
de estimación en inferencia estadística puede ser descrito como el proceso de
estimar un parámetro a partir del estadístico correspondiente, tal como usar una
media muestra (un estadístico) para estimar la media de la población (un
parámetro).
El todo estudio de muestreo se debe definir las etapas que permiten su desarrollo.
14
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Con los conceptos previos que se han analizado, ahora corresponde estudiar
las clases de muestreo. Los dos grandes grupos están enmarcados en las
siguientes clases:
- Muestreo probabilístico.
- Muestreo no probabilístico.
Muestreo No Probabilístico.
15
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
puede usar alumnos voluntarios para formar la muestra, tan solo porque dispone
fácilmente de ellos y participan como elementos a un costo pequeño o nulo.
Tiene la ventaja de ser de fácil selección y recolección de sus datos. Tiene la
desventaja de no poderse evaluar en su bondad de la muestra en
función de la representatividad de la población, motivo por el cual se hace
imposible inferir a cerca de la población correspondiente.
Muestreo probabilístico
16
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
17
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Ejemplo 1:
Solución:
n = 100, 007, 141, 151, 142, 128, 146, 042, 156, 134
Ejemplo 2:
Solución:
n = 9, 5, 1, 3, 7, 8
18
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Fuente: Web
Este método de selección permite que todos los elementos que constituyen la
población tengan la misma posibilidad de ser incluidos en la muestra. Los
19
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Sintaxis para
obtener números
aleatorios de
una población
de 1.000
observaciones
Al dar clic se genera el primer numero aleatorio y desplegando se obtiene los que
se desea.
20
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Primer numero
aleatorio.
Se despliega desde
la parte inferior
derecha hasta
completar
20 elementos
b) Método de Fan Muller: Se definen los números aleatorios Ó1, Ó2, Ó3,Ö
independientes bajo la distribución uniforme u (0,1). Si Ók=1 < n / N. (Siendo
N el tamaño de la población y n el tamaño de la muestra), entonces k = 1 es
seleccionado para la muestra, en otro caso no. Para los siguientes
números k = 2, 3, 4,Ö, nk los seleccionados deben cumplir
n–n
k =<
N–k+1
21
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
4. Los costos por observación en las encuestas son más reducidos ya que
se evitan desplazamientos extremos.
Como los elementos de los estratos son disyuntos, entonces cada unidad
de muestreo pertenece solo a un estrato. Las muestras seleccionadas
en los estratos deben ser independientes; es decir, la elegida en un estrato no
debe afectar la elección de otra muestra en otro estrato.
La esencia de la estratificación es que ésta saca provecho de la homogeneidad
conocida de las su poblaciones, de tal forma sólo se requieran muestras
relativamente pequeñas para estimar las características de cada sub-población,
estas estimaciones individuales pueden entonces ser fácilmente combinadas
para producir una estimación de toda la población; además, la economía
en el tamaño de la muestra, un valioso sub-producto del esquema de
22
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Para una descripción general del muestreo aleatorio estratificado y los métodos
de inferencia asociados con este procedimiento, suponemos que la
población está dividida en h su poblaciones o estratos de tamaños conocidos
N1, N2,...,Nh tal que las unidades en cada estrato sean homogéneas respecto
a la característica en cuestión.
N = N1 + N2 +Ö+ NL
Nl = Tamaño del estrato l.
x l j = Valor de la observación j en el Estrato l.
µl = Media poblacional en el estrato l.
Û2l = Varianza poblacional en el estrato l.
Ù l = Total poblacional en el estrato l.
p l = Proporción poblacional en el estrato l.
Nl Nl
Nl N1
µi =
1
Nl j=l
Xy 1=
J=l
(xiy - µ i)
Nl - 1
ti =
j=l
Xy t=
j=l
tl
Nµ
pl = µ
1
Nl
j=l
Xli Donde xli son los elementos j del estrato l que tiene la característica
23
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Nl
= 1
Nl j=l
Xlj Donde lj son los elementos j del estrato l
Nl
2
sl= (xij - i)
j=l Nl - 1
Nµ
1
pl = µ N
l
j=l
Xli = Elementos j del estrato l que tiene la característica
Muestreo Sistemático
N = Tamaño de la población
Donde:
N = Tamaño de la muestra
Ejemplo 1
24
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Solución:
Muestreo Conglomerados
Este es un método de muestreo aleatorio en el que los elementos de la
población se dividen en forma natural en subgrupos, de tal forma que dentro de
ellos sean lo más heterogéneo posible y entre ellos sean homogéneos, caso
contrario al muestreo estratificado.
25
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Ejemplo:
26
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Ejemplo:
Solución:
Ejemplo:
Solución:
Ejemplo:
Solución:
Para los propósitos de esta selección, los valores podrían ser el número de
las personas que viven en cada una de cuatro unidades habitacionales que
constituyen una población. Se realizará una comparación entre el muestreo
aleatorio con y sin reemplazamiento para una muestra de tamaño n=2.
Primero se listan todas las posibles muestras no ordenadas de tamaño n= 2.
27
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Métodos Paramétrico
Métodos no paramétrico
28
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Ventajas y Desventajas
Existen muchos casos en los que se recogen datos medidos en una escala
nominal u ordinal. Muchas aplicaciones de negocios involucran opiniones o
sentimientos y esos datos se usan de manera cualitativa.
29
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
estimación
Propiedades de un estimador:
1. Insesgado:
2. Eficiencia:
3. Consistencia:
30
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Ejercicios: 1
4. Supongamos que en la ciudad “T” hay 200 barrios. Si elegimos al azar dos de
estos barrios, de manera que la muestra esté compuesta por todos los
individuos de esos dos barrios. Se trata de de:
31
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
R/ta: 84
6. Supongamos que en la ciudad “T” hay 200 barrios. Si elegimos al azar dos de
estos barrios, de manera que la muestra esté compuesta por todos los
individuos de esos dos barrios. Se trata de de:
R/ta: Muestreo por conglomerados
7. Con un nivel de confianza del 95% y un error de muestreo del 3%, se quiere
estimar el verdadero promedio de consumo de agua diario y la verdadera
proporción de familias compuestas por más de 3 miembros por unidad familiar,
de una ciudad con 10.000 unidades familiares, durante un periodo estacional
seco. Sí se sabe que en el mismo periodo del año anterior en un estudio
realizado a través de un muestreo, el consumo promedio diario fue de 42, 5
metros cúbicos, con una variancia de 12,5. El tamaño de muestra necesario es:
R/ta: 965
10.En cierto barrio se quiere hacer un estudio para conocer mejor el tipo de
actividades de ocio que gustan más a sus habitantes. Para ello van a ser
encuestados 100 individuos elegidos al azar.
-Explicar qué procedimiento de selección sería más adecuado utilizar: muestreo
con o sin reposición. ¿Por qué? R/ta: Sin reemplazamiento para que sea
representativa.
-Como los gustos cambian con la edad y se sabe que en el barrio viven 2.500
niños, 7.000 adultos y 500 ancianos, posteriormente se decide elegir la muestra
32
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
12. Se desea hacer una encuesta para determinar la proporción de familias que
carecen de medios económicos para atender los problemas de salud. Existe la
impresión de que esta proporción está próxima a 0´35. Se desea determinar un
intervalo de confianza del 95% con un error de estimación de 0´05. ¿De qué
tamaño debe tomarse la muestra?
R/ta: n=350.
33
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
La forma funcional.
La media
La desviación estándar
Los estadísticos obtenidos en una muestra son variables aleatorias, por lo cual
deben tener una distribución de probabilidad, así que la media muestral tiene
una distribución.
Teorema:
-------------------------------------------------------------------------------------------------------
X X 2 ... X n
Sea X 1 la media de la muestra aleatoria de tamaño n,
n
proveniente de una población infinita con media y varianza 2 .
Entonces:
E (X ) 2
V (X )
n
---------------------------------------------------------------------------------------------------------
Comentario:
34
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Teorema:
-------------------------------------------------------------------------------------------------------
X X 2 ... X n
Sea X 1 la media de la muestra aleatoria de tamaño n,
n
proveniente de una población finita de tamaño N con media y varianza 2 .
E (X ) 2 N n
y Entonces: V (X ) *
n N 1
---------------------------------------------------------------------------------------------------------
Comentario:
N n
Se conoce como el factor de corrección para poblaciones finitas. Cuando
N 1
Ejemplo:
Salario profesores
Profesor Salario $
1 7.000
2 7.000
3 8.000
4 8.000
5 7.000
6 8.000
7 9.000
Cuadro 2.3
35
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Solución:
Entonces:
Solución:
1 N
2
N i 1
( xi ) 2
Entonces:
1 N
2 (7000 7714.3) 2 ... (9000 7714.3) 2 699,85
7 i 1
Solución:
7! 7! 7 x6 x5! 42
C 27 21
7 2!2! 5! x2! 5! x2 2
36
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Distribución de probabilidad
Media muestral Número de medias Probabilidad
7000 3 0.1429
7500 9 0.4285
8000 6 0.2857
8500 3 0.1429
Suma 21 1.0000
Cuadro 2.5
Solución:
37
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
N
1 Suma de medias muestrales
X
N
x
i 1
i
Número total de muestras
162.000
X $7.714.30
21
Distribución muestral
Figura 2.3
38
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Figura 2.4
La tercera propiedad del teorema central del límite se expresa: No importa que
distribución tenga la población, pero la distribución muestral de medias a partir
de esa población, tiene una distribución normal.
Ejemplo:
Z 2,40 A0,4918
39
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
ai
p
n
A Ai
p P P P Proporción de elementos que presenta la
N N
característica en la población
NA
Q 1 P Proporción de elementos que no presenta la característica
N
P Q 1
p PQ Desviación estándar
p PQ
p Error estándar de la proporción
n n
pP p p
Z
PQ p
n
40
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Ejemplo:
Cuarenta y seis por ciento de los sindicatos del país están en contra de
comerciar con la China Continental; ¿Cuál es la probabilidad de que en una
encuesta a 100 sindicatos muestre que más del 52% tengan la misma posición?
41
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Se puede considerar que la desviación típica de las diferencias entre los pares
de medias muéstrales, denominado como error estándar de las diferencias entre
las medias muéstrales, es igual a:
siendo:
x y x y x y x y
Z
x y x2 y2
n1 n2
2 2
muéstrales s x y s y siempre y cuando que n1 y n 2 sean mayores que 30.
Ejemplo:
P( x y > 0) = ?
42
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
0 20 25 0 5 5
Z 1,90
36 30,25 3,6 3,36 6,96
10 9
Z 1,90 A0,4713
P P1Q1 y P P2 Q2 .
1 2
El error estándar de las diferencias entre las dos medias proporcionales estará
dada por:
P1Q1 P2 Q2
P P Cuando son valores poblacionales
1 2
n1 n2
p1 q1 p 2 q 2
s P1 P2
n1 n2
P P P P P1 P2
1 2 1 2
43
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
p1 p2 P P p1 p2 P1 P2
Z 1 2
cuando n1 y n 2 > 30
P1Q1 P2 Q2 p1 q1 p 2 q 2
n1 n2 n1 n2
Ejemplo:
p1 p2 = 8% = 0,08
Z 2,98 A0,4986
El teorema central del límite es uno de los teoremas más importantes dentro de
las ciencias estadísticas, ya que su funcionalidad es muy grande.
44
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
O sea: Z n(0,1)
Ejemplo:
45
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Solución:
1 N 1 2 3 4 5
N i 1
xi
5
3
N
1 1
2
N
(x
i 1
i ) 2 (1 3) 2 (2 3) 2 ... (5 3) 2 1.999
5
1.414
Solución:
N! 5! 5! 5 x 4 x3!
C NN Reemplazando: C25 10
N n ! xn! 5 2! x2! 3!2! 3! x2
46
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Solución:
En la segunda y cuarta columna del cuadro 2.6 están las medias de todas las
muestras posibles, lo que se debe hacer es sumarlas y dividirlas por en número
de medias.
1.5 2.0 2.5 3.0 2.5 3.0 3.5 3.5 4.0 4.5
X 3
10
Solución:
47
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
X 0.7499 0.8660
N n
X Donde:
n N 1
1,4142 5 2
x 0,8660
2 5 1
El segundo principio del teorema central del límite para poblaciones finitas se
expresa: La desviación estándar de la distribución muestral de medias es igual
al factor de corrección poblacional multiplicada por la relación entre la
desviación estándar poblacional y la raíz cuadrada del tamaño de la muestra.
Dicho principio queda demostrado con la relación anterior.
48
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Solución:
Solución:
Con lo estudiado:
Solución:
49
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
X X
1.0
n 25
X Corrección para poblaciones no finitas
n
1.41421356
Reemplazando en el caso que nos ocupa: x 1
2
50
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
2 N n
B Z (1 / 2)
n N 1
Despejando n, se obtiene:
Z (21 / 2) 2 N
n
( N 1) B 2 Z 2 2
Z (21 / 2) 2
n
B2
Ejemplo:
Solución:
Z(1-α/2)=Z0,975 = 1,96
B = 0,5 y σ = 1,5
51
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Ejemplo:
Solución:
1 n
Se sabe que: p yi Para yi = 1.
n i 1
52
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
p * q N n
B Z (1 / 2) Despejando n se obtiene:
n 1 N
Z (21 / 2 ) p * qN NB 2
n
NB 2 Z (21 / 2 ) p * q
Ejemplo 1:
Solución:
15
p 0,15 Luego q 1 0,15 0,85
100
53
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Por consiguiente se debe tomar una muestra de 192 habitantes para estimar la
proporción poblacional, con un límite de error de 0,05 y un nivel de confianza de
95%.
Ejemplo:
Solución:
Z (21 / 2) p * qN Z (21 / 2) p * qn (1,96) 2 * 0,5 * 0,5 * 3.500 (1,96) 2 * 0,5 * 0,5 * 4.000
B
2
nN N 400 * 3.500 3.500
B 0,002132 0,04617
Ejemplos:
54
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Z 2 2 2 2 30.000
2
n= = = 1.600 cuentas se deben seleccionar
E2 1.500 2
2. Un auditor desea tener un nivel de confianza del 95%, para que la verdadera
proporción de error no exceda del 2%. Si la población es muy grande, ¿Qué
tamaño tendrá la muestra que va a tomarse, si el auditor estima que la
proporción de error es del 5%?
Z 2 PQ 2 2 0,050,95
n= = = 475 cuentas
E2 0,02 2
no Z 2 2
n= donde: no En variables
n E2
1 o
N
no Z 2 PQ
n= donde: no En proporciones
n E2
1 o
N
N n
2
B Z (1 / 2) N 2
n N 1
Despejando n se obtiene:
55
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Z (21 / 2) N 3 2
n
( N 1) B 2 Z (21 / 2) 2 N 2
Ejemplo:
Una compañía que hace estudios a nivel social, desea estimar el total de
ingresos de una población de 3.000 habitantes que tiene ingresos. Por estudios
previos se sabe que la varianza poblacional para los ingresos es de $40.000
¿Cuántas personas se deben tomar como muestra, si se asume un límite de
error de estimación de $100.000 y un nivel de confianza del 95%?
Solución:
Los datos:
N = 3.000
σ2 = 40.000
B = 100.000
Entonces:
Z (21 / 2) N 3 2
n
( N 1) B 2 Z (21 / 2) 2 N 2
56
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Para el primer caso no se tiene ningún problema porque al ser n1 sería igual n2
Se calcula una sola muestra de tamaño “n”
n = Z**2(S1**2 + S2**2)/E**2
En este caso se calculan los tamaños con los mismos criterios anteriores, es
decir para muestras de igual tamaño y tamaños desiguales, así:
57
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
i = 1…..h
Asignación proporcional:
N11 = 800,000
N22 = 240,000
N33 = 420,000
----------------
Total = 1,460,000
58
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
n1 =
n2 =
n3 =
Ejercicios: 2
59
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
R/ta: T-Student
R/ta:2/3
Rta: 0951
R/ta:(101.55; 106.45)
7. ¿Cuál sería el mínimo tamaño muestral necesario para que pueda decirse
que la verdadera media de las estaturas está a menos de 2 cm de la media
muestral, con un nivel de confianza del 90%?
60
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
de confianza para la media mensual de las ventas, cuyos extremos son 4 663 €
y 5 839 €.
- ¿Cuál ha sido la media de las ventas en estos nueve meses?
R/ta: x =5251
R/ta: 75%.
R/ta:(0,3).
61
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Introducción
Objetivo general
Mostrar los diferentes métodos para calcular los intervalos de confianza, a partir
de muestras grandes y pequeñas, para estimar los parámetros poblacionales de
una media y proporción, así como para la diferencia de medias y proporciones.
Objetivos específicos
62
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Los dos tipos de problemas que resuelven las técnicas estadísticas son:
estimación y contraste de hipótesis. En ambos casos se trata de generalizar la
información obtenida en una muestra a una población. Estas técnicas exigen
que la muestra sea aleatoria. En la práctica rara vez se dispone de muestras
aleatorias, por la tanto la situación habitual es la que se esquematiza en la figura
63
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Estimación
1 n
X xi
n i 1
Entonces:
E (X )
Demostración:
1 n 1 n 1 n
E ( X ) E xi E xi E ( xi )
n i 1 n i 1 n i 1
1 n 1 n 1
E ( xi ) i (n )
n i 1 n i 1 n
64
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
El valor de X indicaría muy poco sobre al menos que se evalúe la bondad del
estimador, lo que se hace por medio de la varianza del estimador, la cual nos
indica el grado de variabilidad que tiene dicho estimador, así un estimador con
varianza pequeña tiene más valor que un estimador con varianza grande.
2 N n
V (X )
n N 1
1 n N
S2
n 1 i 1
( xi x ) 2 Por definición: E ( S 2 )
N 1
2
En la ecuación:
N n
Es el factor de corrección para poblaciones finitas, se puede despreciar si
N
N n N
0,95 o cuando n
N 20
65
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Ejemplo 1:
Solución:
Ahora la varianza:
n
2 V ( x ) E ( x ) 2 ( xi ) 2 p ( xi )
i 1
Reemplazando:
n
2 V ( x) ( xi ) 2 p( xi ) (2 5) 2 (1 / 4) (4 5) 2 (1 / 4) (6 5) 2 (1 / 4) (8 5) 2 (1 / 4)
i 1
2 V ( x) 9 / 4 1 / 4 1 / 4 9 / 4 5
Ejemplo 2:
Solución:
66
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
4!
C2 6 Muestras posibles, cada una tendrá como probabilidad 1/6
2!(4 2)!
4
MUESTRA P(xi) x S2 V (x )
n1 = 2, 4 1/6 3 2 1/2
n2 = 2, 6 1/6 4 8 2
n3 = 2, 8 1/6 5 18 9/2
n4 = 4, 6 1/6 5 2 ½
n5 = 4, 8 1/6 6 8 2
n6 = 6, 8 1/6 7 2 1/2
4
E ( x ) xi p( xi ) 3(1 / 6) 4(1 / 6) 5(1 / 6) 5(1 / 6) 6(1 / 6) 7(1 / 6) 5
i 1
n
V ( x ) E ( x ) 2 ( xi ) 2 p ( xi )
i 1
Reemplazando:
V ( x ) E ( x ) 2 (3 5) 2 (4 5) 2 (5 5) 2 (5 5) 2 (6 5) 2 (7 5) 2 (1 / 6)
5
3
2 N n 542 5
V (x)
n N 1 2 3 3
2 N n
E (x ) y V ( x )
n N 1
El error de estimación se calcula así:
67
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
B z (1 / 2) V ( x )
Como α = 0,01 entonces: 1 – α/2 = 0,995 Para esta probabilidad z0,995 = 2,575
B 2,575 5 / 3 3,324
Cuando de una población se obtiene una muestra aleatoria para estudiar una
característica de la primera, uno de los parámetros a obtener es el total
poblacional . Por ejemplo a partir de una muestra de personas, se puede
estimar la edad total de una población, la partir de una muestra de cuentas de
ahorro, se puede estimar el capital total del banco, otros.
n
Sea i Donde πi la probabilidad de selección del elemento i-ésimo
N
elemento en una muestra dada n. En el M. A. S. sin reemplazamiento. El es
estimado por obtenido en la muestra, de la siguiente manera:
n
X i n X i n NX i n
Xi
N NX
i 1 i i 1 n / N i 1 n i 1 n
N
Varianza del Estimador:
68
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
2 N n
V ( ) V ( N ) N 2
n N 1
2 S N n
2
V ( ) V ( NX ) N
n N
Error de Estimación:
S N n
2
B Z (1 / 2) N 2
n N
Con un nivel de significancia α, el parámetro estará entre B
Ejemplo 1:
Solución:
Los datos:
Población N = 800
Muestra n = 60
Promedio muestral x 15
Varianza muestral s 2 5
69
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
s2 N n
V ( x ) N 2
n N
Reemplazando:
5 800 60
V ( x ) 800 2 640.000 x0,07708 49.331,2
60 800
B z (1 / 2) V ( x ) 2,575 49.331,2 571,92
Ejemplo 2:
En una granja avícola hay 250 gallinas, el avicultor desea saber el total de
huevos que producen semanalmente, para lo cual tomo una muestra de 20
gallinas, cuyo promedio de huevos producidos es de 16 huevos / gallina /
semana, con una varianza de 28 huevos2. Además hallar el error de estimación.
Solución:
70
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
1 si y tiene atributo
Sea yi
0 si yi no tiene atributo
N
Los elementos que tienen el atributo son a y i Donde yi = 1.
i 1
a
Entonces: P Pero como no se conoce P, éste se puede estimar a partir
N
de la proporción muestral. Si n es grande, p es aproximadamente normal,
donde:
pxq
E ( p) P y V ( p)
n
1 n
p yi Donde yi son los elementos que tiene el atributo.
n i 1
pxq
V ( p) Varianza estimada del estimador.
n
71
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Error de Estimación:
pxq
B z (1 / 2 )
n
pxq N n
B z (1 / 2)
n 1 N
Ejemplo
Solución:
n
32
Como y
i 1
i 32 Entonces: p
120
0,267
pxq 0,267 x0,733
V ( p) 0,00163
n 120
72
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Ejemplo
80 80
xi 35
i 1
y y
i 1
i 25
Solución:
35 25
px 0,4375 y py 0,3125
80 80
El error de estimación:
Bx z (1 / 2) V ( p x ) z 0,995 V ( p x ) 2,575 0,00273 0,1345
B y z (1 / 2) V ( p y ) z 0,995 V ( p y ) 2,575 0,00208 0,1174
73
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Suponga por ejemplo que Ud. está dispuesto a aceptar un riesgo de error de
0.05 ; entonces 1 0.95 , luego se trata de un intervalo de confianza del
nivel 0.95. Dado que esta probabilidad se distribuye simétricamente a los dos
lados de la media, se obtiene 0.475 a cada lado. Ahora bien, el valor de Z
asociado a una probabilidad de 0.475 es de 1.96 (de acuerdo a la tabla de la
distribución normal) a la derecha de la media y de –1.96 a la izquierda, como se
puede apreciar el la siguiente grafica:
74
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
X 1.96 n ; X 1.96 n
X 1.96
n
N n
X Z
n N 1
75
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Podrá darse cuenta las semejanzas con los procedimientos utilizados para las
pruebas de hipótesis, vistas anteriormente para pruebas unilaterales y
bilaterales.
Ejemplo 4.2
1.14
X Z 20.2 2.58 20.2 0.294
n 100
Ejemplo 4.3
76
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Por tanto el contenido medio de calorías del lote esta dentro del intervalo de
75.13 y 76.87 calorías con un 95% de nivel de confianza, y expresado
matemáticamente es:
12 22
X1 X 2 Z
n1 n2
Ejemplo 4.5
12 22 0.082 0.062
X1 X 2 Z 5.0 4.86 1.96
n1 n2 50 40
77
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Por lo tanto se puede afirmar con un nivel del 95% que la diferencia de los dos
contenidos de vitamina A de la mantequilla y la margarina enriquecida se
encuentran entre 0.111 y 0.169 unidades.
78
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
( = = )
79
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Como las varianzas son iguales, calculamos que está dado por:
Debido a que la diferencia real puede ser cero, no se puede concluir que existe
una diferencia en el contenido de nicotina de las dos marcas de cigarrillos.
80
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
donde
81
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
PQ
PZ
n
PQ N n
PZ
n N 1
Ejemplo 4.4
82
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
PZ
PQ N n
43
1.96
43501 4350 500 50
n N 1 50 50 500 1
(0.86)(0.14) 450
0.86 1.96
50 499
p1q1 p2 q2
P1 P2 Z
n1 n2
Ejemplo 4.6
83
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
(0.76)(0.24 (0.74)(0.26)
0.76 0.74 2.58 0.02 0.073
500 450
Por lo cual es de esperar con un nivel de confianza del 99% que la verdadera
diferencia de proporción de venta de los quesos A y B se encuentre entre –
0.053 y 0.093. La diferencia de proporción negativa del límite inferior del
intervalo indica que en esta región la diferencia está a favor del queso B cuya
proporción de venta es menor en las muestras estudiadas.
S
X t
n
Ejemplo
Una muestra de 10 cajas de atún dio un peso neto medio de 184 gramos y una
desviación estándar de 3.0 gramos. Encontrar los límites de confianza con un
95% para el verdadero peso promedio de todas las latas de atún.
84
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
El intervalo de confianza para la media de peso de todas las cajas de atún esta
dado por:
S 3.0
X t 184 2.26 184 2.14
n 10
Se interpreta que las cajas de atún tienen un promedio de peso entre 181.86 y
186.14 gramos con un nivel de confianza del 95% y expresado
matemáticamente es:
85
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
suponga que se tiene un grupo de personas que se someten a una dieta para
reducción de peso, y para cada persona se lleva el registro del peso, en kgs,
antes de la dieta, y un tiempo razonable después de haber empezado la dieta.
En este caso, el peso de cada persona después de la dieta no es independiente
del peso de la misma persona antes de la dieta; por lo tanto estas dos variables
están correlacionadas, y si se quiere examinar el efecto de la dieta, se debe
llevar el registro del peso para la misma persona antes y después de la dieta.
Sea Dj la diferencia entre las variables aleatorias del j-ésimo par, es decir, Dj =
X1j-X2j. El valor esperado y la varianza de la diferencia entre las variables está
dado por:
86
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
87
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Tenemos que:
Dado que la diferencia puede ser cero, se concluye que no hay evidencia para
rechazar la hipótesis de que ambos lenguajes requieren el mismo tiempo de
programación, y por lo tanto no hay preferencia por ninguno de los dos
lenguajes.
88
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
02.975
n 1S 2 2
2 0.025
89
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
02.975
n 1S 2 n 1S 2
despejando la varianza se tiene:
2
2 02.975
n 1S 2 2 2
n 1S 2
02.025 despejando la varianza se tiene: 02.025
n 1S 2 2
n 1S 2
02.025 02.975
Ejemplo 4.7.
90
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
n 1S 2 2
n 1S 2
2 21
2 2
Ejercicios: 3.
91
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
R/ta:(101.55; 106.45)
R/ta: x =5251
R/ta: 95%
92
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
R/ta(0.196;0.504)
11. En una población una variable aleatoria sigue una ley normal de media
desconocida y desviación típica 2.
-Observada una muestra de tamaño 400, tomada al azar, se ha obtenido una
media muestra al igual a 50. ¿Calcule un intervalo, con el 97 % de confianza,
para la media de la población.
R/ta:(49,783 y 50,217)
- Con el mismo nivel de confianza, ¿qué tamaño mínimo debe tener la muestra
para qué la amplitud del intervalo que se obtenga sea, como máximo, 1?
R/ta: n ≥ 76
12. La cantidad de hemoglobina en sangre del hombre sigue una ley normal
con una desviación típica de 2g/dl.
-Calcule el nivel de confianza de una muestra de 12 extracciones de sangre
que indique que la media poblacional de hemoglobina en sangre está entre
13 y 15 g/dl.
R/ta:91.64
13. Si X ~ N (40,10), calcular Pr (39≤ X ≤41) para n=10. ¿En qué intervalo
se obtendrán el 95% de los resultados?
R/ta : (33.802,46.198)
15. Una marca de lavadoras quiere saber la proporción de amas de casa que
preferirían usar su marca. Toman al azar una muestra de 100 amas de casa y
20 dicen que la usarían. Calcula un intervalo de confianza del 95% para la
verdadera proporción de amas de casa que preferirían dicha lavadora.
93
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Autoevaluación. 1
donde:
94
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
donde:
N = Total de la población
Z 2 = 1.962 (si la seguridad es del 95%)
p = proporción esperada (en este caso 5% = 0.05)
q = 1 – p (en este caso 1-0.05 = 0.95)
d = precisión (en este caso deseamos un 3%).
95
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Solución:
Mediante los cálculos básicos obtenemos que la media muestral vale 505,35 y
la desviación típica 42,54.
96
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
UNIDAD DOS
97
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Introducción.
Objetivo general.
Objetivos específicos.
98
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Tipos de pruebas.
Nivel de significancia.
99
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Clases de hipótesis.
Tipos de error.
Cuando se tiene una hipótesis esta puede ser verdadera o falsa y la decisión
que se toma en la prueba es aceptar o rechazar la hipótesis. Si la decisión que
se toma está de acuerdo con la realidad no se cometen errores, en este caso
las dos buenas decisiones son: aceptar la hipótesis nula cuando es cierta o
rechazar la hipótesis nula cuando es falsa.
100
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
El p-valor
101
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Pruebas bilaterales.
Pruebas unilaterales
PRUEBA BILATERAL
H 0 : 0
H1 : 0
102
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
x
Z
n
Rechazar H0 si z -Z o si Z Z
2 2
Ejemplo
Paso 1
H 0 : 200
H 1 : 200
Paso 2
Paso 3
103
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Paso 4
Paso 5
Se concluye que el llenado de los envases cumple con las políticas generales
de la empresa, y la diferencia de promedios se atribuye a variaciones aleatorias.
104
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
PRUEBA UNILATERAL
Con anterioridad de dijo que la hipótesis alternativa indica una dirección ya sea
“mayor que” o “menor que”, la prueba es de una cola. El procedimiento para
demostrar la hipótesis es por lo general igual a la prueba de dos colas, excepto
que el valor crítico es diferente. Ahora se modificará la hipótesis alternativa del
problema anterior, sobre el llenado de los envases de una factoría de coca cola
Paso uno:
H 0 : 200
H1 : 200
Paso dos: igual.
Paso tres: igual
Paso cuatro:
Paso cinco: Igual, puesto que el valor estadístico de prueba está ubicado en la
zona de aceptación de la hipótesis nula, es decir, se está diciendo que el
promedio de llenado es de 200, tal como está planteada la hipótesis nula.
105
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Ejercicio
X
Sugerencia: Utilice el siguiente estadístico de prueba: Z
n
X
Z
S
n
Ejemplo
106
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
H 0 : 400
H1 : 400
Dado que la hipótesis alternativa se enuncia “mayor que”, se aplica una cola a la
derecha, y como la muestra es grande ( n >= 30), se aplica la distribución
normal estandarizada en Z.
X 407 400
Z 2.42
S 38
n 172
La decisión a tomar por Ud. es que el promedio de los créditos es mayor que
400 unidades monetarias con un grado de confianza del 95%.
107
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Paso 1: Se plantea la hipótesis nula (Ho) que no existe diferencia entre las
resistencias medias a la compresión de los bloques de concreto. La hipótesis
alternativa se plantea en términos que hay alguna diferencia significativa entre
las dos resistencias medias a la compresión. Simbólicamente se expresa así:
H0 : A B
H1 : A B
108
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
X1 X 2
Z
S12 S 22
n1 n2
Suponga que Usted seleccionó una muestra de cada una de las empresas
licitantes y determinó la resistencia a la compresión, con los siguientes
resultados:
X1 X 2 1.070 1.020 50
Z 5.01
S1
2
S 2
2 63 2
57 2
9.98827
n1 n2 81 64
Paso 4
109
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Paso 5
110
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
PP
Z
P(1 P)
n
donde:
P es la proporción muestral.
P es la proporción poblacional.
n es el tamaño de la muestra.
111
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
X n p
Z
n p q
donde:
X es el número de éxitos en la muestra.
P es la proporción hipotética de éxitos.
PRUEBA UNILATERAL
Ejemplo
Suponga que para que lo elijan a Ud. como alcalde, es necesario que logre al
menos el 80% de los votos del barrio donde vive. Dado su interés decide hacer
una encuesta en el barrio con una muestra de 2.000 personas, para ver la
posibilidad y 1.550 dieron respuesta favorable por sus aspiraciones. Pruebe la
hipótesis de favorabilidad, con un nivel de significancia del 0.05.
Paso 1
La hipótesis nula se plantea diciendo que Ud. sí tiene el 80% de favorabilidad
de voto en su barrio y la hipótesis alternativa en que no alcanza a tener este
porcentaje de favorabilidad de voto. Simbólicamente se expresa como sigue:
Ho : P 0.80
H1 : P 0.80
Paso 2
La distribución de probabilidad a utilizar es la normal estandarizada en Z, con un
nivel de significancia del 5%, con una cola a la izquierda.
Paso 3
El estadístico de prueba a utilizar es:
PP
Z
P(1 P)
n
donde:
P es la proporción muestral.
112
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
P es la proporción poblacional.
n es el tamaño de la muestra.
P(1 P)
P es el error estándar de la proporción poblacional.
n
1.550
0.80
PP 2.000 0.775 0.80 0.025
Z 2.80
P(1 P) 0.80(1 0.80) 0.00008 0.0089443
n 2.000
Paso 4
La regla de decisión se toma sobra la base de un valor critico calculado a partir
de la tabla de distribución Z, con un área de 0.4500 (0.5000-0.0500)
Paso 5
Como el valor Z (-2080) está en la región de rechazo de la hipótesis nula,
entonces se acepta la hipótesis alternativa y se concluye la favorabilidad de voto
es menos al 80%.
113
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
PRUEBA BILATERAL
Ejemplo
Paso 1
La hipótesis nula se plantea diciendo que el 55% de las familias desean adquirir
residencia en un condominio en Melgar.
Ho : P 0.55
H1 : P 0.55
Paso 2
La distribución de probabilidad a utilizar es la normal estandarizada en Z, con un
nivel de significancia del 1%, con dos colas.
PP
280 0.55 0.02
Z 400 0.80
Paso 3 P(1 P) 0.55(1 0.55) 0.0248747
n 400
Paso 4
La regla de decisión se toma sobre la base del siguiente grafico:
114
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Paso 5
La hipótesis nula que la proporción verdadera es del 55% no es rechazada a un
nivel de significancia del 1%, concluyendo que el 55% de las familias planean
adquirir residencia vacacional en Melgar lo desean en un condominio.
A continuación se proponen dos ejercicios para que los desarrolle aplicando las
sugerencias propuestas:
Ejemplo 3.12
Se lanza una moneda 200 veces y se obtienen 105 caras. Si el nivel de
significancia es de 1% probar la hipótesis que la probabilidad de caras es de ½
contra la hipótesis:
a. Que es mayor de ½.
b. Que es menor de ½.
c. Que es diferente de ½.
np 200 1 2 100 n p q 2001 2 1 2 7.07
X n p
Z
n p q
Ejemplo
115
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
( P1 P2 ) P1 P2
Z
PC (1 PC ) PC (1 PC )
n1 n2
Donde:
n1 Es la cantidad seleccionada en una muestra.
n2 Es la cantidad seleccionada en la otra muestra.
X X2
PC 1 Es la media ponderada de las proporciones muestrales.
n1 n2
X1 Es la cantidad de éxitos de la primera muestra.
X2 Es la cantidad de éxitos de la segunda muestra.
P1 yP2 Proporción de éxitos de la población uno y dos respectivamente.
Ejemplo
Paso 1
La hipótesis nula se plantea diciendo que no hay diferencia entre la proporción
de mujeres jóvenes y maduras que prefieren el nuevo perfume. La hipótesis
alternativa se plantea que las dos proporciones no son iguales.
Ho : P1 P2
H1 : P1 P2
116
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Paso 3: Los planes son tomar una muestra al azar de 100 mujeres jóvenes
designada por n subuno y una muestra de 200 mujeres mayores designada
como n subdos. Los resultados una vez hecha el experimento dio los siguientes
resultados: de las 100 mujeres jóvenes 20 eligieron el nuevo perfume,
designando este valor como X subuno; y de las 200 mujeres maduras 100
prefirieron el nuevo perfume, designando este valor como X subdos.
X1 X 2 20 100 120
PC 0.40
n1 n2 100 200 300
P1 P2
20 100 0.30
Z 100 200 5.0
PC (1 PC ) PC (1 PC ) 0.40(1 0.40) 0.40(1 0.40) 0.06
n1 n2 100 200
Paso 4
Los valores críticos para un nivel de significancia del 5% son –1.96 y +1.96.
Igual que en los otros casos, la siguiente grafica establece la regla de decisión:
Paso 5
El valor de Z calculado de –5.0 se encuentra en el área de rechazo de la
hipótesis nula. Por tanto, la hipótesis que las proporciones son iguales se
rechaza a un nivel del 5% de significancia.
117
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Dos lotes de frutas conformados cada uno por 250 unidades son tratados y
almacenados en iguales condiciones salvo que el lote No 1 está a temperatura
ligeramente inferior que el lote No 2. Pasado un tiempo se encuentra que el lote
No 1 hay 225 frutas sanas y en el lote No 2 hay 200 sanas. Probar la hipótesis
que la temperatura más baja favorece la conservación de las frutas al nivel de
significación de 0.05.
Ho : P1 P2
Paso 1: H1 : P1 P2
Paso 3:
X 1 X 2 225 200
PC 0.85
n1 n2 250 250
118
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Paso 5
La temperatura más baja favorece la conservación de las frutas.
Ejemplo
Paso 1
La hipótesis nula se plantea en el sentido que el costo promedio es de 60
unidades monetarias. La hipótesis alternativa que el costo es menor a 60
unidades monetarias. Esto se expresa en la siguiente forma:
119
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
H 0 : 600
H1 : 600
Paso 2
Se usa un nivel de significancia del 0.01 con una distribución “t”, en
consideración a que la muestra en menor a 30, es decir, es una pequeña
muestra.
Paso 3
Utilizando los datos de la muestra, se utiliza la siguiente fórmula como
estadístico de prueba:
X 57 60
t 1.530
S 10
n 26
Paso 4
Los valores críticos para la distribución “t” se encuentran en la tabla
correspondiente (anexo D), con 25 grados de libertad (26 – 1), prueba de una
cola a un nivel de significancia de 0.01, correspondiendo un valor crítico de
2.485. En el siguiente figura se indica el presente planteamiento:
Paso 5
Puesto que –1.53 se encuentra en la región de aceptación de la hipótesis nula a
un nivel del 1% de significancia, se concluye que los costos para los tramites de
120
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Ejemplo
Paso 1
Plantea sus hipótesis:
H 0 : 43
H1 : 43
Paso 2
Se dispone a probar la hipótesis con un nivel de significancia del 0.02, utilizando
la distribución “t” porque es una pequeña muestra, con 11 grados de libertad
aplicando el principio de ( n- 1) y calculo para dos colar puesto que la hipótesis
alternativa está planteada desde el punto de vista de “diferente”.
Paso 3
El estadístico de prueba a utilizar es el siguiente:
X
t
S
n
121
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
X X X
2
498 35
X 41.5 S 1.78
n 12 n 1 11
X 41.5 43.0
t 2.92
S 1.78
n 12
Paso 4
Para aplicar la regla de decisión, muestra en el siguiente gráfico el
planteamiento anterior:
Paso 5
La hipótesis nula que la media poblacional es 43 mm se rechaza a un nivel de
significancia del 0.02 y se acepta la hipótesis alternativa, concluyendo que los
ajustes en las máquinas sí causaron un cambió en la calidad de control en el
largor de los diferentes elementos que se producen.
122
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Ejemplo
Sugerencia:
X
Utilizar el siguiente estadístico de prueba: t S
n
Una prueba que utiliza la distribución t también puede aplicarse para comparar
dos medias muestrales que tienen las siguientes características:
123
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Ejemplo
Ho : 1 2
H1 : 1 2
La hipótesis nula consistente en que los dos grupos no tienen alguna diferencia
en la habilidad de conocimiento, y la hipótesis alternativa en que existe
diferencia entre los grupos sobre la habilidad en la aplicación de los
conocimientos.
Paso 3 Para el cálculo del estadístico de prueba se requiere estimar las medias
de los grupos y sus varianzas, los cuales se presentan en el siguiente cuadro:
124
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
X1 X 2 45
t 0.6620
S12 n1 1 S22 n2 1 1 1 8.55 1 4.46 1 1 1
562 5 6
n1 n2 2 n1 n2
La característica principal para aplicar este tipo de prueba, es que las muestras
sean dependientes y el tamaño de cada muestra sea inferior a 30 elementos
seleccionados.
125
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Ejemplo 3.9:
Antes 128 105 119 140 98 123 127 115 122 145
Después 135 110 131 142 105 130 131 110 125 149
En estas condiciones hay un par de índices de eficiencia para cada miembro del
grupo, antes y después del curso,; éste conjunto de pares es lo que se
denomina muestra por pares. La prueba de hipótesis que se realiza para
determinar si hay diferencia entre los índices antes y después del curso de
nivelación, es lo que denomina prueba de diferencia por pares. Obsérvese que
las dos muestras, una antes y una después, dependen entre sí, debido a que los
mismos alumnos están en ambas pruebas, por tanto son dependientes.
Ho : d 0
Paso 1: H1 : d 0
La hipótesis nula plantea que no hay diferencia de eficiencia después del curso.
La hipótesis alternativa plantea que el programa de nivelación mejoró el nivel de
los estudiantes.
Paso 2
Se usa un nivel de significancia del 5%, la muestra seleccionada es de 10
estudiantes considerada pequeña muestra, la distribución de probabilidad a
utilizar es la “t” student , con n – 1 grados de libertad.
Paso 3
El estadístico de prueba a utilizar es:
d
t
Sd
n
126
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
donde:
d :es la media de la diferencia entre las observaciones por pares.
Sd :es la desviación estándar de las diferencias entre las
observaciones por pares.
n :es el número de observaciones por pares.
G.L :son los grados de libertad (n –1)
d
d
46
4.60
n 10
d
d n
46
2 2
2
386
Sd 10 4.40
n 1 10 1
d 4.6
t 3.30
Sd 4.4
n 10
127
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Paso 4
El valor crítico de t para esta prueba de una cola a la derecha, es 1.833 que se
obtiene en la tabla de la distribución “t” (anexo D), ubicando en la columna de
la izquierda 9 grados de libertad y recorriendo a la derecha hasta la columna de
una cola con 0.05 nivel de significancia. En la siguiente gráfica se indica lo
expuesto:
Paso 5
Como el valor t (3.30) está en la región de rechazo de la hipótesis nula,
entonces se acepta la hipótesis alternativa y se concluye que el programa de
adiestramiento para los alumnos fue eficaz para aumenta su eficiencia.
128
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Su utilidad radica en determinar si una población normal tiene más variación que
otra población que se considera también normal. Como ejemplo se pueden
mencionar, si dos máquinas dedicadas a producir cierto artículo de precisión
pueden ser confiables en el control de calidad, es decir, el producto tiene el
mismo largor, el mismo diámetro y las variaciones presentadas son similares.
Ejemplo 16
Ho : 12 22
Paso 1:
H1 : 12 22
S12 122
F 2 5.76
S22 5
129
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Paso 4
El valor crítico se obtiene del Anexo F, para lo cual se reproduce una parte de la
tabla. Debido a que utiliza una prueba de dos colas, el nivel de significancia para
0.10 0.05
cada cola será de: 2 2 .
GRADOS LIBERTAD
NUMERADOR
G.L 5 6 7 8
Denominador
1 230 234 2.7 239
2 19.3 19.3 19.4 19.4
3 9.01 8.94 8.89 8.85
4 6.26 6.16 6.09 6.04
5 5.05 4.95 4.88 4.82
6 4.39 4.28 4.21 4.15
7 3.97 3.87 3.79 3.73
8 3.69 3.58 3.50 3.44
9 3.48 3.37 3.29 3.23
10 3.33 3.22 3.14 3.07
Ejercicios: 4
R/ta: 0,25
130
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
3. A fin del mes de marzo de 2007 la empresa brasilera compro el 51% de las
acciones de Paz del Rio S.A a razón de $120 la acción. En el mes de junio de
2007, en una muestra de 500 acciones, la razón promedio de las acciones
cotizadas en la bolsa de valores de Bogotá fue de $95, con una desviación
estándar de $20. ¿Si queremos saber si se puede afirmar que esta muestra
ofrece suficiente evidencia en un nivel de significancía de 0.05, que durante el
mes de junio de 2007 el precio de estas acciones en la bolsa de valores de
Bogotá se desmejoraron, ¿las hipótesis a probar son?:
6. Una marca de nueces afirma que, como máximo, el 6% de las nueces están
vacías. Se eligieron 300 nueces al azar y se detectaron 21 vacías.
1.Con un nivel de significación del 1%, ¿se puede aceptar la afirmación de la
marca?
R/ta: Aceptamos la hipótesis nula H0. Con un nivel de significación del 1%.
131
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
132
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
B. SPSS
Ejemplo 2.17
Dado que la situación de cada individuo es que viva o que no viva, y una de las
dos alternativas se debe de presentar, la situación de cada individuo se ajusta a
una variable de Bernoulli con probabilidad de éxito (vivir 30 años más) igual a
3./5 = 0.6. Al considerar los 5 individuos, se esta ante una variable X Binomial
con n = 5, p = 0.6. Se designa F(X) como la función de distribución, en donde
para el literal a, habrá de calcularse P(X>=3).
Figura 3.10
133
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Figura 3.11
Figura 3.12
134
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Actividades de aprendizaje.
135
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Alfa: Se introduce el nivel de significancia para la prueba, valor que debe estar
comprendido entre el rango de cero y uno. El nivel alfa es un nivel de
importancia relacionado con la probabilidad de que haya un error de tipo I
(rechazar una hipótesis verdadera).
136
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
En cuanto a las opciones de salida, se presenta “En una hoja nueva” para
insertar una hoja en el libro actual y pegar los resultados comenzando por la
celda A1 de la nueva hoja de cálculo. “En un libro nuevo” para crear un nuevo
libro y pegar los resultados en una hoja del libro creado.
137
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
138
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
139
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
140
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
141
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
142
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
cola como para el contraste de dos colas, puesto que ambos valores críticos de
Z ( 1.64485348 y 1.95996279) son mayores que el valor estadístico de prueba Z
(0.19377279), es decir, cae fuera de la región crítica o de rechazo. Además, la
probabilidad o p-valor (0.42317692) es mayor que el nivel alfa preestablecido de
0.05.
Auto evaluación
Resumen
Cuando las personas toman decisiones lo hacen con base en creencias que
tienen en relación a su concepto de realidad. Cada una de estas creencias
origina una hipótesis, que es una proposición avanzada con posibilidad de ser
verdadera. La prueba de hipótesis es un método sistemático de evaluar
creencias sobre la realidad que requiere de la confrontación de una creencia
con una evidencia y decidir si puede mantenerse como razonable o descartarse
por insostenible, e intervienen 5 pasos principales.
143
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
A. Excel
144
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
145
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
146
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
147
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Rótulos: Active ésta casilla si la primer afila y la primera columna del rango de
entrada contiene rotulo. Desactive si el rango de entrada carece de rotulo.
Método de muestreo: Haga clic en el periódico o aleatorio para indicar el
intervalo de muestreo que desee.
Periodo: Introduzca el intervalo en el que desee realizar la muestra. El valor n
del período del rango de entrada y cada valor n del período siguiente se copian
en la columna de resultados. El muestreo termina cuando se llegue al final del
rango de entrada.
Número de muestra: Introduzca el número de valores aleatorios que desee en la
columna de resultados. Cada valor se extrae de una posición aleatoria del rango
de entrada, y puede seleccionarse cualquier número más de una vez.
Rango de salida: Introduzca la referencia correspondiente a la celda superior
izquierda de la tabla de resultados. Los datos se escriben en una sola columna
debajo de la celda. Si selecciona “Periódico”, el número de valores de la tabla
de resultados es igual al número de valores del rango de entrada dividido por la
tasa de muestreo. Si selecciona “Aleatorio”, el número de valores de la tabla de
resultados es igual al número de muestras.
En hoja nueva: Hace clic en ésta opción para insertar nueva hoja en e libro
actual y pegar los resultados, comenzando por la celda A1 de la nueva hoja de
cálculo. Para darle un nombre a la nueva hoja de cálculo, escríbalo en el
cuadro.
En libro nuevo: Haga clic en ésta opción para crear un libro nuevo y pegar los
resultados en una hoja nueva del libro creado.
Al pulsar aceptar en la figura 2.8, se obtiene la muestra aleatoria simple con ó
sin reposición.
B. SPSS
Ordenar casos
Para ordenar una variable aleatoria de un archivo en SPSS, elija en los menús:
datos, seleccionar casos como se indica en la figura:
148
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Figura 2.9
Al hacer clic en ordenar datos aparece la siguiente figura que permite ordenar
por la variable en que se esté interesado, para el caso se ha seleccionada la
edad.
Figura 2.10
149
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Figura 2.11
Figura 2.12
150
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Figura 2.13
Actividades de aprendizaje.
Ejercicio 2.15
151
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Ejercicio 2.16:
152
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Auto evaluación
153
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Resumen.
154
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Introducción.
Cuando se desea conocer la homogeneidad que existe entre tres o más medias
muestrales, se procede a determinar la variabilidad entre esas medias, técnica
que se conoce como “análisis de varianza”. Es decir, cuando productos o
individuos son sometidos a tratamientos determinados para ver cómo éstos
influyen en resultados o comportamientos, lo más aconsejable es utilizar la
técnica de análisis de varianza.
155
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Objetivo general.
Objetivos específicos.
156
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
H o : 1 2 ... K
H 1 : No todas las medias de la población son iguales.
157
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
K nj
X
j 1 i 1
ij
X
nt
Donde: nt n1 n2 ... nK
X
nt K K
Ejemplo 1
158
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
X J
79 74 66 219
X J 1
73
nJ 18 3
Se observa que se obtienen las medias para cada tratamiento (79,74,66) y una
media general (73). Para llevar a cabo la prueba de la igualdad de las medias
de la población, se subdivide la variación total en dos mediciones:
k n 2
2
3 X X 85 732 75 732 ... 71 732 75 732 ...
6
VT ij
J 1 i 1
59 732 64 732 946
K n
X
j 1 i 1
ij
159
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
k n
Variación dentro del grupo (VDG) = X ij X j
2
= VDG
j 1 i 1
3 6 85 792 75 792 ... 71 742 75 742 ...
VDG
j 1 I 1 59 66 64 66 .... 430
2 2
3 2
VEG n6 X X 679 73 674 73 666 73 516
2 2 2
J 1
Puesto que K niveles están siendo comparados, existen (K-1) grados de libertad
asociados con la suma de cuadrados entre los grupos, niveles o tratamientos.
Como cada uno de los K niveles contribuye con ( n j 1 ) grados de libertad,
160
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
j 1
nj X j X
2 (K-1)
VET
K 1
A
B
A
X
Dentro o error k n (n-K) VDT
B
2
X j
j 1 i 1
ij
n k
Total
X (n-1)
2
k n VT
X
j 1 i 1
ij n 1
161
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
A
Rechaza H0 si Valor crítico
B
Para el caso la relación es igual a 8.99 mayor que el valor crítico 3.68, entonces
se tienen pruebas suficientes para rechazar la hipótesis nula consistente en que
las medias de las tres poblaciones son iguales. En otras palabras el análisis de
varianza apoya la conclusión que las medias para la duración de las bombillas
es diferente en las tres plantas.
El gráfico para dicho planteamiento es el siguiente:
162
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Se representa por uij la variación causada por todos los factores no controlables
(error experimental).
X ij ui uij
Se supone que uij es una variable normal de media cero y varianza constante.
X iJ i ij donde:
163
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
i J J J 0
J 1 J 1 J 1
iJ X iij j
164
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
165
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
5 nj
X
j 1 i 1
ij
8.52 7.15 ... 6.45 8.76 ... 7.41 8.65 ... .... 236.48
X 7.882666
nt 30 30
X
k n 2
VT 8.52 7.88 ... 6.12 7.88 ... 7.07 7.88 7.17 7.88 24.0741867
2 2 2 2
X
k n
2
Variación dentro del grupo (VDG) = ij X j
j 1 i 1
VDG 8.52 7.09 ... 6.45 8.406 ... 7.41 8.523 .... 7.17 6.926 11.9584533
2 2 2 2
j 1
j X j X
2
166
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Existen varias, (Duncan, Newman-Keuls, LSD): todas ellas muy parecidas. Usan
el rango (diferencia entre medias) de todos los pares de muestras como
estadístico y dicho rango debe superar un cierto valor llamado mínimo rango
significativo para considerar la diferencia significativa.
167
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
grupos VEC r j 1 c 1
MCA
VEC
F
MCA
o c 1 MCE
column
as (j)
Entre
los r
X i. X
2 VEF MCB
bloque VEF c
i 11 r 1
MCB
r 1
F
MCE
s o
filas (i)
Error
de c r
X X . j X i. X
2
r 1c 1 VE
muestr VE
j 1 i 1
ij
MCE
r 1c 1
eo, E
c r 2
Total, T VT X ij X rc 1
j 1 i 1
168
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
X
j 1 i 1
ij X La sumatoria de los valores de todos los bloques y de todos los grupos,
Ejemplo 3
Suponga que existen cuatro parcelas diferentes las cuales son sometidas
sucesivamente a seis tipos de insumos y se piensa que la producción es
afectada por el tipo de insumo y mantenimiento a que es sometida. Se desea
probar los diferentes tratamientos afectan la producción por parcela, y la
producción es la siguiente:
Los totales por grupo (parcelas) y sus correspondientes promedios, los totales y
los promedios por tratamientos o bloques (insumo y manteniendo), así como la
gran media se indican en el cuadro.
169
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
r 6; c 4; n rc 24
c r
X
j 1 i 1
ij
1.887
X 78,625
rc 24
c r 2
Variación Total de Cuadrados: VT X ij X
j 1 i 1
C 2
Variación entre grupos o columnas: VEC r X . j X
j 1
VEC 6 77.5 78,625 66.67 78,625 ... 79.33 78,625 1.787,46
2 2 2
r 2
Variación entre bloques o filas: VEF c X i. X
i 11
VEF 4 71.75 78,625 79 78,625 ... 82.5 78,625 238,38
2 2 2
c r 2
Variación del error de muestreo: VE X ij X . j X i. X
j 1 i 1
170
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
244.79
VEC 1.787,46
MCA 595,82
c 1 4 1
VEF 283.38
MCB 56,676
r 1 6 1
VE 224.79 224.79
MCE 14,986
r 1c 1 6 14 1 15
Error 224.79
VE
224.79 (6-1)(4-1)=15 15
14,986
Total 2.295.63 (6)(4)-1=23
171
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Si se desea probar las diferencias entre los rendimientos de las parcelas con un
nivel de significancia del 5%, la regla de decisión consiste en rechazar la
hipótesis nula H o : 1 2 3 4 si el valor F calculado es mayor que 3.29
(Ver anexo F con 3 grados de libertad en el numerados y 15 grados en el
denominador). Para el caso F = 39,758 es mayor que el valor crítico 3.29,
entonces se rechaza la hipótesis nula y se llega a la conclusión que existe
evidencia de una diferencia entre la producción promedio de las diferentes
parcelas, como se puede apreciar en el siguiente gráfico:
172
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
X ijk Valor de la k - ésima observació n del nivel i del factor A t del nivel j del factor B.
X ij Suma de los valores de la celda ij (las observacio nes del nivel i del factor A y del nivel j del factor B.
X i.. Suma de los valores de la hilera i del factor A.
X.j. Suma de los valores de la columna j del factor B.
GT Gran total de todos los valores en todas las hileras y columnas.
r Número de niveles del factor A.
c Número de niveles del factor B.
n ' Número de valores(replicas) para cada celda.
n Número total de observacio nes del experiment o (con n r.c.n '
173
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Tabla resumen para el análisis de varianzas de dos vías con más de una
observación por célula se resume en el siguiente cuadro:
Ejemplo 4
Para ilustrar el modelo factorial de dos factores, suponga que UD como dueño y
propietario de una cadena de supermercados esta interesado en saber el efecto
de la colocación de los estantes en la venta de un producto. Para ello estudia 4
posibles lugares distintos donde colocar los estantes: Colocación normal entre el
pasillo(A), colocación ingreso del pasillo (B), colocación a la entrada del pasillo
con impulsadora (C) y colocación normal con propaganda (D). Se toman ventas
aleatorias en las jornadas de la mañana, tarde y noche y los resultados de las
ventas semanales se resumen en la siguiente tabla:
174
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
GT 1.612
r c n'
X
i 1 j 1 k 1
2
ijk 452 502 ... 752 111.550
r
X i2.. 4512 5392 6222
i 1 cn
'
42
110.100,75
GT 2
1.6122
108.272.66
rcn' 342
175
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
VEGB
c X .2j .
GT 2 109.375 108.272.66 1.102.34
j 1 rn' rcn'
VEGA 1.828.09
MCA 914.045
r 1 3 1
BEGB 1.102.34
MCB 367.447
c 1 4 1
VEABI 88.91
MCC 14,818
r 1c 1 3 14 1
VE 258
MCE 21.5
rc n 1 342 1
'
176
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Así mismo si utiliza un nivel de significancia de 0.05 para probar si existe alguna
diferencia entre la ubicación de los estantes, la regla de decisión es rechazar la
hipótesis nula ( H 0 : 1 2 ... c ), si el valor calculado F (17.09) es mayor
que 3.49 (observar anexo F para 3 grados de libertad en el numerador y 12
grados de libertad en el denominador); se rechaza la hipótesis nula y se
concluye que existe una diferencia entre los promedios de ventas para la
colocación de los diferentes estantes en el almacén.
177
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Se ha realizado hasta ahora las pruebas para la significación del factor A, del
factor B y de la interacción, corresponde entender en mejor forma el concepto
de interacción, si se grafica las medias, empleando la siguiente fórmula:
X ij
X ij
n'
95 122 148
X 11. 47.5 X 21. 61.0 X 31. 74.0
2 2 2
119 147 157
X 12. X 22. 73.5 X 32. 78.5
2 2 2
136 153 171
X 13. X 23. 76.5 X 33. 85.5
2 2 2
101 117 146
X 14. 50.5 X 24. 58.5 X 34. 73.0
2 2 2
90
85
80 A
75
Ventas
70 B
65
60 C
55
D
50
45
40
Mañana Tarde Noche
Jornada
178
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Ejercicios: 5
R/ta: 27
A un nivel de confianza del 95% ¿Puede considerarse que los tres métodos
producen resultados equivalentes? O por el contrario ¿Hay algún método
179
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
R/ta: 27
R/ta: F= 1.5
R/a: 15 y 51.6
R/ta: 15
180
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
A. ANOVA EN EXCEL
181
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
182
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
183
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
184
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
B. ANOVA en SPSS
185
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Figura 5.14
Figura 5.15
186
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Figura 5.16
ANOVA
Precio
Suma de Media
cuadrados gl cuadrática F Sig.
Inter-grupos 198123,716 5 39624,743 1,148 ,335
Intra-grupos 10144438,6
294 34504,893
14
Total 10342562,3
299
30
Actividades de aprendizaje.
187
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
188
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
189
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Podrá darse cuenta que los resultados son idénticos, teniendo como ventaja el
uso de la herramienta, un ahorro considerable de tiempo y menor riesgo a
equivocarse.
Suponga que existen cuatro parcelas diferentes las cuales son sometidas
sucesivamente a seis tipos de insumos y se piensa que la producción es
afectada por el tipo de insumo y mantenimiento a que es sometida. Se desea
probar los diferentes tratamientos afectan la producción por parcela, y la
producción es la siguiente:
190
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
El p-valor es menor a un nivel de significancia del 0.05, por tal razón los
rendimientos medios son diferentes para las parcelas como para la utilización de
los diferentes tipos de insumos. De otra parte el valor estadístico de prueba F es
superior al valor crítico afirmando la conclusión anterior. Los resultados son los
191
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Error 224.79
VE
224.79 (6-1)(4-1)=15 15
14,986
Total 2.295.63 (6)(4)-1=23
192
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
193
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
194
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
195
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Pruebe al nivel de significancia del 0.05 que no hay diferencia entre los
promedios para los 4 grupos.
5.4 Se distribuyen 3 clases de jabones: A, B y C. Las ventas mensuales en
unidades monetarias se indican en la siguiente tabla:
Mes Jabón A Jabón B Jabón C
Enero 7 9 12
Febrero 11 12 14
Marzo 13 11 8
Abril 8 9 7
Mayo 9 10 13
Resumen.
196
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
del error, y una mejor prueba para determinar si las medias de población o
tratamiento del factor difieren apreciablemente.
Algún Glosario
197
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
198
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Introducción
Las pruebas que se mencionarán son las que se podrían necesitar con mayor
frecuencia, se mencionarán sus principales características y aplicaciones.
Objetivo general.
199
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Objetivos específicos.
200
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Características de la prueba
La prueba de K-S de una muestra es una hipótesis de bondad de ajuste. Esto
es, se interesa en el grado de acuerdo entre la distribución de un conjunto de
valores de la muestra y alguna distribución teórica específica. Determina si
razonablemente puede pensarse que las mediciones muéstrales provengan de
una población que tenga esa distribución teórica. En la prueba se compara la
201
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Estadístico de prueba
D = máxima
Sn(x): es la función de distribución empírica.
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-M0| y
se ordenan de menor a mayor, asignándoles su rango (número de orden). Si
hubiera dos o más diferencias con igual valor (empates), se les asigna el rango
medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna
el valor 2.5 a ambas). Ahora calculamos R+ la suma de todos los rangos de las
diferencias positivas, aquellas en las que Xi es mayor que M0 y R- la suma de
todos los rangos correspondientes a las diferencias negativas. Si la hipótesis
nula es cierta, ambos estadísticos deberán ser parecidos, mientras que si
nuestros datos tienen a ser más altos que la mediana M0, se reflejará en un
valor mayor de R+, y al contrario si son más bajos. Se trata de contrastar si la
menor de las sumas de rangos es excesivamente pequeña para ser atribuida al
azar, o, lo que es equivalente, si la mayor de las dos sumas de rangos es
excesivamente grande.
202
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
203
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Esta prueba solamente se puede usar cuando el tamaño de cada muestra sea
mayor o igual a cinco. Se puede afirmar que el procedimiento que se realiza en
esta prueba es una extensión del utilizado en la prueba U de Mann-Withney.
Para proceder a realizar esta prueba, se utiliza la distribución ji cuadrada con (k-
1) grados de libertad, siendo k el número de muestras con las que se trabaja.
Ejercicios: 6
Ala B 10 9 7 8
R/ta: 9 días
R/ta: 16
204
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Edad
Partido 18 – 35 35 – 50 50 o más
A 10 40 60
B 15 70 90
C 45 60 35
D 30 30 15
Autoevaluación
A un nivel de confianza del 95% ¿Puede considerarse que los tres métodos
producen
205
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Solución:
serán: CM(entre) =
26,8/2 = 13,4
CM(intra) = 17,2/12 = 1,43
206
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Test No Parámetro
Solución:
Edad
207
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Partido 18 – 35 35 – 50 50 o más
A 10 40 60
B 15 70 90
C 45 60 35
D 30 30 15
Solución:
Edad
Partido 18 – 35 35 – 50 50 o más
A 10 40 60 110
B 15 70 90 175
C 45 60 35 140
D 30 30 15 75
100 200 200 500
Edad
Partido 18 – 35 35 – 50 50 o más
A 22 44 44
B 35 70 70
C 28 56 56
D 15 30 30
Edad
208
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Partido 18 – 35 35 – 50 50 o más
A -12 -4 16
B -20 0 20
C 17 4 -21
D 15 0 -15
Edad
Partido 18 – 35 35 – 50 50 o más
A 144 16 256
B 400 0 400
C 289 16 441
D 225 0 225
Edad
Partido 18 – 35 35 – 50 50 o más
A 6,55 0,36 5,82
B 11,43 0 5,71
C 10,32 0,29 7,88
D 15 0 7,5
43,30 0,65 26,91 70,86
209
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Solución:
1º La hipótesis nula es que los datos proceden de una Normal (110, 10).
6º Como el valor del estadístico 0,1071 es menor que el valor crítico se acepta
la
hipótesis nula.
210
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
211
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
BLIOGRAFÍA
212
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD
ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERIA
CONTENIDO DIDÁCTICO DEL CURSO: 100403 – INFERENCIA ESTADISTICA
Sitios Web.
http://server2.southlink.com.ar/vap/PROBABILIDAD.htm
http://es.wikipedia.org/wiki/Probabilidad
http://www.terra.es/personal2/jpb00000/pprobjunio99.htm
http://www.fvet.edu.uy/estadis/probabilidad.htm
http://thales.cica.es/rd/Recursos/rd98/Matematicas/28/matematicas-28.html
http://www.aulafacil.com/CursoEstadistica/CursoEstadistica.htm
http://www.uantof.cl/facultades/csbasicas/Matematicas/academicos/emartinez/E
stadistica/index.html
http://www.d16acbl.org/U173/Brmx_prob1.html#_1
http://espanol.geocities.com/eprobabilidades/index.htm
http://www.monografias.com/trabajos11/tebas/tebas.shtml
http://www2.uiah.fi/projects/metodi/252.htm
http://e-stadistica.bio.ucm.es/mod_intervalos/intervalos6.html
http://escuela.med.puc.cl/Recursos/recepidem/EPIANAL9.HTM
http://adrianamoralesunad.blogspot.com/
213