Documentos de Académico
Documentos de Profesional
Documentos de Cultura
MÓDULO ÚNICO
CARRERA: CONTADOR PÚBLICO
ADMINISTRACIÓN DE EMPRESAS
CURSO: 3º AÑO
PROFESOR: Lic. ROBERTO CADAR
SALTA - 2007
1
2
Educación
A DISTANCIA
AUTORIDADES DE LA UNIVERSIDAD
CANCILLER
Su Excelencia Reverendísima
Mons. MARIO ANTONIO CARGNELLO
Arzobispo de Salta
RECTOR
VICE-RECTOR ACADÉMICO
VICE-RECTOR ADMINISTRATIVO
SECRETARIA GENERAL
DELEGADO RECTORAL
del S.E.A.D.
3
4
Indice general
5
2.1. Media aritmética ..................................... 94 3.2.- Frecuencia relativa de ocurrencia ....... 169
2.2. Mediana ............................................... 100 3.3.- Probabilidad subjetiva ......................... 170
2.3 Moda ..................................................... 101 4.- Axiomas de Probabilidad ....................... 173
2.4. Media aritmética, mediana y moda 5.- Reglas de Probabilidad .......................... 174
para datos agrupados ............................ 105
5.1.- Eventos mutuamente excluyentes y
Media aritmética combinada ........................ 106 no excluyentes. Reglas de la adición ..... 174
2.5. Otras medidas de posición ................... 118 5.2.- Eventos independientes y
Uso de la G para obtener tasas promedio dependientes. Reglas de la
de crecimiento ........................................ 120 multiplicación .......................................... 179
2.- Conceptos básicos ................................ 163 Uso de las tablas ........................................ 221
2.1.- Evento aleatorio - Espacio muestral - 4.2.- Distribución de Poisson ...................... 225
Experimento ........................................... 164 Aproximación de la distribución de
2.2.- Eventos aleatorios simples y Poisson a la distribución binomial ........... 226
compuestos ........................................... 164 4.3.- Distribución hipergeométrica ............... 229
3.- Los tres enfoques de la Probabilidad ..... 168 5.- Distribución de probabilidades
continuas................................................ 232
3.1.- Probabilidad clásica ............................ 168
6
5.1. Distribución Normal .............................. 232 UNIDAD IX
5.2. Distribución exponencial ...................... 246 TEST DE HIPOTESIS ................................ 301
1. Generalidades......................................... 301
APÉNDICES 2. Procedimiento de las pruebas de
hipótesis ................................................. 301
Apéndice 1 .................................................. 257
3. Hipótesis exactas e inexactas ................ 305
Distribución Probabilisticas Binomiales ....... 257
4. Pruebas de hipótesis con muestras
Apéndice 2 .................................................. 260
grandes .................................................. 305
Probabilidades acumuladas para
4.1 Prueba de una media poblacional .......... 305
distribuciones binomiales ....................... 260
4.2 Prueba de la proporción de la población 307
Apéndice 3 .................................................. 263
4.3 Prueba para la diferencia de medias ..... 308
Probabilidades Poisson .............................. 263
5. Error de tipo II. Curva Característica
Apéndice 4 .................................................. 267
Operativa y Curva de Potencia de
Apéndice 5 .................................................. 268 Contraste ............................................... 309
Valores de e-l .............................................. 268 6. Inferencia para muestras pequeñas.
Diagrama de Contenido - Unidad VII ........... 269 La Distribución “t” de Student ................. 317
6.1 Introducción ......................................... 317
6.2 Características 3.................................. 317
UNIDAD VII
6.3 Uso de la tabla ...................................... 318
DISTRIBUCION EN EL MUESTREO ........ 271
6.4 Inferencia estadística utilizando la
1. Introducción ............................................ 271
distribución t ........................................... 319
2. Importancia de la muestra ....................... 271
6.5 Grados de libertad 4 ............................. 326
3. Error muestral ......................................... 272
4. Distribución en el muestreo ..................... 272
UNIDAD X
5. Error estándar ......................................... 273
LA DISTRIBUCIÓN JI CUADRADA (c2) ... 333
6. Distribución muestral de medias ............. 273
1. Características de la distribución ............ 333
7. Distribución muestral de proporciones .... 275
2. Uso de las tablas de c2 .......................... 334
8. Teorema del límite central ...................... 277
3. Aplicaciones de c2 .................................. 334
3.1 Prueba para la bondad de ajuste ........... 336
UNIDAD VIII
3.2 Test de Independencia .......................... 346
TEORÍA CLÁSICA DE LA ESTIMACIÓN ... 285
3.3 Prueba de Homogeneidad ..................... 348
1. Introducción ............................................ 285
3.4 Prueba de una varianza de la población 353
2. Estimador y Estimación .......................... 285
3. Tipos de Estimaciones ............................ 285
APÉNDICES
4. Propiedades de un buen estimador ......... 286
Apéndice 6 .................................................. 361
5. Estimaciones puntuales .......................... 287
Tabla de números aleatarios ....................... 361
6. Estimación por intervalo ......................... 289
Apéndice 7 .................................................. 362
6.1 Introducción .......................................... 289
Valores porcentuales de la distribución t ..... 362
6.2 Nivel e Intervalo de Confianza .............. 290
Apéndice 8 .................................................. 363
6.3 Cálculo de Estimaciones por
intervalos para muestras grandes .......... 291 Valores porcentuales de la distribución X2 .. 363
7
8
CURRICULUM VITAE
1. DATOS PERSONALES
2. TÍTULOS
a)Nivel Medio
b) Nivel Superior
9
4. OTROS CARGOS DESEMPEÑADOS
5. ANTECEDENTES DOCENTES
a)Nivel Medio
10
* Organización del Comercio y de la Empresa desde marzo de 1984
hasta diciembre de 1997.
* Contabilidad y Sistematización Administrativa - Contable de 3er. año
desde el 01-02-98 a la fecha.
11
* Estadística Aplicada en la carrera de Turismo desde agosto de 1992
hasta la fecha.
* Administración del Personal desde el 15-08-88 al 31-12-88 y desde el
14-08-89 al 31-12-89.
* Métodos y Modelos Decisionales en la carrera de Administración de
Empresas desde marzo de 1.994 hasta la fecha.
12
Carrera: Contador Público - Administración de Empresas
Curso: 3º Año
Materia: Estadística
Profesor: Lic. Roberto Cadar
Año Académico: 2007
I. Fundamentación
La información es un recurso fundamental para la toma de decisiones
en todo tipo de organización. Los directivos enfrentan el desafío de resol-
ver distintos problemas en condiciones de incertidumbre. Gracias al desa-
rrollo de los métodos cuantitativos, muchos de estos problemas han en-
contrado soluciones. La Estadística ha demostrado ser una herramienta
útil en todas las disciplinas en los procesos de decisión, en trabajos de
investigación y en evaluación de proyectos.
II. Objetivos
√ Conocer el significado y alcance de la Estadística como disciplina
científica.
√ Aplicar los métodos y técnicas estadísticas a los problemas relaciona-
dos con la Economía y los Negocios.
√ Valorar la Estadística como herramienta fundamental en los procesos
de investigación y toma de decisiones.
13
2. Variables. Concepto. Clasificación. Datos estadísticos.
3. Población. Concepto. Población finita y población infinita. Unidades
elementales de observación. Parámetro.
4. Muestra. Conceptos. Razones para el muestreo. Muestras
probabilísticas y no probabilísticas. Estadígrafo.
5. Objetivos del análisis estadístico. Estadística Descriptiva. Inferencia
Estadística.
6. Relevamiento de datos. Fuentes internas y externas. Fuentes prima-
rias y secundarias. Métodos de obtención de datos.
7. Organización de los datos recopilados.
8. Presentación de la información. Cuadros y gráficos. Elementos es-
tructurales. Distintos tipos. Construcción. Lectura e interpretación.
Instrumentos de análisis.
14
2. Eventos aleatorio. Espacio muestral. Experimento. Eventos simples y
compuestos.
3. Los tres enfoques de la probabilidad. Probabilidad clásica. Frecuencia
relativa de ocurrencia. Probabilidad subjetiva.
4. Axiomas de probabilidad.
5. Eventos excluyentes y no excluyentes. Regla de la adición.
6. Eventos independientes y dependiente. Regla de la multiplicación.
7. Probabilidades conjuntas.
8. Reglas de conteo. Permutaciones. Variaciones. Combinaciones.
9. Teorema de Bayes.
1. Importancia de la muestra.
2. Error muestral
3. Distribución en el muestreo. Error estándar. Distribución muestral de
medias y de proporciones.
4. Teorema del límite central.
15
2. Pruebas de hipótesis para muestras grandes. Prueba de la media
poblacional. Prueba de la proporción de la población. Prueba de la
diferencia de medias. Error de tipo II. Curva de característica opera-
tiva. Potencia de contraste.
3. Inferencia estadística para muestras pequeñas. La distribución “t” de
Student. Pruebas de hipótesis. Estimaciones.
IV. Bibliografía
BÁSICA
COMPLEMENTARIA
16
• D’OTTONE, Horacio “Estadística”. Ed. Copecultura (Sgo. De Chile)
• RANKE, J. y REITSCH. A., “Pronóstico de los negocios”. Ed. Prenice-
Hall
• PUBLICACIONES DEL INDEC (Instituto Nacional de Estadísticas y
Censos).
17
18
DIAGRAMA DE CONTENIDO - BLOQUE Nº 1
UNIDAD I
SIGNIFICADO Concepto de Aplicaciones La falsedad
Y ALCANCE DE Estadística estadística
LA ESTADISTICA
BLOQUE Nº 1
UNIDAD II
Etapas de un tra-
19
LA INVESTIGACIÓN bajo estadística
ESTADISTICA
Relevamiento
Variables
de datos
Datos Organización
estadísticos de los datos
Presentación
Población y de la
Muestra
información
Estadística
Descriptiva Cuadros Gráficos
e Inferencial
20
VI. Guía de Estudios
UNIDAD I
21
2. Aplicaciones de la estadística
2.1. Aplicación en distintas disciplinas
22
investigación de mercados, evaluación de proyectos, pronósticos de ven-
tas, etc. En la actualidad, se trata de incluir todos los métodos relaciona-
dos con las decisiones estadísticas en una teoría que las abarque por
completo denominada "teoría de las decisiones".
3. La Falsedad estadística
23
Actividad Nº 1
a) Geografía
b) Turismo
c) Educación
d) Psicología
24
UNIDAD II
LA INVESTIGACIÓN ESTADÍSTICA
1. Etapas de un trabajo estadístico
25
2. Variables
0-5 3 5 2 4
5 - 10 18 16 19 11
10 y más 45 60 22 24
TOTAL 66 81 43 39
26
y, desde luego, no están representadas numéricamente. Ej.: Cargo y
Sexo. Otros ejemplos: nacionalidad, nivel instrucción, estado civil, etc.
- Las variables discretas son aquellas que pueden tomar sólo ciertos
valores es el intervalo considerado y no admiten valores intermedios.
Generalmente son valores enteros. Ej.: el número de hijos. Una fami-
lia puede tener 0,1, 2... hijos, pero no algún valor intermedio.
- Las variables continuas son las que pueden tomar cualquier valor en
el intervalo considerado. Ej.: el peso. Una persona que pesa 65 kgs.,
redondeando a enteras se puede tener la certeza que su peso es un
valor entre 64,5 y 65,5 kgs. Puede pesar 65 a 65,385 kgs., o cualquier
valor entre 64,5 y 65,5 kgs.
En resumen:
27
3. Datos estadísticos
28
Actividad Nº 2
29
4. Población y Muestra
4.1. Población
30
Puede ocurrir que distintos investigadores se opongan en las definicio-
nes sobre una misma cuestión básica. Por ejemplo, si se toma en conside-
ración al “turista” como unidad de observación para un análisis cualquiera,
puede ocurrir que para un economista, un turista sea la persona que se
desplaza de su residencia habitual, ya que tal desplazamiento lo obliga a
realizar gastos de hotelería, transporte, comida, etc. cualquiera sea la
“motivación” del viaje; sin embargo un sociólogo puede considerar que un
“viajante de comercio” o “un director de una S.A." que asiste a una reunión
de trabajo, no es un turista, puesto que la motivación de su viaje es con-
secuencia de la actividad laboral.
Una población de este tipo podría ser todas las baterías posibles que
fabricaría un industrial si continuara trabajando indefinidamente, bajo de-
terminadas condiciones de operación. Otra población infinita sería todos
los resultados posibles al lanzar un dado en forma continua e indefinida.
En las poblaciones infinitas, no puede obtenerse información completa,
por lo que para poder estudiarla se deberá trabajar con una muestra.
31
4.3. Muestra
32
Existen varios tipos de diseños de muestras, pero todos ellos producen
dos categorías de muestras. Las probabilísticas y las no probabilísticas.
33
Actividad Nº 3
a) ¿Cuál es la población?
b) ¿Cuál es la unidad de observación?
c) ¿Qué constituye la muestra?
a) como muestra,
b) como una población.
34
a) Varias veces durante el día un ingeniero de control de calidad, en
una fábrica textil, selecciona diferentes muestras de metros cua-
drados de tela, las examina y registra el número de imperfecciones
que encuentra.
35
5. Objetivos del Análisis Estadístico
Vendedor A B C D E
Monto (en 18 25 20 15 22
miles de $)
18 + 25 + 20 + 15 + 22
Media = = $ 20
5
36
Los datos pueden presentarse en diversos gráficos, como por ejemplo,
un gráfico de barras.
30
25
20
15
10
A B C D E Vendedor
37
En el ámbito de la administración de empresas, los métodos de inferencias
son fundamentales para la toma de decisiones. Se tomarán a modo de
ejemplos dos casos típicos.
38
Actividad Nº 4
39
6. Relevamiento de datos estadísticos
6.1. Concepto
40
- Las fuentes secundarias son aquellas que proporcionan toda la infor-
mación existente sobre el tema bajo estudio. Se denominan secunda-
rias porque los datos son obtenidos de una reimpresión, que es publi-
cada por una persona u organización distinta al recopilador original.
41
Una encuesta estadística es el proceso de recopi-
lación de datos relacionados con las característi-
cas de elementos, sin un control especial que
influya sobre la variable de interés.
42
nes de sus suscriptores acerca de la misma, de esta manera puede
recabar los datos en distintos lugares de un área geográfica determi-
nada.
7.2. Clasificación
La clasificación implica el establecimiento de grupos o clases para los
resultados de una variable. El criterio de clasificación depende de los ob-
jetivos y el método de estudio. La clasificación es importante para el aná-
lisis de relaciones entre variables.
43
El monto de ventas, por ejemplo, puede clasificarse por año o por sucur-
sal de una compañía. Los empleados de una empresa pueden clasificarse
por categorías o por nivel de instrucción.
7.3. Tabulación
20 - 25 /// 3
25 - 30 //// /// 8
30 - 35 //// 5
35 y más // 2
18
44
Actividad Nº 5
45
8. Presentación de los datos estadísticos
8.1. Introducción
Las dos técnicas básicas de presentación son los cuadros o tablas y los
gráficos.
8.2.1. Concepto
46
PRODUCCION ARGENTINA (a) Título
DE PAPEL POR PRINCIPALES TIPOS
(En miles de toneladas) (b) Nota de
encabezado
P E R I O D O S (c)
TIPOS Encabezado
1991 1992 1993 (1)
47
la celda se deja en blanco, no se sabe si el dato es cero, no está
disponible o hubo alguna omisión.
Vendedores 60 50 100
Administrativos 40 20 60
Maestranza 20 10 30
Total 120 80 200
Porcentajes conjuntos
Vendedores 30 25 55
Administrativos 20 10 30
Maestranza 10 5 15
Total 60% 40% 100%
48
Porcentajes verticales
Vendedores 50 62.5 55
Administrativos 33 25 30
Maestranza 17 12.5 15
Porcentajes horizontales
Vendedores 55 45 100%
Administrativos 67 33 100%
Maestranza 67 33 100%
49
Actividad Nº 6
Presente todos datos del informe en cuadro con todos los elementos
estructurales asegurando una lectura comprensiva de las cifras.
50
- Hombres casados 1730 satisfactorios y 630 insatisfactorios.
- Hombres en otro estado civil 190 satisfactorio y 350 insatisfactorio.
- Mujeres casadas 304 satisfactorios y 430 insatisfactorios.
- Mujeres en otro estado civil 621 satisfactorios y 45 insatisfactorio.
51
8.3. Gráficos Estadísticos
8.3.1. Concepto
$
60
50
40 Diagramas
Escala de
y 30
20
10
Mes
Enero Febrero
Escala de x
Al igual que los cuadros, en los gráficos se consignan las notas del
encabezado y notas al pie cuando fuese necesario.
52
8.3.3. Tipos de gráficos
a) Simples
I. Lineales
b) Múltiples
a) Simples
GRAFICOS II. De Barras b) Múltiples
c) Compuestas
d) Bidireccionales
III. Circulares
Cuadro Nº 1
Lunes 5 3 8
Martes 2 2 4
Miércoles 5 2 7
Jueves 11 4 15
Viernes 7 3 10
Sábado 8 5 13
38 19 57
Cuadro Nº 2
53
CARRERA 1997 1998
Abogacía 90 108
Adm. de Empresas 40 80
Ingeniería Civil 70 35
I. Gráficos Lineales
$
16
14
12 Ventas totales
diarias de la empresa
10
Llave
8
4 El tiempo siempre
se coloca en el eje de la x.
2
Día
L M M J V S
54
GRAFICO Nº 2
$
16
14
12
10 Ventas diarias
al contado y a crédito
8 de la empresa LLave
6
II.Gráfico de barras
55
GRAFICO Nº 3
(Barras Simples)
$
16
14
12
10
L M M J V S Día
GRAFICO Nº 4
(Barras Múltiples)
56
Se representarán los cambios porcentuales en el número de ingresan-
tes en 1998 con respecto a 1997.
Variación
porcentual +20% +100% -50%
Abogacía
Ing.
Civil
Adm. De
Empresa
Nº de Alumnos
25 50 75 100
GRAFICO Nº 7
-100 -80 -60 -40 -20 0 -20 -40 -60 -80 -100
Adm. De
Empresas
Abogacía
Ing. Civil
57
GRAFICO Nº 5
(Barras Compuestas)
58
Carrera Ingresante %
Abogacía 90 45
Adm. de Empresas 40 20
Ing. Civil 70 35
200 100
Abogacía
Adm. de Empresas
Ing. Civil
Abogacía 45%
59
Además de los gráficos desarrollados, los datos pueden presentarse en
mapas estadísticos, pictogramas, gráficos de volúmenes, etc.
GRÁFICO (a)
GRAFICO (b)
El eje vertical debe comenzar en cero para que se tenga una adecuada
representación de la situación. Los gráficos cuyas escalas de los ejes
verticales comienzan en cero tienden a enfatizar la magnitud de las cifras
consideradas, mientras que en los gráficos que omiten el cero tienden a
enfatizar la variación en el número sin considerar la verdadera magnitud.
60
Actividad Nº 7
Ingresos 50 45 70 40 80 100
61
a) Obtener el número de turistas que ingresaron en enero y febrero de
1997. Construir un gráfico comparativo.
62
Actividad Obligatoria
a) Objetivo de la investigación.
b) La población bajo estudio y las variables de interés.
c) Tipos de fuentes de datos disponibles y métodos de recolección a
utilizar.
63
64
UNIDAD III
DISTRIBUCIÓN DE FRECUENCIAS
1. Introducción
2. Series estadísticas
Temporales o cronológicas
Series
estadísticas
Espaciales
Intemporales
De Cualitativas
Frecuencia Discretas
Cuantitativas Continuas
65
En las series intemporales los valores se observan en un período fijo o
en un momento determinado. Si los valores se estudian en función de un
espacio geográfico; las series se denominan "espaciales"; por ejemplo
población (número de habitantes) de las provincias argentinas en 1997.
3. Distribución de frecuencias
Estos valores constituyen una "serie simple" de datos. Son datos brutos
porque todavía no han sido procesados por métodos estadísticos.
66
4.1. Organización de los datos
Indices de accidentes
Tallos Hojas
1 8 0 4
2 7 1 5 2 5
3 8 1 4 3 3 6 0 0 9 4
4 8 1 5 4
5 3 6 8
67
4.2. Construcción de las tablas de frecuencias
68
Se puede utilizar el siguiente procedimiento para determinar la amplitud
de los intervalos.
R = 5.8 - 1.0
R = 4.8
10 a 100 4a8
100 a 1.000 8 a 11
1.000 a 10.000 11 a 14
R R = 4.8
A=
k k= 5
4.8
A= = 0.96
5
A=1
(1) La fórmula de Sturges establece que k = 1 + 3.3 log n (siendo n el número de observaciones)
69
Por conveniencia y facilidad de lectura, el ancho del intervalo se redon-
dea a 1.
70
4.4 Marca de clase (xi)
Li + Ls
xi =
2
1.0 + 2.0
xi =
2
xi = 1.5
71
fi
fr =
n
Si se expresa en porcentaje
fi
fr = . 100
n
3 3
fr = o fr= . 100
25 25
fr = 0.12 o 12%
Indice de
accidentes fr
1.00 o 100%
72
4.6. Gráficos de distribución de frecuencias simples
a)Histograma
12
10
1 2 3 4 5 6 Indices
(Intervalos)
b) Polígono de frecuencias
73
12
10
10
74
4.7. Algunas situaciones particulares con las tablas de frecuencias
Ventas Nº de
(en miles de $) sucursales
fi
10 - 20 4
20 - 30 7
30 - 40 12
40 - 60 8
60 - 100 4
35
Obsérvese que las tres primeras clases tienen una amplitud de 10, la
tercera clase, 20 y la última tiene una amplitud de 40.
75
fi
12
10
10 20 30 40 60 100 Intervalos
10 - 20 10 1 4 4
20 - 30 10 1 7 7
30 - 40 10 1 12 12
40 - 60 20 2 8 4
60 - 100 40 4 4 2
76
El histograma apropiado será el siguiente:
fi
12
10
8
6
4
10 20 30 40 60 100 Intervalos
b) Intervalos abiertos
Ventas Nº de sucursales
(en miles de $) fi
Menos de 20 4
20-30 6
30-40 10
40-50 3
50 y más 2
25
Los intervalos abiertos son aquellos que no tienen definidos uno de los
límites. En el primer intervalo no está definido el límite inferior y en el
último, el límite superior.
77
Las clases abiertas se utilizan con fines de presentación, pero presen-
tan dificultades para los cálculos, como así también para la representa-
ción gráfica.
fi
12
10
8
6
4
2 4 empresas 2 empresas
tienen ventas tiene ventas
de menos de de 50 y más
20. Ventas
10 20 30 40 50
78
Indices Frecuencias acumuladas (fa)
1.0 y mayor 25
6.0 y mayor 0
79
Frecuencias acumuladas Frecuencias acumuladas
"menor que" "mayor que"
Índice fa Índice fa
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
1 2 3 4 5 6
Ma ïndices
80
Mediante las ojivas se puede obtener gráficamente el valor mediano
(3,45) que es el valor que deja dividida la distribución en la mitad (Ver
Unidad IV).
1 1 1 2 2
2 2 2 2 2
3 3 3 3 3
4 4 4 5 5
Nº de hijos (Xi) : 1 2 3 4 5
1 3 0.15 o 15%
2 7 0.35 o 35%
3 5 0.25 o 25%
4 3 0.15 o 15%
5 2 0.10 o 10%
20 1 100 %
81
fi
7
0 Xi
0 1 2 3 4 5
Nº de hijos Nº de empleados
(xi) (fa)
Hasta 1 3
Hasta 2 10 (3 + 7)
Hasta 3 15 (3 + 7 + 5)
Hasta 4 18 (3 + 7 + 5 + 3)
Hasta 5 20 (3 + 7 + 5 + 3 + 2)
82
fa
20
18
16
14
12
10
8
6
4
2
0 Xi
0 1 2 3 4 5
Casado 45 56.25 %
Soltero 23 28.75 %
Divorciado 7 8.75 %
Viudo 5 6.25 %
80 100 %
83
Para graficar esta información pueden utilizarse gráficos de barras o
circulares como los desarrollados en la unidad II.
Viudo
Divorciado 6,25%
8,75%
Casado
Soltero
56,25%
28.75%
84
Actividad Nº 8
85
Actividad Nº 9
2 2 3 3 4 0 6 2 6 4
3 2 2 6 4 2 0 2 3 3
86
Actividad Nº 10
87
Actividad Nº 11
Menos de 16 1
16 - 17 6
18 - 19 8
20 - 19 7
22 - 25 12
26 - 29 14
30 - 39 19
40 - 49 25
50 o más 8
100 %
88
Actividad Nº 12
clases: 100 - 150 150 - 200 200 - 250 300 - 350 350 - 450
fi: 5 9 18 10 8
b)Construir un histograma.
89
Actividad Nº 13
Antigüedad Nº de docentes
5-9 9
10 - 14 14
15 - 19 18
20 - 24 32
25 - 29 17
30 - 34 5
35 - 39 5
100
90
Actividad Nº 14
Nº de 10 22 15 6
empleados (fi)
91
92
UNIDAD IV
RESUMEN DE INFORMACIÓN A TRAVÉS
DE MEDIDAS DESCRIPTIVAS
1. Concepto
- Medidas de posición.
- Medidas de dispersión.
- Medidas de asimetría (sesgo)
- Medidas de apuntamiento (curtosis)
2. Medidas de posición
93
2.1. Media aritmética
2.1.1. Concepto
Media = · 339,43
x1 + x2 + ... + xn Σ xi
μ= μ = (1)
N N
x1 + x2 + ... + xn Σ xi
X= χ = (2)
n n
94
xi = representa a cada valor de la distribución.
N = representa al total de observaciones de la población.
n = representa al total de observaciones de la muestra.
Σ = Suma de los valores de la variable.
Ejemplo:
8 - 10 - 12 - 15 - 50
8 + 10 + 12 + 15 + 50
χ = = 19
5
8 9 10 11 12 13 14 15 16 17 18 19 50
x
La media está afectada por el valor extremo.
Ejemplo:
95
x = 4.8 n=5 Σ xi (Total) = ?
Σ xi Σxi = n (x)
x=
n Σxi = 5 (4,8) = 24 pólizas
d = xi - x
(xi - x) = 0
o d=0
25 - 30 - 34 - 41
xi d = (xi - x)
25 25 - 32.5 = - 7.5
30 30 - 32.5 = - 2.5
34 34 - 32.5 = 1.5
41 41 - 32.5 = 8.5
Σ= 0
96
Ejemplo: Considerando los datos del ejemplo anterior, cuya media es
32.5, se elige arbitrariamente el valor 33.
25 - 7.5 56.25 25 -8 64
30 - 2.5 6.25 30 -3 9
34 1.5 2.25 34 1 1
41 8.5 72.25 41 8 64
Σ=137 Σ=138
Si y = xi + c entonces y=x+c
x1 x2 x3 x4
Jornales (xi) = 25 30 34 41
Jornales (yi): x1 + c x2 + c x3 + c x4 + c
yi : 25 + 10 30 + 10 34 + 10 41 + 10
yi: 35 40 44 51
170
y= = $42.5
4
97
y=x+c
42.5 = 32.5 + 10
Si y = xi . c entonces y=x.c
Si y = xi /c entonces y = x/c
Sean x1, x2 ... xn los valores de la variable y p1, p2 ... pn sus ponderacio-
nes correspondientes. La media ponderada (w) es:
x1 p1 + x2 p2 + ... xn pn
w=
p1 + p2 + .... + pn
Σxi pi
w= (3) xi: Cada valor de la variable
Σpi pi: cada ponderación
98
Ejemplo: un estudiante de Administración de la U.C.S. obtuvo las si-
guientes calificaciones en 3 asignaturas:
20
x= = 6,67
7
Filosofía 10 2
Economía 6 3
Costos 4 4
w=6
99
2.2. Mediana
2.2.1. Concepto
Md = $ 340
Md
100
La mediana se ubica entre el 4º y 5º lugar, o sea:
340 + 346
(8/2) = 4º y [(8/2)/2] = 5º Md = = $343
2
Md = 12
2.3 Moda
2.3.1 Concepto
365 - 320 - 340 - 370 - 380 - 340 - 355 - 340 - 326 - 340
101
Mo = $ 340
102
Actividad Nº 15
Sucursal A B C D E F G H I J
Número de
heladeras vendidas 4 6 0 7 3 5 2 1 5 5
103
b) Los hoteles de tres estrellas registran un promedio de 2 pernoctes
por noche.
c) La mitad de los hoteles de tres estrellas logró un índice de aloja-
miento menor que 70% y la otra mitad logró un índice superior al
70%.
104
2.4. Media aritmética, mediana y moda para datos agrupados
Si cada valor x1, x2, ... xn está agrupado en una tabla con su frecuencia
respectiva, f1, f2, ... fn, la media aritmética se obtiene multiplicando cada
valor (xi) por su frecuencia (fi) y la suma de los productos se divide por el
total de observaciones de la muestra o de la población, o sea:
x1 f1 + x2 f2 + ... + xn fn
μ =
f1 + f2 + ... + fn
Σ xi fi Σ xi fi
μ = (4) x = (5)
Σ fi Σ fi
Σ xi fi Σ xi fi
μ = (6) x = (7)
N n
105
Utilizando la fórmula (6)
x = 3.3 hijos
Cuando los datos están agrupados en una tabla con intervalos de clase,
el xi de las fórmulas (6) y (7) representa a la marca de clase de cada
intervalo. Para el cálculo de la media, se multiplica cada marca de clase
(xi) por su frecuencia de clase (fi) y la suma de los productos se divide por
el total de observaciones de la distribución.
1 - 2 1.5 3
2 - 3 2.5 5
3 - 4 3.5 10
4 - 5 4.5 4
5 - 6 5.5 3
25
1.5 (3) 2.5 (5) + 3.5 (10) + 4.5 (4) + 5.5 (3) 86.5
x= =
25 25
106
La media combinada se obtiene multiplicando cada media muestral (x)
por su tamaño (n) y dividiendo la suma de los productos por el total de los
tamaños de las muestras, o sea:
x = $ 343.33
107
Actividad Nº 16
Alquileres Nº de locales
fi
200 - 300 22
300 - 400 30
400 - 500 19
500 - 600 10
600 - 700 12
700 - 800 7
100
108
2.4.2 Mediana
a) Método gráfico
1- 2 3 3
2- 3 5 8
3- 4 10 18
4- 5 4 22
5- 6 3 25
25
109
fa
25
20
18 E
15
n/2 = 12.5 C 10
10 4.5
8.0 A B D
Indices
1 2 3 4 5 6
Li
Md
b)Método de interpolación
n/2 - fa
Md = Li + . Ci (9)
fi
110
Li: límite inferior del intervalo mediano
n: total de datos promediados
fa: frecuencia acumulada anterior al intervalo mediano
fi: frecuencia absoluta simple del intervalo mediano
Ci: amplitud del intervalo mediano.
AB AD CB . AD
= donde AB =
CB ED ED
Md = Li + AB
CB . AD
Md = Li +
ED
donde:
que indica los elementos que faltan para llegar a la mitad del total de
datos. Hasta la clase anterior al intervalo mediano hay 8 observaciones,
por lo que faltan 4,5 para la mitad.
111
Por último AD = Ci o sea AD = 1 (amplitud del intervalo). La fracción
anterior se multiplica por la amplitud que da la posición de la mediana
dentro del intervalo.
n/2 - fa 4,5
. Ci = .1 = 0.45
fi 10
n/2 - fa
Md = Li + Ci
fi
12.5 - 8
Md = 3 + .1
10
Md = 3 + 0.45 = 3.45
112
Actividad Nº 17
Alquileres Nº de locales
$ fi
200 - 300 22
300 - 400 30
400 - 500 19
500 - 600 10
600 - 700 12
700 - 800 7
100
Obtener la mediana:
113
2.4.3 Moda
1- 2 3 1.5
2- 3 5 2.5
3- 4 10 3.5
4- 5 4 4.5
5- 6 3 5.5
25
a)Método directo
Mo = 3.5 accidentes
114
b)Interpolación mediante gráfico
fi
clase modal fn = 10
10
8 d1 d2
4 f1 = 5
f2 = 4
2
1 2 3 4 5 6 Indices
moda 3,4
d1
Mo = Li + . Ci (10)
d1 + d2
115
Li : Límite inferior del intervalo modal
d1 : Diferencia entre la frecuencia de la clase modal y la frecuencia de la
clase premodal (d1= fn - f1)
d2 : Diferencia entre la frecuencia de la clase modal y la frecuencia de la
clase posmodal (d2 = fn - f2).
Ci: Amplitud de la clase modal.
Li = 3
d1 = 10 - 5 = 5
d2 = 10 - 4 = 6
Ci = 1
5
Mo = 3 + .1
5+6
Mo = 3 + 0.45 = 3.45
Mo ~ 3.45 accidentes
116
Actividad Nº 18
Alquileres Nº de locales
fi
200 - 300 22
300 - 400 30
400 - 500 19
500 - 600 10
600 - 700 12
700 - 800 7
100
117
2.5. Otras medidas de posición
n
G = √ x1 . x2 ... xn
4 4
G = √ (5) (7) (10) (12) = √ 4.200
G = 8,05
Ejemplo:
G=3 n=5
Producto de n valores = Gn
= 35 = 243
118
Ejemplo: 12 - 8 - 0
3
G = √ (12) (8) (0)
G=0
Σ xi
x=
n
36
x= = 12
3
G = 8,9
119
Se calcula la media geométrica de las razones.
3 3
G = √ (1.10) (1.70) (2.00) = √ 3.74
G = 1.5522 o 155.22 %
Mes Ventas
E 1.000 -
F 1.100 1.000 (1.5522) = 1.552.20
M 1.870 1.552.20 (1.5522) = 2.409.32
A 3.740 2.409.32 (1.5522) = 3.739.75 = 3.740
120
Simbólicamente
Enero (base) = 1.000 Po
Febrero = 1.000 (1.5522) = 1.552.20 Po . G
Marzo = 1.552.20 (1.5522) = 2.409.32 Po G(G) = Po G2
Abril = 2.409,32 (1.5522) = 3.739.75 Po G2 (G) = PoG3
Po . Gn = Pn
Pn
n
G =
Po
Pn
G =n (12)
√ Po
r = G - 100% (13)
G=? r=?
3.740
G= 3
√ 1.000
G = 1.5522 o 155.22 %
r = 155.22 - 100
r = 55.22%
Las ventas tienen una tasa promedio de crecimiento mensual del 55,22%.
121
2.5.2 Media Armónica
1 n
H= entonces H= (14)
Σ 1 Σ 1
x x
por lo tanto
n
H=
1 1 1
+ + .... +
x1 x2 xn
4 4
H= =
1 1 1 1 54
+ + +
2 3 6 8 48
H = 3.55
Ejemplo: 4 - 7 - 25
x = 12 G = 8.9
122
3
H=
1 1 1
+ +
4 7 25
H=7
En resumen:
H < G < x
80 + 60
= 70 km/h
2
Espacio 2
H (velocidad media) = =
Tiempo 1 1
+
80 60
H = 68.57 km/h
123
2.5.3 Cuartiles
- Primer cuartil (Q1) es el valor de la variable por debajo del cual queda
el 25% de los elementos de la serie estudiada.
- Segundo cuartil (Q2) es el valor por debajo del cual queda el 50% de
los elementos de la distribución. El segundo cuartil es igual a la mediana.
- Tercer cuartil (Q3) es el valor por debajo del cual queda el 75% de los
elementos de la distribución.
Para calcular los cuartiles en los datos sin agrupar se debe seguir el
siguiente procedimiento.
n+1 2(n + 1) 3 (n + 1)
Orden Q1 = ; Orden Q2 = ; Orden Q3 =
4 4 4
45 - 47 - 49 - 50 - 52 - 52 - 57 - 60 -
62 - 65 - 65 - 68 - 70 - 74 - 78
n+1
Orden Q1 =
4
124
15 + 1
Orden Q1 = = 4º lugar
4
Q1 = 50 puntos
3 (n + 1)
Orden Q3 =
4
3 (15 + 1)
Orden Q3 = = 12º lugar
4
Q3 = 68 puntos
125
Ejemplo: Dados los siguientes valores:
10 20
12 22
14 25
18 27
18 30
n+1 10 + 1
Orden Q1 = = = 2.75
4 4
Q1 = 14
3 (n+1) 3(10+1)
Orden Q3 = = = 8.25
4 4
Q3 ≅ 25
126
n/4 - fa
Q1 = Li + . Ci (15)
fi
2n/4 - fa
Q2 = Li + .Ci (16)
fi
3n/4 - fa
Q3 = Li + . Ci (17)
fi
Li: Límite inferior de la clase a la que pertenece el 1', el 2' o el 3' cuartil
1- 2 3 3
2- 3 5 8
3- 4 10 18
4- 5 4 22
5- 6 3 25
25
127
fa
25
20
15
10
1 2 3 4 5 Indices
Q1 Q3
n 25 3n 3(25)
Q1 = = = 6.25 Q3 = = = 18.75
4 4 4 4
La clase del 1' cuartil se localiza La clase del 3' cuartil se localiza en
en el intervalor 2 - 3. el intervalor 4 - 5.
3.25 - 3 18.75 - 18
Q1 = 2 + .1 Q3 = 4 + .1
5 4
Q1 = 2.65 Q3 = 4.1875
128
2.5.4 Deciles y Percentiles
- Los deciles (D) dividen a la distribución en diez partes iguales. Así, por
ejemplo, el decil 1 (D1), deja el 10% de los valores por debajo de él; el
decil 2 (D2) deja el 20% de los valores por debajo de él. Análogamente
ocurre con los deciles D3, D4... D9.
129
Actividad Nº 19
2 - 7 - 8 - 15 - 10 - 4 - 9 - 10
Calcular:
a) La media geométrica;
b) La media armónica;
c) El tercer cuartil.
a) Calcular el Q1 y Q3
b) Interpretar las medias calculadas.
Alquileres Nº de locales
fi
200 - 300 22
300 - 400 30
400 - 500 19
500 - 600 10
600 - 700 12
700 - 800 7
100
130
3. Medidas de Dispersión
Rango
De distancia Rango inter-cuartil (*)
Desviación cuartílica (*)
Absolutas
Medidas * Desviación absoluta promedio
de De desviación * Varianza
Dispersión promedio * Desviación típica
* Desviación intercuartílica (*)
A
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
A
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
μA = 10 μB = 10
131
3.1 Rango
RA = 14 - 5 = 9 RB = 12 - 8 = 4
Σ⎥ xi - μ⎥
Dm = (19)
N
132
SUCURSAL "A"
5 5 - 10 = -5 5
12 11 - 10 = 2 2
8 8 - 10 = -2 2
14 14 - 10 = 4 4
11 11 - 10 = 1 1
Σ=0 Σ⎥ d⎥ = 14
SUCURSAL "B"
9 9 - 10 = -1 1
8 8 - 10 = -2 2
10 10 - 10 = 0 0
12 12 - 10 = 2 2
11 11 - 10 = -1 1
Σ=0 Σ⎥ d⎥ = 14
14 6
DmA = = 2,8 DmB = = 1,2
5 5
Características de la DM
133
3.3 Varianza
Σ(xi - μ)2
σ2 = (19)
N
L M M J V
50 10
σ2A = σ2B =
5 5
σ2A = 10 σ2B = 2
134
Σ xi2 Σxi 2
Σ xi
(20) σ = 2
- (21) σ = 2
- (μ)2
N N N
xi 9 8 10 12 11 Σ = 50
Utilizando la Utilizando la
fórmula 20 fórmula 21
2
510 50 510
σ =
2
- σ =
2
- (10)2
5 5 5
σ2 = 2 σ2 = 2
135
Σ (xi - μ)2
σ= (22)
√ N
50 10
σA = = √ 10 σB = =√ 2
√ 5 √ 3
Σ xi2 Σxi 2
Σ xi
σ = - (23) σ= - (μ)2 (24)
√ N N √ N
136
b)Si a cada valor de la variable x lo multiplica (o se lo divide) por una
constante, el desvío típico queda multiplicada (o dividida) por dicha
constante.
Σ (x1 - x)2
S2 = (25)
n-1
Σ (x1 - x)2
S= (26)
√ n-1
Ejemplo: las edades de una muestra de cinco personas son: 20; 24; 28;
35; 40. La media es:
Σxi
x= x = 29.4 años.
n
137
Al utilizar en el cálculo la moda muestral como estimador de la media
poblacional, por lo regular se obtendrá una desviación estándar menor
que la desviación estándar poblacional. Este sesgo se puede corregir di-
vidiendo Σ = (xi - x )2 entre los grados de libertad n - 1. Debido que la media
muestral se usó como estimación de la media poblacional en el cálculo del
desvío muestral, solo cuatro de las edades son libres de varias, ya que la
quinta edad se puede determinar porque Σ = (xi - x) = 0. Sólo se requiere
de cuatro edades para tener toda la información.
138
Actividad Nº 20
1) Las ventas de una compañía (en miles de pesos) durante una sema-
na fueron:
Día L M M J V S
Ventas ($) 8 4 6 7 10 7
i) Rango;
ii) Desviación absoluta promedio;
iii) varianza
iv) Desviación típica
50 - 56 - 55 - 49 - 52
57 - 56 - 57 - 56 - 59
139
4) Se toman las medidas a 80 personas y resulta una estatura media de
1.70 mts. y una desviación típica de 0.02 mts. Posteriormente se
verifica que el instrumento usado en la medición tenía 3 cm menos.
Ratifique o rectifique los valores mencionados.
140
3.6. Coeficiente de Variación
Cía. I Cía. II
μ1 = 400 μ2 = 200
δ1 = 65 δ2 = 48
A simple vista, la Cía. I tiene mayor dispersión que la Cía. II debido a que
el desvío típico es mayor. Pero esta conclusión no es cierta, ya que la
desviación típica es significativa sólo en relación con la media respecto a
la cual se calcula.
δ
(27) cv = Población
μ
S
(28) cv = Muestra
x
Compañía I Compañía II
65 48
cv = cv =
400 200
141
cv = 0.1625 o 16.25% cv = 0.24 o 24%
Sx 20
cv = cv = = 0,10
x 200
y = $ 240 Sy = $20
Sy 20
cv = cv = = 0.08 el nuevo CV disminuye
y 204
y = $400 Sy = $40
142
Sy 400
cv = cv= = 0.10 el nuevo CV no se
y 40 modifica
143
Actividad Nº 21
144
3.7 Varianza y desvío típico para datos agrupados
donde:
145
Indices Marca de Nº de empresas (xi - x)2 (xi - x)2 f
25 33
33 33 33
σ =
2
= σ= = √1.375
25 - 1 24 √ 25 -1
σ 2 = 1.375 σ = 1.17
Σxi2 - fi Σ xi2 - fi
σ2 = - μ2 (33) σ= μ2 (34)
N √ N
Σxi2fi - n x 2
Σ xi2fi - nx 2
σ2 = (35) σ= (36)
n-1 √ n-1
146
Actividad Nº 22
147
3.8 Otras medidas de dispersión
RI = Q3 - Q1 (37)
45 - 47 - 49 - 50 - 52 - 57 - 60 - 62 - 65 - 65 - 68 - 70 - 74 - 78
Q1 = 50 Q3 = 68
RI = 68 - 50
RI = 18 puntos
Q3 - Q1
QD = (38)
2
148
68 - 50
QD =
2
QD = 9 puntos
4. Formas de la distribución
4.1 Simetría y Asimetría
Distribución simétrica
Considérese la distribución A
Intervalos fi xi
10 - 20 3 15
20 - 30 5 25
30 - 40 9 35
40 - 50 5 45
50 - 60 3 55
25
149
Se construye a continuación el polígono de frecuencias.
fi
10
xi
5 15 25 35 45 55 65
El polígono se vuelve cada vez más suave y curvo a medida que au-
menta el número de observaciones. El Polígono suavizado recibe el nom-
bre de “curva de frecuencia”.
150
Se puede observar que la distribución es simétrica por la forma del
polígono. En este caso los valores de la media aritmética, la mediana y la
moda son iguales o casi iguales.
x = 35 Md = 35 Mo = 35
(B) (C)
Intervalos fi xi Intervalos fi xi
10 - 20 3 15 10 - 20 2 15
20 - 30 12 25 20 - 30 3 25
30 - 40 5 35 30 - 40 5 35
40 - 50 3 45 40 - 50 12 45
50 - 60 2 55 50 - 60 3 55
25 25
151
Se construyen el polígono y la curva de frecuencias para ambas distri-
buciones y se calculan los 3 promedios.
fi fi
x = 30,6
12 12
md = 27,9
10 mo = 25 10
8 8
6 6
4 4
2 2
0 0
fi fi
x = 39,4
12 12
md = 42,1
10 mo = 45 10
8 8
6 6
4 4
2 2
0 0
En resumen
152
Media Moda
Moda
Mediana Mediana Mediana
Moda Media Media
x - MO
Sk = (39) Sk = 3 (x - Md) (40)
S S
Si Sk = 0 distribución simétrica.
Si Sk < 0 distribución asimétrica negativa.
Si Sk > 0 distribución asimétrica positiva.
35 - 35 30,6-25 39,4-45
Sk = Sk = Sk =
11,9 11,2 11,2
Sk = 0 Sk = 0.50 Sk = -0.50
153
Mientras más marcada sea la asimetría menos representativa es la
media, siendo la mediana una medida más conveniente debido a que no
recibe influencias de valores extremos.
4.4. Curtosis
fi
Mesocúrtica Apuntamiento
intermedio.
“Meso”: palabra griega que
significa “mitad”.
fi
Platocúrtica Achatada
“Platos” palabra griega que
significa “ancho” o “plano”.
154
Actividad Nº 23
Intervalo fi
0 - 200 10
200 - 400 13
400 - 600 17
600 - 800 42
800 - 1000 18
100
155
EL GRÁFICO DE CAJA
Lic. ALICIA QUINTANA
156
El lugar que ocupa la Existen varios métodos es igual a 16.
mediana es (8+1) / 2 = para calcular Q1 y Q3.
4,5. Como el lugar 4,5 A continuación se expo- Ejemplo 2:
no existe, en estos ca- nen los pasos de uno
sos, cuando la cantidad solo de ellos. El lugar que ocupa Q1
(n+1)/2 no es un núme- es (8+1)/4=2.25. Como
ro entero, procedemos Paso 1: ordenar los da- el lugar 2.25 no existe,
de la siguiente manera: tos de menor a mayor. entonces promediamos
podemos afirmar que la los valores que ocupan
mediana se encuetra Paso 2: hallar la posición 2º y 3º posición. Luego,
entre el 4º y el 5º lugar. que ocupa Q1 a través Q1= (8+8)/2=8.
Luego, la mediana será de la fórmula (n+1)/4
igual al promedio de los siendo n la cantidad de El lugar que ocupa Q3
valores, que ocupan el datos y hallar la posición es 3 (8+1)/4=6.75. Por
4º y el 5º lugar. O sea, M que ocupa Q3 a través lo tanto, prome-diamos
será igual a (9-11)/2=10. de la fórmula 3(n+1)/4. los valores que ocupan
la 6º y 7º posición. O sea,
II.- CUARTILES Paso 3: buscar la obser- Q3=(13+16)/2=14.5
vación que ocupa la po-
Se trata de valores que sición encontrada en el III. RANGO
dividen al conjunto de paso 2 para Q1 y bus- INTERCUARTILICO
datos ordenados de me- car la observación que
nor a mayor en cuatro ocupa la posición encon- El rango intercuartílico
partes iguales (o casi trada en el paso 2 para (R1) representa la dis-
iguales). Existen tres Q3. tancia entre Q1 y Q3. O
cuartiles que notaremos sea, R1=Q3-Q1.
Q1, Q2 y Q3. Como ilustración, calcu-
lemos Q1 y Q3 de los EL GRÁFICO DE
- Q1, llamado cuartil de ejemplos dados ante- CAJA. CONCEPTO.
orden 1, es tal que el riormente:
25% de los valores es El aspecto de un gráfico
inferior a él. Ejemplo 1: de caja es como el que
- Q2, llamado cuartil de se muestra en la figura 1.
orden 2, es tal que el El lugar que ocupa Q1
50% de los valores es es (7+1)/4=2. Luego, Q1 Como su nombre lo in-
inferior a él. Por lo tanto, ocupa el 2º lugar que es dica se trata de una caja
coincide con la mediana. igual a 9. rectangular de largo
- Q3, llamado cuartil de igual la rango
orden 3, es tal que el El lugar que ocupa Q3 intercuartílico. La altura
75% de los valores es es 3(7+1)/4=6. Luego de la caja es arbitraria.
inferior a él. Q3 ocupa el 6º lugar que
157
entonces la distribu-
ción de los datos es
asimétrica.
L1 Q1 M Q3 L2
EL GRAFICO DE CAJA
outlier
COMO METODO PARA
Fig. 1 LA DETECCION DE
LOS "OUTLIERS"
El lado izquierdo repre- En cuanto a su posición,
senta a Q1 y el lado de- cuanto más grandes En ocasiones, al selec-
recho a Q3. Por lo tanto, sean las observaciones, cionar una muestra, se
la caja contiene el 50% esto se manifiesta con observa que uno o más
de los datos. un desplazamiento de la de los datos parece ser
caja hacia la derecha. muy grande o muy pe-
En el interior de la caja queño en relación al res-
se dibuja una línea ver- En cuanto a su variabili- to de los datos. Tal me-
tical que representa a la dad, cuanto más disper- dición recibe el nombre
medicina. De la caja sa- sas estén las observa- de "outliers" y se presen-
len dos líneas horizon- ciones, mayor será la ta un problema. ¿Debe-
tales que llegan hasta los amplitud de la caja. mos conservarlo en la
valores limítrofes L1 y muestra o desecharlo?.
L2. L1 representa a la En cuanto a la forma de
menor observación que la distribución, podemos La presencia de outliers
es, a su vez mayor o establecer una regla ge- puede deberse a varias
igual que Q1-1.5 * R1. neral para averiguar si la causas, entre ellas:
L2 representa a la ma- distribución de los datos
yor observación que es, es simétrica o no: - a algún error de medi-
a su vez, menor que Q3 ción o registro. Estos a
+ 1.5 * R1. - Si la caja interna iz- su vez pueden ser pro-
quierda es igual a la vocados por un instru-
EL GRAFICO DE CAJA caja interna derecha (o mento de medición de-
COMO METODO PARA sea, la mediana se lo- ficiente, la misma uni-
ANALIZAR UN CON- caliza a la mitad de la dad experimental pue-
JUNTO DE DATOS. caja: entonces la distri- de estar defectuosa o
bución de los datos es tal vez el experimenta-
Permite visualizar las simétrica. dor registró equivoca-
carac-terísticias más damente la medición.
importantes de un con- - Si la caja interna iz-
junto de datos, su posi- quierda es más gran- - la presencia de un va-
ción, su variabilidad y la de que la caja interna lor muy grande o muy
forma de la distribución. derecha o viceversa, pequeño en relación al
158
resto de los datos pue- que lo produjo para de-
de tratarse de un acon- cidir su eliminación o
tecimiento que tiene conservación.
muy poca probabilidad
de ocurrir. No quiere
decir que no ocurre
nunca. De hecho, algu-
30 29 30 34 35 40
na vez ocurre.
Fig. 2
Para decidir si un
outlier debe ser des- EJEMPLO M=34 Q1=30
echado o conservado Q3=35 R1=5
en la muestra se debe- Quiero finalizar este ar-
rá investigar la causa tículo con un ejemplo Para la detección de
que lo produjo. Si se simple de construcción outliers calculamos:
debió a un error de me- de un gráfico de caja que
dición o registro se Usted puede realizar a Q1 - 1.5 * R1=30 -1.5 *
podrá eliminar de la mano pero, hoy en día, 5 =22.5
muestra. Pero si no existen software esta-
puede encontrarse una dísticos modernos que Q3 + 1.5 * R1= 35 + 1.5
razón que indique que los realizan muy eficien- *5=42.5
el outlier se debió a un temente.
error de medición o re- No existen observacio-
gistro, se ha de man- Los siguientes datos re- nes superiores a 42.5
tener en la muestra. Es presentan 15 medicio- pero si existe una obser-
peligrosa su elimina- nes del espesor de las vación inferior a 22.5 que
ción pues ese valor asas de unas latas de es el dato 20. Luego, 20
puede contener infor- pintura: es considerado un
mación importante. outlier. Para completar la
29 29 34 35 30 34 30 20 caja, debemos calcular
El gráfico de caja permi- 30 L1 y L2 que resultan ser
te detectarla la presen- 29 y 40 respectivamen-
cia de outliers de la si- 35 34 38 34 40 34 te.
guiente manera:
Siguiendo los métodos El gráfico de caja corres-
Toda observación supe- vistos en la primera par- pondiente se expone en
rior a Q3+1.5 * R1 o in- te de este artículo cal- la figura 2. Se observa
ferior a Q1 - 1.5 * R1 es culamos M, Q1, Q3 y que los datos presentan
considerada un outlier. R1: una marcada asimetría.
Luego deberá
investigarse la causa
159
FINAL
160
Actividad Obligatoria
DESOCUPACIÓN
1) Bahía Blanca 13,4
2) Gran La Plata 14,7
3) Mar del Plata y Batán 17,0
4) GBA y Capital 14,3
5) Catamarca 13,2
6) Corrientes 13,4
7) Gran Córdoba 16,1
8) Río Cuarto 13,1
9) Chaco (Gran Resistencia) 10,1
10) Chubut (Comodoro Rivadavia) 11,8
11) Paraná 12,2
12) Concordia 13,7
13) Formosa 6,3
14) Jujuy (San Salvador, Palpalá) 15,5
15) La Pampa (Sta. Rosa) 9,3
16) La Rioja 9,7
17) Mendoza 6,1
18) Misiones (Posadas) 4,9
19) Neuquén y Plottier 11,3
20) Salta 14,3
21) Gran San Juan 8,6
22) San Luis y El Chorrillo 11,5
23) Santa Cruz (Río Gallegos) 4,6
24) Gran Rosario 13,2
25) Sta. Fe y Sto. Tomé 16,2
26) Santiago del Estero 9,4
27) Tierra del Fuego 10,3
28) Tucumán 15,5
Río Negro 13,9
161
Con los datos del informe sobre el desempleo, efectuar los siguientes
ejercicios:
162
UNIDAD V
TEORIA DE LAS PROBABILIDADES
1.- Introducción
163
El resultado de la tirada de una moneda o de un dado es un ejemplo
clásico de un fenómeno aleatorio ya que situaciones aleatorias determina-
rán si ocurre cara o sello en la moneda o, los números 1, 2, ..., 6 en el
dado. También son ejemplos de fenómenos aleatorios el número de acci-
dentes de tránsito en una ruta, el resultado de un partido de fútbol o el
número de defectuosos de un producto en un proceso productivo.
Ejemplo:
164
a) Un evento aleatorio simple es el resultado de un solo ensayo en
particular.
CC CS SC SS
165
Actividad Nº 24
D T
5 2 6
1
3 4 8
7 A
166
a) El evento de obtener un cuatro.
b) El evento de obtener un número par.
c) El evento de obtener un número mayor que 3.
d) El evento de obtener un número menor que 2.
167
3.- Los tres enfoques de la Probabilidad
4 1
P (E) = = = 0,1
40 10
8
P (C) = = 0,16
50
168
dad a priori”. El espacio muestral está constituido: por resultados
equiprobables puesto que cada resultado tiene la misma probabilidad de
ocurrencia. Sin embargo, no en todos los problemas se pueden indicar de
antemano las probabilidades de los experimentos, por ejemplo, la proba-
bilidad de que una persona viva hasta los 70 años, la probabilidad de que
las ventas de una empresa aumenten en los próximos tres meses, proba-
bilidad de ocurrencia de un accidente de tránsito, etc. En estos casos son
útiles los otros dos enfoques.
169
12 meses. ¿Cuál es la probabilidad de ocurrencia de accidentes de trabajo
durante este año?
300
P (E) = = 0,03
10.000
Este valor de probabilidad está calculado sobre una muestra, por eso es
una estimación del valor verdadero. Además, se hace la suposición de que
los parámetros de seguridad industrial no han variado con respecto al
período anterior en que se tomó la muestra.
lim f / n
n →∞
170
enfoque personalista es apropiado cuando hay probabilidad de que el evento
ocurra (o no) una única vez o muy pocas veces.
El siguiente ejemplo ilustra muy bien este enfoque. Un juez debe decidir
si permite o no la instalación de una planta de energías nuclear en una
zona donde existe una falla geológica. Puede preguntarse cuál será la
probabilidad de que ocurra un grave accidente nuclear en ese lugar. El
hecho de que no haya frecuencia relativa de evidencia de accidentes an-
teriores en el lugar no lo exime de tomar la decisión. Deberá recopilar toda
la información posible y actuar con gran sabiduría para determinar la pro-
babilidad o no de un accidente nuclear (4).
171
Actividad Nº 25
1) Para cada uno de los siguientes casos, indicar cuál de los 3 enfoques
es el más apropiado (clásico, de frecuencia relativa o subjetiva) es el
más apropiado para determinar el valor de probabilidad.
172
4.- Axiomas de Probabilidad
P (E) + P (E’) = 1
por lo tanto,
complemento de complemento de
E E’
P (E) + P (E’) = 1
173
5.- Reglas de Probabilidad
5.1.- Eventos mutuamente excluyentes y no excluyentes.
Reglas de la adición
P (A o B) = P (A) + P (B)
o P (A u B) = P (A) + P (B) (3)
P (S o R) = P (S u R) = P (S) + P (R)
4 4 8
= = =
40 40 40
1
P (S o R) = = 0,02
5
174
* La regla de la adición se puede aplicar para tres o más eventos.
b) Eventos no excluyentes
P (A o B) = P (A) + P (B) - P (A y B)
o P (A u B) = P (A) + P (B) - P (A n B) (4)
P (S o C) = P (S) + P (C) - P (S y C)
4 10 1 13
= + − =
40 40 40 40
S C
los eventos se intersectan
S parcialmente
y
C
Otros ejemplos:
175
Sean C = Cajero, A = Administrativo, V = vendedores, M = empleado
de maestranza, H = hombre, F = mujer.
a)
P (V o A) = P (V) + P (A)
20 7 27
= + = = 0,675 (eventos excluyentes)
40 40 40
b)
P (V’) = P (C) + P (A) + P (M)
8 7 5 20
= + + = = 0,50 (eventos excluyentes)
40 40 40 40
o bien:
20
P (V' ) = 1− = 0,50
40
c)
P (C o F) = P (C) + P (F) - P (C y F)
8 15 3 20
P (Cop) = + − = = 0,50 (eventos no excluyentes)
40 40 40 40
d)
P (M o H) = P (M) + P (H) - P (M y H)
5 25 2 28
P (M y H) = + − = = 0,70 (eventos no excluyentes)
40 40 40 40
176
a)Invierta en A o en B o en ambas.
b)Invierta en A o en B pero no en ambas.
c) No invierta en ninguna de las dos.
A B
0,60
b)P (A o B) = P (A o B) - P (A y B)
= 0,40 - 0,10 = 0,30 (sucesos excluyentes)
177
Actividad Nº 26
a) Sea defectuoso
b) Sea Y o Z.
c) Sea X o defectuoso o ambos
d) Sea Z o bueno o ambos
178
5.2.- Eventos independientes y dependientes.
Reglas de la multiplicación
a) Eventos independientes
179
1 lanzamiento 2 lanzamiento Probabilidades conjuntas
P (S n R) = P (S) . P (R)
4 4 1
= × = = 0,01
40 40 100
b) Eventos dependientes
180
P (B/A) denota la probabilidad condicional de B dado que ocurre A.
P (S o R) = P (S) . P (R / S)
4 4 16 4
= × = = = 0,0103
40 39 1560 390
181
CARRERA
Rendimiento C C’ Total
P (B) = 0,20
P (B n C) 0,08
P (B/C) = = = 0,20
P (C) 0,40
P (B/C) = P (B)
182
CARRERA
Rendimiento C C’ Total
P (B) = 0,20
P (B C) 0,15
P (B/C) = = = 0,375
P (C) 0,40
P (B/C) ≠ P (B)
183
Primero se confeccionará un diagrama de árbol:
Probabilidades Conjuntas
0
= 0,4
( M) P(D/M) = 0,10 P(M) . P(D/M) = 0,40 (0,10) = 0,04
P
P( V
)=
P(A/V) = 0,80 P(V) . P(V/A) = 0,60 (0,80) = 0,48
0,6
0
0,12
P(D/V) = 0,20 P(V) . P(D/V) = 0,60 (0,20)=
1,00
Resultado
A D Total
Sexo
Determinar
P (V n A) 0,48
c) P (V/A) = = = 0,57
P (A) 0,84
P (A n V) 0,48
d)P (A/V) = = = 0,80
P (V) 0,60
184
P (M n A) 0,36
e)P (M) = 0,40 P (M/A) = = = 0,43
P (A) 0,84
P (M/A) = P (M)
no son independientes.
185
Actividad Nº 27
186
REACCIÓN
187
6.- Reglas de conteo
kn = 24 = 16 posibles resultados
b)Si hay n actos u operaciones que pueden realizarse en k1, k2, .... kn
formas, respectivamente, el número total de posibles resultados diferen-
tes para los n actos u operaciones es:
188
(k1) . (k2) .... (kn)
Diagrama de árbol
P1 C1 B1 P1
B1
P2 C1 B1 P2
C1
P1 C1 B2 P1
B2
P2 C1 B2 P2
P1 C2 B1 P1
B1
P2 C2 B1 P2
C2
P1 C2 B1 P1
B2
P2 C2 B2 P2
P1 C3 B1 P1
B1
P2 C3 B1 P2
C3
P1 C3 B2 P1
B2
P2 C3 B2 P2
6.2.- Permutaciones
189
n
Pn = n (n-1) (n-2) (n-3) ... (3) (2) (1)
n
Pn = n! (8)
n! factorial de n
Si n = 0, 0! = 1
3
P3 = 3! = 3 x 2 x 1 = 6 permutaciones
6.3.- Variaciones
n=3 r=2
3! 3 x 2 x1
V = = = 6
3 2 (3 − 2)! 1
o 3
V2 = 3x2 = 6
190
Otro ejemplo: En un concurso hay 3 premios (primero, segundo y ter-
cero) para 10 participantes. ¿De cuántas formas pueden obtenerse los 3
premios?
V3 =
10
(10) (9) (8) = 720 formas posibles
6.4.- Combinaciones
n!
C=
r! (n − r )!
(10)
n r
n=3 r=2
3! (3) (2) (1)
C = = = 3
3 3 2! (3 − 2!)! (2) (1)
ab - ac - bc ⇒ 3 formas posibles
191
El número total de combinaciones posibles de un conjunto de n elemen-
tos tomados todos a la vez es igual a 1.
n
Cn = 1
6
C4 + 9
C4 = 15 + 126 = 141
192
La probabilidad de sacar 4 rojas y 4 verdes es:
C + C
6 4 9 4 141
R (4R o 4V) = = = 0,103
C 1.365
15 4
193
Actividad Nº 28
194
7.- Teorema de Bayes
P (A1) ⋅ P (B / A1)
P ( A 1 / B) = = (11)
P (B)
Sustituyendo en (11)
P (A1) . P(B/A1)
(12) P(A1/B) =
P(A1).P(B/A1)+P(A2)P(B/A2) +...+ P(An).P(B/An
195
P ( A1 n B )
P ( A1 / B ) = (13) igual a la fórmula (7)
P (B)
P(Y/R) = 0,658
Proveedor R R’ Total
X 0,009 0,291 0,30
Y 0,025 0,475 0,50
Z 0,004 0,196 0,20
Total 0,038 0,962 1,00
196
P(Y n R) 0,025
P(Y/R) = = = 0,658
P (R) 0,38
197
Actividad Nº 29
2) Hay 3 cajas iguales (I, II, III) que contienen alhajas de oro. La caja I
contiene un anillo, la II un reloj y dos pulseras y la III un anillo, dos
pulseras y dos relojes. Se selecciona al azar una caja y extrae una
alhaja. Si la alhaja es un reloj, cuál es la probabilidad de que provenga
de la caja I? ¿De la caja II? ¿De la caja III?
198
Ejercicios de Repaso
A $ 350.000
B $ 550.000
C $ 250.000
D $ 200.000
E $ 250.000
199
3) Un canillita ofrece 3 diarios: Tribuno, Nación y Clarín. Posee 10
ejemplares del diario Tribuno, 7 del diario Nación y 4 del diario Clarín.
Un comprador adquiere 3 ejemplares, ¿Cuál es la probabilidad de que:
X W Y Z
Edad
Ocupación 21 - 30 31 - 40 41 - 50 51 y más
Administrativo 2 24 16 17
Docentes 1 40 36 28
Personal de
Apoyo 16 20 14 2
200
Condición Condición de empleo
del Total
Préstamo Con empleo (E) Sin empleo (E’)
Moroso (M) 10 8 18
No moroso (M’) 60 22 82
Total 70 30 100
201
P (A1) = 0,70 P (B2) = 0,45 P (B3) = 0,08
202
Respuestas a los ejercicios de la Unidad V
Puntos 1 y 2
1) a) 16
SSSS, SSSN, SSNS, SNSS, NSSS, SSNN, SNNS, SNSN
b) (U) = NSNS, NNSS, NSSN, NNNS, NNSN, NSNN, SNNN, NNNN
2)a) 6 b) 8 c) 5 y 8 d) 4 - 6 - 7 y 8 e) 1
Punto 3
Puntos 4 y 5.1
1)
C V G a) P (C o V o G) = 0,83
0,17
203
Punto 5.2
0,06
b) P (Beta/Alfa) = = 0,20
0,30
c) ¿P (Beta) = P (Beta/Alfa)?
P (Beta) = 0,20
P (Beta/Alfa) = 0,20
son independientes
P (R n A) 0,48
4)P (R/A) = = = 0,86
P (A) 0,56
e) P (J o R) = 0,75 f) P (R o N) = 0,425
Punto 6
1) kn = (2)10 = 1024
204
3) V4 = 5040
10
Punto 7
1)
C C’ Total
205
Ejercicios de Repaso
2) a)
E F b) P (E o F) = 0,50
20 20 10 c) P (E o F) = 0,30
50 d) P (F \ E) = 0,50
5) 0,98
6) a)
E E’ Total
M 0,10 0,08 0,18
M’ 0,60 0,22 0,82
Total 0,70 0.30 1,00
206
7) I F
5 3 7
8)
B1 B2 B3 Total
a) 0,072
A1 0,2455 0,3825 0,072 0,70
b) 0,708
A2 0,2245 0,0675 0,008 0,30
c) 0,546
Total 0,47 0,45 0,08 1,00
d) 0,85
9)a)
Satisf. (S)
0,80 0,24
Aprobaron (A)
0,30 0,06
No satisf. (S’)
0,20
Satisf. (S)
0,10 0,07
Reprobaron (R)
0,70 0,63
No Satisf. (S’)
0,90 1,00
10) a) I b) C c) C d) I e) C
207
208
UNIDAD VI
DISTRIBUCIÓN DE PROBABILIDADES
1.- Distribución probabilística
1.1.- Concepto de Función (6)
5
4
3 (5.3)
2
1
x
1 2 3 4 5
Cada par ordenado está representado por un punto en el plano. Los dos
conjuntos de elementos representan a todos los posibles valores que x e
y pueden tomar; cualquier regla que defina una relación entre ellos será
una ecuación. Considérese y = x + 2; y es una función de x. Al asignar un
valor a x le corresponde uno y solo un valor de y; por ej.: x=6; y=8.
209
La mayoría de las funciones en estadística son funciones probabilísticas.
A cada evento aleatorio se le asigna un número y dicho número es “el
valor de la variable aleatoria”.
SS 0 (ninguna cara)
CS 1 (una cara)
SC 1 (una cara)
CC 2 (dos caras)
SS 0 1/4
CS
1 2/4
SC
CC 2 1/4
1,0
210
P(x)
2/4
1/4
0 1 2 x
211
Actividad Nº 30
212
2.- Valor esperado
n
E (X) = ∑ Xi P (Xi) (14)
i=1
X (millones) P (X)
1 0,2
2 0,3
3 0,2
4 0,2
5 0,1
1,0
213
¿Cuál es la ganancia esperada de este inversor?
E(X) = ∑ xi P (xi)
E(X) = 1 (0,2) + 2 (0,3) + 3 (0,2) + 4 (0,2) + 5 (0,1)
E(X) = 2,7 millones.
∑ xi
μ= (15)
N
x: 1 - 2 - 3 - 4 Distribución
P (x): 0,30 0,20 0,10 0,40 probabilística
214
La media de X es el valor esperado E (X)
E(X) = 2,6
σ2 = ∑ (XI − μ)
2
(16)
N
σ = ∑ ( XI − μ )
2
s 2
= E (x - μ )2
(X - μ )2 = X2 - 2 μ X + μ 2
Entonces E (x - μ )2 = E (X2 - 2 μ X + μ 2) =
= E (X2) - E (2 μ X) + E (μ 2)
215
Como 2 μ y μ son constantes, el valor esperado del producto de una
constante por una variable es igual a la constante multiplicada por el valor
esperado de la variable o sea: E (2 μ X) = 2 μ E(X). Además E (μ2) = μ2.
Por lo tanto:
= E (X2) - 2 μ μ + μ 2
= E (X2) - 2 μ 2 + μ 2
x P(x) x2 x2 P (x)
1 0,30 1 0,30
2 0,20 4 0,80
3 0,10 9 0,90
4 0,40 16 6,40
8,40
σ 2 = 8,40 - (2,6)2
σ 2 = 1,64
216
Actividad Nº 31
Proyecto 1 Proyecto 2
217
4.- Distribuciones de probabilidades discretas
4.1- Distribución binominal
P ( x ÷ n÷ p) = n
Cx px qn-x (18)
q = 1-p
218
Re sultados x Distribución probabilística P(x )
3
SSS 0 (1−p) = = 1
1 3
2 8
SSC
1 12
SCS 1 3(p ) (1−p) =3
2 2
=
3
8
CSS
SCC
2
3(p ) (1− p) = 3
2 1 1 3
CCS 2 =
2 2 8
CSC
3
CCC 2 (p) = 1 = 1 8
3
2 1
Cara Sello
P (X = 0) = P (SSS)
= (1-p) (1-p) (1-p) = (1-p)3 = 1/8
219
El total de posibles resultados para cada valor de x para una muestra de
3 elementos no es otra cosa que una combinación de x elementos entre
3 elementos.
Entonces:
X Combinaciones
0 3
C0 = 1
1 3
C1 = 3
2 3
C2 = 3
3 3
C3 = 1
P (x ÷ n÷ p) = n
Cx px qn-x
P (X)
3
8
2
8
1
8
0 1 2 3 x
220
x=3 n = 10 p = 0,20 q = 0,80
10!
P (x = 3) = (0,20)3 (0,80)7 = 0,20133
3! 7!
221
En lugar de sumar las probabilidades individuales, se puede utilizar la
tabla 2 que contiene las probabilidades acumuladas:
= 1 - 0,6778 = 0,3222
n = número de ensayos
m=np p = probabilidad de éxito
q = probabilidad de fracaso
s= npq 1 - p.
222
Se toma una muestra aleatoria de 25 artículos, ¿cuál es el número
esperado de defectuosos (promedio de largo plazo)? ¿Cuál es la desvia-
ción típica?
μ = 25 (0,20) = 5 artículos
σ= (25) (0,20) (0,80) = 4= 2
223
Actividad Nº 32
224
4.2.- Distribución de Poisson
x −λ
P (x ⎮ λ) = λ e (19)
X!
donde:
225
(5)2 (2,7183)-5
P (X=2 ôl = 5) = = 0,0842
2!
Uso de tablas
Utilizando la tabla 3
a) P (x = 1 ⎮ λ = 5) = 0,0337
1) n grande
2) p pequeño
226
Ejemplo: un informe indica que en el 10% de las empresas industriales
se producen graves accidentes de trabajo. Si se toma una muestra de 30
empresas, ¿cuál es la probabilidad de que en 5 de ellas hayan ocurrido
graves accidentes de trabajo?
-Utilizando la binomial
-Utilizando Poisson
λ = np
λ = 30 (0,10) = 3
P (x = 5 ⎮ λ = 3) = 0,1008
227
Actividad Nº 33
228
4.3.- Distribución hipergeométrica
N-T T
Cn - x Cx
P (x) = N
(20)
Cn
X=2 T= 6
N = 10 n=5
10 - 6 6 4 6
4! 6!
C5 - 2 C2 C3 C2 3! 1! 2! 4!
P (x = 2) = 10
= 10
=
C5 C5 10!
5! 5!
(4) (15)
= = 0,24
252
229
Debe observarse que la distribución hipergeométrica es una aplicación
del análisis combinatorio desarrollado en el punto 6.4. Se resolverá el
ejercicio (a) que se utilizó como ejemplo en esa oportunidad utilizando la
fórmula (20).
X=4 X=4
N = 15 N = 15
T=6 T=9
n=4 n=4
15 - 6 6 15 -9 9
C4 - 4 C4 C4 - 4 C4
P (4 rojas o 4 verdes) = 15
+ 15
C4 C4
9 6 6 9
C0 C4 C0 C4
= 15
+ 15
C4 C4
15 126 141
= + =
1365 1365 1365
= 0,103
230
Actividad Nº 34
231
5.- Distribución de probabilidades continuas
5.1. Distribución Normal
5.1.2.- Características
−∞ μ ∞
Figura A
232
1 −1 2 [(x − μ \ σ )] 2
P(x ) = e (21)
σ 2π
Figura B
a b
2') La curva normal tiene forma de campana. El componente exponencial
da la forma general de la curva.
4') Una curva normal está definida por tres constantes (π y 2) y dos
parámetros, la μ y σ de x.
233
5') Como x es una variable continua, puede asumir cualquier valor real
entre - ∞ y + ∞. La curva normal no toca el eje de las x. Cuando, x aumenta
o disminuye apartándose de la media, la curva es asintótica al eje x.
68 % 95,5 %
16 % del área 16 % del área 2,25 % del área 2,25 % del área
del área del área
1σ 1σ 2σ 2σ
Figura C Figura D
234
99,7 %
15 % del área del área 15 % del área
3σ 3σ
Figura 3
235
5.1.4.- Importancia de los parámetros
σ =3
σ =5 σ =5
μ = 10 μ = 18
σ =5
μ = 10 Figura G
Figura F
x-m
Z= (22)
s
236
donde:
320 - 300
Z= = 2
10
−∞ μ ∞
Figura H
237
En el ejemplo anterior el valor 2 significa 2 desviaciones típicas por
encima de la media o bien Z es igual a 2.
0,4775 0,4775
Volviendo al ejemplo
320 - 300
Z= =2
10
μ + 2 σ = 0,4775
μ - 2 σ = 0,4775
(Ver figura)
Z=2
P (x ≥ 320) = 0,0225
300 320
238
El valor de probabilidad entre 0 y Z o 0 y 2 es igual a 0,4775. Como P
( > 300) = 0,5, para conocer el valor de probabilidad de x > 320 o Z > 2
se debe restar 0,5 - 0,4775 = 0,0225. Esto significa que existe una proba-
bilidad de 0,0225 (o del 2,25%) que un vendedor gane un salario igual o
mayor que 320.
Por ejemplo:
0,4332 0,4406
0,0594
0,0668
−∞ 0 1,5 ∞ −∞ - 1,56 0 ∞
239
Con el siguiente ejercicio se analizarán distintos casos para obtener
valores de probabilidades para x con la distribución normal.
70 - 80
Z= = -1,67
70 80
- 1,67 0
Area entre 0 y -167 = 0,4525 y como
el área entre - ¥ y 0 es 0,50.
240
c) P (85 < x < 95)
85 - 80
Z= = 0,83
6
95 - 80
Z= = 2,5
80 85 95 6
0 0,83 2,5
d) P (x > 75)
75 - 80
Z= = -0,83
6
e) P (x = 90)
241
90,5 - 80
Z= = 1,75
6
89,5 - 80
Z= = 1,58
80 89,5 90,5
6
242
Ejemplo: En un barrio de la ciudad de Salta el 20% de las casas no
poseen gas natural. Si se investigan 30 casas de ese barrio, cuál es la
probabilidad de que 50 más no haya gas natural.
P (X>5\n=30\p=0,20) = 0,7448
- Aproximación de la normal
n = 30 np = 30 (0,20) = 6
σ = 2,2
4,5 - 6
Z= = -0,68
2,2
-0,68 0
P (X > 5) = 0,2518 + 0,5 = 0,7518
243
La diferencia entre el valor obtenido por la binomial y el obtenido por la
normal es solamente 0,007 por lo que la aproximación es buena.
Recordar que μ - λ y σ = λ
+ 0,0378 = 0,0671
- Utilizando la Normal
λ = 20 σ= 10 = 3,16
5,5 − 10
Z= = − 1,42
3,16
Area entre 0 y -1,42 = 0,4222
5,5 10
P (X < 5,5) = 0,5 - 0,4222 =0,0778
- 1,42 0
244
Actividad Nº 35
Hallar:
a) P (X > 10.000)
b) P (X < 7.000)
c) P (X = 6.000)
245
5.2. Distribución exponencial
-λ
P (t < t) = 1 - e (23)
-λ
P (T > t) = e (24)
246
Ejemplo 1
-2
P (T < 15') = 1 - e
= 1 - 0,13534
= 0,8647
Ejemplo 2:
λ = 8 por hora
P(T>8) = e-8
= 0,00034
247
ACTIVIDAD INTEGRADORA
248
Ejercicios de Repaso
a) 8 respuestas,
b) no más de 3 respuestas,
c) por lo menos 16 sin respuestas.
249
d) Sobre la base de la información anterior, ¿qué firma seleccionaría
Ud? Fundamentar la respuesta.
e) ¿Qué otros factores además de la calidad, consideraría al hacer
la selección del proveedor?
250
Respuestas a los ejercicios de la Unidad VI
Punto 1
1) X: 1 2 3 4
P(X): 1/4 1/4 1/4 1/4 = 4/4 = 1
c) Eventos simples RRR - RRS - RSR - SRR - SSR - SRS - RSS - SSS
Valor de X 1 0 0 0 0 0 0 1
d) X= 0 1
Punto 2 y 3
Punto 4.1.
Punto 4.2.
2) 0,9834
251
Punto 5
252
Ejercicios de Repaso
2) a) 0,2019 b) 0,3375
4) a) 0,4572; b) 0,4443;
5) 78 postulantes.
253
254
APÉNDICES
255
256
Apéndice 1
Distribución Probabilisticas Binomiales
⎛ n ⎞ x n −x
Las anotaciones en la tabla son valores de ⎜⎜ ⎟⎟ p q
⎝x⎠
257
258
259
Apéndice 2
Probabilidades acumuladas para distribuciones binomiales
x ⎛ n ⎞ k n−k
CP (x ) = ∑ ⎜ ⎟p q
⎜ ⎟
k −0 ⎝k⎠
260
261
262
Apéndice 3
Probabilidades Poisson
263
264
265
266
Apéndice 4
267
l
Apéndice 5
Valores de e-λ
268
Diagrama de Contenido - Unidad VII
Errores muestrales
y no muestrales
Distribución Distribuciones
Importancia de la
en el muestreo Muestrales
muestra
269
Distribución muestral
de medias
Distribución muestral
de proporciones
Teorema del
límite central
270
UNIDAD VII
(1)
DISTRIBUCION EN EL MUESTREO
1. Introducción
2. Importancia de la muestra
271
de probabilidad. Si bien una muestra de juicio es fácil de obtenerla y su
costo es bajo, no permite medir el error muestral.
Media x μ
Desviación típica s σ
Proporción p p
Números de elementos n N
3. Error muestral
Debe hacerse notar que hay errores que se cometen en las encuestas,
en las tabulaciones de datos, en los cálculos, etc. que no son debidos a la
muestra por eso se denominan errores “no muestrales”.
4. Distribución en el muestreo
272
3, con los elementos A, B y C, es posible extraer 3 muestras de tamaño 2
(sin reposición). Si se calcula la media de cada muestra, habrá 3 medias
muestrales. Estas 3 medidas forman una distribución que se denomina
“distribución de medias muestrales” o “distribución muestral de medias”.
5. Error estándar
Trabajador A B C D
Jornal ($) 2 5 6 3
∑ x i = 16 4 = $4
La media es μ =
N
La desviación típica es σ =
∑ ( x − μ )2
= $ 1,58
N
273
Muestras Jornales Medias muestrales
A-B 2- 5 3,5
A-C 2- 6 4,0
A-D 2- 3 2,5
B-C 5- 6 5,5
B-D 5- 3 4,0
C-D 6- 3 4,5
24,0
2,5 1
3,5 1
4,0 2
4,5 1
5,5 1
6
∑ x2 f 10 − 1
σx = − x2 = − 42 ; σ x = 0,83 = 0,91
n 6
274
El desvío típico obtenido es el “error estándar de la media”, que en la
práctica se calcula por:
σ
σx = (1)
n
σ N−n
σx = (2)
n N −1
En el ejemplo σ = 1,58 ; N = 4 ; n= 2
1,58 4−2
σx = = 0,91
2 4 −1
En resumen:
275
Empleado X La proporción de los profesionales es
A 1
2
B 1 p= = 0,50 Parámetro y el desvío típico:
4
C 0
D 0
2 σ = p.q = 0,50(0,50) = 0,50
σp = 0,17
p.q p.q N − n
(3) σp = n
o σp = −
n N −1
(4)
para poblaciones
finitas
0,50(0,50) 4 − 3
σp = 3 4 −1
= 0,17
276
8. Teorema del límite central
Ejemplo:
x −μ x −μ
Z= = (6)
σx σ n
260 − 250 10
Z= = = 2,22
45 100 4,5
250 260
277
Cuando N es grande y el tamaño de la muestra n, es pequeña, el factor
de corrección
N−n
N −1
278
Actividad Nº 36
Vendedor A B C D E
Pólizas Vendidas 2 3 4 5 1
3) Con los datos de la población del ejercicio (2), elegir todas las muestras
posibles de tamaño 3 (sin reposición) y realizar las mismas actividades
consignadas en el punto II.
279
6) Consultar la bibliografía consignada en el programa y desarrollar la
siguiente guía de estudio sobre el tema Métodos de Muestreo.
Instrucción Nº de Trabajadores
Primaria 50
Secundaria 500
Superior No Univ. 150
Superior Univ. 300
1.000
280
e.3. Señale ventajas y desventajas de este diseño de muestra.
f. Lea el tema "Muestreo por Conglomerados"
f.1. ¿En qué consiste este tipo de muestreo?
f.2. ¿Qué diferencias hay con el muestreo estratificado?
f.3. Determine ventajas y desventajas.
g. Lea el tema "Muestras no Probabilísticas".
g.1. A qué se denomina "muestras no probabilísticas?
g.2. Explique cuál es la diferencia con las muestras probabilísticas?
g.3. Señale, en general, ventajas y desventajas.
281
Respuestas a los ejercicios de la Unidad VII
2) I) μ = 3 σ = 1,41
II) a) 10 muestras
3)a) 10 muestras
4) P (X ³ 35 meses) = 0,9960
5) P (X ³ 0,33) = 0,0668
282
Diagrama de Contenido - Unidad VIII
TEORÍA CLÁSICA
DE LA ESTIMACIÓN
Tipos de Propiedades
Estimador y
estimación de un buen
Estimación
estimador
283
^ Puntual
^ Por intervalo
Nivel e Intervalo de Confianza
2. Estimador y Estimación
3. Tipos de Estimaciones
285
Si el margen es de solamente de 50 hs., 4.000 hs. puede ser una
buena estimación, pero si el error es de 500 hs., se rechazará como
estimación. Esta estimación debe incluir una estimación del error (2).
286
5. Estimaciones puntuales
x=
∑ xi
n
∑ (x − x )
2
s =
2
n
Pero al utilizar S2 como estimador de σ2, la fórmula anterior se vuelve:
∑ (x − x )
2
s = n −1
2
(7)
1 2 2 3 3 3 4 4 5 5
5 6 6 7 8 8 9 10 10 10
111
x= = 5,6 S 2 = 8,26 S= 8,26 = 2,9
20
287
Actividad Nº 37
Ejercicios - Puntos 1 al 5
288
6. Estimación por intervalo
6.1 Introducción
Por regla de la normal (Unidad VII) hay una probabilidad de 0,683 de que
la media de una muestra de tamaño 300 se encuentre dentro de un error
estándar positivo y negativo de μ . En otras palabras el 68,3% de todas las
medias muestrales se encuentra a un error estándar positivo o negativo
de m . En el ejemplo de la duración de focos, hay una confianza del 68,3%
de que la duración se encuentre en el intervalo 3.913,4 o 4.086,6 (4.000
± 1 σ ). Análogamente:
289
6.2 Nivel e Intervalo de Confianza
Una proporción 1 - a del área bajo la curva normal estándar queda entre
-z a /2 y z a /2.
1−α
α/2 0,005 0,90 α/2 0,005
Ζα/2 σx Ζα/2 σx
μ
− Ζα/2 0 + Ζα/2
Interpretación
290
“Si se seleccionan muchas muestras aleatorias de tamaño 300 y se
calcula el intervalo de confianza de todas esas muestras, en el 90% de
ellas, la media de la población se encuentra dentro de ese intervalo”.
∑ (x − x )
2
S=
n
291
Ejemplo: El Dpto. de Personal de una empresa está interesada en es-
timar el número promedio de días que los empleados faltaron por razones
particulares. Un análisis de los legajos de 49 trabajadores elegidos al azar
dio una media de 12 días. Si el desvío estándar poblacional es de 2,5 días,
determinar el intervalo de confianza del 95% para el verdadero promedio.
x±z
12 ± 1,96 (2,5 / 49)
12 ± 1,96 (0,36)
11,3 ≤ μ ≤ 12,7
En la distribución normal
μ ± z σx = μ ± E y E = z
donde:
292
(1,96)2 . (2,5)2
n= = 96,04 = 96 trabajadores
(0,5)2
n ≥ 30 y np ≥ 5, donde μ = np y σ = n.p.q
μp = p
293
Ejemplo: Otro problema del jefe del personal es estimar la verdadera
proporción de legajos de los empleados que están incompletos. Elige una
muestra de 50 legajos y encuentra 14 incompletos. Determinar el intervalo
de confianza del 99% para p.
14
p= = 0,28
50
p + z α / 2 . Sp
0,28 (0,72)
0,28 ± 2,58 .
50
0,12 ≤ p ≤ 0,44
donde:
p . q E2
= 2
n z
z2 .p . q
n= (13)
E2
n = 134 legajos
294
6.3.3 Estimación de la diferencia entre dos medias
D − z α / 2 . σD ≤ δ ≤ D + z α / 2 . σ2 (13)
Siendo D = x1 - x2
σ12 σ 22
σD = + (15)
n1 n2
Marca A Marca B
Tamaño de la muestra n1 = 100 n2 = 100
Media muestral x1 = 38 meses x2 = 35 meses
Varianza poblacional σ12 = 36 meses σ12 = 25 meses
σ12 σ 22
D + zα / 2 + D = 38 − 35 = 3
n1 n2
36 25
3± 1,96 +
100 100
3 ± 1,96 (0,78)
295
Actividad Nº 38
296
esos 100 trabajadores, se encontró que 20, tenían un ingreso menor
a $350.
297
Respuestas a los ejercicios de la Unidad VIII
Puntos 1 al 5
2) a) I ; b) I ; c) I
3) μ = 13,5 σ = 4,6
Punto 6
1) 843,9 ≤ μ ≤ 866,1
2) 0,07 ≤ p ≤ 0,23
3) 1,49 ≤ δ ≤ 6,51
4) n = 16,34
5) n = 784
6) a. 514,12 ≤ μ ≤ 525,88
b. 0,12 ≤ p ≤ 0,28
298
TEST DE
PRUEBAS DE HIPOTESIS PRUEBAS DE
HIPÓTESIS HIPÓTESIS
MUESTRAS
PEQUEÑAS
MUESTRAS
Distribución t GRANDES
PROCEDIMIENTO
DE LA PRUEBA
DE HIPÓTESIS
299
Características Prueba de una
media poblacional
Inferencia
estadística
Prueba de
proporción
de la población
Pruebas para la media
Diagrama de Contenidos - Unidad IX
poblacional y para la
diferencia de medias Prueba de la
diferencia de
Estimaciones de la media dos medias
poblacional y de la
diferencia de medias
300
UNIDAD IX
TEST DE HIPOTESIS
1. Generalidades
H0: μ = 10
301
La hipótesis alternativa es una afirmación tentativa de que el parámetro
de la población tiene un valor diferente del especificado en la hipótesis
nula:
H1: μ = 10
Al usar un nivel de significación del 5%, existe una probabilidad del 0,05
de rechazar H0 si ésta es verdadera. Este error se denomina de “tipo I” que
es siempre igual al nivel de significación.
302
(4) Planteo de la regla de decisión
a) el estadístico de prueba y
b) la región crítica.
1-α
μ c
α/2 α/2 α α
-c μ c μ c c μ
303
Rechazar H0 si el Rechazar H0 si el Rechazar H0 si el
valor del estadísti valor del estadís- valor del estadís
co de prueba es tico de prueba es tico de prueba es
≥ que C o ≤ que C ≥ que C. ≤ que C
(Test de dos colas) (Test de una cola) (Test de una cola)
En resumen:
H0 H0
Decisión Verdadera Falsa
Error de Decisión
Rechazar H0 tipo I (α) correcta (1- β)
Decisión Error de
Aceptar H0 correcta (1- α) tipo II (β)
Debe tenerse cuenta que los dos tipos de error están relacionados
inversamente. En los gráficos se representan las áreas de α y β.
304
α
μ0
μ1
305
1 La distribución en normal.
H0: μ ≤ 90
H1: μ > 90
4 Regla de decisión
0 1,645
x − μ0
z=
σ/ n
98 − 90
z= = 3,2 Como Z > 1,645 se rechaza H0 es decir
25 / 100
la afirmación del gerente.
90 94,11
306
Rechazar H0 si X es mayor que la media crítica.
148
H0: p = 0,80 p= = 0,74
200
H1: p 0,80
p −p
z=
p.q
n
-2,33 0
0,74 − 0,80
z= = − 2,12
0,80(0,20)
200
307
4.3 Prueba para la diferencia de medias
Esta prueba tiene como finalidad decidir si la diferencia entre dos me-
dias obtenidas de muestras independientes es lo suficientemente grande
que indiquen que las muestras se tomaron a partir de poblaciones distin-
tas o si dicha diferencia es tan pequeña que se debe al azar. La H0 de
interés no sólo se refiere a que las medias muestrales se obtuvieron de
poblaciones con medias iguales, sino que las dos muestras se obtuvieron
de la misma población. Esto significa que σ1 = σ2.
H0: μ1 - μ2 = 0 ó μ1 = μ2
H1: μ1 - μ2 ≠ 0 ó μ1 ≠ μ2
( − ) − (μ1 − μ 2)
z = x1 x 2
σD
Como μ1 - μ2 = 0 , entonces:
−
z = x1 x 2 (17) D = x1 − x 2
σD
σD = σ1 + σ2
2 2
n1 n2
308
H0: μ1 = μ2 (no hay diferencias en las duraciones de ambas marcas).
Rechazar H0 si z ³ 1,96 ó
z £ -1,96
-1,96 1,96
z = 3,85
H0 : μ1 = μ2 H1: μ1 > μ2
309
Rechazar H0 si z ³ 1,645. Esta regla puede replantearse como:
1- α
0,95
90 94,11
0.06 1-α
0,94
94,11 98
94,11− 98
z= = − 1,56
2,5
310
Al mantener constantes el nivel de significación y el tamaño de muestra
de la muestra, β disminuye a medida el valor de la media alternativa se
aleja del valor de H0. Esta probabilidad aumenta al acercarse el valor
alternativo al valor de H0. La probabilidad de aceptar H0 con diversos va-
lores alternativos de la media verdadera se puede graficar mediante una
curva denominada “de característica operativa” (CO).
92 94,11
94,11− 92
z= = 0,84 Area entre 0 y 0,84 = 0,2995
2,5
1 - β = 1 - 0,80 = 0,20
94,11 95
94,11− 95
z= = − 0,36 Area entre 0 y − 0,36 = 0,1406
2,5
1 - β = 1 - 0,36 = 0,64
311
94,11 98
94,11− 98
z= = − 1,56 Area entre 0 y − 1,56 = 0,4406
2,5
1 - β = 1 - 0,06 = 0,94
94,11 100
94,11− 100
z= = − −2,36 Area entre 0 y − 2,36 = 0,4909
2,5
1- β = 1- 0,01 = 0,99
90 0,95 0,05
92 0,80 0,20
95 0,36 0,64
98 0,06 0,94
100 0,01 0,99
β = Probabilidad de aceptación de H0
312
La curva CO queda graficada de la siguiente forma:
β
1.00
0.50
0
90 91 92 93 94 95 96 97 98 99 100 µ
β
1-
90 92 95 98 100 µ
313
Valores críticos para los niveles de significación más utilizados
314
Actividad Nº 39
Ejercicios - Puntos 1 al 5
315
investigación aplicó una encuesta a 200 familias y averiguó que la
salsa sería comparada por 120 de ellas. Un estudio hecho el año
pasado reveló que el 55% de las familias comprarían la nueva marca.
Con un nivel de significación del 1%, deberá la compañía concluir
que hay un mayor interés en la nueva salsa condimentada?
316
6. Inferencia para muestras pequeñas. La Distribución “t”
de Student
6.1 Introducción
Este caso fue resuelto a principios de siglo cuando W.S. Gosset, utili-
zando el seudónimo de “Student”, publicó una distribución teórica que
lleva el nombre de Distribución t de Student.
3
6.2 Características
Normal t, n = 10
t, n = 2
317
- Mientras que z contiene sólo una variable aleatoria que es x, ya que n
y σ son constantes, la razón t contiene dos variables aleatorias que
son x y s, estas variables son independientes unas de las otras.
Ejemplo Nº 1: Obtener el valor crítico t para una prueba de una cola con
n = 10 y α =0,05.
318
Obsérvese que el valor de 0,10 en el renglón 2Q es equivalente al valor
de 0,05 en el renglón Q.
Ejemplo Nº 3: Obtener los valores críticos t para cada uno de los si-
guientes casos.
- Planteo de la hipótesis
H0: μ = 38 meses
H1: μ < 38 meses
319
Prueba de una cola. El valor
crítico de t con α = 0,05
y con gl = 16-1 = 15 es igual
a -1,753 (extremo izquierdo).
-1,753
- Regla de decisión -t
Rechazar H0 si t ≤ α -1,753
- Estadístico de prueba
35 − 38
t= = − 1,935
6,2 / 16
- Planteo de hipótesis
H0: μ = 38
H1: μ ≠ 38
Regla de decisión
-t t
-2,131 0 2,131
320
- Estadístico de prueba
t = -1,935
x − t gl α / 2 s x ≤ μ ≤ x + t gl α / 2 s x (19)
x= ∑ ∑
x ( x − x )2
s=
n n −1
x = $ 200,42 s = $ 88,17
121,27 ≤ μ ≤ 279,57
321
6.4.3 Prueba de la diferencia entre dos medias
a)Muestras independientes
SD =
(n1 − 1) S2 + (n2 − 1)S22 . ⎛⎜ 1 + 1⎞
⎟
n1 + n2 − 2 ⎜n n2 ⎟⎠
(23)
⎝ 1
−
t = x1 x 2 (24)
SD
322
Ejemplo: una fábrica produce dos marcas distintas de tubos fluores-
cente A y B. De cada marca se toma una muestra de 15 unidades y se
calcula la duración media y la varianza muestral de cada una los resulta-
dos son:
Marca A Marca B
Muestra n1 = 15 n2 = 15
Duración media x1 = 1.600 hs. x2 = 1.570 hs.
Varianza S21 = 14.4000 hs. S22 = 12.100 hs
15 + 15 - 2 = 28
t26,0,05 = 2,048
-2,048 2,048
323
1600 − 1570 30
t= = = 0,714
(15 − 1).14.400 + (15 − 1).12 .100 ⎛ 1 1⎞ 42,03
⎜ + ⎟
14 + 14 − 2 ⎝ 15 15 ⎠
b) Muestras dependientes
D= ∑
D
(25)
n
SD = ∑ D2
− D2 (26)
n
324
Ejemplo: Diez trabajadores de una fábrica son entrenados con un nue-
vo método de trabajo. Se desea saber si con dicho entrenamiento la pro-
ductividad ha aumentado. A continuación se muestran las producciones
(en unidades) de cada uno del entrenamiento.
1 85 80 5 25
2 92 90 2 4
3 94 95 -1 1
4 88 80 8 64
5 82 79 3 9
6 95 88 7 49
7 94 90 4 16
8 82 87 -5 25
9 85 86 -1 1
10 89 84 5 25
Σ = 27 Σ = 219
27 219
D= = 2,7 SD = − (2,7 )2 = 3,82
10 10
3,82
SD = = 1,273 error estándar
10 − 1
t9,0,01 = 2,821
Rechazar H0 si t ≥ 2,821:
2,7
t= = 2,12
1,273
325
6.4.4 Estimación de la diferencia de dos medias muestrales
D − t gl α / 2 SD ≤ δ ≤ D + t gl α / 2 SD (29)
D ± tgl, a/2
SD
0 ≤ δ ≤ 116.1
0 ≤ δ ≤ 6,8
a + b + c + d = 15
326
El número de valores que puede variar libremente en el conjunto es 2.
Por lo tanto, si hay n elementos y la suma de ellos es un valor fijo, el
número de grados de libertad es igual a n-1.
x1 = 10 ; x2 = 6 ; x32 = 9 ; x4 = 7
x5 = 8
S =∑2(x − x ) 2
n −1
S 2
=
(10 − 8 )2 + (6 − 8 )2 + (9 − 8 )2 + (7 − 8 )2 + (8 − 8 )2
4
S2 = 2,5
327
Actividad Nº 40
Tarjeta A B C D E F G H I J
Horas extras 18 22 20 15 24 18 19 21 22 20
Máquina I Máquina II
Tamaño de la muestra n1 = 8 n2 = 10
Promedio muestral
(en pulgadas) x1 = 2,6 x2 = 2,5
328
Varianza muestral S21 = 0,0054 S22 = 0,0046
a) Indicar los datos que existe una diferencia significativa entre las
dos medias con α = 0,01.
Estudiante A B C D E F G H I J
Matemática 84 55 85 98 80 55 80 64 91 85
Física 84 57 90 97 74 53 75 63 90 82
329
Respuestas a los ejercicios de la Unidad IX
Puntos 1 al 5
2) a) una cola
b) β = 0,43 1 - β = 0,57
6) Valores alternativos de μ1 84 83 81 78
β C 0,95 0,85 0,43 0,02
1-β Potencia 0,05 0,15 0,57 0,98
Punto 6
3) 18,1 ≤ μ ≤ 21,7
4) a) t = 3,03 Rechazar H
b) 0,003 ≤ μ ≤ 0,197
5) a) t = 1,19 Aceptar H
330
CHI CUADRADO
CARACTERÍSTICAS APLICACIONES
331
- BONDAD DE AJUSTE
- TEST DE INDEPENDENCIA
Diagrama de Contenidos Unidad X
- PRUEBA DE HOMOGENEIDAD
- PRUEBA DE LA VARIANZA
POBLACIONAL
332
UNIDAD X
LA DISTRIBUCIÓN JI CUADRADA (χ2)
1. Características de la distribución
0.60 f (x )
0.50
0.40 R=1
0.30
0.20 R= 5
0.10 R = 10
0 2
x
2 4 6 8 10 12 14 16
333
2. Uso de las tablas de χ2
La tabla del Anexo III muestra los valores críticos χ2 que se denota por
χ2(gl,a). El subíndice tiene dos números, gl indica los grados de libertad y a
indica el porcentaje cortado bajo la cola superior de la distribución.
5% 5%
15,507
El gráfico también muestra el valor que corta el 5% inferior del área bajo
la curva (o el 95% superior de la distribución) con 8 grados de libertad.
χ2(8,0,95) = 2,732
3. Aplicaciones de χ2
334
regular” o “las variables desempeño e instrucción son independientes”.
Los datos son categorizados y los resultados se muestran en forma de
conteo. Por ejemplo, los salarios de los empleados de una compañía re-
presentados a través de una tabla de frecuencias. Cada frecuencia se
anota en una celda o clase. Las frecuencias observadas de la muestra se
denotan por f01 f02, ....f0n. La suma de todas las frecuencias observadas es
igual al tamaño de la muestra, o sea:
χ =∑
2 (f0 . fe )2
(31)
fe
335
3.1 Prueba para la bondad de ajuste
gl = k - 1 (32)
ZONA A B C D TOTAL
336
Planteando las hipótesis:
Las categorías son 4, por lo tanto los grados de libertad son 3, ya que:
k=4 gl = k - 1 gl = 4 - 1 = 3
χ2(3,0,05) = 7,814
7,814
10,68
χ =∑
2 (f0 . fe )2 = 10,68
fe
337
Como χ2 es mayor que 7,814, se rechaza H0 es decir no hay uniformidad
en las preferencias en las 4 zonas.
gl = k - 1 - m (33)
X= ∑
xf
X = 2,3
n
S= ∑
(x − x ) f 2
S = 0,60
n −1
- Planteo de hipótesis
338
- El número de clases está dado por el número de intervalos, o sea k = 5.
Menos de 1,5
1,5 - 2,0
2,0 - 2,5
2,5 - 3,0
3,0 y más
1,0000 50,0
L i − 2,3 L s − 2,3
ZL i = ZL s =
0,6 0,6
339
Por ej. ZLs en la primera clase
1,5 − 2,3
ZL s = = − 1,33
0,6
-1,33 0
n . P (ZLi ≤ Z ≤ ZLs)
gl = k - 1 - m
k = es el número de clases
m = es el número de parámetros a estimar
340
En nuestro ejemplo:
k=5
m = 2, ya que son dos los parámetros desconocidos a estimar μ y σ.
Por lo tanto:
gl = 5 - 1 - 2 = 2 grados de libertad.
- Valor crítico
- Regla de decisión
Rechazar H0 si X2 ≥ 5,991
Aceptar H0 si X2 ≤ 5,991
- Cálculo de X2
f0 − fe2
Frecuencias Frecuencias
fe
Observadas Esperadas (f0 -fe ) 2
(f0 ) (fe )
50 50,0 1,848
X2 = 1,848
341
Como X2 es menor que el valor crítico, se acepta H0, lo que indica que
la distribución de frecuencias sigue una distribución normal.
0 0,0672 3,4
1 0,1815 9,1
2 0,2450 12,3
3 0,2205 11,0
4 0,1488 7,4
5 0,0804 4,0
6 0,0362 1,8
7 0,0139 0,7
8 0,0047 0,2
9 0,0014 0,1
50,0
342
(*) Diferencia por redondeo de datos.
2,189
X2 = 2,189
gl = k - m - 1
gl = 5 - 1 - 1 = 3
343
Rechazar H0 si X2 > 11,3449
344
Actividad Nº 41
Día D L M M J V S
Nº de accidentes 28 12 10 7 8 11 24
345
3.2 Test de Independencia
r = el número de renglones.
k = el número de columnas.
Sexo
Asistencia V M Total
S 45 25 70
NS 15 15 30
Total 60 40 100
5. Kazmier, Leonard: "Estadística Aplicada a la Economía y Administración". Ed. Mc. Gral. Hill.
346
La tabla tiene dos categorías de renglón (V y M) y dos de columnas
(S y NS), por lo tanto es una tabla de 2 x 2.
f0 = ∑
fr . ∑ fk
(33)
n
Sexo
Asistencia V M Total
S 42 28 70
NS 18 12 30
Total 60 40 100
fe =
(60)(70 ) = 42
100
gl = (r - 1) (k - 1) (34)
gl = (2-1) . (2-1) = 1
347
Rechazar H0 si X2 ≥ 3,841
Aceptar H0 si X2 < 3,841
X =∑
2 (f0 − fe )2
fe
En este caso, se eleva el cuadrado la diferencia entre f0 y fe de cada
celda y se divide entre la fe de dicha celda.
X 2
=
(45 − 42 )2 (25 − 28 )2 (15 − 18 )2 (15 − 12 )2
+ + + = 1,789
42 28 18 12
348
Considérese el siguiente problema. Los técnicos de un establecimiento
que fabrica fiambres y embutidos deben decidir la adopción de un nuevo
proceso para elaborar jamón cocido tipo A. Eligen 200 piezas obtenidas
mediante le proceso nuevo y 200 mediante el proceso tradicional. Los
resultados son:
La hipótesis nula puede plantearse como que las dos muestras proce-
den de la misma población, es decir que las dos clasificaciones son homo-
géneas en lo que respecta al estado de las piezas. Esto significa que no
hay diferencia entre los dos métodos.
S se define:
p1a = p1b
H0
p2a = p2b
349
(7)
58/400 (200) = 29 342/400 (200) = 171
Piezas
Proceso Defectuosos Buenas Total
En resumen:
p1a = p1b
H0 Los métodos son iguales
p2a = p2b
Rechazar H0 si X2 ≥ 6,634
(f0 − fe )2
X =
2
∑
fe
7. fe = Σ fr Σ fk/n
350
X 2
=
(22 − 29 )2 (178 − 171)2 (36 − 29 )2 (164 − 171)2
+ + + = 3,952
29 171 29 171
X2 = 3,952
Se acepta H0.
351
Actividad Nº 42
DIVISION DE COMPRAS
Contado 10 15 5 5 15 50
efectivo
Contado 20 15 5 15 5 60
Cheque
Tarjeta de 70 75 25 20 50 240
crédito
Cuenta 50 45 15 10 30 150
Corriente
352
Docentes A Neutral En Total
Favor Contra
X 2
=
(n − 1) S 2
(36)
σ2
La prueba puede ser de una cola o de dos colas y las hipótesis pueden
plantearse
Desde luego, H0 puede también ser una hipótesis inexacta como H0: σ2
≥ σ02 o H0: σ2 ≤ σ02 .
353
Dado un nivel de significación (α) y especificando los grados de libertad
se puede tomar la decisión comparando el valor del estadístico de prueba
con el valor crítico.
gl = 15 -1 = 14
X214,0,05 = 23,68
23,684
Rechazar H0 si X2 ≥ 23,684
Aceptar H0 si X2 < 23,684
14 (15.625 )
X2 = = 21,875
10.000
Se acepta H0.
354
10%
26,118
14 (15.625 )
X2 = = 21,875
10.000
Se acepta H0.
(n − 1)S 2 ≤ σ 2 ≤ (n − 1)S 2
(37)
X 2gl,α X 2gl,α
14 (15.625 ) 2 14 (15.625 )
≤σ ≤
26,118 5,628
8.375,45 ≤ σ 2 ≤ 38.868,16
91,52 ≤ σ ≤ 197,15
355
ACTIVIDAD OBLIGATORIA
Ejercicios punto 3
9 10 13 12 8 6 12
a) Obtener S2.
356
Respuestas a los ejercicios de la Unidad X
Punto 1
2)χ2 = 7 Aceptar H0
Punto 2
Punto 3
1)a) S = 6,33
b) χ2 = 9,495 Aceptar H0
c) 2,63 ≤ σ2 ≤ 30,69
b) 82362,17 ≤ σ2 ≤ 214.912,28
286,99 ≤ σ ≤ 463,59
357
358
APÉNDICES
359
360
Apéndice 6
Tabla de números aleatarios
361
Apéndice 7
Valores porcentuales de la distribución t
362
Apéndice 8
Valores porcentuales de la distribución X2
363
364
FICHA DE EVALUACIÓN
MÓDULO ÚNICO
Sr. alumno/a:
CONSULTAS A TUTORIAS SI NO
2) Para que la próxima salga mejor... (Agregue sugerencias sobre la línea de puntos)
.......................................................................................................................................................................................................
.......................................................................................................................................................................................................
Evaluación: MB - B - R - I -
4) Otras sugerencias.............................................................................................................................................................
.......................................................................................................................................................................................................
365