Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística Aplicada A La Gestión: Manual
Estadística Aplicada A La Gestión: Manual
la Gestión
Carlos Berrocal Gutarra
Manual
Índice
Tema n° 1. Prueba de hipótesis para la proporción de una población y Prueba de hipótesis para la
media de una población...............................................................................................................................35
1. Prueba de Hipótesis:........................................................................................................................35
1.1. Hipótesis 35
2
Universidad Continental | Manual
1.2. Prueba de Hipótesis 35
2. Prueba de Hipótesis para la proporción poblacional.......................................................................37
2.1. Procedimiento tradicional 38
2.1.1. Error Tipo I y Tipo II al realizar una prueba de Hipótesis. 39
2.1.2. Relaciones entre y β: 39
2.2. Procedimiento usando el Valor P. 40
3. Prueba de hipótesis para la media poblacional................................................................................42
3.1. Prueba de hipótesis para la media poblacional con desviación estándar desconocida 42
3.2. Prueba de hipótesis para la media poblacional con desviación estándar desconocida.
44
Tema n° 2. Inferencias acerca de dos proporciones poblacionales..........................................................46
1. Prueba de Hipótesis para dos proporciones poblacionales..............................................................46
2. Intervalos para dos proporciones poblacionales..............................................................................48
Tema n° 3. Inferencias acerca de dos medias independientes..................................................................50
1. Muestras independientes y se conoce 1 y 2..................................................................................50
2. Muestras independientes, no se conoce 1 y 2 pero se asumen iguales.........................................52
3. Muestras independientes, no se conoce 1 y 2 pero no se asumen iguales....................................54
3.1. Intervalo para la diferencia de medias con Muestras independientes, no se conoce 1 y 2
56
Tema n° 4. Inferencias de dos medias con muestras dependientes..........................................................58
LECTURA N° 2:.....................................................................................................................................61
Actividad N° 2: Auto evaluación - Pruebas de Hipótesis (cuestionario en línea)...................................62
Foro 2:.....................................................................................................................................................62
GLOSARIO DE LA UNIDAD II:...........................................................................................................63
Bibliografía de la Unidad 2..........................................................................................................................63
3
Universidad Continental | Manual
1.3. Frecuencias no uniformes. 84
1.4. Pruebas de ajuste a una distribución probabilística. 85
2. Tablas de contingencia:...................................................................................................................89
2.1. Prueba de Homogeneidad 89
2.2. Prueba de Independencia 89
2.3. Procedimiento de solución: 90
Tema n° 3. Estadística no paramétrica: Prueba de rangos con signo de Wilcoxon para datos
apareados y Prueba de la suma de rangos de Wilcoxon para dos muestras independientes........................93
1. Prueba de rangos con signo de Wilcoxon para datos apareados......................................................93
2. Prueba de la suma de rangos de Wilcoxon para dos muestras independientes................................96
2.1. Estadístico de prueba: 96
Tema n° 4. Pruebas no paramétricas: Prueba de Kruskal –Wallis y Correlación de rangos de Spearman.
99
1. Prueba de Kruskal –Wallis..............................................................................................................99
1.1. El valor crítico: 99
2. Correlación de rangos de Spearman..............................................................................................101
2.1. Coeficiente de correlación de Spearman 101
2.2. Estadístico de prueba: 102
Ejemplo: 102
De la teoría a la práctica........................................................................................................................106
LECTURA N° 3:...................................................................................................................................106
Actividad N° 3: Auto evaluación - Pruebas no paramétricas (cuestionario en línea)...........................107
GLOSARIO DE LA UNIDAD 3..........................................................................................................108
Bibliografía Unidad 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
Tema n° 1. Correlación...........................................................................................................................113
1. Correlación.....................................................................................................................................113
2. Análisis de correlación lineal simple.............................................................................................114
2.1. Gráfico de dispersión114
2.2. Coeficiente de correlación lineal 115
2.3. Prueba de Hipótesis para la correlación115
Tema n° 2. Regresión lineal simple........................................................................................................117
1. Ecuación de regresión:...................................................................................................................117
1.1. Prueba de hipótesis para β1 118
2. Estimación puntual e Intervalo de predicción................................................................................120
2.1. Estimación puntual 120
2.2. Estimación por intervalo 120
2.3. Estimación por Intervalo o Intervalo de predicción 121
Tema n° 3. Correlación Regresión Lineal Múltiple...............................................................................123
4
Universidad Continental | Manual
1. Correlación.....................................................................................................................................123
1.1. Análisis de correlación 123
1.2. Coeficiente de determinación lineal Múltiple 124
2. Regresión lineal multiple:..............................................................................................................125
2.1. Ecuación de regresión 126
2.2. Prueba de Hipótesis para los coeficientes β1 y β2 126
Tema n° 4. Series de tiempo...................................................................................................................128
1. Componentes de una serie temporal: 128
3. Análisis de series temporales: 133
De la teoría a la práctica........................................................................................................................138
LECTURA N° 4:...................................................................................................................................138
Actividad N° 4: Auto evaluación – Correlación, Regresión y Series Temporales (cuestionario en línea)
...............................................................................................................................................................139
GLOSARIO DE LA UNIDAD 4..........................................................................................................140
Bibliografía de la Unidad 4........................................................................................................................140
3. APENDICES.................................................................................................................................142
Índice de Tablas
Tabla 1: Elección entre z y t........................................................................................................................24
Tabla 2: Datos de Vida útil de viviendas.....................................................................................................42
Tabla 3: Puntuaciones de examen verbal de padres....................................................................................54
Tabla 4: Datos comparación de gastos en restaurants.................................................................................58
Tabla 5: ¿Cuáles son los factores más importantes para conseguir más inclusión social?..........................61
Tabla 6. Tabla ANOVA de un factor. Formulas..........................................................................................69
Tabla 7. Datos Cereales...............................................................................................................................70
Tabla 8. ANOVA de dos factores diseño aditivo. Fórmulas.......................................................................72
Tabla 9. Tiempos de recorrido.....................................................................................................................73
Tabla 10. Tabla ANOVA de dos factores diseño AxB - Fórmulas.............................................................77
Tabla 11. Datos Efecto tamaño de anuncio.................................................................................................78
Tabla 12. Datos Bubba's Fish and Pasta......................................................................................................82
5
Universidad Continental | Manual
Tabla 13: Datos Producto financiero...........................................................................................................84
Tabla 14: Datos Vehiculos Applewood.......................................................................................................85
Tabla 15: Ejemplo - Tabla de contingencia.................................................................................................89
Tabla 16. Datos Ford Motro Company........................................................................................................90
Tabla 17: Datos valoración de salsa............................................................................................................94
Tabla 18. Datos Resistencia cables..............................................................................................................96
Tabla 19: Datos System Hospital.................................................................................................................99
Tabla 20: Datos ejemplo correlación lineal...............................................................................................113
Tabla 21: Datos ejemplo Grava.................................................................................................................116
Tabla 22: Datos ejercicio Correlación múltiple.........................................................................................124
Tabla 23: Evolución Precios por m2 de departamentos en La Molina, Miraflores, San Borja, San Isidro y
Surco por trimestres...................................................................................................................................133
Tabla 24: Desarrollo del cálculo de los componentes estacionales...........................................................136
Tabla 25: Componentes estacionales no estandarizados y sus promedios................................................136
Tabla 26: Índices estacionales de Precios de departamentos por m2........................................................137
Índice de figuras
Figura 1. Marco muestra Invest...................................................................................................................12
Figura 2: Lotto sphere..................................................................................................................................13
Figura 3. Muestreo Sistemático...................................................................................................................13
Figura 4: Muestreo Estratificado.................................................................................................................13
Figura 5: Muestreo por conglomerados.......................................................................................................13
Figura 6: Nivel de confianza. Tomado de Estadística,................................................................................17
Figura 7. Diagrama tallo – hoja...................................................................................................................22
Figura 8. Diagrama de caja y bigotes..........................................................................................................23
Figura 9: Distribución t-student a diferentes tamaños de muestra...............................................................24
Figura 10 Formas de plantear hipótesis, tomado de (Triola, Estadística, 2009)..........................................36
Figura 11: Formas de reglas de decisión, por Sergio Jurado (Jurado, 2017)..............................................36
Figura 12: Formas de plantear una conclusión. Tomado de Estadística por Mario Triola (2009)..............37
Figura 13: Gráfico de prueba de normalidad Vida útil................................................................................43
Figura 14: Gráficos P-P de normalidad para las muestras 1 y 2. Elaboración: propia................................55
Figura 15: Curva de la distribución F tomado de Sergio Jurado (Jurado, 2017).........................................69
Figura 16. Gráfica de medias: tiempos de recorrido. Tomado de Marchal Lind (2012).............................76
6
Universidad Continental | Manual
Figura 17: Curva Ji cuadrada por (Jurado, Estadística Inferencial, 2017)...................................................81
Figura 18; Gráfica de dispersión ejemplo de correlación Fuente: Elaboración propia.............................103
Figura 19: Gráfico de dispersión ejemplo..................................................................................................113
Figura 20: Formas de gráficos de dispersión.............................................................................................114
Figura 21: Gráfico de dispersión ejemplo cálculo de coeficiente de correlación......................................116
Figura 22: Resultados probables para x = 28, tomado de Manual de Estadística Inferencial por Sergio
Jurado (2017).............................................................................................................................................121
Figura 23: Ejemplo de serie temporal tomado de Manual Estadística Inferencial por Sergio Jurado (2017)
...................................................................................................................................................................128
Figura 24: Formas de la componente Tendencia en la serie temporal, obtenido de Manual de Estadística
Inferencial por Sergio Jurado (2017).........................................................................................................129
Figura 25: Componente estacional en una serie temporal, obtenido de Manual de Estadística Inferencial
por Sergio Jurado (2017)...........................................................................................................................129
Figura 26: Cálculo de promedios móviles 3 obtenido de Manual de Estadística Inferencial por Sergio
Jurado (2017).............................................................................................................................................130
Figura 27: Gráfica de promedio móvil 3 obtenido de Manual de Estadística Inferencial por Sergio Jurado
(2017).........................................................................................................................................................130
Figura 28: Calculo de promedio móvil 4, obtenido de Manual de Estadística Inferencial por Sergio Jurado
(2017).........................................................................................................................................................131
Figura 29: Grafica promedio móvil 4, obtenido de Manual de Estadística Inferencial por Sergio Jurado
(2017).........................................................................................................................................................131
Figura 30: Estacionalidad. Fuente: propia.................................................................................................132
Figura 31: Gráfica de componente cíclico (Universidad de Valladolid, 2012).........................................132
Figura 32: Disposición de datos para el cálculo de la Serie Temporal. Fuente y elaboración: Propia......134
Figura 33: Gráfica en Excel de una serie temporal, Elaboración: propia..................................................134
Figura 34: Desarrollo del cálculo de promedios móviles 4, Elaboración: Propia....................................135
Figura 35: Cálculo de Promedios móviles centrados.................................................................................135
7
Universidad Continental | Manual
INTRODUCCION:
Pretendemos que el manual apoye los procesos de aprendizaje de manera básica - avanzada tomando
como base el libro “Estadística” de Mario Triola (12ª y 15ª ed.), y en concordancia con los conceptos
estadísticos actuales.
Para una mejor comprensión del material se requiere que el estudiante tenga conocimientos básicos de
estadísticos de tendencia central, de variación y forma, así de las distribuciones de probabilidades
Binomial, Potencial, de Poisson y Normal
El manual está organizado en cuatro Unidades que corresponde a las unidades didácticas que se
desarrollan en la asignatura virtual:
En cada unidad se plantean ejercicios desarrollados, como preguntas de auto evaluación que se pueden
realizar en línea en el aula virtual. Se han planteado lecturas que ayuden a mirar lo desarrollado con
relación a una realidad de gestión.
Organiza tu tiempo para que obtengas buenos resultados, la clave está en encontrar el equilibrio entre tus
actividades personales y las actividades que asumes como estudiante. El estudio a distancia requiere
constancia, por ello es necesario encontrar la motivación que te impulse a hacer mejor cada día.
El autor.
8
Universidad Continental | Manual
Organización de la Asignatura
Resultado de aprendizaje de la asignatura
Unidades didácticas
UNIDAD 1 UNIDAD 2 UNIDAD 3 UNIDAD 4
Muestreo y diseños Prueba de hipótesis e Análisis de varianza, Correlación, regresión
experimentales, inferencias. experimentos y series de tiempo.
estimados y tamaños de multinomiales y tablas
muestra. de contingencia y
estadística no
paramétrica.
9
Universidad Continental | Manual
UNIDAD 1
MUESTREO Y ESTIMACIÓN DE PARÁMETROS
Diagrama de organización de la Unidad 1
Resultado de aprendizaje de la unidad: Al finalizar la unidad, el estudiante será capaz de aplicar los métodos de
muestreo y de estimación de parámetros a partir de una muestra aleatoria proveniente de una población.
10
Universidad Continental | Manual
1. Muestreo y diseños experimentales.
La estadística que desarrolla cuestiones como el caso de desarrollar una descripción de las características
de un grupo de consumidores, detallando sus hábitos de consumo mediante gráficas, tablas y medidas
como la media, la desviación estándar, se denomina Descriptiva.
Su alcance es limitado a solo entablar una descripción del grupo del que se tomaron las mediciones, los
datos, pero con normalidad eso es insuficiente. En muchos casos se requiere información del todo.
En esta sección abordamos la explicación de técnicas estadísticas que permiten desarrollar estimaciones
de las características de la población utilizando datos y mediciones de una muestra.
Al realizar estimación con una muestra, es comprensible que primero entablemos una revisión de los
métodos de muestreo de tal manera que garanticemos que los datos cumplan con dos condiciones básicas
para ser válidos: Aleatoriedad y Representatividad.
El autor.
11
Universidad Continental | Manual
2. Definiciones básicas
Iniciamos nuestro manual haciendo un recorrido por conceptos básicos como:
Es entonces claro que no se puede indagar científicamente nada sin antes tener en claro como
es nuestra población y si de ella tomamos una parte, como es nuestra muestra.
A. Población:
Es el conjunto de todos los sujetos, las cosas o los eventos sobre los que se quiere
investigar con respecto a una particularidad dada. A la población le correspondería la
colección completa de datos –casi siempre imposible de elaborar por su tamaño u otras
condiciones– sobre los cuales se harán inferencias.
Censo “es el conjunto de datos de todos los miembros de la población” (Triola, 2018, p.
26)
B. Muestra:
A. Métodos Probabilísticos:
12
Universidad Continental | Manual
Aleatorio simple: “es un método que se emplea para
seleccionar una muestra de n objetos de una población
en el que cada miembro de la población se elige
estrictamente al azar, cada miembro de la población se
elige con la misma probabilidad y todas las muestras
posibles de un tamaño dado (n), tienen la misma
probabilidad de ser seleccionadas. Este método es tan
frecuente que generalmente se suprime el adjetivo
simple y la muestra resultante se denomina muestra
aleatoria” (Newbol, Carlson, & Thorne, 2008, p. 3).
Figura 2: Lotto sphere.
Se realiza mediante un sorteo. Tomado de banco de imágenes
DLPNG.
B. Métodos No probabilísticos:
Los métodos no probabilísticos son aquellos que emplean solo el criterio del que
investiga, por ello acarrean muchas dudas sobre la representatividad de la muestra
obtenida.
C. Ficha Técnica
13
Universidad Continental | Manual
Es el resumen del diseño del proceso de muestreo, en ella se explican las condiciones que
hacen válida una muestra. Ejemplo:
Una ficha técnica es el documento que obligatoriamente se presenta al presentar los resultados
de una encuesta. En este documento se expone las características del estudio realizado y que
respaldan la coherencia de la información obtenida en la muestra.
Ejemplo
Título del estudio: Encuesta de Opinión en Lima Metropolitana noviembre 2009
Representatividad: En los distritos que forman parte del universo y que están incluidos en el
marco muestral se encuentra el 95.88% de la población electoral total de
la provincia de Lima.
Error y nivel de confianza estimados: ±4.32% con un nivel de confianza del 95%, asumiendo
50%-50% de heterogeneidad, bajo el supuesto de muestreo aleatorio
simple.
Ponderación: En Lima Metropolitana los datos se ponderaron en función del peso de los
estratos en la población total.
14
Universidad Continental | Manual
Financiamiento: Pontificia Universidad Católica del Perú.
Email: iop@pucp.edu.pe
3. Diseño experimental
Las investigaciones pueden seguir dos tipos de diseños de manera general: Observacional y
Experimental.
A. Preexperimental.
En este diseño se aplica un estímulo o tratamiento a un grupo que es la única muestra que
se puede alcanzar (la elección no es aleatoria) y se aplica una medición.
En otros casos se puede efectuar dos mediciones; una medición antes de aplicar el
estímulo y otra después de aplicarlo: G O1 x O2
Su deficiencia radica en que como no se emplea la aleatoriedad para elegir a los sujetos,
no hay validez interna y no se puede validar la causalidad.
B. Diseño Cuasiexperimental.
- Se aplican dos mediciones; una antes de aplicación del estímulo y otra después.
GE 01 x O2
GC 01 x O2
15
Universidad Continental | Manual
Igualmente, su deficiencia radica en que como no se emplea la aleatoriedad para elegir a
los sujetos, no hay validez interna y no se puede validar la causalidad.
- Se tiene control de la situación experimental (validez interna) que se puede lograr con la
elección aleatoria de los sujetos, varios grupos de comparación, equivalencia entre los
grupos al inicio del experimento.
RGC O1 x O2
RGE O1 x O2
16
Universidad Continental | Manual
4. Estimación de la proporción poblacional y cálculo del tamaño de su muestra
1. Estimación de la proporción poblacional.
Cuando iniciamos el proceso de inferencia estadística, es necesario atender al desarrollo de las
estimaciones.
En el desarrollo de las investigaciones, se requiere siempre determinar cuales son las características
de la población que responden a las preguntas o cuestiones que investigamos. Los valores de estas
características son en muchas ocasiones difíciles de obtener y por ello se utilizan muestras. Con los
datos de la muestra calculamos los valores de las características de nuestro interés y esperamos que
estos valores sean iguales sino muy cercanos a los verdaderos valores en la población.
Trasladar la veracidad de nuestros cálculos empleando una muestra hacia población es lo que
denominamos Inferencias. Estas inferencias nos dan la oportunidad de determinar cuáles son los
valores de las características de una población con cierta precisión basada en las probabilidades de un
muestreo aleatorio.
Estimación puntual
Como afirma (Triola, 2009, p. 321), Si . . . .”empleamos la proporción muestral ^p, obtenida
de una muestra aleatoria y ^p es un valor único podemos asegurar que es el valor que más se
acerca al valor verdadera de la proporción proporcional p”.
Ejemplo: “Hacemos referencia a una encuesta de Gallup aplicada a 1487 adultos, en ella, 639
de los encuestados dijeron que tienen una página de Facebook. Con base en ese resultado,
encuentre la mejor estimación puntual de la proporción de todos los adultos que tienen una
página de Facebook” (Triola, 2018, p. 300).
SOLUCIÓN
Requisitos
Figura 6: Nivel de confianza. Tomado
a. La muestra es aleatoria simple. de Estadística, por Mario Triola,
2012.
b. Se cumplen las condiciones de la
binomial: n, número fijo de ensayos independientes, 2 posibles resultados (éxito
fracaso) y las probabilidades constantes de ambos.
c. Existen por lo menos 5 éxitos y/o 5 fracasos para que la distribución normal sea
una buena aproximación a la distribución normal.
17
Universidad Continental | Manual
Fórmula:
p= ^p ± Z α /2
√ ^p∗(1− ^p )
n
Ejemplo: “En el problema del capítulo observamos que una encuesta de Gallup aplicada a
1487 adultos demostró que 639 de los encuestados tiene páginas de Facebook. Los resultados
de la muestra son n = 1487 y x = 639” (Triola, 2018, p. 300).
a Determine la estimación del intervalo de confianza del 95% para la proporción poblacional
p.
b. “Con base en los resultados, ¿podemos concluir con seguridad que menos de 50% de los
adultos tienen páginas en Facebook? Asumiendo que usted es un periodista, escriba un breve
artículo que describa con precisión los resultados e incluya toda la información relevante”
(Triola, 2018, p. 304).
Verificando:
Se cumple que la muestra es aleatoria ya que los procedimientos de Gallup así lo hacen. Hay
dos posibles resultados: tienen o no tienen una página de Facebook. Número de ensayos fijo,
probabilidad constante y hay más de 5 éxitos y fracasos.
Calculando:
Datos Procedimiento
√
n = 1487 ^p∗(1− ^p )
a. p= ^p ± Z α /2
x = 639 n
√
^p = 0,4297 0.4297∗(1−0.4297)
p=0.43± 1,96∗¿
NC = 95% 1487
= 0,05
Z/2 = 1,96
18
Universidad Continental | Manual
2
pq Z α / 2
Cuando se conoce ^p: n= 2
E
2
(0,25)Z α /2
Cuando no se conoce ^p: n= 2
E
de ^p
SOLUCIÓN
0,169(0,831) ( 1,96 2 )
n= 2
0.04
n = 337,194 = 338 (redondeado)
(0,25)(1,962 )
n=
0,042
n = 600,25 = 601 (redondeado)
INTERPRETACIÓN “Para tener una confianza del 95% de que nuestro porcentaje muestral
está dentro de cuatro puntos porcentuales del porcentaje verdadero para todos los hogares,
debemos seleccionar al azar y encuestar 601 hogares. Comparando este resultado con el
tamaño muestral de 338 calculado en el inciso a), podemos ver que, si no tenemos
conocimiento de un estudio previo, se requiere una muestra más grande para obtener los
mismos resultados que cuando se puede estimar el valor de . Pero ahora recurramos al sentido
19
Universidad Continental | Manual
común: sabemos que el uso del correo electrónico está creciendo tan rápidamente que el
estimado de 1997 es muy antiguo para ser de utilidad. En la actualidad, mucho más del 16.9%
de los hogares estadounidenses utilizan correo electrónico. Siendo realistas, necesitamos una
muestra mayor que 338 hogares. Suponiendo que en realidad no conocemos la tasa actual de
uso de correo electrónico, deberíamos seleccionar al azar 601 hogares. Con 601 hogares,
tendremos una confianza del 95% de que estamos dentro de cuatro puntos porcentuales del
porcentaje verdadero de hogares que usan correo electrónico” (Triola, 2018).
Se debe precisar que se pueden presentar dos condiciones: Se conoce la desviación estándar de la
población o no se conoce.
Cuando hacemos una estimación, nos referimos al hecho de calcular un valor o valores que
nos permitan acercarnos al valor verdadera del parámetro, es decir tratamos de determinar un
valor lo más cercano, por ejemplo, a la media poblacional.
Lo primero que se puede usar en este cálculo es la media muestral x . Si la muestra de la que
calculamos esta media muestral es “aleatoria”, entonces tendremos altas probabilidades para
asegurar que esta media es muy cercana al valor de la media poblacional . Por ello
afirmamos que la media muestral tiene un valor tal que la hace el mejor estimador de la media
poblacional. Podemos decir esto en base a las siguientes razones:
1. “Para todas las poblaciones, la media muestral x es un estimador sin sesgo de la media
poblacional , lo que significa que la distribución de medias muestrales tiende a concentrarse
alrededor del valor de la media poblacional m. Es decir, las medias muestrales no tienden
sistemáticamente a sobreestimar el valor de , ni tienden sistemáticamente a subestimar el
valor de , sino que tienden a coincidir con este valor ” (Triola, 2018, p. 339).
2. Para muchas poblaciones “la distribución de las medi as muestrales x tiende a ser más
consistente (con menos variación) que la distribución de otros estadísticos muestrales” (Triola,
2018, p. 338 ).
Utilice esta muestra para calcular el mejor estimado puntual de la media poblacional de los
pulsos cardiacos de todas las mujeres.
20
Universidad Continental | Manual
SOLUCIÓN “Para los datos muestrales, x = 76,3. Como la media muestral x es el mejor
estimado puntual de la media poblacional , concluimos que el mejor estimado puntual de los
pulsos cardiacos de todas las mujeres es 76,3” (Triola, 2018, p.338).
“Un intervalo de confianza nos ofrece información que nos permite comprender mejor la
exactitud del estimado. El intervalo de confianza se asocia con un nivel de confianza, como
0,95 (o 95%). El nivel de confianza nos da la tasa de éxitos del procedimiento que se utiliza
para construir el intervalo de confianza. Como se describió en la sección anterior, es el
complemento del nivel de confianza. Para un nivel de confianza de 0.95 (o 95%), = 0,05.
Para un nivel de confianza de 0,99 (o 99%), = 0,01” (Triola, 2018, p. 339).
σ
μ = x ± Z α /2 *
√n
Ejemplo:
SOLUCIÓN
Datos Procedimiento
n = 40 σ
μ = x ± Z α /2 *
x = 76.3 √n
= 12.5 12,5
μ = 76,3 ±1,96 *
NC = 95%
√ 40
= 0.05
72,43 < < 80,17
/2 = 0.025
Z/2 = 1.96
La distribución t es una distribución normal modificada que depende de los grados de libertad:
gl = n – 1
21
Universidad Continental | Manual
En la tabla se tiene que buscar los valores críticos con el valor de los gl ubicado en la primera
columna a la derecha y el valor de en la primera fila.
s
μ = x ± t α/ 2 *
√n
Ejemplo:
Como indica (Triola, 2018), en el diagrama de tallo y hojas que aparece al margen, se incluyen
las edades de solicitantes que no lograron un ascenso (según datos de “Debating the Use of
Statistical Evidence in Allegations of Age Discrimination”, de Barry y Boland, American
Statistician, vol. 58, núm. 2). Existe el tema más importante de si ciertos solicitantes fueron
víctimas de discriminación por edad, pero por ahora nos enfocaremos en el simple aspecto de
utilizar esos valores como una muestra con el propósito de estimar la media de una población
más grande. Suponga que la muestra es aleatoria simple y utilice los datos muestrales con un
nivel de confianza del 95% para calcular 3 4 7 7 8
el intervalo de confianza para
4 1 2 3 4 4 5 5 5 6 8 8
SOLUCIÓN
5 3 3 4 4 5 6 7
REQUISITOS Primero debemos verificar
6 0
que los dos requisitos para esta sección se
satisfacen. Estamos suponiendo que la
muestra es aleatoria simple. Ahora Figura 7. Diagrama tallo – hoja.
revisamos el requisito de que la población Fuente: Elaboración propia
se distribuya normalmente o n = 30”. Puesto que n
= 23, debemos verificar que la distribución sea
aproximadamente normal. La forma de la gráfica
de tallo y hojas sugiere una distribución normal.
Además, una gráfica cuantilar normal confirma que
los datos muestrales provienen de una población
con una distribución aproximadamente normal (no
se muestran datos atípicos). Por consiguiente, los
requisitos se satisfacen y procedemos con los Figura 8. Diagrama de caja y bigotes.
métodos de esta sección (Triola, 2018). Fuente: elaboración propia
Datos
n = 23 s
μ = x ± t α/ 2 *
x = 47.0 √n
s = 7.2 7,2
μ = 47,0 ± 2,074 *
NC = 95% √23
= 0.05
Tabla A - 3
22
Universidad Continental | Manual
2.1. La distribución t-student:
De acuerdo con (Newbol, Carlson & Thorne, 2008): “ . . .dada una muestra aleatoria de n
observaciones, de media x y desviación típica s, extraída de una población que sigue una
distribución normal de media , la variable aleatoria t sigue la distribución t de Student con (n
- 1) grados de libertad y viene dada por:
x−μ
t= s
√n
La distribución t-student es una distribución normal estándar “modificada” “. . . Al igual que
ella tiene una media igual a cero. La distribución “t” es una distribución con diferentes formas
de acuerdo a los grados de libertad de la muestra (gl=n-1):
23
Universidad Continental | Manual
Tabla1:
Elección entre z y t
σ 2∗Z 2α / 2
n=
E2
24
Universidad Continental | Manual
3. Estimación de la varianza poblacional y desviación estándar y cálculo del
tamaño de su muestra.
1. Intervalo de confianza:
Los requisitos para obtener un intervalo de confianza para la varianza o para la desviación estándar
son:
- La muestra es aleatoria.
√ ( n−1 )∗s 2
❑D
2
¿ σ < ¿
√
( n−1 )∗s 2
❑I
2
Donde :
n: Tamaño de la muestra.
❑2I = El valor crítico en la distribución Ji cuadrado ubicado al lado izquierdo (Triola, 2009).
Ejemplo:
En el desarrollo del control de calidad de lentes de contacto se verifican las medidas de grosor de
cierta línea. La desviación estándar es un indicador de calidad por lo que se requiere controlarla. Una
muestra de 51 lentes arroja un promedio de 0,034mm con una desviación estándar muestral de
0,0012mm. Determine un intervalo de confianza al 95% para la desviación estándar poblacional.
Datos
n = 51 Con la fórmula:
s = 0,0012mm
√ √
NC = 95%
( n−1 )∗s 2 ( n−1 )∗s 2
2
¿ σ < ¿ 2
/2 = 0,025 ❑D ❑I
En la tabla A-4 del
Apéndice B:
Reemplazando:
2 derecho:
gl = 51 – 1 = 50
25
Universidad Continental | Manual
√ √
/2 = 0,025 ( 51−1 )∗0,00122 ¿ σ < ¿ ( 51−1 )∗0,00122
71,420 32,357
−3 −3
1.004 x 10 <σ <1.492 x 10
2 Izquierdo:
gl = 51 – 1 = 50
1 – /2 = 0,975
2. Tamaño de muestra:
El tamaño muestral se puede calcular de despejar la fórmula de la distribución Ji cuadrada para las
varianzas:
2
2
(n−1) s
❑ = 2
σ
Se puede despejar:
❑2∗σ 2
n= +1
s2
El coeficiente s2/2 = error de muestral E de la varianza.
2
❑
2
n= s +1
2
σ
2
n=❑ +1
E
26
Universidad Continental | Manual
De la Teoría a la práctica:
Lectura 1:
Los ingresos per cápita de América Latina llevan 60 años estancados – El País
(Manetto, 2018):
“América Latina necesita incrementar con urgencia sus índices de productividad. La brecha que la separa,
en su conjunto, de las economías más avanzadas es aún profunda y la fotografía del pasado reciente
demuestra que la situación, en lo sustancial, no ha mejorado en los últimos 60 años. Así lo indica CAF-
Banco de Desarrollo de América Latina, que este jueves ha presentado en Bogotá un informe que arroja
un diagnóstico sobre el panorama socioeconómico lleno de desafíos e insta a los Gobiernos de la región a
poner en marcha una agenda de reformas estructurales” (Manetto, 2018).
"El habitante latinoamericano promedio tiene una cuarta parte del ingreso de un estadounidense típico.
Incluso dentro del grupo de países más avanzados de la región, el nivel de ingreso per cápita actualmente
fluctúa aproximadamente entre 20% y 40% del de Estados Unidos", señala el informe. "En el año 1960 el
habitante latinoamericano promedio tenía un 20% del ingreso de un estadounidense típico. Hoy, la
situación sigue siendo prácticamente la misma. Otros países, por el contrario, han mostrado importantes
avances en el mismo periodo: Corea del Sur, por ejemplo, pasó de un ingreso per cápita del 7% del de
Estados Unidos a uno del 67% en ese período".
“A eso se añade que "la productividad laboral", según esta institución, "es de alrededor del 30% con
relación a la de Estados Unidos, en contraste con la del Reino Unido, del 75%, Australia, del 82%, o
Alemania, del 90%". Con estas premisas, explica a EL PAÍS Pablo Sanguinetti, vicepresidente de
Conocimiento de CAF, América Latina afronta retos enormes relacionados con el crecimiento y la
productividad de las economías, cuyas disfunciones están a la base de esta brecha. "La productividad es
baja en todo, el problema es transversal, de la infraestructura al sector financiero, y hay que trabajar para
mejorarla en cada sector", apunta. Al mismo tiempo, se debe hacer frente a la alta informalidad”
(Manetto, 2018).
“¿Qué pueden hacer las autoridades? En opinión de Sanguinetti, se trata de lograr "mayor competencia,
mejor acceso a insumos, un mejoramiento de las relaciones laborales y finalmente el acceso a
financiamiento". Eso no significa que hasta ahora los Gobiernos no hayan hecho esfuerzos. El Banco de
Desarrollo reconoce "que muchos países de la región han llevado a cabo planes para impulsar la
productividad". No obstante, en líneas generales el insuficiente ritmo de crecimiento tiene que ver con
"bajos niveles de innovación, barreras a la financiación de empresas e individuos, brechas en la adopción
de nuevas tecnologías, marcos regulatorios que no suelen propiciar la entrada y salida de empresas o los
centros logísticos poco desarrollados para comercializar exitosamente productos y servicios" (Manetto,
2018).
“El estudio de CAF apuesta por aplicar una agenda de reformas institucionales que se han abordado
durante dos días en un encuentro de alrededor de 500 líderes latinoamericanos. Ayer recibieron la
bienvenida del presidente de Colombia, Iván Duque, quien prometió acabar con la informalidad para que
los ingresos medios superen los 20.000 dólares per cápita en tres décadas, y debatieron las fórmulas para
superar los obstáculos de la productividad urbana y mejorar la calidad del empleo (Manetto, 2018).
Esas reformas deben, según el Banco, no solo promover la competencia, sino "fomentar la cooperación
entre empresas mediante el desarrollo de conglomerados productivos; impulsar ecosistemas innovadores
y la adopción tecnológica; mejorar el acceso al financiamiento de empresas y reducir las barreras de
oferta y demanda para el acceso a recursos financieros formales por parte de empresas e individuos; o
27
Universidad Continental | Manual
limitar los marcos regulatorios y políticas hostiles que dificultan la entrada y salida de empresas y afectan
la eficiencia en la asignación de recursos productivos" (Manetto, 2018).
“Luis Carranza Ugarte, presidente ejecutivo de CAF, resumió esos desafíos con una pregunta y un toque
de ironía: "¿Cuánto es dos más dos?". La respuesta no es tan obvia, en realidad, sobre todo en economía.
"Normalmente, el economista se demora un tiempo y dice… ¿Cuánto quieres que sea? En economía dos
más dos no siempre es cuatro. Dos más dos son ocho, esa es la historia de los países europeos. En
Latinoamérica dos más dos en promedio han sido cuatro, y eso no es suficiente para llegar a la
prosperidad", afirmó. La pelota está ahora en el tejado de los sectores productivos y de los Gobiernos de
la región” (Manetto, 2018).
28
Universidad Continental | Manual
GLOSARIO DE LA UNIDAD 1
Aleatorio: “Que depende del azar o no sigue una pauta definida': «La grabación de las conversaciones se
realizó de forma aleatoria»” (Real Academia Española, 2019)
Nivel de confianza “Si se extraen repetidamente muestras aleatorias de la población, el verdadero valor
del parámetro se encontrará en el 100(1 – a)% de los intervalos calculados de esta forma” (Newbol,
Carlson, & Thorne, 2008, p. 123).
Curva de densidad Gráfico que representa el área que se produce debajo de una curva generada por una
distribución de probabilidad (Triola, 2009).
Datos Información observada, obtenida de una característica o variable en una unidad de observación
(Triola, 2009).
Datos continuos resultan de un infinito de posibles valores que corresponden a alguna escala continua
que cubre un rango de valores sin huecos, interrupciones o saltos (Triola, 2009).
Datos cualitativos Información en una unidad de observación debido a una variable de tipo cualitativa
(Jurado, 2017).
Datos cuantitativos Información en una unidad de observación debido a una variable de tipo cuantitativa
(Jurado, 2017).
Datos de atributo Información en una unidad de observación debido a una variable de tipo cualitativa
(Jurado, 2017).
Datos discretos Información en una unidad de observación debido a una variable de tipo discreta, que
toma infinitos valores que pertenecen al conjunto de números enteros (Triola, 2009).
Datos numéricos Datos que consisten en números que representan conteos o mediciones (Jurado, 2017).
Desviación estándar Medida de variación igual a la raíz cuadrada de la varianza (Jurado, 2017).
Distribución muestral Distribución de las medias o las proporciones muestrales y que por el teorema del
límite central se determina normal (Jurado, 2017).
Distribución normal Distribución de probabilidad con forma de campana, descrita algebraicamente con
la fórmula (Jurado, 2017):
b ( x− μ) 2
1 .dx
∫e
2
P ( a< x <b ) = 2σ
x∈R
σ √2 π a
Se caracteriza por ser simétrica, con valores iguales para su media y mediana.
Distribución normal estándar Distribución normal con una media igual a cero y una desviación
estándar igual a 1 (Jurado, 2017).
Distribución t Distribución normal que suele estar asociada con datos muestrales de una población con
una desviación estándar desconocida (Jurado, 2017).
Estadístico Medida que se calcula o identifica con los datos de una muestra como, por ejemplo; La
proporción muestral ( ^p) la media muestral ( x ), la desviación estándar muestral (s), etc, (Jurado, 2017)
Estimación Calcular o determinar el valor de un parámetro a partir de los datos que se tienen en una
muestra .Jurado, 2017)
29
Universidad Continental | Manual
Margen de Error Es el error máximo (E) que se puede cometer al realizar una estimación. Está
supeditado al valor puntual de z o t según el nivel de confianza utilizado en la estimación. (Jurado, 2017)
Parámetro Medida que se calcula o identifica con los datos de una población como, por ejemplo; La
proporción poblacional (p) la media poblacional (µ), la desviación estándar (σ), etc. (Jurado, 2017)
Valor crítico Es una puntuación de alguna distribución como la normal estándar, t, Chi cuadrada, F u
otra, que separa el área de las puntuaciones más probables de aquellos menos probables (Triola, 2018).
Bibliografía unidad 1
Alfaro, D., & Macera, D. (2011). Una mirada a los programas sociales [mensaje en un blog]. Obtenido
de https://www.grade.org.pe/novedades/una-mirada-a-los-programas-sociales/
Anderson, D., Dennis, S., & Thomas, W. (2012). Estadística para negocios y economía. México D. F.:
CENGAGE Learning.
Banco Central de Reserva del Perú. (2019). Banco Central de Reserva del Perú. Recuperado el 21 de
junio de 2019, de BCRP Data: https://estadisticas.bcrp.gob.pe/estadisticas/series/trimestrales
Devore, J. (2008). Probabilidad y estadística para ingenieriía y ciencias. México D. F.: CENGAGE
Learning.
Díaz, A. (2013). Estadística aplicada a la administración y la economía. Mexico D. F.: Mc Graw Hill
Education.
Díaz, A. (2013). Estadística aplicada a la administración y la economía. México D. F.: McGraw Hill.
Elgin Community Collage. (2016). Muestreo sistemático [figura]. Recuperado el 3 de febrero de 2018, de
Elgin.edu: https://faculty.elgin.edu/dkernler/statistics/ch01/1-4.html
Hernandez, R., Fernandez, C., & Baptista, P. (2014). Metodología de la investigación. Mexico D. F.: Mc
Graw Hill Education.
Jurado, S. (2017). Curvas y áreas. Regla de decisión [figura]. Huancayo: Universidad Continental.
León, M. (18 de junio de 2019). Las balanzas dle bienestar. Recuperado el 19 de junio de 2019, de El
País: https://elpais.com/elpais/2019/06/17/opinion/1560781691_381446.html
Levin, R., & Rubin, D. (2004). Administración para Administración y Economía. Mexico D. F.: Pearson
Education.
Lind, D., Marchal, W., & Wathe, S. (2012). Estadística aplicada a los negocios y la economía (15a ed.).
Mexico D. F.: Mc Graw Hill Education.
Manetto, F. (9 de Noviembre de 2018). Los ingresos per cápita de América Latina llevan 60 años
estancados. El País, pág. 12. Recuperado el 24 de febrero de 2019, de
https://elpais.com/internacional/2018/11/08/colombia/1541659854_428801.html
30
Universidad Continental | Manual
Mendenhal, W. (2010). Introducción a la estadística y la probabilidad. México D. F.: CENGAGE
learning.
Newbol, P., Carlson, W., & Thorne, B. (2008). Estadística para Administración (6a ed.). (R. Esther,
Trad.) Madrid: Pearson Education.
Persekutuan, W. (28 de setiembre de 2008). Blogger Ng Ooi Pin @ Json. Recuperado el 21 de julio de
2016, de RAG 132 BUILT ENVIRONMENT & HUMAN SETTLEMENTS:
http://ngooipin.blogspot.pe/
Pontificia Universidad Catolica del Perú. (2009). Instituto de Opinión Pública - Data. (I. d. Pública,
Editor) Obtenido de https://docs.google.com/viewer?url=http://iop-data.pucp.edu.pe/media/
archivos/2009/11/1/IOP_1109_01_F.pdf&embedded=true0
Real Academia Española. (2019). Diccionario de la Lengua española (pagina web). (R. A. Española,
Editor) Obtenido de http://lema.rae.es/dpd/srv/search?key=aleatorio
Triola, M. (2018). Estadística (12a ed.). (J. Murrieta, Trad.) Mexico D. F.: Pearson Education.
Wikimedia org. (2017). Distribución t con diferentes tamaños de muestra [figura]. Obtenido de
Wikilibros: https://es.wikibooks.org/wiki/Tablas_estad%C3%ADsticas/Distribuci
%C3%B3n_t_de_Student
31
Universidad Continental | Manual
UNIDAD 2:
PRUEBA DE HIPÓTESIS E INFERENCIAS
Diagrama de organización de la Unidad 2
Resultado de aprendizaje de la unidad: Al finalizar la unidad, el estudiante será capaz de aplicar pruebas de
hipótesis para la media, proporción, varianza y desviación estándar poblacional a partir de una muestra aleatoria y
dos muestras aleatorias.
Conocimientos Habilidades Actitudes
Tema n° 1. Prueba de 1. Identifica las clases de hipótesis. Valora la importancia de las
hipótesis para la proporción 2. Plantea pruebas de hipótesis. pruebas de hipótesis e interpreta
de una población y Prueba 3. Identifica correctamente los correctamente los resultados para
de hipótesis para la media de valores críticos para la una buena toma de decisiones.
una población. aplicación de las pruebas de
1. Prueba de hipótesis para la hipótesis.
proporción de una población 4. Determina el procedimiento
2. Prueba de hipótesis para la pertinente de la prueba de
media de una población. hipótesis.
A. Con conocida 5. Realiza la interpretación del
B. Con no conocida resultado de la prueba de
hipótesis
Tema n° 2. Inferencias
acerca de dos proporciones. Actividad 1:
1. I Parcita del foro de discusión
Tema n° 3. Inferencias Importancia de las pruebas de
acerca de dos medias hipótesis.
independientes. Actividad 2:
1. Se conocen 1 y 2 Evaluación del tema N° 1 y el
Tema N° 2
2. No se conocen 1 y 2, y
se asumen iguales.
3. No se conocen 1 y 2, y
no se asumen iguales.
Tema n° 4. Inferencias de
dos medias con muestras
dependientes.
32
Universidad Continental | Manual
Tema n° 1. Prueba de hipótesis para la proporción de una población y Prueba de
hipótesis para la media de una población.
En esta Unidad, exponemos los métodos iniciales que hacen posible probar una afirmación realizada
sobre alguna propiedad de una población, como por ejemplo pudiera ser el caso de una publicación en
una revista especializada que menciona que, en América Latina, el promedio de inversión en Educación
de las familias es el más bajo de todas las regiones del mundo, a excepción de África. ¿Cuán importante
puede ser responder a la interrogante que se hace respecto de la veracidad de este tipo de afirmaciones?
Conocer la veracidad de estas afirmaciones resulta importante por cuanto puede aportar un conocimiento
clave para la toma de decisiones en el mercadeo.
El desarrollo de las pruebas de Hipótesis en este acápite solo considerara los casos en los que estén
involucradas una o dos muestras y se quieran probar valores de medias, proporciones y varianzas.
1. Prueba de Hipótesis:
1.1. Hipótesis
En estadística, una hipótesis es una aseveración o afirmación acerca de una propiedad de una
población. (Jurado, 2017)
A. Planteamiento de Hipótesis
Figura 10: Formas de plantear hipótesis. Tomado de Una hipótesis alterna tiene un
planteamiento complementario y opuestos al de la Hipótesis nula, por Triola, 2009.
33
Universidad Continental | Manual
B. Planteamiento de una regla de decisión
/2 1– /2 1– 1–
-Z +Z -Z Z
Valor crítico Valor crítico Valor crítico Valor crítico
H1 p 0.50 H1 < 50.23 H1 p > 0,23
Dos colas Una cola Una cola
Figura 11: Formas de reglas de decisión, Tomado de Estadística Inferencial. Manual de Auto
aprendizaje, por Sergio Jurado, 2017. (Jurado, 2017)
Donde las áreas sombreadas representan la probabilidad de un valor muy extremo del
estadístico y por tanto sirven para rechazar H0 como verdadera.
Las áreas blancas 1 – , sirven para definir cuando aceptamos H0 como verdadera.
Un valor crítico es cualquier valor que separa la región crítica (donde rechazamos la
hipótesis nula) de los valores del estadístico de prueba que no conducen al rechazo de la
hipótesis nula. Los valores críticos dependen de la naturaleza de la hipótesis , de la alterna
H1, de la distribución muestral que se aplique (z, t, 2 o F) y del nivel de significancia .
El estadístico de prueba es el valor calculado con los datos de la muestra. Puede ser un valor
z, t, 2 o F, de acuerdo con el parámetro sometido a prueba.
^p − p x−μ 2
( n−1 ) s 2 s mayor
√
z= pq t= s =
2
F= 2
σ2 S menor
n √n
D. Decisión sobre H0
Si el Estadístico de prueba cae bajo la región crítica, se debe rechazar Ho como verdadera,
caso contrario se acepta.
E. Conclusión
34
Universidad Continental | Manual
Figura 12: Formas de plantear una conclusión. Tomado de Estadística, por Mario Triola, 2009.
- Se tiene un experimento que cumple con las condiciones de una distribución binomial.
Estadístico de prueba:
p^ − p
Z=
√ p(1− p)
n
Donde:
¿ exitos
^p = proporción muestral; ^p =
n
p = proporción poblacional hipotética (se toma de las hipótesis)
n = tamaño de la muestra
Una encuesta de n = 703 empleados seleccionados al azar, reveló que 429 de ellos consiguió
trabajo por medio de una red de contactos. Calcule el valor del estadístico de prueba para la
aseveración de que la mayoría de los empleados (más del 50%) consiguen trabajo por medio
de una red de contactos. (Para este ejemplo, suponga que se satisfacen los supuestos
35
Universidad Continental | Manual
requeridos y concéntrese en el cálculo del estadístico de prueba indicado). Emplee un nivel de
significancia de 0,05
Datos
#exitos=429
H0: p 0,5
429
^p = H1: p > 0,5 (la mayoría de los empleados consigue trabajo por medio de
703
una red de contactos)
^p = 0,6102 Es una prueba de cola derecha.
Zcrit = 1,645
Tabla A - 2
1–
1.645
Valor crítico
Rechazar H0 si z 1,645
^p − p 0.6102−0.5
z=
√ p(1− p) =
n √ 0.5∗(1−0.5) = 5,84
703
Paso 5: Conclusión:
Existe evidencia muestral suficiente para probar que “la mayoría de los
empleados consigue trabajo por medio de una red de contactos”
36
Universidad Continental | Manual
Cuando realizamos una prueba de hipótesis estamos expuesto a las probabilidades. Apoyados
en la información que nos da una muestra elaboramos un proceso de prueba que nos permite
obtener una conclusión, más, sólo contamos con una muestra aleatoria que bien pudiera no ser
representativa y sus datos nos puedan llevar a concluir lago equivocado. ¿Cuál es la
probabilidad de que esto suceda?
Error Tipo I:
Se estaría cometiendo un error de tipo I cuando rechazamos H0 como verdadera, decimos que
es falsa, cuando en verdad H0 es verdadera.
y β no son complementarios, es decir si sumamos alfa más beta no nos dará uno:
+β1
37
Universidad Continental | Manual
En este caso la probabilidad “real” de cometer el error tipo I es menor a la prevista (), por
tanto, podemos asumir el riesgo menor de equivocarnos, en consecuencia, podemos rechazar
H0 como verdadera.
Ejemplo:
Una encuesta de n = 703 empleados seleccionados al azar, reveló que 429 de ellos consiguió
trabajo por medio de una red de contactos. Calcule el valor del estadístico de prueba para la
aseveración de que la mayoría de los empleados (más del 50%) consiguen trabajo por medio
de una red de contactos. (Para este ejemplo, suponga que se satisfacen los supuestos
requeridos y concéntrese en el cálculo del estadístico de prueba indicado). Emplee un nivel de
significancia de 0.05
Datos
#exitos=429
H0: p 0,5
429
^p = H1: p > 0,5 (la mayoría de los empleados consigue trabajo por medio
703
de una red de contactos)
^p = 0,6102
Paso 2: Regla de decisión
= 0,05
Zcrit = 1,645
Rechazar H0 si Valor P
^p − p 0.6102−0.5
z=
√ p(1− p) =
n √ 0.5∗(1−0.5) = 5,84 con este valor buscamos
703
en la tabla de la distribución z A-3. El valor P = 0,0001
38
Universidad Continental | Manual
Paso 5: Conclusión:
Existe evidencia muestral suficiente para probar que “la mayoría de los
empleados consigue trabajo por medio de una red de contactos”
Debe tenerse en cuenta que para aplicar esta regla se deben observar:
- n 30 ó
x−μ
z= σ
√n
Donde:
n: es el tamaño de la muestra
x = media de la muestra.
= media hipotética en la población (se toma de las hipótesis).
Ejemplo:
En su tesis de grado, Carlos Carhuapoma desarrolla la teoría de que el promedio de vida útil
de una vivienda unifamiliar es menos de 28 años, considerando que todos los elementos
39
Universidad Continental | Manual
constructivos e instalaciones funcionan correctamente. Toma una muestra de 18 viviendas y
obtiene los datos de la tabla adjunta. Realice una prueba al 0.05 de significancia, considerando
que no existen datos atípicos (Jurado, 2017).
Tabla 2:
Datos de Vida útil de viviendas
25 24 29 30 26 36 34 26 14
22 20 24 28 21 23 17 25 35
Solución:
p(z)
0.6
x = H0: p 28
25.5
H1: p < 28 (la vida útil de una
= vivienda unifamiliar
4,76 es menos de 28 años
en promedio)
=
0,05
x−μ 25.5−28
z= σ = 4.76 = -2,23 con
√n √18
este valor buscamos en
40
Universidad Continental | Manual
Paso 4: Decisión respecto de H0
Paso 5: Conclusión:
3.2. Prueba de hipótesis para la media poblacional con desviación estándar desconocida.
x−μ
t= s
√n
Donde:
n: Tamaño de muestra.
x : Media muestral.
s: Desviación estándar de la muestra.
Ejemplo: Una publicación en un diario local menciona que el gasto per cápita en diversión en
la región Junín es menor a S/.780 mensuales. Esta afirmación es sometida a prueba al nivel de
significancia del 1%. Se toma una muestra aleatoria de 46 individuos y se logra una media en
gastos de S/.768 con una desviación estándar de S/.63. ¿Se puede asegurar que la afirmación
del diario es cierta? (Jurado, 2017)
Solución:
41
Universidad Continental | Manual
Datos
H0: 780
x = 768
H1: < 780 (el gasto per cápita en diversión en la región Junín es
s = 63 menor a S/.780 mensuales)
conoce :
gl = 45
tcrit = -2.412
-2,412
Valor crítico
Rechace H0 si t ≤ - 2,412
x−μ 768−780
t= s = 63 = - 1,292
√n √ 46
Paso 5: Conclusión:
42
Universidad Continental | Manual
Tema n° 4. Inferencias acerca de dos proporciones poblacionales.
En el desarrollo de las pruebas se tienen casos en los que la comparación entre grupos es necesaria. En
este acápite trabajaremos la comparación de dos grupos.
Estadístico de prueba:
( ^p1−^p2 )− ( p 1− p2 )
√ ( n1 + n1 )
Z=
p( 1− p)
1 2
Donde:
¿ exitos 1 ¿ exitos 2
^p1 = ^p2 =
n1 n2
Ejemplo:
Solución:
Dado que se cumplen las condiciones para la prueba (n > 30, más de 5 éxitos en ambas
muestras (87 y 94) y en consecuencia más de 5 fracasos, se puede ejecutar una prueba de
hipótesis para dos muestras.
43
Universidad Continental | Manual
Datos
87 +94
p=
17+220 /2 1– /2
-1.96 1.96
Valor crítico Valor crítico
p = 0,4582
Rechace H0 si |z| 1,96
√ ( n1 + n1 )
Z=
p( 1− p)
1 2
( 0.4971−0.4273 )−0
√ ( 1751 + 2201 )
Z=
0.4582( 1−0.4582)
Z = 1,38
Paso 5: Conclusión:
44
Universidad Continental | Manual
2. Intervalos para dos proporciones poblacionales.
En el caso de un intervalo el cálculo requiere de la fórmula siguiente:
√ p^ ∗q^ ^p ∗q^
( p1− p2 ) = ( ^p1− ^p2 ) ± Z α /2* 1 1 + 2 2
n1 n2
Donde:
¿ exitos 1 ¿ exitos 2
^p1 = ^p2 =
n1 n2
q^ 1 = 1 - ^p1 q^ 2 = 1 - ^p2
n1 : Tamaño de la muestra 1 n2 : Tamaño de la muestra 2.
Ejemplo:
Solución:
Datos
30 a 39 40 a 49
√
n1 = 175 n2 = 220
^ 1∗q^ 1 P
P ^ ¿ q^
#e1= 87 #e2 = 94 ( p1− p2 ) =( ^p1− ^p2 ) ± z α /2* + 2 2
n1 n1
87 94
^p1 = ^p2 =
175 220
( p1− p2 ) =( 0,4971−0,4273 ) ± 1.96*
^p1 = 0,4971
q^ 1 = 0,5029
^p2 = 0,4273
q^ 2 = 0,5727
√ 0.4971(0.5029) 0.4273(0.5727)
175
+
220
= 0,05
45
Universidad Continental | Manual
/2 = 0,025
Z/2 = 1,96
/2 /2
1–
-1.96 1.96
Conclusión:
( p1− p2 ) =0
46
Universidad Continental | Manual
3. Inferencias acerca de dos medias independientes.
En este caso los supuestos de normalidad se aplican a los conjuntos de datos que intervienen en las
pruebas. Es necesario verificar entonces:
- Las muestras son pequeñas y las poblaciones de las que fueron sacadas son normales.
( μ1−μ2 ) −( x 1−x 2)
√
Z= 2 2
σ 1 σ2
+
n1 n 2
Donde:
Ejemplo:
Se esperaba que el Día de San Valentín el gasto promedio se igualara entre hombres y mujeres
(USA Today, 13 de febrero de 2006). ¿Hay diferencia en las cantidades que desembolsan los
hombres y las mujeres? El gasto promedio en una muestra de 40 hombres fue de $135,67 y en
una muestra de 30 mujeres fue de $98,64. Por estudios anteriores se sabe que la desviación
estándar poblacional en el consumo de los hombres es $35 y en el de las mujeres es $20.
(Anderson, Dennis & Thomas, 2012)
Solución:
Datos
47
Universidad Continental | Manual
usar Z
Rechace H0 si Valor P
( x 1−x 2) −( μ1−μ 2)
√
Z= 2 2
σ 1 σ2
+
n1 n 2
( 135,67−98,64 )−0
√
Z= 35 2 202
+
40 30
Z = 5,59
48
Universidad Continental | Manual
( μ1−μ2 ) −( x 1−x 2)
√ ( n1 + n1 )
t= 2
S p∗
1 2
Donde:
Ejemplo:
Solución:
Los supuestos necesarios se cumplen: se tienen muestras grandes (n1 y n2 > 30), las
desviaciones estándar son muestrales no se conocen 1 ni 2:
Datos
H0: σ 1 = σ 2
Paso 2: Regla de decisión
H1: σ 1 σ 2
=0.01
1– gl = 180
Los grados de libertad son:
2.3488
Valor crítico
gln = 61-1 =60 (s mayor)
49
Universidad Continental | Manual
Se rechazará H0 si F 1.530
2
s mayor 1.322
F= = = 1,365
2
s menor 1.132
Asumimos σ 1 = σ 2
gl = n1 + n2 – 2
gl = 61+121 – 2 = 180
√ ( )
t= 1 1
S2p = 2
Sp +
( 61−1 ) 1.32 + ( 121−1 ) 1.132
2 n 1 n2
61+ 121−2 ( 1,91−1,21 ) −0
√ ( 611 + 1211 )
t=
2
1,4321
S =1,4321
p
t = 3,725
( μ1−μ 2 ) =( x 1−x 2 ) ±t α / 2 * S 2p +
√
1 1
(n n )
1 2
En este caso se debe usar la siguiente fórmula para calcular el estadístico de prueba:
( μ1−μ2 ) −( x 1−x 2)
√( )
t= 2 2
s 1 s2
+
n 1 n2
Donde:
50
Universidad Continental | Manual
1: media en la población 1 2: media en la población 2.
( A+ B )2 2 2
S1 S2
gl = A2 B
2
; A= B=
+ n1 n2
n 1−1 n2−1
Ejemplo:
Tabla 3:
Solución:
Como las muestras son pequeñas (n1 y n2 < 30), las desviaciones estándar son muestrales no
se conocen 1 ni 2, debemos demostrar que las poblaciones son normales. Un gráfico p-p
para cada grupo:
51
Universidad Continental | Manual
Figura 14: Gráficos P-P de normalidad para las muestras 1 y 2.
Fuente: Elaboración propia.
En ambos casos se aprecia que los puntos se acercan bastante a una recta. Por tanto, se asume
que ambas poblaciones son casi normales, lo que es suficiente para seguir con los cálculos.
Datos
H0: σ 1 = σ 2
Paso 2: Regla de decisión
H1: σ 1 σ 2
=0.05
1– gl = 17
Los grados de libertad son:
1.740
gln = 16-1 =15 (s mayor) Valor crítico
gld = 12 - 1 = 11
Rechace H0 si t 1,740
/2 = 0,025
( x L −x B ) −( μ L−μ B )
s 2mayor 64.4492
√
t= 2 2
s 1 s2
F= = = 14,155 +
s 2menor 17.1302 n1 n 2
52
Universidad Continental | Manual
Asumimos σ 1 σ 2
2
s B 64.4492
A= = = 259,605
nB 16
2
s L 17.1302
B= = = 24,453
nL 12
( A+ B )2
gl = A2 B2
+
n 1−1 n2−1
( 528,938−492,833 )−0
( 259.605+24.453 )2
√
t= 64,449 2 17,130 2
gl = 2
259.605 24.453
2
+
+ 16 12
16−1 12−1
gl = 17,744 17
t = 2,142
( μ1−μ 2 ) =( x 1−x 2 ) ±t α/ 2 *
√ S12 S 22
+
n1 n2
Solución:
Los supuestos necesarios se cumplen: se tienen muestras grandes (n1 y n2 > 30), las
desviaciones estándar son muestrales no se conocen 1 ni 2:
Datos
√
Empresarios Directivos
n1 = 61 n2 = 121
1 1
( μ1−μ 2 ) =( x 1−x 2 ) ±t α/ 2 * S 2p + (n n )
1 2
53
Universidad Continental | Manual
x 1 = 1,91 x 2 = 1,21
s1 = 1,32 s2 = 1,13
H0: σ 1 = σ 2
H1: σ 1 σ 2
/2 = 0,025
2
s mayor 1.322
F= = = 1,365
2
s menor 1.132
F < 1,530 no rechazamos H0 como
verdadera.
Asumimos σ 1 = σ 2
( μ1−μ 2 ) =( 1,91−1,21 ) ±2,603 *
gl = n1 + n2 – 2
gl = 61+121 – 2 = 180
√ 1,4321 ( 611 + 1211 )
/2 = 0.005
0,211< ( μ1 −μ 2 ) <1,189
t α / 2 = 2,603
61+ 121−2
2 ( μ1−μ 2 )=+¿
S p =1,4321
54
Universidad Continental | Manual
d−μd
t = Sd
√n
Donde:
Ejemplo:
Tabla 4:
Datos comparación de gastos en restaurants
Usuario 1 2 3 4 5 6 7 8 9 10 11 12
Gasto Antes 553 250 160 194 196 247 303 286 356 415 438 265
Gasto Actual 412 569 719 347 337 164 344 786 446 154 709 291
Según esta información y considerando que las diferencias proceden de una población poco sesgada,
¿los gastos en restaurantes se han incrementado desde que se aplicó esta nueva norma? (Jurado,
2017)
Solución
Como sólo se tiene 12 usuarios de tarjetas de débito en la muestra, y por cada uno de ellos se da dos
datos (antes y después), se reconoce que se tiene datos emparejados (relacionados).
Usuario 1 2 3 4 5 6 7 8 9 10 11 12
Gasto Antes 553 250 160 194 196 247 303 286 356 415 438 265
Gasto Actual 412 569 719 347 337 164 344 786 446 154 709 291
D 141 -319 -559 -153 -141 83 -41 -500 -90 261 -271 -26
Al tener una muestra de n = 12 se debería probar la normalidad de los datos por lo menos con un
gráfico de normalidad P-P, pero como nos dicen que la población de las diferencias es poco sesgada,
consideraremos que es casi normal, lo que es suficiente para seguir con los cálculos:
55
Universidad Continental | Manual
En el caso de H1: El gasto se ha incrementado, significa que ahora el gasto es mayor:
Se puede escribir:
Datos
=0.05
gl = 11 1–
- 1.796
Valor crítico
Rechace H0 si t -1,796
d−μd
t = Sd
√n
−134,583−0
t= 246,608
√12
t = - 1,890
56
Universidad Continental | Manual
Paso 5: Conclusión:
Sd
μd =d ± t α /2*
√n
57
Universidad Continental | Manual
De la teoría a la práctica:
LECTURA N° 2:
Una mirada a los programas sociales (tomado de Estadística inferencial por
Jurado, 2017
La inclusión social es parte fundamental del nuevo discurso político. Aquí se describen los nuevos
programas sociales a la luz de la experiencia de los anteriores gobiernos.
El Perú sigue escalando posiciones en el ranking de competitividad del Foro Económico Mundial. Ello
obedece a las recetas ya conocidas: macroeconomía estable, inflación controlada y menores barreras para
iniciar negocios. Sin embargo, todavía existe un camino largo por recorrer. El mismo foro alerta sobre la
necesidad de una mayor institucionalidad, infraestructura básica, calidad de la educación, entre otros. Es
decir, el aumento sostenido de la competitividad estará ligado a la eficiencia de las políticas públicas en la
distribución de los beneficios del crecimiento económico.
“Por lo menos ésa es la percepción que los peruanos proporcionaron en una encuesta realizada por Ipsos
APOYO Opinión y Mercado, en que la
Tabla 5: ¿Cuáles son los factores más importantes para
inversión en educación y la promoción conseguir más inclusión social?
del empleo figuran como los dos
factores más importantes para conseguir
la inclusión social; se deja en tercer
lugar la implementación de programas
para los pobres. Así, la percepción de la
política social dejó de ser asistencialista
para dar paso a un enfoque productivo,
en que la educación y el empleo
asegurarán que las poblaciones más
excluidas cuenten con una mejor
posición competitiva para superar la
pobreza” (Alfaro & Macera, 2011).
La encuesta menciona considera un porcentaje total de 39% cree que el factor más importante para
conseguir más inclusión social es la promoción de la creación de empleos. ¿Esto nos podría dar la
seguridad de que un 40% está de acuerdo con este factor como el más importante?
58
Universidad Continental | Manual
Actividad N° 2: Auto evaluación - Pruebas de Hipótesis (cuestionario en línea)
Ingrese al Aula Virtual >> Unidad 2 >> Autoevaluación
Foro 2:
“De forma breve plantee y describa un problema de investigación y su hipótesis General
de diseño experimental en el ámbito de su desempeño laboral. Detalle la muestra, y
explique el procedimiento necesario para probar la hipótesis”
Ingrese al Aula Virtual, a la pestaña de la 2 Unidad >> Foro 2:
Lea la consigna y las instrucciones.
Escriba su respuesta a la pregunta tomando en cuenta las indicaciones de la consigna.
59
Universidad Continental | Manual
GLOSARIO DE LA UNIDAD II:
Varianza poblacional: Promedio de la distancia total entre cada observación (en la población) y la media
(Newbol, Carlson, & Thorne, 2008, p. 57).
Desviación estándar muestral: Es un tipo de desviación o variación de los datos promedio de los
valores (muestrales) con respecto a la media (Triola, 2009, p. 94).
Hipótesis: “es una aseveración o afirmación acerca de una propiedad de una población” (Triola, 2009, p.
386).
Prueba de Hipótesis: “es un procedimiento estándar para probar una aseveración acerca de una
propiedad de una población” (Triola, 2009, p. 386).
Distribución Chi (Ji) cuadrada: En una población distribuida normalmente con varianza 2, suponga
que seleccionamos al azar muestras independientes de tamaño n y, para cada muestra, calculamos la
varianza muestral s2 (que es el cuadrado de la desviación estándar muestral s). El estadístico muestral 2
= (n – 1)s2 / 2 tiene una distribución llamada distribución chi cuadrada (Triola, 2009, p. 437).
Distribución F Distribución de las probabilidades continua de una variable aleatoria que tiene un
comportamiento muy cercano a la distribución muestral del cociente de las varianzas (Triola, 2009).
Nivel de significancia Valor del área crítica o de rechazo de H0, es también el valor de la probabilidad de
cometer un error de tipo I (Triola, 2009, p. 392).
Potencia de una prueba: Es la medida de la probabilidad de no cometer el error de tipo II. Es decir, es
iguala 1- (Triola, 2009, p. 400).
Proporción Es la relación entre la cantidad de éxitos y el total muestreado. Se puede leer como un
porcentaje si se le multiplica por 100. Puede existir una proporción de “éxitos” como
complementariamente una proporción de “fracasos” (Triola, 2009, p. 270).
Bibliografía de la Unidad 2
Alfaro, D., & Macera, D. (2011). Una mirada a los programas sociales [mensaje en un blog]. Obtenido
de https://www.grade.org.pe/novedades/una-mirada-a-los-programas-sociales/
Anderson, D., Dennis, S., & Thomas, W. (2012). Estadística para negocios y economía. México D. F.:
CENGAGE Learning.
Banco Central de Reserva del Perú. (2019). Banco Central de Reserva del Perú. Recuperado el 21 de
junio de 2019, de BCRP Data: https://estadisticas.bcrp.gob.pe/estadisticas/series/trimestrales
Devore, J. (2008). Probabilidad y estadística para ingenieriía y ciencias. México D. F.: CENGAGE
Learning.
Díaz, A. (2013). Estadística aplicada a la administración y la economía. Mexico D. F.: Mc Graw Hill
Education.
Díaz, A. (2013). Estadística aplicada a la administración y la economía. México D. F.: McGraw Hill.
60
Universidad Continental | Manual
Elgin Community Collage. (2016). Muestreo sistemático [figura]. Recuperado el 3 de febrero de 2018, de
Elgin.edu: https://faculty.elgin.edu/dkernler/statistics/ch01/1-4.html
Hernandez, R., Fernandez, C., & Baptista, P. (2014). Metodología de la investigación. Mexico D. F.: Mc
Graw Hill Education.
Jurado, S. (2017). Curvas y áreas. Regla de decisión [figura]. Huancayo: Universidad Continental.
León, M. (18 de junio de 2019). Las balanzas dle bienestar. Recuperado el 19 de junio de 2019, de El Pa
´s: https://elpais.com/elpais/2019/06/17/opinion/1560781691_381446.html
Levin, R., & Rubin, D. (2004). Administración para Administración y Economía. Mexico D. F.: Pearson
Education.
Lind, D., Marchal, W., & Wathe, S. (2012). Estadística aplicada a los negocios y la economía (15a ed.).
Mexico D. F.: Mc Graw Hill Education.
Manetto, F. (9 de Noviembre de 2018). Los ingresos per cápita de América Latina llevan 60 años
estancados. El País, pág. 12. Recuperado el 24 de febrero de 2019, de
https://elpais.com/internacional/2018/11/08/colombia/1541659854_428801.html
Newbol, P., Carlson, W., & Thorne, B. (2008). Estadística para Administración (6a ed.). (R. Esther,
Trad.) Madrid: Pearson Education.
Persekutuan, W. (28 de setiembre de 2008). Blogger Ng Ooi Pin @ Json. Recuperado el 21 de julio de
2016, de RAG 132 BUILT ENVIRONMENT & HUMAN SETTLEMENTS:
http://ngooipin.blogspot.pe/
Pontificia Universidad Catolica del Perú. (2009). Instituto de Opinión Pública - Data. (I. d. Pública,
Editor) Obtenido de https://docs.google.com/viewer?url=http://iop-data.pucp.edu.pe/media/
archivos/2009/11/1/IOP_1109_01_F.pdf&embedded=true0
Real Academia Española. (2019). Diccionario de la Lengua española (pagina web). (R. A. Española,
Editor) Obtenido de http://lema.rae.es/dpd/srv/search?key=aleatorio
Triola, M. (2018). Estadística (12a ed.). (J. Murrieta, Trad.) Mexico D. F.: Pearson Education.
Wikimedia org. (2017). Distribución t con diferentes tamaños de muestra [figura]. Obtenido de
Wikilibros: https://es.wikibooks.org/wiki/Tablas_estad%C3%ADsticas/Distribuci
%C3%B3n_t_de_Student
61
Universidad Continental | Manual
62
Universidad Continental | Manual
UNIDAD 3:
ANÁLISIS DE VARIANZA, EXPERIMENTOS
MULTINOMIALES Y TABLAS DE CONTINGENCIA Y
ESTADÍSTICA NO PARAMÉTRICA
Diagrama de organización de la Unidad 3
Resultado de aprendizaje de la unidad: Al finalizar la unidad, el estudiante será capaz de aplicar pruebas de
hipótesis para la media, proporción, varianza y desviación estándar poblacional a partir de una muestra aleatoria y
dos muestras aleatorias.
Conocimientos Habilidades Actitudes
Tema n° 1. Análisis de la 1. Identifica las clases de hipótesis. Valora la importancia de las
varianza. 2. Plantea pruebas de hipótesis. pruebas de hipótesis e interpreta
1. ANOVA de un factor 3. Identifica correctamente los correctamente los resultados
2. ANOVA de dos factores. valores críticos para la para una buena toma de
A. Diseño completamente aplicación de las pruebas de decisiones.
aleatorio hipótesis.
B. Diseño AxB 4. Determina el procedimiento
Tema n° 2. Experimentos pertinente de la prueba de
multinomiales y tablas de hipótesis.
contingencia
1. Bondad de ajuste 5. Realiza la interpretación del
2. Tablas de contingencias resultado de la prueba de
hipótesis
A. Prueba de independencia.
B. Prueba de homogeneidad.
Tema n° 3. Estadística no
paramétrica: Prueba de rangos Actividad 1:
con signo de Wilcoxon para
datos apareados y Prueba de la Parcita del foro de discusión
suma de rangos de Wilcoxon Importancia de las pruebas de
para dos muestras hipótesis.
independientes.
Actividad 2:
1. Prueba de rangos con signo de
Wilcoxon para datos apareados Evaluación del tema N° 1, Tema
2. Prueba de la suma de rangos de N° 2 y el Tema N° 3
Wilcoxon para dos muestras
independientes.
Tema n° 4. Estadística no
paramétrica: Prueba de
Kruskal –Wallis y
Correlación de rangos de
Spearman.
1. Prueba de Kruskal –Wallis
2. Correlación de rangos de
Spearman
63
Universidad Continental | Manual
Introducción
¿Cómo podemos probar que una campaña de incentivos puede brindarnos resultados comprobados de
eficiencia en un mercado con grupos diferenciados de clientes? ¿Cómo podemos asegurar que durante el
desarrollo de las actividades de producción existe una considerable mejora real en la producción y que
método nos sería más útil?
Cuestiones como éstas tiene una respuesta en la primera parte de esta unidad. El análisis de la varianza
nos permite realizar pruebas de hipótesis con más de dos medias lo que permite comparar por ejemplo el
efecto de tres o más formas de incentivos de compra y su impacto en las ventas, los niveles de compra
entre grupos de clientes diferenciados por sus estilos de vida.
El autor
64
Universidad Continental | Manual
Tema n° 1. Análisis de la Varianza.
En el desarrollo de pruebas de hipótesis, este procedimiento se aplica cuando se tiene 3 o más grupos que
comparar mediante una variable cuantitativa. Los grupos se encuentran delimitados por las formas en que
se aplica una variable.
La variable independiente (tratamiento) es la que manipulamos de tal manera que debido a la forma en
que se aplica en la población, genera una división. Esta manipulación se encuentra en el nivel de más de
dos grados, es decir existe tres o más formas de aplicar la variable (tratamiento) en la población como,
por ejemplo, como explica (Hernandez, Fernandez, & Baptista, 2014 p. 235) ” Supongamos . . . . que
queremos analizar el posible efecto del contenido antisocial por televisión sobre la conducta agresiva de
ciertos niños. Podría hacerse que un grupo fuera expuesto a un programa de televisión sumamente
violento (con presencia de violencia física y verbal); un segundo grupo se expusiera a un programa
medianamente violento (sólo con violencia verbal), y un tercer grupo se expusiera a un programa sin
violencia. En este ejemplo, se tendrían tres niveles o cantidades de la variable independiente, lo cual se
representa de la siguiente manera:
La variable dependiente es en la que se realizan las mediciones, es decir sirve para mostrar las reacciones
de los sujetos al contenido violento. En el caso del ejemplo, se mediría el nivel de sociabilidad.
Requisitos
Distribución F:
65
Universidad Continental | Manual
En la tabla VI solo se presentan valores de áreas de cola derecha.
SCTr CMTr
Tratamiento SCTr gln = K – 1 CMTr =
gl n CME
SCE
Error SCE gld =N – K CME =
gl d
Donde:
x j : Media de la muestra j.
S j: Desviación estándar de la muestra j.
Ejemplo:
Un fabricante de cereales tiene que elegir entre tres colores para las cajas de cereales: rojo,
amarillo y azul. Para averiguar si el color influye en las ventas, se eligen 16 tiendas de tamaño
66
Universidad Continental | Manual
parecido. Se envían cajas rojas a 6 de estas tiendas, cajas amarillas a 5 y cajas azules a los 5
restantes. Después de unos días, se comprueba el número de cajas vendidas en cada tienda. La
tabla adjunta muestra los resultados (en decenas de cajas) obtenidos. (Newbol, Carlson &
Thorne, 2008)
Tabla 7.
Datos Cereales
Rojo Amarillo Azul
43 52 61
52 37 29
59 38 38
76 64 53
61 74 79
81
Solución:
nj 6 5 5
2 62 53 52
xj
sj 14.339 16.155 19.596
Origen SC gl CM F
Total 3948,94134 15
67
Universidad Continental | Manual
Paso3: Regla de decisión:
Rechazar H0 si F 3,8056
Paso5: Conclusión:
Como queríamos probar que había diferencia entre las medias H1, y esta resultó ser falsa:
No existe evidencia para probar que “existe una diferencia significativa en la preferencia
de los colores”
Tabla 8:
ANOVA de dos factores diseño aditivo. Fórmulas
Origen SC Gl CM F
SCF CMF
Filas SCF glf = L – 1 CMF =
gl f CME
SCC CMC
Columnas SCC glc = K – 1 CMC =
gl c CME
SCE
Error SCE gle CME =
gl e
Total SCT N–1
68
Universidad Continental | Manual
SCF = ∑ ( xi −x́ ) 2 ni SCC = ∑ ( x j−x́ )2 n j SCT = N*σ Total
2
Donde:
Filas Columnas
Ejemplo:
Tabla 9.
Tiempos de recorrido Tiempo de recorrido de Starbrick a Warren
(minutos)
West Hickory
Conductor Carretera 6 Ruta 59
End St.
Deans 18 17 26 22
Snaverly 16 23 23 21
Ormson 17 21 26 27
Zollaco 19 22 29 25
Filbeck 18 23 28 28
A un nivel de significancia de 0.05, ¿hay alguna diferencia entre los tiempos de recorrido
medios a lo largo de las cuatro rutas? Si elimina el efecto de los conductores, ¿hay alguna
diferencia entre los tiempos de recorrido medios? (Lind, Marchal & Wathe, 2012)
Solución
69
Universidad Continental | Manual
Si realizamos solo una prueba con las rutas es probable que esta variable no sea la única que
influye en los tiempos, por ello se considera una variable interviniente como es el factor
humano (conductor).
West Hickory
Conductor Carretera 6 Ruta 59 ni xi Si
End St.
nj 5 5 5 5 N= 20
SCF =
( 20,75−22,45 ) ( 4 ) + ( 20,75−22,45 ) ( 4 ) + ( 22,75−22,45 ) ( 4 ) + ( 23,75−22,45 ) ( 4 ) + ( 24,25−22,45 )2 (4
2 2 2 2
SCF = 43.2
SCC = 226.55
SCT = 20(15,75)
SCT = 314.95
SCE = 45.2
Tabla ANOVA
Origen SC Gl CM F
Total 314,95 19
70
Universidad Continental | Manual
Paso1:
Paso1:
H0: 1 = 2 = 3 = 4
H0: 1 = 2 = 3 = 4 = 5
H1: Por lo menos una ruta tiene un nivel
H1: Por lo menos un chofer tiene un nivel tiempo diferente en promedio.
tiempo diferente en promedio.
Rechazar H0 si F 3.4903
Rechazar H0 si F 3.2592
F = 20.049
F = 2.867
Paso5: Conclusión:
Paso5: Conclusión:
71
Universidad Continental | Manual
Estás pruebas se realizan solo si se ha rechazado H0 y en consecuencia se afirma que por los
menos una de las medias es diferente.
Existen muchos métodos, pero el que usaremos aquí será el de LSD de Fisher:
Regla de decisión:
Rechazar H0 si |x i −x i| LSD
Donde:
√
LSD = t α/ 2 CME
( n1 + n1 )
i j
En el caso de los datos de WARTA, como en el caso de las Rutas se rechazó H0, entonces
aplicaremos este método:
Cálculo de LSD:
√
LSD = t α/ 2 CME
( n1 + n1 )
i j
√
LSD = 2,120 3.767
( 15 + 15 )
LSD = 2,602
Se calcula solo un valor ya que se tienen muestras del mismo tamaño (n j=5)
Pruebas Múltiples:
Podemos afirmar que las medias diferentes son 1, 2 y 4 solo son iguales 3 y 4. Una
gráfica con las medias de cada grupo podría orientarnos mejor:
72
Universidad Continental | Manual
30
26.4
24.6
25
21.2
20
17.6
15
Car r eter a 6 West E n d Hick o ry St. Ru ta 5 9
Tabla 10:
Tabla ANOVA de dos factores diseño AxB - Fórmulas
Origen SC gl CM F
CMF
Filas (A) SCF L–1 CMF
CME
CMC
Columnas (B) SCC K–1 CMC
CME
CM AxB
A x B (interacción SCAxB (L-1)(K-1) CMAxB
CME
73
Universidad Continental | Manual
2.3.2. Cálculo de las varianzas
( ) ( )
K 2 L 2
i ni j nj
(∑ ∑ )
k L 2
x ij 2
SCM = j i –C SCT = N*σ Total SCE = SCT – (SCF + SCC + SCAxB)
nij
Donde:
(∑ )
N 2
C= x i /N
i
2
σ Total: Desviación estándar poblacional de todos los datos.
Ejemplo:
Una empresa de ventas por catálogo realizó un experimento factorial para probar el efecto del
tamaño de un anuncio de revista y su diseño sobre el número de solicitudes de catálogos
recibido (datos en miles). Se pusieron a consideración tres diseños publicitarios y dos
tamaños. Los datos obtenidos se presentan a continuación. Utilice el procedimiento A NOVA
para un diseño factorial a fin de probar si hay efectos significativos debido al tipo de diseño, al
tamaño del anuncio o a la interacción. Use = 0.05. (Anderson, Dennis & Thomas, 2012)
Tabla 11:
Datos Efecto tamaño de anuncio
Diseño Pequeño Grande
8 10 12 13
A
12 11 8 9
21 23 17 18
B
14 20 30 28
10 15 18 19
C
18 17 14 15
Fuente: Anderson, 2012
Solución:
74
Universidad Continental | Manual
Origen SC Gl CM F Valor Crít.
Diseño 484,083333 2 242,041667 16,7245681 3,55455715
Tamaño 20,1666667 1 20,1666667 1,39347409 4,41387342
Diseño*Tamaño 12,5833333 2 6,29166667 0,43474088 3,55455715
Error 260,5 18 14,4722222
Total 777,333333 23
Abordamos entonces la solución por cada factor y por la interacción Diseño*Tamaño:
Paso1:
H0: 1 = 2 = 3 = 4 = 5
H1: Por lo menos un tipo de diseño produce un número de solicitudes promedio diferente.
Rechazar H0 si F 3,5546
De la tabla ANOVA:
F = 16,7246
Paso5: Conclusión:
Existe evidencia muestral suficiente para probar que “por lo menos un tipo de diseño produce
un número de solicitudes promedio diferente”.
Tamaño de anuncio:
Paso1:
H0: 1 = 2
Rechazar H0 si F 4,4139
De la tabla ANOVA:
F = 1,3935
75
Universidad Continental | Manual
Como F < 3,2592
Paso5: Conclusión:
No existe evidencia muestral suficiente para probar que “por lo menos un Tamaño de anuncio
produce un número de solicitudes promedio diferente”.
Paso1:
Rechazar H0 si F 3,5546
De la tabla ANOVA:
F = 0,4347
Paso5: Conclusión:
No existe evidencia muestral suficiente para probar que “exista interacción de Diseño y
Tamaño de anuncio”.
76
Universidad Continental | Manual
Tema n° 3. Experimentos mutinomiales y tablas de contingencia.
1. Experimentos multinomiales.
1.1. Bondad de ajuste
En esta unidad iniciamos revisando las pruebas que tiene por objetivo comparar las formas de
las distribuciones en variables que no cumplen con los requisitos de normalidad.
Se trabaja con las frecuencias de las variables y por ello se aplica preferentemente a variables
de tipo categórico.
( O−E )2
2 = ∑ E
Donde:
Gl: k – 1
La curva de esta distribución no es simétrica y solo existe para valores desde 0 a infinito
positivo.
En la Tabla IV se muestran los valores críticos para áreas de cola derecha con gl = k - 1
Limitaciones:
77
Universidad Continental | Manual
Bubba’s Fish and Pasta es una cadena de restaurantes ubicados a lo largo de la costa del
Golfo de Florida. Bubba, el propietario, desea añadir filete a su menú. Antes de hacerlo,
decide contratar a Magnolia Research, LLC, para que lleve a cabo una encuesta entre
personas adultas para saber cuál es su platillo favorito cuando comen fuera de casa.
Magnolia seleccionó una muestra de 120 adultos y les pidió que indicaran su comida
favorita cuando salen a cenar. Los resultados se reportan en la siguiente tabla:
Tabla 12:
Datos Bubba's Fish and Pasta
Plato favorito Frecuencia
Pollo 32
Pescado 24
Carne 35
Pasta 29
Total 120
¿Es razonable concluir que no hay preferencia entre los cuatro platillos?
Si no existe diferencia entre la popularidad de los cuatro platillos, se podría esperar que las
frecuencias observadas fueran iguales, o casi iguales. Para decirlo de otro modo, se esperaría
que el mismo número de adultos indicara que prefiere pollo o pescado. Así, cualquier
discrepancia entre las frecuencias observadas y esperadas se atribuye al azar, o a un error de
muestreo. ¿Cuál es el nivel de medición en este problema? Observe que cuando se
selecciona a una persona, sólo se le puede clasificar en una de las categorías de platillos
preferidos. No se obtiene ningún tipo de lectura o medición. La “medida” o “clasificación”
se basa en el platillo seleccionado. Además, no existe un orden natural entre los platillos. No
se supone que alguno de los platillos sea mejor que otro. Por lo pronto, la
escala nominal es apropiada. Si los platillos son igualmente populares, se esperaría que 30
adultos eligieran cada uno de ellos. ¿Por qué es esto? Si hay 120 adultos en la muestra, y
cuatro categorías, lo esperado sería que una cuarta parte de los encuestados elegirían cada
platillo. Por lo tanto, la frecuencia esperada de cada categoría o celda sería 30, calculada
mediante 120/4, asumiendo que no existe preferencia por ninguno de los platillos. Esta
información se resume en la tabla siguiente. Un examen de los datos indica que la carne es
el platillo seleccionado con más frecuencia
(35 de 120), y que el pescado es el que cuenta con menos preferencia (24 de 120). ¿Se debe
al azar esta diferencia entre los números de veces que cada platillo es seleccionado, o se
debe concluir que los platillos no tienen el mismo grado de popularidad? (Lind, Marchal &
Wathe, 2012)
Pollo 32 30
Pescado 24 30
Carne 35 30
Pasta 29 30
78
Universidad Continental | Manual
Total 120 120
Si 2 7,8147 rechazar H0
(29−30)2
=
Pasta 29 30 30
0,0333
2 = 2,2
Paso5: Conclusión
Como queríamos probar que no había diferencia en la preferencia (H0) lo que resulto
verdadero:
Existe evidencia muestral suficiente para probar que: “Es razonable concluir que no hay
preferencia entre los cuatro platillos”
79
Universidad Continental | Manual
Ejemplo:
Supongamos que se tienen estadísticas de las preferencias por topos de servicios financieros
en una población que afirman que 15% de clientes optan por créditos personales, 25% créditos
hipotecarios, 30% por depósitos a plazo fijo, y el resto por créditos de capital. En la actualidad
se desea saber si estas proporciones cambiaron, para ello se toma una muestra de 700 clientes
y encuentra (Jurado, 2017):
Tabla 13:
Datos Producto financiero
Producto Financiero Frecuencia
Cred. Personal 175
Cred. Hipotecario 126
Dep. L. Plazo 105
Cred. Capital 294
Total 120
Fuente: Jurado, 2017
Solución:
Para este ejercicio contamos con las proporciones hipotéticas de cada categoría (15%, 25%
30% y 30%) las que emplearemos para encontrar las frecuencias esperadas (E):
Rechazar H0 si 2 7,8147
(175−105)2
=
Cred. Personal 175 0,15 700(0,15) = 105
105
46,667
2
(126−175)
=
Cred. Hipotecario 126 0,25 700(0,25) = 175
175
13,72
(105−210)2
Dep. L. Plazo 105 0,30 700(0,30) = 210 =
210
52,50
80
Universidad Continental | Manual
2
(294−210)
=
Cred. Capital 294 0,30 700(0,30) = 210
210
33,60
2 = 146,487
Paso5: Conclusión
Como queríamos probar que las proporciones cambiaron (H1) lo que resulto verdadero:
Existe evidencia muestral suficiente para probar que: “estas proporciones cambiaron”
Ejemplo:
Utilizamos una distribución de frecuencia para organizar las ganancias de la venta de 180
vehículos en Applewood Auto Group. A continuación:
Tabla 14:
Datos Vehiculos Applewood
Ganancia Frecuencia
$200 a $600 8
600 a 1000 11
1000 a 1400 23
1400 a 1800 38
1800 a 2200 45
2200 a 2600 32
2600 a 3000 19
3000 a 3400 4
Total 180
81
Universidad Continental | Manual
Para probar una distribución normal, debemos encontrar las frecuencias esperadas de cada
clase de dicha distribución, asumiendo que la distribución esperada sigue una distribución de
probabilidad normal. Iniciamos con la distribución normal calculando las probabilidades de
cada clase. Después, usamos estas probabilidades para calcular las frecuencias esperadas de
cada clase.
Para comenzar, es necesario encontrar el área, o probabilidad, de cada una de las ocho clases
en la tabla, asumiendo una población normal con una media de $1 843.17 y una desviación
estándar de $643.63. Para hallar esta probabilidad, utilizamos la fórmula:
x−μ
z=
σ
Al aplicar esta fórmula, podemos convertir cualquier distribución de probabilidad normal en
una distribución normal estándar.
P($200 < x < $600) = P(-2,55 < z < 1,93) = 0,0268 – 0,0054 = 0,0214
Esto es, alrededor de 2,14% de los vehículos vendidos generará una ganancia de entre $200 y
$600.
Existe una probabilidad de que la ganancia obtenida sea menor a $200. Para encontrarla:
82
Universidad Continental | Manual
1400 a 1800 38 -0,69 a -0,07 0,2451 – 0,4721 0,2270 40,86
1800 a 2200 45 -0,07 a 0,55 0,4721 – 0,7088 0,2367 42,61
2200 a 2600 32 0,55 a 1,18 0,7088 – 0,8810 0,1722 31,00
2600 a 3000 19 1,18 a 1,80 0,8810 – 0,9641 0,0831 14,96
3000 a 3400 4 1,80 a 2,42 0,9641 – 0,9922 0,0281 5,06
3400 a más 0 2,42 o más 1 – 0,9922 0,0078 1,40
Total 180
Como las frecuencias esperadas al inicio final de la tabla son menores a 5 se debe unir las filas
primera, segunda y tercera como la penúltima y última. Así tendremos:
Frecuencia Frecuencia
Ganancia
O E
menos a 1000 19 17,11
2 = 3.1957
H0: O = E Las ganancias siguen una distribución normal con = $1843,17 y = $643,63
Rechazar H0 si 2 12.591
Ganancia
Frecuencia Frecuencia ( O−E )2
O E
E
2
(19−17.11)
=
menos a 1000 19 17,11
17.11
0,2088
2
1000 a 1400 23 27,00
(23−27)
= 0,5926
27
83
Universidad Continental | Manual
2
(38−40.86)
=
1400 a 1800 38 40,86
40.86
0,2002
2
( 45−42.61)
=
1800 a 2200 45 42,61
42.61
0,1341
2
2200 a 2600 32 31,00
(32−31)
= 0,0323
31
2
(19−14.96)
=
2600 a 3000 19 14,96
14.96
1,0910
2
3000 a 3400 4 6,46
( 4−6.46)
= 0,9368
6.46
Total 180 180 3,1957
2 = 3,1957
Paso5: Conclusión
Como queríamos probar que las ganancias se comportan como una distribución normal (H0)
lo que resulto verdadero:
Existe evidencia muestral suficiente para probar que “Las ganancias siguen una distribución
normal con = $1843,17 y = $643,63”
84
Universidad Continental | Manual
2. Tablas de contingencia:
Una tabla de contingencia es un arreglo matricial que incluye las frecuencias que corresponde
a las categorías de dos variables categóricas:
Tabla 15:
Ejemplo - Tabla de contingencia
Pésimo 45 36 28 16 10
Malo 35 36 30 12 8
Regular 23 20 18 15 16
Bueno 18 22 21 33 25
Excelente 15 18 25 32 25
Donde:
De acuerdo con el tipo de análisis que se quiera realizar se pueden encontrar dos casos:
Pruebas de Homogeneidad y Pruebas de Independencia
85
Universidad Continental | Manual
2.3. Procedimiento de solución:
Se tiene un proceso asociado a la distribución 2, con un estadístico de prueba:
( O−E )2
2 = ∑ E
Donde:
Ejemplo:
La Ford Motor Company opera una planta de ensamble en Dearborn, Michigan. La planta
opera tres turnos. El gerente de control de calidad quiere comparar el nivel de calidad en los
tres turnos. Los vehículos se clasifican por su nivel de calidad (aceptable, inaceptable) y por
turno (matutino, vespertino, nocturno). ¿Hay alguna diferencia en el nivel de calidad en los
tres turnos? Es decir, al nivel del 5% de significancia ¿está relacionada la calidad del
producto con el turno donde se fabricó? Los datos siguientes pertenecen a una muestra de
87 (Lind, Marchal & Wathe, 2012)
Tabla 16:
Datos Ford Motro Company
Nivel de Calidad
Turn Total, de
Aceptable Inaceptable
o Filas
1 12 14 26
2 18 23 41
3 6 14 20
Total 36 51 87
Fuente: Lind, Marchal & Wathe, 2012.
Solución:
86
Universidad Continental | Manual
Seleccione el nivel de significancia = 0,05.
Rechazar H0 si 2 5,991
O E
Total Total
Turno Aceptable Inaceptable de Turno Aceptable Inaceptable de
Filas Filas
1 12 14 26 1 10,759 15,241 26
2 18 23 41 2 16,966 24,034 41
3 6 14 20 3 8,276 11,724 20
Total 36 51 87 Total 36 51 87
1
( 12−10.759 )2( 14−15.241 )2
10.759 15.241
2
( 18−16.966 ) ( 23−24.034 )2
2
16.966 24.034
3
( 6−8.276 ) ( 14−11.724 )2
2
8.276 11.724
Total 1.419
2 = 1,419
Paso5: Conclusión
Como queríamos probar que Turno y Nivel de calidad estaban relacionados (H1) lo que
resulto falso:
87
Universidad Continental | Manual
No existe evidencia muestral suficiente para probar que “está relacionada la calidad del
producto con el turno donde se fabricó”
88
Universidad Continental | Manual
3. Estadística no paramétrica: Prueba de rangos con signo de Wilcoxon para
datos apareados y Prueba de la suma de rangos de Wilcoxon para dos muestras
independientes.
1. Prueba de rangos con signo de Wilcoxon para datos apareados
Es una prueba aplicada cuando se tiene muestras pequeñas o de variables categóricas con las que no
se puede demostrar una distribución normal en los datos.
Se basa en la comparación de dos grupos de datos. Una muestra de sujetos que aportan dos
mediciones (antes-después o Antiguo-Nuevo). Las diferencias entre los valores de las mediciones se
ordenan de menor a mayor sin importar el signo, para luego hallar la sumatoria de rangos. Una
sumatoria menor es el estadístico de prueba. Las diferencias “cero” se desechan.
El estadístico de prueba:
Así se tiene:
Según (Newbol, Carlson & Thorne, 2008), si la muestra es grande (n > 20) se puede
aproximar a la normal:
n(n+1)
μT =
4
√
σ T = n(n+1)(2 n+1)
24
T −μ T
z=
σT
Ejemplo:
Tabla 17:
Datos valoración de salsa
89
Universidad Continental | Manual
Valoración
Producto Producto
Estudiante
Original nuevo
A 6 8
B 4 9
C 5 4
D 8 7
E 3 9
F 6 9
G 7 7
H 5 9
Fuente: Elaboración propia
Solución:
La solución pasa por calcular las diferencias, de ellas se toma la mediana(Me d) de las
diferencias, la que se compara con “cero”. Si decimos que Me d = 0 es que existen resultados
que negativos y positivos por igual y en consecuencia los conjuntos de datos son iguales. Si se
plantea Med < 0, entonces se tendrán una mayoría de resultados negativos, la mediana será
negativa y menor a “cero”. Esto implicará que los valores de la segunda muestra serían
mayores a los de la primera muestra. De manera contraria se explicaría un planteamiento
como Med > 0.
Para obtener el valor crítico se debe contabilizar “n” sólo con las parejas de datos cuyas
diferencias no sean “cero”.
Se debe tener cuidado al ingresar a la tabla A-8, ya que en esta los valores críticos se dan para
a una cola como para dos.
Paso1: Hipótesis
H0: Med = 0
H1: Med < 0 Se prefiere la nueva salsa. (la mayoría de los puntajes en la segunda muestra son
mayores)
Rechazar H0 si T 4
Se calculan las diferencias y se les asignan rangos de menor a mayor en valor absoluto, estos
rangos se separan de acuerdo con el signo y se suman:
90
Universidad Continental | Manual
Rango
Estud. original nuevo D Rango (-) (+)
inicial
A 6 8 -2 3 3 3
B 4 9 -5 6 6 6
C 5 4 1 1 1,5 1,5
D 8 7 1 2 1,5 1,5
E 3 9 -9 7 7 1
F 6 9 -3 4 4 4
G 7 7 0 - -
H 5 9 -4 5 5 5
25 3
Nótese que para la diferencia 1, se ha asignado el rango 1,5, esto sucede porque la diferencia 1
se repite 2 veces e inicialmente se les asigno los rangos 1 y 2. En estos casos se suele decir que
existe empate y se procede a asignar el promedio de los rangos a los empates (1+2)/2 = 1,5.
T=3
El Valor Crítico es 4 y T = 3
Paso5: Conclusión:
Como queríamos probar que la preferencia por el nuevo producto era mayor (H1) lo que
resultó verdadero:
Existe evidencia muestral suficiente para probar que: “existe una tendencia general a preferir
la nueva salsa a la original”
Se asigna los rangos a todos los datos como se si se tratase de una sola muestra. La prueba se basa en
la idea de que la suma de rangos será casi la misma en ambas muestras si no existiese diferencias
significativas.
91
Universidad Continental | Manual
2.1. Estadístico de prueba:
Según(Lind, Marchal & Wathe, 2012).
n1 ( n1+ n2 +1 )
T−
2
Z=
√ n1 n1 ( n1 +n2 +1 )
12
Donde:
Ejemplo
Tabla 18;
Datos Resistencia cables
Acabado
A B
3,21 3,49
3,43 3,37
3,35 3,67
3,51 3,50
339 3,31
3,17 3,29
3,48 3,52
3,42 3,37
3,29 3,44
3,40 3,53
Fuente: Díaz, 2013
Solución:
H0: MeA = MeB (no existe diferencia entre las distribuciones de las resistencias entre los dos
tipos de cable)
H1: MeA MeB
92
Universidad Continental | Manual
Prueba a dos colas
= 0.01
/2 = 0,005
n1 = 10 A B
n2 = 10 3,21 2 3,49 15
3,43 12 3,37 7.5
3,35 6 3,67 20
3,51 17 3,50 16
3,39 9 3,31 5
3,17 1 3,29 3.5
3,48 14 3,52 18
3,42 11 3,37 7.5
3,29 3.5 3,44 13
3,40 10 3,53 19
T = 2+12+6+17+9+1+14+11+3.5+10 = 85,5
n1 ( n1+ n2 +1 )
T−
2
Z=
√ n1 n1 ( n1 +n2 +1 )
12
10 ( 10+10+1 )
85.5−
2
Z= = -1.47
√ 10 (10) ( 10+10+1 )
12
93
Universidad Continental | Manual
Paso4: Decisión respecto de H0
Z > -2,575
Paso5: Conclusión:
Deseábamos probar que no existía diferencias entre las resistencias de A y B (H0) lo que
resulto verdadera:
Existe evidencia muestral suficiente para probar que “no existe diferencia entre las
distribuciones de las resistencias en los 2 tipos de cable (A y B)”
94
Universidad Continental | Manual
3. Pruebas no paramétricas: Prueba de Kruskal –Wallis y Correlación de rangos
de Spearman.
[ ( ∑ R1 ) ( ∑ R2 ) ( ∑ R 3 )
]
2 2 2
12
H= + + +. . . −3(N +1)
N ( N +1) n1 n1 n1
Donde:
ni : Tamaño de la muestra i.
El valor crítico se extrae de la tabla A-4 con gl = K -1, donde K es el número de muestras.
Ejemplo:
System Hospital en Carolina opera tres hospitales en el área de Great Charlotte: St. Luke’s
Memorial, en el lado poniente de la ciudad, Swedish Medical Center, al Sur, y el Piedmont
Hospital en el lado Este. El director de administración está preocupado acerca del tiempo de
espera de los pacientes con lesiones de tipo deportivo, que no ponen en peligro la vida, y que
llegan durante las tardes entre semana a los tres hospitales. Específicamente, ¿existe una
diferencia en los tiempos de espera en los tres hospitales?
Tabla 19:
Center
St. Luke’s Swedish
Piedmont
Memorial Medical
Hospital
56 103 42
39 87 38
48 51 89
38 95 75
73 68 35
60 42 61
62 107
89
Fuente: Elaboración propia
95
Universidad Continental | Manual
Solución:
H0: Las distribuciones de las poblaciones de los tiempos de espera son iguales para los
tres hospitales.
H1: No todas las distribuciones de las poblaciones son iguales. Existe una diferencia en
los tiempos de espera en los tres hospitales.
Para este procedimiento asignamos los rangos a los datos como si se tratase de una sola
muestra:
Center
St. Luke’s Swedish
Rangos Rangos Piedmont Rangos
Memorial Medical
Hospital
56 9.0 103 20.0 42 5.5
39 4.0 87 16.0 38 2.5
48 7.0 51 8.0 89 17.5
38 2.5 95 19.0 75 15.0
73 14.0 68 13.0 35 1.0
60 10.0 42 5.5 61 11.0
62 12.0 107 21.0
89 17.5
n1 = 7 n1 = 8 n1 = 6
N = 21
[ ( ∑ R1 ) ( ∑ R2 ) ( ∑ R 3 )
]
2 2 2
12
H= + + +. . . −3(N +1)
N ( N +1) n1 n1 n1
H=
12
21(21+1) 7 [
( 58.5 )2 ( 120 )2 ( 52.5 )2
+
8
+
6
+. .. −3(21+1) ]
H = 5.38
H < 5,991
Paso5: Conclusión:
96
Universidad Continental | Manual
Queríamos probar que había por lo menos un tiempo diferente (H1) lo que ha resultados Falso:
No existe evidencia muestral suficiente para probar que “Existe una diferencia en los tiempos
de espera en los tres hospitales”
En este acápite explicaremos el desarrollo de una prueba de hipótesis en el caso de dos variables de
quienes se tiene la idea de que se relacionan de alguna manera, como puede ser el caso de las
calificaciones obtenidas por una persona en un examen y su desempeño posterior en una empresa.
Como afirma (Díaz, 2013, p. 542) “Este coeficiente de correlación por rangos es el
equivalente no paramétrico del coeficiente de correlación de Pearson y que se calcula para
variables que están cuando menos en escala de intervalo y se utiliza, de igual manera, para
medir la relación que existe entre 2 variables cualitativas ordinales o cuantitativas que no
tienen distribución normal en sus residuos. Mide tanto la intensidad como el sentido de la
relación. Este coeficiente de correlación por rangos se calcula para variables que están en
escala ordinal y asume los mismos valores que su contraparte paramétrica; es decir, asume
valores entre −1 y 1, en donde un valor de −1 significa que existe una correlación inversa
perfecta entre las 2 variables, un valor de 1 señala que existe una correlación positiva perfecta
y valores de 0 o cercanos a 0 son señal de que no existe o existe poca relación entre las 2
variables”.
“El procedimiento para calcular este coeficiente de correlación por rangos es similar a las
otras pruebas que ya se revisaron y que se basan en rangos: se asignan rangos a las
observaciones de las 2 variables por separado y los empates se resuelven asignando el
promedio de los rangos que les corresponderían en caso de no haber empates. Después de que
se obtienen los rangos, se calculan las diferencias de éstos para cada par de observaciones de
las 2 variables. El estadístico de prueba, el coeficiente de correlación de Spearman, es” (Díaz,
2013, p. 541).
6∑d
2
rs = 1- 2
n(n −1)
Interpretación
97
Universidad Continental | Manual
–0,8 < rs –0,5 Correlación inversa moderada
rs = 0 Incorrelación
(Jurado, 2017).
6 ∑ d2
rs = 1-
n(n 2−1)
Donde:
Ejemplo:
En una investigación desarrollada en las empresas molineras de la región se desea averiguar si
existe relación entre el aprovechamiento de la oportunidad de mercado y el desarrollo de
sistemas de calidad. La tabla siguiente muestras las puntuaciones obtenidas en inspecciones a
las plantas de producción y las puntuaciones obtenidas del análisis del aprovechamiento de
oportunidades de mercado (Jurado, 2017, p. 157):
Tabla 20:
Empresa A B C D E F G H I J
Oportunidad de
125 465 156 120 425 387 234 504 489 310
mercado
Sistema de calidad 36 145 39 39 97 98 48 233 215 72
Fuente: Elaboración propia
Solución:
98
Universidad Continental | Manual
El análisis paso por el lado de determinar algunas características descriptivas de la posible
relación entre las variables. Por ello realizamos un gráfico:
Oportunidad de mercado
600
500
400
300
200
100
0
0 50 100 150 200 250
En el diagrama cada par de datos dibuja un punto. La forma que adquiere la nube de puntos
nos indica que existe una relación entre las variables en la muestra.
Se debe cambiar el orden las variables dado que se entiende que, a mayor desarrollo de
sistema de calidad, mejor debe el aprovechamiento de las oportunidades del mercado.
Asignamos rangos a los datos por separado según la variable y luego hallamos las diferencias
entre estos rangos:
Empresa A B C D E F G H I J
1 8 2.5 2.5 6 7 4 10 9 5
Oportunidad de 125 465 156 120 425 387 234 504 489 310
99
Universidad Continental | Manual
mercado
2 8 3 1 7 6 4 10 9 5
d -1 0 -0.5 1.5 -1 1 0 0 0 0
d2 1 0 0,25 2,25 1 1 0 0 0 0
d2 = 5.5
En la fórmula:
6∑ d
2
rs = 1- 2
n(n −1)
6(5,5)
rs = 1-
10(102−1)
^
rs = 0,63
rs < 0,648
Paso5: Conclusión
Queríamos probar que existe relación entre las variables (H1) pero resultó falsa.
No existe evidencia muestral suficiente para probar que “existe relación entre el
aprovechamiento de la oportunidad de mercado y el desarrollo de sistemas de calidad”
100
Universidad Continental | Manual
De la teoría a la práctica
LECTURA N° 3:
“La evaluación del desempeño es la piedra angular de los sistemas de gestión de las
personas que brinda tanto un beneficio para la organización como para los
colaboradores” (Jurado, 2017))
Entrevista a Pilar Quinteros Marquina, Gerente de Recursos Humanos de Merck Sharo & Dohme Perú
¿Cuál es el objetivo que persiguen las empresas al realizar una evaluación de desempeño, cuál es el
beneficio para la organización y para los empleados?
El sistema de evaluación del desempeño tiene como objetivo medir, analizar y desarrollar las habilidades,
conocimientos y comportamientos estratégicamente requeridos por la organización. Es la piedra angular
de los sistemas de gestión de las personas que brinda tanto un beneficio para la organización como para
los colaboradores.
Finalmente, el sistema de evaluación del desempeño es un proceso organizacional que facilita e impulsa
el logro de los objetivos de la empresa a través de las personas.
La administración del proceso comprende la gestión de las etapas y componentes del sistema de
desempeño. En general se inicia con la definición de los objetivos tanto de negocio como personales
alineados al plan estratégico, se realiza una revisión de medio año en la que se monitorean los avances y
se realizan los ajustes necesarios y finalmente se cierra el ciclo con la evaluación de fin de año. Entre los
componentes podemos resaltar diversos tipos de feedback, modalidades de medición de indicadores,
variantes en la entrevista de retroalimentación etc. La administración del proceso incluye también la
relación con otros sistemas como el de selección, compensaciones, capacitación, reconocimiento, talento,
etc.
Dependiendo del desarrollo de la gestión de las personas en la empresa el proceso de evaluación del
desempeño puede ir acompañado de un proceso paralelo y complementario que se denomina proceso de
desarrollo personal, totalmente dirigido al desarrollo de competencias personales en preparación para
asumir retos de mayor desafío. En definitiva, esto es un aporte al desarrollo del empleado como ser
humano que impacta positivamente en la organización, en la sociedad, en su entorno familiar, amical etc.
La evaluación del desempeño hace énfasis específicamente en las variables que se van a medir, cómo
medirlas, cómo desarrollarlas y potenciarlas; cómo impulsarlas desde una perspectiva organizacional.
En resumen, el sistema de evaluación del desempeño tiene como objetivo medir, analizar y desarrollar las
habilidades, conocimientos y comportamientos estratégicamente requeridos por la organización
(APTiTUS, 2009).
Los problemas surgen a raíz de una inadecuada medición y cuando estas mediciones se empelan para
promover incentivos, entonces estas mediciones pueden no tener representatividad en su media, dado que
las distribuciones de los puntajes no son normales.
101
Universidad Continental | Manual
- Ingrese al aula virtual, en la unidad 3, al cuestionario de Autoevaluación y desarrolle los
ejercicios.
102
Universidad Continental | Manual
GLOSARIO DE LA UNIDAD 3
Experimento Aleatorio Actividad realizada con el propósito de obtener datos aleatorios que permitan
probar una teoría o hipótesis (Jurado, 2017).
Muestras Independientes Son dos o más muestras que tienen elementos que no tienen ninguna relación
con otros en otras muestras. De ninguna manera forman parejas o se asocian a valores de otras muestras
(Anderson, Dennis & Thomas, 2012).
Muestras Relacionadas Dos o más muestras que tienen elementos que forman pares o asociaciones con
los datos de otras muestras y que en general pertenecen a una misma unidad de análisis (Díaz, 2013).
Multinomial Se refiere a una variable que tiene múltiples categorías como Puesto de trabajo: Gerente,
jefe de área, Secretaria (Levin & Rubin, 2004).
Prueba Paramétrica Procedimiento estándar para realizar una prueba de hipótesis con una población que
tiene una distribución normal o casi normal (Newbol, Carlson & Thorne, 2008).
Prueba No Paramétrica Procedimiento para realizar una prueba de hipótesis cuando no se conoce el tipo
de distribución de las poblaciones (Newbol, Carlson & Thorne, 2008).
Rango: Un rango es un número asignado a un elemento muestral individual de acuerdo con su lugar en
la lista ordenada. Al primer elemento se le asigna un rango de 1, al segundo elemento se le asigna un
rango de 2 y así sucesivamente (Triola, 2009).
Correlación: Una correlación existe entre dos variables cuando una de ellas está relacionada con la otra
de alguna manera (Triola, 2009).
Racha: Secuencia de sucesos iguales como bueno, bueno, bueno . . . o malo, malo , malo . . . (Triola,
2009),
Bibliografía Unidad 3
Alfaro, D., & Macera, D. (2011). Una mirada a los programas sociales [mensaje en un blog]. Obtenido
de https://www.grade.org.pe/novedades/una-mirada-a-los-programas-sociales/
Anderson, D., Dennis, S., & Thomas, W. (2012). Estadística para negocios y economía. México D. F.:
CENGAGE Learning.
Banco Central de Reserva del Perú. (2019). Banco Central de Reserva del Perú. Recuperado el 21 de
junio de 2019, de BCRP Data: https://estadisticas.bcrp.gob.pe/estadisticas/series/trimestrales
Devore, J. (2008). Probabilidad y estadística para ingenieriía y ciencias. México D. F.: CENGAGE
Learning.
Díaz, A. (2013). Estadística aplicada a la administración y la economía. Mexico D. F.: Mc Graw Hill
Education.
Díaz, A. (2013). Estadística aplicada a la administración y la economía. México D. F.: McGraw Hill.
103
Universidad Continental | Manual
Elgin Community Collage. (2016). Muestreo sistemático [figura]. Recuperado el 3 de febrero de 2018, de
Elgin.edu: https://faculty.elgin.edu/dkernler/statistics/ch01/1-4.html
Hernandez, R., Fernandez, C., & Baptista, P. (2014). Metodología de la investigación. Mexico D. F.: Mc
Graw Hill Education.
Jurado, S. (2017). Curvas y áreas. Regla de decisión [figura]. Huancayo: Universidad Continental.
León, M. (18 de junio de 2019). Las balanzas dle bienestar. Recuperado el 19 de junio de 2019, de El Pa
´s: https://elpais.com/elpais/2019/06/17/opinion/1560781691_381446.html
Levin, R., & Rubin, D. (2004). Administración para Administración y Economía. Mexico D. F.: Pearson
Education.
Lind, D., Marchal, W., & Wathe, S. (2012). Estadística aplicada a los negocios y la economía (15a ed.).
Mexico D. F.: Mc Graw Hill Education.
Manetto, F. (9 de Noviembre de 2018). Los ingresos per cápita de América Latina llevan 60 años
estancados. El País, pág. 12. Recuperado el 24 de febrero de 2019, de
https://elpais.com/internacional/2018/11/08/colombia/1541659854_428801.html
Newbol, P., Carlson, W., & Thorne, B. (2008). Estadística para Administración (6a ed.). (R. Esther,
Trad.) Madrid: Pearson Education.
Persekutuan, W. (28 de setiembre de 2008). Blogger Ng Ooi Pin @ Json. Recuperado el 21 de julio de
2016, de RAG 132 BUILT ENVIRONMENT & HUMAN SETTLEMENTS:
http://ngooipin.blogspot.pe/
Pontificia Universidad Catolica del Perú. (2009). Instituto de Opinión Pública - Data. (I. d. Pública,
Editor) Obtenido de https://docs.google.com/viewer?url=http://iop-data.pucp.edu.pe/media/
archivos/2009/11/1/IOP_1109_01_F.pdf&embedded=true0
Real Academia Española. (2019). Diccionario de la Lengua española (pagina web). (R. A. Española,
Editor) Obtenido de http://lema.rae.es/dpd/srv/search?key=aleatorio
Triola, M. (2018). Estadística (12a ed.). (J. Murrieta, Trad.) Mexico D. F.: Pearson Education.
Wikimedia org. (2017). Distribución t con diferentes tamaños de muestra [figura]. Obtenido de
Wikilibros: https://es.wikibooks.org/wiki/Tablas_estad%C3%ADsticas/Distribuci
%C3%B3n_t_de_Student
104
Universidad Continental | Manual
105
Universidad Continental | Manual
Unidad 4:
CORRELACIÓN, REGRESIÓN Y SERIES DE TIEMPO
Diagrama de organización de la Unidad IV
Resultado de aprendizaje de la Unidad 4:
Al finalizar la unidad, el estudiante será capaz de realizar pruebas de hipótesis de correlación y
regresión, y series de tiempo.
CONOCIMIENTOS HABILIDADES ACTITUDES
Tema n° 1. Correlación 1. Analiza y valida la correlación • Valora reflexivamente la
1. Correlación entre variables. importancia de la
Tema n° 2. Regresión 2. Calcula el intervalo de interpretación de los modelos
lineal simple. predicción para la estimación de de predicción y de series de
Tema n° 3. Regresión valores pronosticados. tiempo en la toma de
múltiple 3. Identifica modelos de regresión decisiones.
Tema n° 4. Series de múltiple y los interpreta.
tiempo.
4. Realiza la suavización
1. Modelos de series de
exponencial.
tiempo.
5. Construye modelos de series de
2. Promedios móviles y
tiempo y analiza la tendencia y
suavizamiento
estacionalidad.
exponencial.
6. Interpreta los modelos de series
3. Análisis de tendencia.
de tiempo.
Actividad 1:
Participa del foro de discusión
sobre aplicación de la correlación
en el ámbito de trabajo.
Actividad 2:
Evaluación del tema N° 1 y el
Tema N° 2
106
Universidad Continental | Manual
Introducción
En la estadística, se tienen métodos que permiten obtener estimaciones de pronósticos en base a dos lo
más variables cuantitativas. Los métodos aquí presentados tienen condiciones de normalidad que
retomamos de las unidades 1 y 2.
Así, si conocemos el desarrollo de los datos dos variables, se puede inferir que estas variables tengan
datos que de alguna manera se relacionen. Los métodos aquí presentados nos van a permitir poner a
prueba estas afirmaciones para luego mediante el cálculo de la regresión, con los datos muestrales,
obtener una función matemática que permita realizar pronósticos sobre valores que no se encuentran en la
muestra.
La primera desarrolla las pruebas de correlación entre dos variables, la segunda sobre la regresión con dos
variables, la tercera sobre la correlación y regresión de más de dos variables, así como modelación no
lineal y en la cuarta parte el desarrollo de técnicas de predicción empleando series temporales.
El autor
107
Universidad Continental | Manual
Tema n° 1. Correlación.
En el capítulo presente se aborda nuevamente el análisis de la relación entre dos variables. Pero en esta
oportunidad las variables son cuantitativas y se aplicarán métodos paramétricos.
1. Correlación
Cuando nos referimos a que existe correlación entre dos variables, como ejemplo podemos
mencionar dos variables muy conocidas el ámbito empresarial: Ingresos y Ganancias, podemos intuir
que estas dos variables se relacionan dado que de forma empírica podemos afirmar que, a mayores
Ingresos, mayores serán las ganancias en una empresa, o viceversa.
En el desarrollo del análisis de los datos, no solo interesa si existe relación, sino que además importa
saber cómo es esa relación. Para esto un gráfico de dispersión nos puede dar una respuesta más
completa. Como ejemplo graficaremos los datos de la siguiente tabla, en la que, cada pareja de datos
se tomará como coordenadas de puntos en el plano cartesiano:
Tabla 21:
Datos ejemplo correlación lineal
La gráfica además nos muestra que el comportamiento de los puntos se acerca bastante a una forma
lineal, es decir se acercan bastante a una línea recta ascendente. Por esta razón la correlación que
pudiera existir entre las variables se denomina “lineal”
Por ello es por lo que nuestro análisis girará en torno a la función lineal como modelo del
comportamiento de la relación entre las variables Independiente (x) y dependiente (y)
108
Universidad Continental | Manual
2.1. Gráfico de dispersión
Un gráfico de dispersión presenta los pares de datos representados como puntos en un plano
cartesiano. Su forma es un indicador de la forma y fuerza de la relación. En general las formas
en las que se puede presentar sen lo siguiente:
La correlación se define como lineal directa cuando los valores de “y” aumentan si los de “X”
lo hacen.
Una correlación lineal inversa es aquella en la que los valores de “Y” disminuyen cuando “X”
aumenta.
109
Universidad Continental | Manual
El coeficiente de correlación lineal (de Pearson)se calcula con:
n ∑ xy−∑ x ( ∑ y )
r=
√ n ∑ x − ( ∑ x ) √ n ∑ y −( ∑ y )
2 2 2 2
Mide la fuerza de la relación lineal entre las variables, por ello puede tener las siguientes
interpretaciones:
Interpretación
rs = 0 Incorrelación
Ejemplo:
En el cálculo de la resistencia de suelos tienen mucha importancia los componentes del suelo
estudiado. La siguiente tabla resumen las resistencias encontradas en 9 terrenos con diferentes
contenidos de arena o grava. ¿Al nivel de 5% de significancia se puede decir que el contenido
de arena en el suelo influye en su resistencia? (Jurado, 2017)
110
Universidad Continental | Manual
50
Tabla 22:
Datos ejemplo Grava
40
Resist
%Grav.
Kg/cm2
8 10
30
22 25
10 15
3 7 20
12 16
15 18 10
30 42
18 21
0
25 37 0 5 10 15 20 25 30 35
Fuente: Elaboración
propia Figura 21: Gráfico de dispersión ejemplo cálculo de coeficiente de
correlación.
Fuente: Elaboración propia.
El análisis inicia con un gráfico de dispersión. Este nos indica que existe una correlación lineal
considerable entre las variables y que esta relación es directa, a mayor % de Grava, mayor
resistencia del suelo.
n ∑ xy−∑ x ( ∑ y )
r=
√ n ∑ x − ( ∑ x ) √ n ∑ y −( ∑ y )
2 2 2 2
9(3826)−143(191)
r=
√ 9(2875)−( 143 ) √ 9(5153)−( 191 )
2 2
r = 0.97178736
Prueba de Hipótesis:
n ∑ xy−∑ x ( ∑ y )
r=
√ n ∑ x − ( ∑ x ) √ n ∑ y −( ∑ y )
2 2 2 2
111
Universidad Continental | Manual
9(3826)−143(191)
r=
√ 9(2875)−( 143 ) √ 9(5153)−( 191 )
2 2
r = 0,97178736
Paso5: Conclusión
Queríamos probar que existía correlación entre las variables (H1) lo que resultó verdadero:
Existe evidencia muestral suficiente para probar que “Existe correlación lineal directa entre %
de Grava y Resistencia del suelo”
Cuando se ha comprobado que existe correlación entre dos variables, se puede proceder al cálculo de
una función lineal que se al que mejor se “ajuste” a los pares de datos (puntos en el diagrama de
dispersión). A este proceso se le conoce como “Regresión”
1. Ecuación de regresión:
^y =b0 +b1 x
Donde:
n ∑ xy−∑ x ∑ y
b1 = 2 y b0 = y−x b1
n ∑ x −( ∑ x )
2
112
Universidad Continental | Manual
La ecuación de regresión en la población:
^y =β 0 + β 1 x
Cuando se logra la ecuación de regresión se puede someter a prueba la pendiente de la recta en
la población β1 , porque este puede ser “cero” en la población. Si la pendiente es “cero”,
produce que β 1 x = 0, por tanto, el valor del estimado de Y será:
^y =β 0
b1−β 1
t=¿ Se
√ s x∗( n−1 )
Donde:
Se =¿
√ ∑ y 2−b0 ∑ y−b1 ∑ xy
n−2
Ejemplo:
Con los datos del ejemplo anterior, y ya que se ha probado que existe correlación lineal
directa, se procede a determinar la ecuación de regresión
%Grav.
Resist n=9 9 ( 3826 )−(143)( 191)
Kg/cm2 b1 =
8 10 ∑ x =¿ 143 9 ( 2875 ) −1432
22 25
10 15 ∑ y=¿ 191
3 7 b 1 = 1,3224
12 16 ∑ x 2=¿ 2875
15 18
30 42
∑ y2 =¿ 5153 b 0 = 21.2222 – 15,8889(1.¿,3224)
18
25
21
37
∑ xy =¿ 3826
113
Universidad Continental | Manual
b 0 = 0,3699
x = 15.8889
y = 21.2222
^y =0,3699+ 1,3224 x
Prueba de Hipótesis:
S e=
√ ∑ y 2−b0 ∑ y−b1 ∑ xy
n−2
Sx =
√ ∑ ( xi −x )2 = 8,6811
n−1
S e=
√ 5153−( 0.3699 ) ( 191 )−(1.3124)( 3826)
n−2
n=9
Se= 8,7036
Reemplazando:
b1−β 1
t= Se
√ s x∗( n−1 )
1.3124−0
t= 8.7036
√ 8.6811∗8
t = 3,6999
t > 2,365
114
Universidad Continental | Manual
Paso5: Conclusión:
Existe evidencia muestral suficiente para probar que “1 ≠ 0 La pendiente no es cero. La
ecuación no es constante”
En el caso del ejemplo supongamos que requerimos calcular el valor de la Resistencia de suelo
si se tiene un porcentaje de 28% de grava.
x = 28
^y = 0,3699 + 1,3124 x
^y = 0,3699 + 1,3124(28)
^y = 37,1171 kg/cm2
El mejor estimado puntual para el valor de la Resistencia del suelo cuando el porcentaje de
grava es de 28%, es de 31,12Kg/cm2
En un modelo determinístico como en una función se espera un solo resultado, a cada valor de
“x” le corresponde un valor de ”y”. Nuestros datos han sido comparados con este tipo de
modelo.
Nuestros datos distan de comportarse de esta manera, nuestros datos se comportan de manera
aleatoria, es decir suceden al azar y por cada “x” pueden existir infinitos valores como en
nuestro ejemplo. Par un valor del porcentaje de Grava como 28%, pueden existir otros niveles
Resistencia de suelo, que no solo depende del contenido de Grava, sino de otros componentes
y condiciones que alteran la resistencia.
115
Universidad Continental | Manual
Figura 22: Resultados probables para x = 28. Tomado de
Estadística Inferencial. Manual de Auto aprendizaje, por Sergio
Jurado, 2017.
Para el cálculo de una estimación, consideramos que estos posibles resultados tienen una
distribución normal con media en el valor de la estimación puntual calculada con la ecuación
de regresión ( ^y = 37.1171).
^y −E < y < ^y + E
Donde:
E: Es el margen de error
√
2
1 n ( x− x )
E=t α /2∗s e∗¿ 1+ +
n n ∑ x 2+ ( ∑ x )2
Ejemplo:
Solución:
Datos
√
n=9 2
1 n ( x− x )
E=t α /2∗s e∗¿ 1+ +
∑ x =¿ 143 n n ∑ x 2+ ( ∑ x )2
116
Universidad Continental | Manual
√
2
1 9 ( 28−15.8889 )
E=2,306(8,7036)∗¿ 1+ +
9 9(2875)+ ( 143 )2
∑ x 2=¿ 2875
E=23,3543
x = 15,8889
^y −E < y < ^y + E
Se =¿ 8,7036
gl = 8
37,1171−23,3543< y< 37,1171+23,3543
= 0,05
t α / 2=¿ 2,306
2 2
13,763 kg /cm < y <60,471 kg /cm
117
Universidad Continental | Manual
Tema n° 3. Correlación Regresión Lineal Múltiple.
Hablaremos ahora del análisis de correlación y regresión cuando se tiene más de una variable
independiente. El modelo general al que se ajustarán los datos será:
^y =β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 +…
1. Correlación
CMR
F=
CME
Donde:
SCR ∑ ( ^y i− y )
2
CMR=¿ =
p p
p = Grados de libertad de la regresión
=¿ ∑ ( i i )
2
SCE y − ^y
CME=¿
n− p−1 n− p−1
Tabla 23:
ANOVA de un Factor – Fórmulas
Cuadrados
Origen Suma de Cuadrados gl F
medios
Regresión CMR=¿
CMR
SCR=∑ ( ^y i− y ) 2
p SCR F=¿
CME
p
Error CME=¿
SCE=∑ ( y i− ^y i)
2
n− p−1 SCE
n− p−1
118
Universidad Continental | Manual
Total
SCT=∑ ( y i− y )2 n−1
2 SCR
R =¿ SCT
Pero este coeficiente tiende a “inflar” el valor de la correlación a medida que se incluyen más
variables independientes, por ello debe corregirse para determinar el verdadero valor de la
bondad de ajuste:
n−1
Rajust =¿ 1 – ( 1−R 2 )*
2
n− p−1
Ejemplo:
“Butler Trucking Company, una empresa que se dedica al transporte de objetos y mercancías
en el sur de California. Para mejorar el horario de trabajo, los gerentes deseaban estimar el
tiempo total de recorrido diario necesario para efectuar las entregas. Los gerentes creen que
este tiempo está relacionado con las Millas recorridas y el número de entregas. A partir de una
muestra aleatoria simple de 10 repartidores con asignación de recorrido se obtuvieron los
datos que se presentan en la tabla siguiente” (Anderson, Dennis & Thomas, 2012, p. 324):
Tabla 24:
Datos ejercicio Correlación múltiple
Número de Tiempo de
Millas
Recorrido entregas viaje (hrs)
x1
x2 y
1 100 4 9.3
2 50 3 4.8
3 100 4 8.9
4 100 2 6.5
5 50 2 4.2
6 80 2 6.2
7 75 3 7.4
8 65 4 6.0
119
Universidad Continental | Manual
9 90 3 7.6
10 90 2 6.1
Usando Excel:
Tabla 25:
Tabla ANOVA de ejemplo de regresión múltiple
ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de los Valor crítico
libertad cuadrados cuadrados F de F
Regresión 2 21,6005565 10,8002783 32,8783674 0,00027624
Residuos 7 2,29944349 0,32849193
Total 9 23,9
Fuente: Jurado, 2017
F = 32,8784
F > 4,7374
Paso5: Conclusión
Existe evidencia muestral suficiente para probar que “Existe correlación lineal múltiple entre Tiempo
de viaje y N° de millas, N° de entregas”
120
Universidad Continental | Manual
Tanto como en la regresión lineal simple, se debe obtener la ecuación de regresión. Para este cálculo
se emplea el método de los mínimos cuadrados. Un software como Excel nos puede brindar:
Tabla 26:
Tabla de coeficientes ejemplo correlación múltiple
^y =−0,8687+0,06113 x 1+ 0,9235 x 2
Que requiere verificar si alguno de los coeficientes (β1 = 0,06113 y β2 = 0,9235) es igual a 0,
lo que nos permitiría decidir si la ecuación hallada es realmente el mejor modelo o se requiere
otro con menos variables independiente.
H0: β 1 = 0 H0: β 2 = 0
H1: β 1 0 H1: β 2 0
= 0,05
Para β 1 : Para β 2 :
121
Universidad Continental | Manual
Paso4: Decisión respecto de H0
Para β 1 : Para β 2 :
Paso5: Conclusión
Para β 1 : Para β 2 :
122
Universidad Continental | Manual
3. Series de tiempo.
“Fenómenos como las ventas, los gastos, el PBI, la producción de una fábrica, los clientes atendidos,
el desarrollo de factores económicos son ejemplos de aplicación del Análisis de Series Temporales.
En todos ellos los datos suceden en el tiempo y varían aleatoriamente” (Jurado, 2017, p. 67).
“Por esto, una serie temporal se conoce como un suceso estocástico de variable discreta-discreta,
discreta-continua. Se compone de los datos aleatorios tomados sucesivamente en el tiempo lo que
configura una gráfica como:” (Jurado, 2017, p. 162)
1.8
1.6
1.4
1.2
Mediciones
0.8
0.6
0.4
0.2
0
0 5 10 15 20 25
tiempo
Figura 23: Ejemplo de serie temporal. Tomado de Estadística Inferencial. Manual de Auto
aprendizaje, por Sergio Jurado, 2017.
Una serie temporal está compuesta de: Tendencia, Estacionalidad, variación Cíclica, y la Aleatoria.
123
Universidad Continental | Manual
Figura 24: Formas de la componente Tendencia en la serie temporal, Tomado de
Estadística Inferencial. Manual de Auto aprendizaje, por Sergio Jurado, 2017.
1.2. Estacional:
“La estacionalidad en una serie temporal provoca que a serie se mueva arriba hacia debajo de
manera periódica en periodos cortos, generalmente en periodos de un año, por ello el nombre
de Estacionalidad ya que las variaciones suceden año a año en las mismas fechas, como las
estaciones” (Jurado, 2017, p. 75).
Repeticiones
estacionales
Promedio Móviles:
124
Universidad Continental | Manual
El procedimiento más simple es el de un promedio impar. Los promedios móviles se calculan
en agrupaciones de 3, 5, 7 a más datos sucesivos
= (345+342+338)/3
= (342+338+347)/3
125
Universidad Continental | Manual
Se realiza en dos etapas; ❶ Calcule el promedio móvil tomando 4 datos y luego calcule ❷
promedios móviles de 2 de los promedios de 4:
Se hace un cálculo de promedios móviles buscando un valor que coincida con un valor de la
variable Y.
En una serie temporal puede elegir una amplitud de promedio móvil de acuerdo con
comportamiento de los datos o en función de los periodos de medición o toma de datos
Cuando se toman en cuenta los valores medidos y su variación se puede actuar conforme lo
indica (Jurado, 2017):
126
Universidad Continental | Manual
por tanto, el promedio móvil que debe aplicarse debería ser de amplitud 3 (PM3)” (Jurado,
Estadística, 2017 p. 126).
En el segundo caso, se toma simplemente el periodo que se uso en la toma de datos, si los
datos se tomaron cada mes, entonces se asumen un Promedio Móvil de 12, si los datos fueron
Figura 30: Estacionalidad. tomados cada trimestre se
Fuente: Elaboración propia asumen un Promedio Móvil de
4.
Y
Ei =
∑ PM *f
k
1.3. Cíclico:
Se establece como aquella variación en la serie que produce cambios de manera periódica,
pero con periodos muy amplios, de más de un año.
Podemos citar como ejemplo de las causas de estas variaciones: los cambios de gobiernos
democráticos, el fenómeno del niño, . . .
1.4. Irregular
Los sucesos como los desastres naturales, terremotos, sunamis, huracanes y los sucesos socio
políticos como los golpes de estado en países poco desarrollados, las guerras, los fenómenos
económicos como las crisis financieras . . . son causa de variaciones de este tipo. Son
totalmente aleatorias e impredecibles.
127
Universidad Continental | Manual
Modelo Aditivo:
Modelo Multiplicativo:
Tabla 27: Evolución Precios por m2 de departamentos en La Molina, Miraflores, San Borja, San
Isidro y Surco por trimestres
Trimestr
e 2013 2014 2015 2016 2017 2018
T1 4198,3 4733,5 4981,5 5249,7 4854,6 4717,5
T2 4553,2 5094,1 4926,0 4916,8 4786,0 4658,5
T3 4588,3 4762,4 4952,5 5009,7 4749,8 4872,3
T4 4436,5 4818,1 5049,7 5205,4 4691,3 4890,6
Fuente: Series Trimestrales, Gerencia de general de Estudios Económicos. por (Banco
Central de Reserva del Perú, 2019),
Elaboración: Propia
c. Determine un pronóstico de las ventas trimestrales para el cuarto trimestre del año 2019
Solución:
a. Análisis de Tendencia
128
Universidad Continental | Manual
Figura 32: Disposición de datos para el cálculo de la
Serie Temporal. Fuente: Elaboración propia
^y =4677,784+11,432 x
b. Índices Estacionales
Tomando en cuenta que los datos son trimestrales asumiremos u promedio móvil de amplitud
4:
Para ello calculamos los promedios tomando 4 datos a la vez y avanzamos dejando uno y
tomando el siguiente en la tabla vertical como se puede ver en la figura siguiente:
129
Universidad Continental | Manual
A. Cálculo de promedios móviles PM4
Datos Promedio
4198,3
4553,2 4444,075
4588,3
4436,5
4553,2
4588,3 4577,875
4436,5
4733,5
4588,3
4436,5 4713,10
4733,5
5094,1
Dado que los promedios están ubicados al centro de cada grupo, para que el resultado
coincida con un valor de la serie original se vuelve a calcular un promedio móvil de
amplitud 2:
De la ecuación general:
Y Y
^y = T * E * C * I despejando E= =
T∗C∗I PM
Determinamos el valor de los coeficientes estacionales E0 =Y/PM4
130
Universidad Continental | Manual
Tabla 28: Desarrollo del cálculo de los componentes estacionales.
Los valores de la última columna son valores no estandarizados de E, por ello se debe
proceder estandarizarlos. Copiamos la última columna y la ordenamos por trimestres y años en
una tabla de doble entrada:
Los índices :
Los promedios se
multiplican por el factor de
corrección fc:
fc = 4/3.99736
131
Universidad Continental | Manual
Tabla 30: Índices estacionales de Precios de
departamentos por m2.
Al cuarto trimestre del 2019 le corresponde el periodo t = 28 ya que nuestros datos son en total
24 hasta el cuarto trimestre del 2018.
X = 28
T = Y = 4677,784 +11,432 x
T = Y = 4677.784 +11,432(18)
T = 4997,88
ET 4= 0,9967
Proyección:
132
Universidad Continental | Manual
De la teoría a la práctica
LECTURA N° 4:
"Las balanzas del bienestar" Margarita León. El País, 18 de junio de 2019.
“Imaginemos un Gobierno que decide destinar un 2% de su producto interior bruto a prevenir y erradicar
la violencia contra las mujeres. Los recursos se distribuyen en medidas preventivas, en mejorar los
mecanismos de detección, atender a las víctimas y procurarles un presente y un futuro dignos. En el
transcurso de unos años, aumentan las denuncias, el número de agresiones y homicidios disminuye, y
mejoran las expectativas de las víctimas. La sociedad termina por comprender la raíz y complejidad del
fenómeno y muestra mayoritariamente su repulsa. Imaginemos ahora otro Gobierno que destina esa
misma proporción de su PIB a combatir la violencia provocada por el narcotráfico. En este caso, los
recursos se destinan casi en su totalidad a incrementar el gasto militar y de las fuerzas de seguridad del
Estado. Aquí, en cambio, la violencia que se pretendía combatir, lejos de disminuir, aumenta. En un
contexto de corrupción generalizada, los homicidios se disparan justamente en los territorios con mayor
presencia del ejército y la policía. La inseguridad ciudadana alcanza niveles sin precedentes.
¿Tiene ese mismo esfuerzo presupuestario el mismo valor añadido? Depende de lo que entendamos por
valor añadido. Si lo que evaluamos es el aumento del gasto en sí, es probable que en el segundo ejemplo
el saldo sea superior al estimular a su vez otros gastos paralelos, como la producción de armas, por
ejemplo. Si, por el contrario, lo que nos interesa es constatar mejoras de progreso social, concluiríamos
que, bajo parámetros objetivables de calidad de vida de las comunidades más afectadas, su incidencia es
positiva en el primero y negativa en el segundo. Sin embargo, el indicador más utilizado, por ser el más
disponible, para analizar los esfuerzos en política pública de los Estados y compararlos entre sí es
precisamente la evolución del gasto en relación con el PIB. Sin duda, el camino más corto, pero no el
mejor. En general, evaluar las balanzas públicas en función de la productividad y el crecimiento puede
llegar a distorsionar sobremanera la realidad porque mide a medias lo que pretende medir, y, además,
otras cosas importantes, como si somos más libres, felices o solidarios, ni siquiera las observa.
¿Cómo otorgar, entonces, valor a aquello que contribuye al bienestar de una sociedad? Esta es
precisamente la pregunta para la que Jacinda Arden, primera ministra de Nueva Zelanda busca respuesta.
Su presupuesto nacional del bienestar, anunciado hace unos días, está orientado a lidiar con problemas y
desafíos tan dispares como la pobreza infantil, la discriminación de la comunidad maorí, la violencia
machista, el sinhogarismo y las emisiones de CO2. La idea no es nueva, pero se mueve despacio. Ya en
2008, la Unión Europea, a instancias de la presidencia francesa, creó una comisión para la medición de la
economía y el progreso social. Ese esfuerzo colectivo, recogido en Medir nuestras vidas, de los
economistas Stiglitz, Sen y Fitoussi, no era más que una fundada invitación a mejorar la métrica. Es un
debate necesario al que cada vez se unen más voces, desde el ecologismo hasta el feminismo, que, para
ser justos, especialmente esta última hace siglos que lo reclama, pero de momento no parece que hayamos
pasado de formular las preguntas. De hecho, algunos años más tarde del trabajo de aquella comisión, la
UE dio un paso en la dirección contraria al incluir en la contabilidad económica los beneficios de la
prostitución y el tráfico de drogas. En el ejercicio de visibilizar la aportación de las actividades ilegales a
la economía resultaron unas nuevas sumas que consiguieron aumentar la riqueza europea hasta en un 4%.
Todo un contrasentido. A través de los desafíos impuestos por la crisis ecológica, el aumento
generalizado de la desigualdad y la automatización del empleo es más fácil entender la perversidad de
crecimientos que no asumen los límites sociales o ecológicos.
Los 17 Objetivos de Desarrollo Sostenible de la ONU son un referente importante en esta dirección, pero
por ver está que logre efectivamente ir más allá de realizar esfuerzos añadidos que funcionan más desde
una lógica de promedios de cumplimiento que desde un ejercicio reflexivo de cambio de paradigma.
Mientras los países nombran guardianes que velan por cada uno de los 17 indicadores, en la mayoría de
los escenarios no se vislumbran todavía las rupturas políticas necesarias. Si el futuro deseable es un
sistema económico más pequeño que opere dentro de los límites que impone la naturaleza y esté
133
Universidad Continental | Manual
socialmente cohesionado, tendríamos que empezar por reconocer que los dilemas a los que nos
enfrentamos raramente son un juego de suma cero. Aún tenemos pendiente decidir colectivamente dónde
termina el derecho de una minoría a elegir lo que para la mayoría resulta inalcanzable. Todavía nos queda
por entender cómo resolver la relación prevalente entre percepción de bienestar y capacidad de consumo
material. Se trata de llegar al fondo de las cuestiones. No vayamos a quedarnos nadando en la superficie
por miedo a sumergirnos mar adentro” (León, 2019).
- Ingrese al cuestionario.
- Lea las instrucciones con mucha atención.
- Realice los ejercicios.
134
Universidad Continental | Manual
GLOSARIO DE LA UNIDAD 4
Bondad de ajuste Medida de la capacidad de un modelo de regresión para explicar las variaciones en la
variable dependiente. Lo que también nos lleva decir que es la medida de lo bien que se ajusta un modelo
a los datos de dos variables correlacionadas (Triola, 2009).
Correlación: Una correlación existe entre dos variables cuando una de ellas está relacionada con la otra
de alguna manera (Triola, 2009)
Regresión: . . . en los modelos probabilísticos, en los que una variable no está determinada por completo
por la otra variable. Por ejemplo, la estatura de un niño no está completamente determinada por la estatura
del padre . . . las estaturas de éstos tienden a regresar o a revertirse a la estatura media más común de las
personas del mismo género (Triola, 2009).
Coeficiente de correlación lineal: Es el valor que mide la fuerza de la relación entre dos variables . . .
(Jurado, 2017).
Ecuación de regresión: Es la ecuación de la recta que representa mejor la relación . . . entre dos
variables. Esta recta se conoce como recta de regresión y su ecuación como ecuación de regresión. A
partir de datos muestrales apareados, calcularemos valores estimados de b0, que es la intersección en “y”,
y la pendiente b1, de manera que podamos identificar una línea recta con la ecuación: ^y =b0 +b1 x
(Newbol, Carlson & Thorne, 2008).
Margen de error: Es la diferencia máxima probable (con probabilidad 1 - a) entre el valor muestral
observado y el valor real de la poblacional (Triola, 2009)
Linealizar Método matemático que permite transformar una ecuación exponencial, logarítmica, etcétera,
en una ecuación lineal con la finalidad de aplicar el análisis de correlación y regresión lineal (Devore,
2008).
Suavizamiento Proceso del método de Análisis de series temporales que permite quitar la componente
estacional de la serie (Anderson, Dennis & Thomas, 2012).
Variable Dependiente Es la variable con valores que cambian en alguna medida al cambiar los valores
de la variable independiente (Jurado, 2017).
Variable independiente Variable que tiene la cualidad de tener datos que cuando se producen, provocan
que la variable dependiente los produzca (Jurado, 2017).
Bibliografía de la Unidad 4
Anderson, D., Dennis, S., & Thomas, W. (2012). Estadística para negocios y economía. México D. F.:
CENGAGE Learning.
Devore, J. (2008). Probabilidad y estadística para ingenieriía y ciencias. México D. F.: CENGAGE
Learning.
Díaz, A. (2013). Estadística aplicada a la administración y la economía. Mexico D. F.: Mc Graw Hill
Education.
135
Universidad Continental | Manual
León, M. (18 de junio de 2019). Las balanzas dle bienestar [versión digital]. El País. Recuperado de
https://elpais.com/elpais/2019/06/17/opinion/1560781691_381446.html
Levin, R., & Rubin, D. (2004). Administración para Administración y Economía. Mexico D. F.: Pearson
Education.
Lind, D., Marchal, W., & Wathe, S. (2012). Estadística aplicada a los negocios y la economía (15a ed.).
Mexico D. F.: Mc Graw Hill Education.
Newbol, P., Carlson, W., & Thorne, B. (2008). Estadística para Administración (6a ed.). (R. Esther,
Trad.) Madrid: Pearson Education.
Triola, M. (2018). Estadística (12a ed.). (J. Murrieta, Trad.) Mexico D. F.: Pearson Education.
136
Universidad Continental | Manual
4. APENDICES.
APENDICE A.
Tabla 31.
Tabla de Números Aleatorios
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
Fuente: Estadística inferencial, por Claudio Cerrón, 2012.
137
Universidad Continental | Manual
APENDICE B. Tablas de Valores Críticos:
139
Universidad Continental | Manual
Valores críticos para el Valores críticos para la Valores críticos para la prueba
coeficiente de correlación de Valores críticos para la
Tabla A-6 Tabla A-7 Tabla A-8 prueba de rangos con signo Tabla A-9 de correlación de rangos de
prueba del signo
Pearson r de Wilcoxon Spearman
140
Tabla 36: Tabla de la distribución F
11 6.7241 5.2559 4.6300 4.2751 4.0440 3.8807 3.7586 3.6638 3.5879 3.5257 3.4296 3.3299 3.2261 3.1725 3.1176 3.0613 3.0035 2.9441 2.8830
12 6.5538 5.0959 4.4742 4.1212 3.8911 3.7283 3.6065 3.5118 3.4358 3.3736 3.2773 3.1772 3.0728 3.0187 2.9633 2.9063 2.8478 2.7874 2.7252
13 6.4143 4.9653 4.3472 3.9959 3.7667 3.6043 3.4827 3.3880 3.3120 3.2497 3.1532 3.0527 2.9477 2.8932 2.8372 2.7797 2.7204 2.6590 2.5957
14 6.2979 4.8567 4.2417 3.8919 3.6634 3.5014 3.3799 3.2853 3.2093 3.1469 3.0502 2.9493 2.8437 2.7888 2.7324 2.6742 2.6142 2.5519 2.4875
15 6.1995 4.7650 4.1528 3.8043 3.5764 3.4147 3.2934 3.1987 3.1227 3.0602 2.9633 2.8621 2.7559 2.7006 2.6437 2.5850 2.5242 2.4611 2.3956
16 6.1151 4.6867 4.0768 3.7294 3.5021 3.3406 3.2194 3.1248 3.0488 2.9862 2.8890 2.7875 2.6808 2.6252 2.5678 2.5085 2.4471 2.3831 2.3165
17 6.0420 4.6189 4.0112 3.6648 3.4379 3.2767 3.1556 3.0610 2.9849 2.9222 2.8249 2.7230 2.6158 2.5598 2.5020 2.4422 2.3801 2.3153 2.2477
18 5.9781 4.5597 3.9539 3.6083 3.3820 3.2209 3.0999 3.0053 2.9291 2.8664 2.7689 2.6667 2.5590 2.5027 2.4445 2.3842 2.3214 2.2558 2.1872
19 5.9216 4.5075 3.9034 3.5587 3.3327 3.1718 3.0509 2.9563 2.8801 2.8172 2.7196 2.6171 2.5089 2.4523 2.3937 2.3329 2.2696 2.2032 2.1336
20 5.8715 4.4613 3.8587 3.5147 3.2891 3.1283 3.0074 2.9128 2.8365 2.7737 2.6758 2.5731 2.4645 2.4076 2.3486 2.2873 2.2234 2.1562 2.0856
21 5.8266 4.4199 3.8188 3.4754 3.2501 3.0895 2.9686 2.8740 2.7977 2.7348 2.6368 2.5338 2.4247 2.3675 2.3082 2.2465 2.1819 2.1141 2.0425
22 5.7863 4.3828 3.7829 3.4401 3.2151 3.0546 2.9338 2.8392 2.7628 2.6998 2.6017 2.4984 2.3890 2.3315 2.2718 2.2097 2.1446 2.0760 2.0035
23 5.7498 4.3492 3.7505 3.4083 3.1835 3.0232 2.9023 2.8077 2.7313 2.6682 2.5699 2.4665 2.3567 2.2989 2.2389 2.1763 2.1107 2.0415 1.9680
24 5.7166 4.3187 3.7211 3.3794 3.1548 2.9946 2.8738 2.7791 2.7027 2.6396 2.5411 2.4374 2.3273 2.2693 2.2090 2.1460 2.0799 2.0099 1.9356
25 5.6864 4.2909 3.6943 3.3530 3.1287 2.9685 2.8478 2.7531 2.6766 2.6135 2.5149 2.4110 2.3005 2.2422 2.1816 2.1183 2.0516 1.9811 1.9058
26 5.6586 4.2655 3.6697 3.3289 3.1048 2.9447 2.8240 2.7293 2.6528 2.5896 2.4908 2.3867 2.2759 2.2174 2.1565 2.0928 2.0257 1.9545 1.8784
27 5.6331 4.2421 3.6472 3.3067 3.0828 2.9228 2.8021 2.7074 2.6309 2.5676 2.4688 2.3644 2.2533 2.1946 2.1334 2.0693 2.0018 1.9299 1.8530
28 5.6096 4.2205 3.6264 3.2863 3.0626 2.9027 2.7820 2.6872 2.6106 2.5473 2.4484 2.3438 2.2324 2.1735 2.1121 2.0477 1.9797 1.9072 1.8295
29 5.5878 4.2006 3.6072 3.2674 3.0438 2.8840 2.7633 2.6686 2.5919 2.5286 2.4295 2.3248 2.2131 2.1540 2.0923 2.0276 1.9591 1.8861 1.8075
30 5.5675 4.1821 3.5894 3.2499 3.0265 2.8667 2.7460 2.6513 2.5746 2.5112 2.4120 2.3072 2.1952 2.1359 2.0739 2.0089 1.9400 1.8664 1.7870
40 5.4239 4.0510 3.4633 3.1261 2.9037 2.7444 2.6238 2.5289 2.4519 2.3882 2.2882 2.1819 2.0677 2.0069 1.9429 1.8752 1.8028 1.7242 1.6375
141
Universidad Continental | Manual
60 5.2856 3.9253 3.3425 3.0077 2.7863 2.6274 2.5068 2.4117 2.3344 2.2702 2.1692 2.0613 1.9445 1.8817 1.8152 1.7440 1.6668 1.5810 1.4826
120 5.1523 3.8046 3.2269 2.8943 2.6740 2.5154 2.3948 2.2994 2.2217 2.1570 2.0548 1.9450 1.8249 1.7597 1.6899 1.6141 1.5299 1.4327 1.3110
##### 5.0240 3.6889 3.1162 2.7859 2.5666 2.4083 2.2876 2.1919 2.1137 2.0484 1.9448 1.8326 1.7085 1.6402 1.5660 1.4836 1.3884 1.2685 1.0173
Fuente: Estadística por Mario Triola (2012)
5 6.6079 5.7861 5.4095 5.1922 5.0503 4.9503 4.8759 4.8183 4.7725 4.7351 4.6777 4.6188 4.5581 4.5272 4.4957 4.4638 4.4314 4.3985 4.3651
6 5.9874 5.1433 4.7571 4.5337 4.3874 4.2839 4.2067 4.1468 4.0990 4.0600 3.9999 3.9381 3.8742 3.8415 3.8082 3.7743 3.7398 3.7047 3.6690
7 5.5914 4.7374 4.3468 4.1203 3.9715 3.8660 3.7870 3.7257 3.6767 3.6365 3.5747 3.5107 3.4445 3.4105 3.3758 3.3404 3.3043 3.2674 3.2299
8 5.3177 4.4590 4.0662 3.8379 3.6875 3.5806 3.5005 3.4381 3.3881 3.3472 3.2839 3.2184 3.1503 3.1152 3.0794 3.0428 3.0053 2.9669 2.9277
9 5.1174 4.2565 3.8625 3.6331 3.4817 3.3738 3.2927 3.2296 3.1789 3.1373 3.0729 3.0061 2.9365 2.9005 2.8637 2.8259 2.7872 2.7475 2.7068
10 4.9646 4.1028 3.7083 3.4780 3.3258 3.2172 3.1355 3.0717 3.0204 2.9782 2.9130 2.8450 2.7740 2.7372 2.6996 2.6609 2.6211 2.5801 2.5381
11 4.8443 3.9823 3.5874 3.3567 3.2039 3.0946 3.0123 2.9480 2.8962 2.8536 2.7876 2.7186 2.6464 2.6090 2.5705 2.5309 2.4901 2.4480 2.4046
12 4.7472 3.8853 3.4903 3.2592 3.1059 2.9961 2.9134 2.8486 2.7964 2.7534 2.6866 2.6169 2.5436 2.5055 2.4663 2.4259 2.3842 2.3410 2.2964
13 4.6672 3.8056 3.4105 3.1791 3.0254 2.9153 2.8321 2.7669 2.7144 2.6710 2.6037 2.5331 2.4589 2.4202 2.3803 2.3392 2.2966 2.2524 2.2066
14 4.6001 3.7389 3.3439 3.1122 2.9582 2.8477 2.7642 2.6987 2.6458 2.6022 2.5342 2.4630 2.3879 2.3487 2.3082 2.2664 2.2229 2.1778 2.1309
15 4.5431 3.6823 3.2874 3.0556 2.9013 2.7905 2.7066 2.6408 2.5876 2.5437 2.4753 2.4034 2.3275 2.2878 2.2468 2.2043 2.1601 2.1141 2.0660
16 4.4940 3.6337 3.2389 3.0069 2.8524 2.7413 2.6572 2.5911 2.5377 2.4935 2.4247 2.3522 2.2756 2.2354 2.1938 2.1507 2.1058 2.0589 2.0098
17 4.4513 3.5915 3.1968 2.9647 2.8100 2.6987 2.6143 2.5480 2.4943 2.4499 2.3807 2.3077 2.2304 2.1898 2.1477 2.1040 2.0584 2.0107 1.9606
18 4.4139 3.5546 3.1599 2.9277 2.7729 2.6613 2.5767 2.5102 2.4563 2.4117 2.3421 2.2686 2.1906 2.1497 2.1071 2.0629 2.0166 1.9681 1.9171
19 4.3807 3.5219 3.1274 2.8951 2.7401 2.6283 2.5435 2.4768 2.4227 2.3779 2.3080 2.2341 2.1555 2.1141 2.0712 2.0264 1.9795 1.9302 1.8782
142
Universidad Continental | Manual
20 4.3512 3.4928 3.0984 2.8661 2.7109 2.5990 2.5140 2.4471 2.3928 2.3479 2.2776 2.2033 2.1242 2.0825 2.0391 1.9938 1.9464 1.8963 1.8434
21 4.3248 3.4668 3.0725 2.8401 2.6848 2.5727 2.4876 2.4205 2.3660 2.3210 2.2504 2.1757 2.0960 2.0540 2.0102 1.9645 1.9165 1.8657 1.8119
22 4.3009 3.4434 3.0491 2.8167 2.6613 2.5491 2.4638 2.3965 2.3419 2.2967 2.2258 2.1508 2.0707 2.0283 1.9842 1.9380 1.8894 1.8380 1.7833
23 4.2793 3.4221 3.0280 2.7955 2.6400 2.5277 2.4422 2.3748 2.3201 2.2747 2.2036 2.1282 2.0476 2.0050 1.9605 1.9139 1.8648 1.8128 1.7572
24 4.2597 3.4028 3.0088 2.7763 2.6207 2.5082 2.4226 2.3551 2.3002 2.2547 2.1834 2.1077 2.0267 1.9838 1.9390 1.8920 1.8424 1.7896 1.7333
25 4.2417 3.3852 2.9912 2.7587 2.6030 2.4904 2.4047 2.3371 2.2821 2.2365 2.1649 2.0889 2.0075 1.9643 1.9192 1.8718 1.8217 1.7684 1.7112
26 4.2252 3.3690 2.9752 2.7426 2.5868 2.4741 2.3883 2.3205 2.2655 2.2197 2.1479 2.0716 1.9898 1.9464 1.9010 1.8533 1.8027 1.7488 1.6908
27 4.2100 3.3541 2.9604 2.7278 2.5719 2.4591 2.3732 2.3053 2.2501 2.2043 2.1323 2.0558 1.9736 1.9299 1.8842 1.8361 1.7851 1.7306 1.6719
28 4.1960 3.3404 2.9467 2.7141 2.5581 2.4453 2.3593 2.2913 2.2360 2.1900 2.1179 2.0411 1.9586 1.9147 1.8687 1.8203 1.7689 1.7138 1.6543
29 4.1830 3.3277 2.9340 2.7014 2.5454 2.4324 2.3463 2.2783 2.2229 2.1768 2.1045 2.0275 1.9446 1.9005 1.8543 1.8055 1.7537 1.6981 1.6379
30 4.1709 3.3158 2.9223 2.6896 2.5336 2.4205 2.3343 2.2662 2.2107 2.1646 2.0921 2.0148 1.9317 1.8874 1.8409 1.7918 1.7396 1.6835 1.6225
40 4.0847 3.2317 2.8387 2.6060 2.4495 2.3359 2.2490 2.1802 2.1240 2.0772 2.0035 1.9245 1.8389 1.7929 1.7444 1.6928 1.6373 1.5766 1.5092
60 4.0012 3.1504 2.7581 2.5252 2.3683 2.2541 2.1665 2.0970 2.0401 1.9926 1.9174 1.8364 1.7480 1.7001 1.6491 1.5943 1.5343 1.4673 1.3896
120 3.9201 3.0718 2.6802 2.4472 2.2899 2.1750 2.0868 2.0164 1.9588 1.9105 1.8337 1.7505 1.6587 1.6084 1.5543 1.4952 1.4290 1.3519 1.2543
####
# 3.8415 2.9958 2.6050 2.3720 2.2141 2.0986 2.0096 1.9385 1.8799 1.8308 1.7522 1.6664 1.5706 1.5173 1.4592 1.3940 1.3181 1.2215 1.0145
Fuente: Estadística por Mario Triola (2012)
143
Universidad Continental | Manual
Tabla 38: Valores críticos para la prueba de rachas Tabla 39: Constantes para gráficos de control
Tabla 14-2 Constantes de una gráfica de control.
n: Número de X s R
observaciones
en subgrupo A2 A3 B3 B4 D3 D4
2 1.880 2.659 0.000 3.267 0.000 3.267
3 1.023 1.954 0.000 2.568 0.000 2.574
4 0.729 1.628 0.000 2.266 0.000 2.282
5 0.577 1.427 0.000 2.089 0.000 2.114
6 0.483 1.287 0.030 1.970 0.000 2.004
7 0.419 1.182 0.118 1.882 0.076 1.924
8 0.373 1.099 0.185 1.815 0.136 1.864
9 0.337 1.032 0.239 1.761 0.184 1.816
10 0.308 0.975 0.284 1.716 0.223 1.777
11 0.285 0.927 0.321 1.679 0.256 1.744
12 0.266 0.886 0.354 1.646 0.283 1.717
13 0.249 0.850 0.382 1.618 0.307 1.693
14 0.235 0.817 0.406 1.594 0.328 1.672
15 0.223 0.789 0.428 1.572 0.347 1.653
16 0.212 0.763 0.448 1.552 0.363 1.637
17 0.203 0.739 0.466 1.534 0.378 1.622
18 0.194 0.718 0.482 1.518 0.391 1.608
19 0.187 0.698 0.497 1.503 0.403 1.597
20 0.180 0.680 0.510 1.490 0.415 1.585
21 0.173 0.663 0.523 1.477 0.425 1.575
22 0.167 0.647 0.534 1.466 0.434 1.566
23 0.162 0.633 0.545 1.455 0.443 1.557
24 0.157 0.619 0.555 1.445 0.451 1.548
25 0.153 0.606 0.565 1.435 0.459 1.541
Fuente: Adaptado del ASTM Manual on the Presentation of Data and Control
Chart Analysis, ©1976 ASTM, pp. 134-136. Reproducido bajo permiso de
Fuente: American Society of Testing and Materials.
Estadística por Mario Triola (2012) Fuente: Estadística por Mario Triola (2012)
144
Universidad Continental | Manual
145
Universidad Continental | Manual