Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadistica Aplicada A La Administracion
Estadistica Aplicada A La Administracion
ESTADISTICA APLICADA A
LA ADMINISTRACION
DATOS INFORMACION
TD
UNSA Dr. Armin Becerra Guzmán 2
ALGUNAS APLICACIONES
ESTADISTICAS
EN LOS NEGOCIOS
CALIDAD
PRODUCCION
Diseño de Procesos TOTAL
Control de Calidad
Muestras de Adquisición
MARKETING
Investigación de Mercados
Análisis de Gustos y Preferencias
Busqueda de Mercados Meta
FINANZAS
TD
Análisis de Rendimientos
Análisis de Riesgos
RECURSOS HUMANOS
Selección de Personal
Evaluación de Personal
INFERENCIA ESTADISTICA
CONSTANTES VARIABLES
CUALITATIVAS CUANTITATIVAS
DISCRETAS CONTINUAS
Recolección de
Determinar una ecuación que represente la
datos
relación entre ellos (regresión)
1. Gráfico de barras
2. Gráfico de columnas
3. Gráfico circular
4. Gráfico lineal
5. Gráfico de dispersión
12
10
Frecuencia 8
Histograma 6
0
132.0 138.9 145.8 152.7 159.6
Marca de Clase
15
10
0
29.5 39.5 49.5 59.5 69.5 79.5 89.5 99.5Peso
(Kgs)
20
15
10
0
Número de
0 1 2 3 4 5 hijos
(escolares)
20
15
10
5
0
Nefrología Ginecología Oftalmología Neurología Traumatología
Derecho
Administración
Contabilidad
Economía
Otros Nº de profesionales
0 10 20 30 40 50 60 70 80 90 100
25
20
15
10
0
29.5 39.5 49.5 59.5 69.5 79.5 89.5 99.5
Tardanza
(Minutos)
350
Meses Nº AUTOS
Enero 120
300
250
Febrero 210
200
Marzo 180
Abril 320 150
Mayo 280 100
Junio 200
50
Julio 350
0
0 Enero Febrero
2 Marzo Abril
4 Mayo Junio
6 Julio 8
120
100
FRECUENCIA
80
60
40
20
0
14,5 24,5 34,5 44,5 54,5 64,5 74,5 84,5 89,5
MINUTOS
UNSA Dr. Armin Becerra Guzmán 24
El Diagrama Circular
El circulo se divide en segmentos circulares, de tamaño proporcional
a la frecuencia de la categoría.
1er trim.
2do trim.
3er trim.
4to trim.
Ejemplo:
100
80
60
40
Este
20
Oeste
0
Norte
Sur
100
50
4to trim.
0 3er trim.
3er trim.
4to trim.
N
medidas
n
MUESTRA Estadígrafos
Parte de los Elementos o Variables
UNSA Dr. Armin Becerra Guzmán 29
TIPOS DE DATOS (Variables)
Sí
Categóricas
No
Discretas 1, 2, 3, 4...
Numéricas
Contínuas De 100 a 200
Ejemplo:
Calificación : A,B,C,D A>B
Lugar (orden) : 1º , 2º , 3º 1º > 2º
Color : leve, moderado, intenso
Ejemplo:
Datos publicados (en papel o en forma electrónica) en
revistas especializadas, tesis, censos y en las hojas de
registro anteriores.
Nivel socio-económico
de la familia Primaria Encuesta
Datos Originales
MESES Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre
VENTAS (Unid) 52 42 45 54 47 45 51 45 40 46 54 53
Datos Ordenados
MESES X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12
VENTAS (Unid) 40 42 45 45 45 46 47 51 52 53 54 54
Identificar:
Nº de polizas de Comisión
Vendedor Seguro por venta $
wi Xi
Pedro 30 30
Juan 25 40
Pablo 20 50
Interpretación:
xg n X1 X 2 X3 ......... X n
Tasa media
= (x g 1) 100
de variación
c) Interpretación
1
xh n 1
i 1
X
i
n
UNSA Dr. Armin Becerra Guzmán 72
Ejemplo:
Los siguientes datos registran el tiempo que
utilizan cuatro obreros al producir un artículo.
Calcule e interprete el tiempo medio.
Médico A B C D
Tiempo
45 38 52 40
(minutos)
4 88920
xh 43.117953 minutos
8249
xh 43 minutos 7 segundos
b) Interpretación:
c) Reglas
Ejemplo:
8, 10, 14, 18, 23, 24, 32, 34
18 23
mediana 20.5
2
3º Sea la serie par o impar, la mediana ocupa el lugar ,de la
serie previamente ordenada.
n 1
2
n 1
2 F 1
Md Li c
f Md
donde:
Md : mediana
L i : limite real (o frontera) inferior de la clase
mediana.
n : número total de datos.
F : suma de todas las frecuencias hasta, pero
sin incluir, la clase mediana.
f Md : frecuencia de la clase mediana
c : amplitud de clase
Ejemplo:
4, 5, 7, 8, 8 , 10, 12, 15
1
Mo L c
donde:
Mo: moda
i
1 2
L : limite real (o frontera) inferior de la clase
i
modal (la de mayor frecuencia)
: frecuencia de la clase modal menos la
1
frecuencia de la clase anterior
: frecuencia de la clase modal menos la
2
frecuencia de la clase siguiente
c : amplitud de clase
Errores de
facturación Días
0-3 6
6
1
Clase
Clase moda : (4 - 7)
4-7 12
Modal
6
8 - 11 8 4 Mo 3.5 4
12 - 15 3
2
64
16 - 19 1
Total 30 Mo = 5,9
Interpretación: Durante un mes, el número más
frecuente de errores de facturación en esta tienda es 6.
UNSA Dr. Armin Becerra Guzmán 84
Cuartiles
n 1
Q1
4
2( n 1)
Q2
4
3( n 1)
Q3
4
Varianza
n
i
( X ) 2
POBLACION
2 i 1
N
n ___
MUESTRA i
( X X ) 2
S2 i 1
n -1
i
( X ) 2
POBLACION
i 1
N
n ___
MUESTRA i
( X X ) 2
S i 1
n -1
CV
POBLACION
S
MUESTRA
CV ___
X
SESGO CERO
Media = Mediana = Moda
SESGO A LA DERECHA
Media > Mediana > Moda
29 67 34 39 23 66 24 37 45 58
51 37 45 26 41 55 27 96 22 43
73 48 63 37 19 31 38 68 22 35
31 58 35 82 28 35 44 40 41 34
15 31 34 56 45 27 54 46 62 29
51 31 56 43 39 35 23 28 45 48
47 41 34 47 30 54 49 34 53 61
82 45 26 35 67 73 30 16 52 35
46 40 41 56 37 51 33 92 70 63
72 35 62 28 38 61 33 49 59 36
n ___
(X i X )2 fi
S i 1
n -1
n n
n ( X i f i ) ( X i f i ) 2
2
S i 1 i 1
n(n - 1)
Una Aproximación
35
30
25
FRECUENCIA
20
15
10
5
0
14,5 24,5 34,5 44,5 54,5 64,5 74,5 84,5 89,5
MINUTOS
POLIGONO DE FRECUENCIAS
35
30
FRECUENCIA
25
20
15
10
5
0
14,5 24,5 34,5 44,5 54,5 64,5 74,5 84,5 89,5
MINUTOS
120
100
FRECUENCIA
80
60
40
20
0
14,5 24,5 34,5 44,5 54,5 64,5 74,5 84,5 89,5
MINUTOS
Minutos
20
10
Frequency
Minutos
,8
,6
,4
,2
Dev from Normal
0,0
-,2
-,4
0 20 40 60 80 100
Observed Value
0
Expected Normal
-1
-2
-3
0 20 40 60 80 100
Observed Value
UNSA Dr. Armin Becerra Guzmán 101
Analisis de Datos con
El SPSS (Cajas y Bigotes)
79 72
Minutos
0 20 40 60 80 100 120
Kn F 1
100 i
P L c
K i f
P
K
Experiencia Trabajadores
(años)
0-3 18
4-7 42
8 - 11 68
12 - 15 120
16 - 19 40
20 - 23 34
24 - 27 12
Total 334
UNSA Dr. Armin Becerra Guzmán 105
¿Sobre qué edad se ubica el 25% de los
trabajadores de mayor experiencia?
75 % 25 %
P75
Menor Mayor
Experiencia Experiencia
K = 75
Kn 75(334)
Lugar del P75 250,5o (de los números ordenados)
100 100
Probabilidades
a
P(A)
ab
a
P(A)
n
Eventos Favorables
P(A)
Total de Eventos
Ejemplos:
Lanzar una moneda
= {cara, sello}
= {defectuoso, no defectuoso}
={cara, sello}
P(cara) = 0,5 P(sello) = 0,5
(1º) P() = 1
(2º) P( ) = 0
A B
U
(A B)
U
P(AUB) = P(A) + P(B) - P (A B)
Si : (A B) =
U
Por lo tanto : P(A B) = 0U
3
comprobando: P(F ) = 11
A 8
11
3
P(F )=
A 8
UNSA Dr. Armin Becerra Guzmán 129
Ejemplo 2
P(TM TL )
P(TL ) = 0,50 P(TM )=
TL P(TL )
P(TL TM ) = 0,20 0,20
= = 0,40
0,50
UNSA Dr. Armin Becerra Guzmán 133
Regla de la Multiplicación
A partir de P(A B)
P(B )
A P(A)
Se despeja
P(A B) P(A) P B ( A)
4
P(D1 )
50
(
P(D1 D 2 ) P(D1 ) P D 2
D1
)
4 3 12
3 =
P(D 2 ) 50 49 2450
D1 49
P (B ) P(B)
A
Entonces,
P(A B) P(A) P(B)
P(V1 V2 ) 0,25
P(-V)
P(A) P(A).P(-V)
P(V) P(B).P(V)
P(B) P(-V)
P(B).P(-V)
1,00
Ejemplo 1:
La Compañía de Seguros JL ha desarrollado un
novedoso seguro familiar. De acuerdo con una
investigación hecha en el mercado, la probabilidad
de que el producto tenga éxito es 0,80 si la
compañía competidora no introduce un plan similar
en el mercado. Luego, la probabilidad de éxito es
0,30 si la empresa competidora lanza al mercado
un seguro similar. Además, la compañía JL estima
que hay una probabilidad de 0,40 de que la firma
competidora comercialice el producto.
Solución:
P(C E)
P(C )=
E P(C E) + P(C ' E)
0.12 0.12
0.20
0.12 0.48 0.60
Proporción de Probabilidad
balones defectuosos () P()
1 = 0,10 P(1) = 0,20
2 = 0,15 P(2) = 0,30
3 = 0,25 P(3) = 0,50
UNSA Dr. Armin Becerra Guzmán 143
Esto significa que el proveedor no está seguro acerca de
la proporción de balones de gas defectuosos en el lote,
sin embargo, basándose en experiencias anteriores, cree
que hay una probabilidad de 0,20 de que el lote tenga
10% de piezas defectuosas, una probabilidad de 0,30 de
que tenga 15%. Y finalmente, de 0,50 de que tenga 25%
de piezas defectuosas. Supongamos que elige un balón
de gas de al azar en el lote:
P(D/3)= 0,25
3=0,25 P( 3 D) = 0,50 0,25 = 0,1250
0,19
P( 3 D) 0.1250
P( 3 / D) 0.6579
P( D) 0.1900
Combinación:
Es una selección de objetos con independencia
en su ordenamiento.
Ejemplo:
Un empresario dispone de 10 plantas de
producción para producir harina de pescado.
Sólo ocho son necesarias para abastecer el
mercado. Las ocho plantas necesariamente son
seleccionadas aleatoriamente.
UNSA Dr. Armin Becerra Guzmán 151
Permutación:
Es una distribución de objetos en un orden
determinado.
Ejemplo:
El numero del DNI.
Ejemplo:
Los nutricionistas de una empresa que produce
alimentos envasados están interesados en el orden en
que cuatro ribonucleótidos adenina (A), uracilo (U),
guanina (G) y citosina (C) se combinan para formar un
catalizador. ¿Cuántas cadenas formadas por dos
nucleótidos pueden formarse?
4! 4 x3x2 x1
P24 12
(4 2)! 2 x1
UNSA Dr. Armin Becerra Guzmán 153
COMBINACION
Numero de combinaciones de n objetos tomadas de r
n!
C n
donde x n
x !(n x)!
x
Ejemplo:
Se realiza un estudio para determinar la opinión de los
profesores de la UNSA respecto a la acreditación; si
se elige una muestra de cuatro profesores de un total
de 45. ¿Cuántas muestras distintas pueden
seleccionarse?
Nº de Probabilidad
Resultados Probabilidad
mujeres 0.50
0 V,V 0,25
1 VM,MV 0,50 0.25
2 MM 0,25
0 1 2 Nº de
mujeres
E(X) X .P( X )
n
i i
i 1
Desviación Estandar
n
(X
i 1
i E ( X i )) .P( X i )
2
0 1/8 0 12
3/8 =
1 3/8 8
2 3/8 6/8
3 1/8 3/8 = 1,5 caras
12/8
UNSA Dr. Armin Becerra Guzmán 160
Aplicación empresarial: uso del
valor esperado y las pérdidas
monetarias.
Un distribuidor de bocaditos sabe que su producto
rápidamente se deteriora. Compra cada cajita a 20 u.m. y
las vende a 50 u.m.. No puede especificar el número de
cajitas que le solicitarán diariamente, pero dispone de los
siguientes datos:
10 0.15
11 0.20
12 0.40
13 0.25
1.00
UNSA Dr. Armin Becerra Guzmán 161
Tipo de pérdidas
(A) Pérdidas por mermas (obsolescencia):
oferta > demanda (costo contable)
(B) Pérdidas de oportunidad: oferta < demanda
(costo económico)
Alternativas de Venta
Alternativas de
Compra
10 11 12 13
10 0 20 40 60
11 30 0 20 40
12 60 30 0 20
13 90 60 30 0
Posibles Pérdidas
10 0 0.15 0.00
11 30 0.20 6.00
12 60 0.40 24.00
13 90 0.25 22.50
n X n -x E ( X ) np
P(X) p q
X np(1 p)
n!
P(X) X n-x
p q
x!(n - x)!
Datos
n!
P(X) p (1 p)
X n -x Discretos
x!(n - x)!
UNSA Dr. Armin Becerra Guzmán 164
La distribución binomial
Se utiliza para describir variables discretas.
a) Características:
El experimento consiste en una serie de ensayos
repetidos.
Cada ensayo sólo tiene dos resultados posibles: éxito y
fracaso.
UNSA Dr. Armin Becerra Guzmán 165
La probabilidad de éxito, designado por p es la misma para
cada ensayo, la probabilidad de fracaso q (igual a 1-p) es
también constante.
0,1536
0 4
4! 1 1
0 116
0!4! 2 2
1 3
4! 1 1 4
1 16
1!3! 2 2
2 2
4! 1 1
2 616
2!2! 2 2
3 1
4! 1 1 4
3 16
3!1! 2 2
4 0
4 4! 1 1
116
4!0! 2 2
A estos resultados se denomina distribución de
probabilidad.
UNSA Dr. Armin Becerra Guzmán 171
e) La media y la desviación estándar
X 0 1 2 3 4
P(X = x) 1/16 4/16 6/16 4/16 1/16
La media
= XP( x)
( x ) 2
P( x)
x P( x) (x ) (x )2 ( x ) 2 P( x )
0 1/16 -2 4 4/16
1 4/16 -1 1 4/16
2 6/16 0 0 0
3 4/16 +1 1 4/16
4 1/16 +2 4 4/16
16/16
16
16
( X ) P( x )
2
1 proceso deficiente
16
También:
npq
4(0,5)(0,5) 1
P = 0.52
q = 1 - 0.52 = 0.48 5!
P(3,5) 0.523 0.48(53) 0.32 32%
n=5
3!(5 3)!
r=3
5 0 0.0380 5
1 0.1755 4
2 0.3240 3
3 0.2990 2
4 0.1380 1
5 0.0255 0 5
n r 0.63 0.62 0.61 0.60 0.59 0.58 0.57 0.56 0.55 0.54 0.53 0.52 0.51 0.50 r n
p
Distribución de Poisson
e
x
P(X)
X!
e 2.71828 Datos
Discretos
x e
P(X = x) =
x!
donde
(lambda): media = np = varianza
e : base de logaritmos naturales =2.71828
x! : factorial de x
UNSA Dr. Armin Becerra Guzmán 181
Ejemplo:
Supongamos que estamos investigando la seguridad de
un autoservicio, los registros indican una media de 5
intentos mensuales por tienda. El número de intentos de
robos esta distribuido de acuerdo con una distribución de
Poisson y el departamento de seguridad desea que
calculemos la probabilidad de que en cualquier mes
ocurra exactamente 3 intentos de robo.
X = 3 robos/mes 3 5
5 2.7183
= 5 robos/mes P( x 3) 0.14042 14.04%
3!
UNSA Dr. Armin Becerra Guzmán 182
Uso de Tablas
Solucionando el problema anterior usando la tabla de
distribución de probabilidades de Poisson:
x 4.1 ......... 4.5 .......... 4.9 5
La probabilidad de tener
0 0.0067
1 0.0337 exactamente 3 intentos
2 0.0842 de robo en un mes
3 0.1404 cualquiera es 0.1404
4 0.1755
5 0.1755
Solución: 32 (2.71828) 3
P(X = 2) =
p = 0.03 2!
n = 100
=3 = 02240
0,1823
ex
P(X = 3) =
x!
UNSA Dr. Armin Becerra Guzmán 186
np = 100 (0,02) = 2
(2) 3 (2,71828) 2 8
2
0,1805
3! 6 (2,71828)
p 0.05 y n 20
Distribución Hipergeométrica
N-X t
Xt
P(x/N, X t , n) n -x x
N
n
Datos
Discretos
a)Características
La información de la muestra se obtiene sin
reposición de una población finita, por lo tanto la
probabilidad de éxito varía.
b) Formula donde:
M : número de éxitos en la población
M N M
k : número de éxitos en la muestra
N : tamaño de la población
P(X = k) = k n k
N-M: número de fracasos en la
N población
n : tamaño de la muestra
n n-k : número de fracasos en la
UNSA
muestra
Dr. Armin Becerra Guzmán 189
Aplicación
P(X = x)
20! 1
10!(20 - 10)! 2
10
1
2
10
184756
0,1762
1048576
La media: E(X) np
La desviación estándar: N n
np (1 p )
N 1
N n
Donde N 1 es un factor de corrección de población
finita que se produce debido al proceso de muestreo sin
reposición de poblaciones finitas.
Distribución Normal
1 (1 / 2 ) ( X ) / 2
f(x) e
2
e 2.71828
Datos
3.14159 Continuos
1 (1 / 2 ) Z 2
f(z) e
2
e 2.71828
Datos
3.14159 Continuos
X
Z
X Z Datos
Continuos
La distribución normal
También conocida como campana de Gauss en honor al
matemático Karl Gauss ( siglo XIX).
Es importante por:
Es aplicable para inferencia estadística
Se ajusta (casi) a las distribuciones de frecuencias
reales observadas.
Se utiliza para describir el comportamiento de una
variable continua.
(a) Características
1. Tiene un sólo pico (unimodal). Forma acampanada.
2. La media cae en el centro
3. La media, media y moda coinciden
4. Es asintótica al eje horizontal
UNSA Dr. Armin Becerra Guzmán 200
La distribución normal de
probabilidad es simétrica con
respecto a una línea vertical
que pase por la media
El extremo izquierdo se
extiende de manera indefinida y
El extremo derecho se
nunca toca el eje horizontal
extiende de manera
indefinida y nunca toca el
eje horizontal
Media
Mediana
Moda
2
x
1
1 2
f (x) e
2
donde:
e : constante matemática: 2.71828
:constante matemática: 3.14159
: media de la población
: desviación estándar de la población
x : cualquier valor de la variable
aleatoria continua
UNSA Dr. Armin Becerra Guzmán 202
Areas debajo de la curva normal
68% datos
UNSA Dr. Armin Becerra Guzmán 204
2: Aproximadamente 95.5% de todos los valores de
una población normalmente distribuida se encuentra
datos 2 desviación estándar de la media.
2
2
94.6% datos
UNSA Dr. Armin Becerra Guzmán 205
3: Aproximadamente 99.7% de todos los valores
de una población normalmente distribuida se
encuentra datos 3 desviación estándar de la
media
3 3
99% datos
UNSA Dr. Armin Becerra Guzmán 206
La distribución normal estándar (Z)
50
1
2.5 2.5
x 15 10
Calculando Z: z 2
2 .5
10 15
Para Z=2, buscamos en la tabla cual es la
probabilidad (o área) que le corresponde:
Área = .4772
Como deseamos conocer esta área: 2.5
10 15
Solución:
En la figura, podemos ver que la
mitad del área bajo la curva está
P(X>500)=0.5
localizada a ambos lados de la
media de 500 horas. Por lo tanto
podemos deducir que la
probabilidad de que la variable
aleatoria tiene un valor mayor a
500 es el área sombreada, es
decir, 0.5.
Solución:
La gráfica se muestra la
respuesta como zona
P(500 X 650)=0.4332 sombreada, representada por
el área entre la media (500
horas) y el valor de X, en el
cual estamos interesados
(650 horas). Estandarizando
la variable tenemos un valor
para Z
650 500
Z 1 .5
100
Solución:
Estamos interesados en el área a la derecha de 700.
Estandarizamos
x
Z
650 500 P(550 X 650)
Z 1 .5
100
A este valor le
corresponde un área
de 0,4332
x
Z
550 500
Z 0 .5
100
SI
¿S E CONOCE ? US A R Z
NO
SI
¿es n 30? US A R Z
NO
US A R t
b) Definición
n
Z i2
2
i 1
d) Distribución
Datos
Continuos
Las curvas simétricas, tienen una forma tal que con una
línea vertical que pase por el punto más alto de la curva,
dividirá el área de esta en dos partes iguales.
3( X Md )
S kp
S
Valores posibles
3 asimetría negativa
S kp
3 asimetría positiva
4 67 18 15 11 3 24
3 85 15 15 14 5 26
5 6 16 15 13 7 21
6 7 17 16 10 8 22
7 7 15 17 6 12 17
25 10 13 17 4 15 16
13 12 13 13 8 17 9
2 15 14 14 14 18 9
4 16 20 16 18 20 15
5 17 14 17 20 21 12
A) Calcular e interpretar la asimetría de la
distribución
UNSA B) Calcular e interpretar la curtosis
Dr. Armin Becerra Guzmán de la distribución. 243
Los resultados han sido obtenidos
usando Microsoft Excel
Tamaño Muestral:
• No Probabilístico
•Intencional o de
N Juicio
•Por Cuotas
n • De Trozos
•Probabilístico
•Aleatorio Simple
• Sistemático
•Estratificado
•Conglomerados
UNSA Dr. Armin Becerra Guzmán 247
Tipos de Muestreo
A) MUESTREO NO PROBABILÍSTICO: No permite
inferencia estadística.
I1 I2 I3 I4
X1
Z
X
Z 2 2
n 2
n e
Z
x
Z (1 ) 2
(1 ) n 2
n e
Z .N .2 2
n 2
E ( N 1) Z 2 . 2
Z 2 .N . p (1 p )
n 2
E ( N 1) Z p (1 p )
2
Pr{x Z o xZ } 1a
n n
Error = e
Entonces
Z
e
n
Elevando al cuadrado
Z 2 . 2
e
2
Z 2 . 2
n
e2
UNSA Dr. Armin Becerra Guzmán 256
Ejemplo 1
A fin de conocer el gasto mensual en golosinas por
familia, el Gerente de Marketing de una empresa desea
determinar el tamaño de la muestra que le proporcione
un nivel de confianza de 0,95 (Z = 1,96). Además
conoce por estudios anteriores que las compras
medias por familia eran de S/. 120 mensuales, con una
desviación estándar de 30. El Gerente busca un
tamaño de muestra que le permita estimar el nivel de
gasto con un error de 10.
n = 35
Za S 2e
n 2
2
donde
Za 2 : Valor tabular para un nivel de confianza.
Depende del nivel de confianza utilizado
por la estimación del parámetro
desconocido. Toma un valor de 1,96
para un nivel de confianza de 0,95.
2
s : Varianza obtenida de revisión bibliográfica
e
UNSA
o estudio piloto.
Dr. Armin Becerra Guzmán 262
2
A mayor variabilidad de la muestra , s e
mayor varianza. A mayor varianza mayor tamaño
muestral representa el error de muestreo,
llamado error de estimación o precisión de la
estimación. El valor debe ser asumido por el
investigador. En este caso ( x)
Para poblaciones finitas (se conoce N), el tamaño
final (nf) queda definido por la siguiente relación
n
nf
n
1
N
UNSA Dr. Armin Becerra Guzmán 263
Ejemplo 2
En cierta población se 1200 maestristas, se desea estimar el
nivel promedio de notas en el curso de estadística con 0,95
de confianza. Al realizar un estudio piloto se encontró que
x 12,3 y S=1,6. Si los investigadores están dispuestos a
asumir un Za 2 1,96 0,5 .Calcular n
N = 1200
n
Za2 2s2e
1,96 1,6
2 2
39,33
Se = 1,6 2
0,52
0,5
Interpretación
El número mínimo necesario de maestristas para
realizar el estudio es de 39, si se desea estimar el nivel
promedio
notas en la población con una precisión de
0,5.
Interpretación :
El número mínimo necesario de escolares para realizar el
estudio es 73, si se desea estimar el nivel promedio de
hierro sérico en la población con una precisión 5
n
nf
n
1
N
Ejemplo 1:
En una población grande, se desea estimar la
prevalencia de gripe con 0,95 de confianza. De la
literatura se sabe que p = 0,10 si se asume un error
muestral de 5%, calcular n
Za 2 1,96 n
1,96 2 0,10,9
p e 10% 0,10 0,05 2
qe 90% 0,90
0,05 n
0,345744
138,3 139
0,0025
DESCRIPTIVA
ESTADISTICA Estimación
INFERENCIAL
Prueba de
Hipótesis
Ejemplo:
Para el próximo mes se espera que las ventas
sean 700 unidades con un error de 10%.
_ X i _ X i
N n X1 i 1
X4 i 1
n n
n
n nn n n
n
_ X i _ X i
X2 i 1
X5 i 1
n n n
n
X n
X
_ i
X3 i 1
n i
X
i 1
N
UNSA Dr. Armin Becerra Guzmán 278
ESTADISTICA INFERENCIAL
Distribuciones Muestrales:
El Error Estandar de la Media
n
N n
X
n
n
n
nn i
n
800
1,5
X = 799,5
X Z
X Z
n n
800
X = 796
S=1,8
S S
X t n 1 X tn1
n n
(1 )
n
x (1 x ) x (1 x )
x Z x Z
n n
La proporción muestral Px = X / n
= número de exitos/ tamaño de la muestra
UNSA Dr. Armin Becerra Guzmán 287
Intervalo para la media
A partir de muestras grandes
x -
pero Z =
n
-Z0 Z0
Pr Z 0 Z Z 0 1 a
x
Pr Z 0 Z0 1 a
x
Pr x Z0 x Z0 1 a
n n
400 400
Pr 740 (1.96) 740 (1.96) 0.95
400 400
Ls
LI
muestra
1 2 3 4 5 6 7 8
UNSA Dr. Armin Becerra Guzmán 291
A partir de muestras pequeñas
x -
Pero, t=
S
n
-t0 t0
Pr t0 t t0 1 a
x
Pr t0 t0 1 a
S
n
s s
Pr x t0 x t0 1a
n n
UNSA Dr. Armin Becerra Guzmán 292
Ejemplo
Se desea estimar el tiempo medio de estancia en un hotel
para cierto tipo de clientes. Se selecciona una muestra
aleatoria de 25 clientes y se calculó x 5,7 y S = 4,5
días. Estimar con 0,95 de confianza.
S S
Pr x t n1 x t n1 1 a
n n
4,8 4,8
Pr 5,7 2,064 5,7 2,064 1 0,05
25 25
GL= n - 1 = 8 t = 2,306
1.14 1.14
Pr8 2.306(
) 8 2.306( ) 0,95
9 9
Pr {7,12372
. 8,.87628} . 0,95
Pero
p
Z
p
-Z0 Z0
donde
Pr{ Z o Z Z } 1 a p (1 p )
p
p n
Pr{ Z o Z} 1 a
`p
Pr{ p Z p p Z o p } 1 a
N n N n
Pr{x Z
n N 1 xZ 1 a
n N 1
75 250 40 75 250 40
Pr{450 1,96 450 1,96 } 0,95
40 250 1 40 250 1
Pr{450 23,24( 0,8433) 450 23,24( 0,8433)} 0,95
Pr{428,66 471,34} 0,95
N n) N n)
Pr{ p Z o p p Z o p
} 1 a
N 1 N 1
300 50 300 50
Pr{0,36 (1,96)(0,06788) 0,36(1,96)(0,06788) } 0,95
300 1 300 1
Pr{0,36 0,12165 0,36 0,12165} 0,95
Pr{0,23835 0,48165} 0,95
(n - 1)S2
Pero , (2n1)
2
12-a 2 a2 2
2 2
Pr 1-a a 1 a
2
2 2
2 (n 1) S 2 2
Pr 1-a 2 a 2 1 a
2
1 2 1
Pr 2 2 1a
1-a 2 (n 1) S
a 2
2
(n 1) S 2 ( n 1) S 2
Pr 2
1a
a 2
1-a 2
2 2
9(9) 9(9)
Datos: Pr 2 0.90
16,919 3,325
S2 = 9
n = 10
81 81
a = 0,10 Pr
2
0.90
16,919 3,325
Pr 4.7875 2 24,3609 0.90
a /2 a /2
(1 - a )
Zona de
Aceptación
-Z0 Z0
0
Hp 0
Poder de la prueba
Ha 0
(1 - )
1
Zona de aceptación Hp
Zona de Rechazo Hp
Ejemplo
a/2 a/2
(1 - a
Hp : = 200 Zona de
Ha : 200 Aceptación
-Z0 Z0
Hp : 200 Hp : 200
Ha : < 200 Ha : > 200
a
a (1 - a)
(1 - a)
Ho : 800
Ha : 800 800 ó 800
800
1,5
X = 796
95%
X 796 800
Z Z
1.5 Z 13,06
n 24
UNSA Dr. Armin Becerra Guzmán 336
PRUEBA DE HIPOTESIS
2 Conocida
800
1,5
X = 799,5
Muestreo: Peso de líquido de 24
botellas con una media de 799,5
ALTERNATIVAS DE DECISION
Aceptar si Ho: 800
Rechazar si Ha:
UNSA
800 Dr. Armin Becerra Guzmán 337
PRUEBA DE HIPOTESIS
Ho : 800
Rechazar Aceptar Rechazar
95%
X 799.5 800
Z Z
1.5 Z 1,632
n 24
UNSA Dr. Armin Becerra Guzmán 338
PRUEBA DE HIPOTESIS
3 Desconocida
800
X = 796
S=1,8
Muestreo: Peso de líquido de 24
botellas con una media de 796 y
desviación de 1,8
800
ALTERNATIVAS DE DECISION
Aceptar si Ho:
UNSA
800 Dr. Armin Becerra Guzmán 339
PRUEBA DE HIPOTESIS
Ho : 800
Rechazar Aceptar Rechazar
95%
-2,0687 2,0687 t
X 796 800
t t
S 1 .8 t 10,88
n 24
UNSA Dr. Armin Becerra Guzmán 340
Prueba de hipótesis acerca de
la media poblacional
(A) Con varianzas conocidas (muestras grandes)
Ejemplo:
Se afirma que el salario diario medio de los técnicos
de una cierta zona minera es de S/.65,42, con una
desviación estándar S/. 2,32. Una muestra de 144
técnicos que laboran en esa zona reciben un salario
diario medio de 64,82 soles. ¿Puede considerarse
este resultado como sustento para afirmar que
técnicos de esa zona tienen un salario diario
diferente de S/. 65,42 a un nivel de significación a =
0,05 ?.
(1 - a)
-Z0 Z0
-1.96 1,96
800
1,4
X = 799,8
Ho : 800
Ha : 800
UNSA Dr. Armin Becerra Guzmán 346
PRUEBA DE HIPOTESIS
Ho : 800
Rechazar Aceptar Aceptar
95%
5% 1,645
-1,645 1,645
X 799,8 800
Z Z
1.4 Z 0,699
n 24
UNSA Dr. Armin Becerra Guzmán 347
EJEMPLO
Criterios de decisión
Si prueba Z es mayor que
1,645, se rechaza Ho.
Si prueba Z es menor o igual
que 1,645, se acepta Ho.
0 1,645
x 23 20 3
Z 3
sx 10 1
100
6. Conclusiones
(A) Se rechaza la hipótesis planteada, se acepta la
hipótesis alternante a un nivel de significación de
0,05. La prueba resultó significativa
(B) Los datos disponibles como evidencia empírica,
han permitido rechazar la hipótesis planteada.
(C) El tiempo que espera un cliente muy
probablemente sea mayor a los 20 minutos.
UNSA Dr. Armin Becerra Guzmán 350
(B) Con varianzas desconocidas (muestras chicas)
1) Hipótesis: Hp : 12
Ha : 12
2) Nivel de significación: a = 0,05
3) Prueba estadística: x-
tc
S
n
Los supuestos son:
•la población se distribuye normalmente.
•la muestra elegida al azar.
UNSA Dr. Armin Becerra Guzmán 352
4) Criterios de decisión
a
(1 - a
-t0
-1.711
to con GL = 24 y a = 0,05
Si { tc>-1,711} se acepta la Hp en caso
contrario se rechaza
12
tc 112,,70
3
0,6522
25
x 22 / 24
Ho : 0,92
Ha : 0,92
95%
x 0,9166 0.92
Z Z
(1 ) 0,92(1 0,92) Z 0,6139
n 24
UNSA Dr. Armin Becerra Guzmán 358
Prueba de hipótesis acerca de la
proporción poblacional ()
Ejemplo:
El Gerente de la Empresa Misti afirma que por lo menos
55% de los clientes se encuentra plenamente satisfecho con
los servicios recibidos. ¿Qué conclusión puede obtenerse si
de una muestra aleatoria de 500 clientes 245 manifestaron
su preferencia?. Utilice un nivel de significación a = 0,01
para comprobar la afirmación.
Proporción 245
muestral : p= 0,49
500
(1 - a
Z
-2,33
(1 )
p
n
(0,55)(0,45)
p 0,022
500
Reemplazando valores en Z:
0,49 0,55 0,06
Z 2,73
0,022 0,022
Grupo n x s
1 10 4.5 2.5
2 9 2.5 2.0
UNSA Dr. Armin Becerra Guzmán 367
EJEMPLO
a/2=0,01
(1 - a
0,99
a2
2
26,217
Datos:
n = 13
S2= 0,0011634
(13 – 1) (0,0011634)
0,0005
= 27,92736
n La empresa realiza 1
n
muestra de 24 botellas por
cada carga
UNSA Dr. Armin Becerra Guzmán 375
PRUEBA DE HIPOTESIS
PARA DIFERENCIA DE MEDIAS
1 2
800 800
1,5 1,5
X = 799,8 n X = 801,5 n
Ho : 1 2 ó 1 2 0
Ha : 1 2 ó 1 2 0
95%
Donde
(n 1) S1 (n2 1) S 2
2 2
1
2
Sx
(n1 1) (n2 1)
x x 2 - 1 2
3) Prueba de estadística
c
1
12 22
n1 n2
con los supuestos
– las distribuciones son normales
– las muestras se seleccionaron al azar.
2 2
a/2 .25 (1 - a
a/2 .25
2
-Z0 Z0
-1.96 1.96
c
1,30 1,35 - 0 0,2115
0,8 1,1
2 2
30 35
1) Planteo de hipótesis
Ho : = 2
Ha : 2
2) Nivel de significación a ,5
3) Prueba estadística
x x2 - 1 2
tc 1
S12 S 22
n1 n2
con los supuestos
las poblaciones se distribuyen normalmente
las muestras han sido seleccionada al azar
UNSA Dr. Armin Becerra Guzmán 384
EJEMPLO
Se cuenta con dos muestras de tamaño 13 y 10 con
medias 11,09 y 13,46 y desviaciones estandar de 1,74 y
8,45 respectivamente, determinar si las medias
poblacionales son significativamente diferentes con un
nivel de confianza del 95%
1) Planteo de hipótesis
Ho : = 2
Ha : 2
2) Nivel de significación a ,5
3) Prueba estadística
x x2 - 1 2
tc 1
S12 S 22
n1 n2
UNSA Dr. Armin Becerra Guzmán 385
4) Criterios de decisión
S12 S 22
t1 t 2 1,74
(2,179)
8,45
(2,262)
t
n1 n2 t 13
1,74 8,45
10 2,25
2
S1 S 2 2
13 10
n1 n2
2 2
(1 - a a/2
a/2
2
- t´ t´
-2,25 2,25
1) Planteo de hipótesis
Ho : = 2
Ha : 2
n1 n2
p
n 1S n 2
1S 22
1 1 2
S p2 Variancia
ponderada n1 n2 2
to con (n 1 + n2 -2)
a/2 a/2
(1 - a
- tO tO
-2,6956 2,6956
S p2
25 20 2
10,532.538
S 2
p
244,943
43
1) Planteo de hipótesis
Ho : 1 = 2
Ha : 1 2
2) Nivel de significación: a 0,05
(p1 - p 2 ) - (1 - 2 )
Zc
p1 -p2
con los supuestos
las poblaciones se distribuyen normalmente
las muestras se han elegido al azar
a/2 a/2
(1 - a
- ZO ZO
-1,96 1,96
ˆ 0 , 046
p p
1 2
Entonces, (p1 - p 2 ) - ( 1 - 2 ) (0,36 0,245) 0
Zc
p1 - p 2 0,046
Z c 2,5
UNSA Dr. Armin Becerra Guzmán 399
6) Conclusiones
MAQUINAS 1 2 3 4 5 6 7 8 9 10
ANTES 73 77 68 62 72 80 76 64 70 72
DESPUÉS 68 72 64 60 71 77 74 60 64 68
Diferencia
Antes Después Diferencias: d de medias
Sd = 3,6
73 68 5
77 72 5
68 64 4
Sd=1.578
62 60 2
72 71 1 d = 3.6
80 77 3
76 74 2 Sd 1.578
64 60 4 Sd = 0.499
n 10
70 64 6
72 68 4
UNSA Dr. Armin Becerra Guzmán 403
1) Planteo de hipótesis
Ho : d 0
Ha : d 0
2) Nivel de significación: a ,5
3) Prueba estadística d d
tc
Sd
con los supuestos
la población (d) se distribuye normalmente
la muestra se ha elegido al azar
to con (n - 1)
(1 - a
a
tO
1,833
d d
tc
Sd
3.6 0
7.21
0.499
Prueba de Homogeneidad
de Varianzas
• Para prueba de dos colas, el estadístico de prueba está
dado por:
2
S
F 1
2
S 2
Ho : 1 2
2 2
Ha : 1 2
2 2
1 2
800 800
n = 24
n n = 24
S = 1,30 n
S =1,45
PRUEBA DE HIPOTESIS
PARA DIFERENCIA DE DESVIACIONES
PARA TAMAÑO DE MUESTRAS IGUALES
EJEMPLO 2
Grupo1 Grupo 2
(40 - 49) (50 - 59)
X = 11,09 X = 13,46
S 1
2 = 1,74 S 22 = 8,45
n1 = 13 n2 = 10
1) Planteo de Hipótesis:
Ho : 2
1
2
2
Ha : 2
1
2
2
2
SM 8.45
Fc 2 1.74 4.86
Sm
2 0
fe
UNSA Dr. Armin Becerra Guzmán 424
PRUEBA DE INDEPENDENCIA ESTADISTICA
Ejemplo:
METODO
68 75 57 79 279
ACTUAL
METODO 32 45 33 31 141
NUEVO
fe = n. proporción
f fe
2
2 0
fe
supuestos:
* la población se distribuye normalmente.
* la muestra se ha seleccionado al azar
METODO ¦o 68 75 57 79 279
ACTUAL
¦e 66.43 79.72 59.79 73.07
32 45 33 31
METODO ¦o 141
NUEVO ¦e 33.57 40.28 30.21 36.93
TOTAL 100 120 90 110 420
a/2=0,05 a/2=0,05
(1 - a
0,90
0,352 7,815
12a a2
2 2
Si 0.352 2 7.815 Se acepta la Ho en caso contrario se rechaza
f fe
2
2 0
c
fe
( 68 66.43) 2
( 75 79.72 ) 2
(57 59.79 ) 2
( 79 73.07 ) 2
c2
66.43 79.72 59.79 73.07
(32 3357
. ) 2 (45 40.28) 2 (33 30.21) 2 (31 36.93) 2
3357
. 40.28 30.21 36.93
c2 2.7638
UNSA Dr. Armin Becerra Guzmán 431
Conclusiones
¿Qué concluimos?
Xi= + i
Donde
i = error, es decir la variabilidad (o diferencia) entre la
observación y el promedio
Xi
i
Xij i ij
Donde
i = efecto del tratamiento
N
X ( )
j1
ij
i i ij
N N
1
1
2
2
Hp : + 1= + 2
Hp : 1= 2
Sólo se prueba la diferencia entre tratamientos
T1 T2 T3
(Error Experimental) ee ij r GL
X2
Xij
2
Total SC total r t -1
rt
SSW
SSW X ij X j SSW MSW
2
Dentro de los n-c
grupos (Error
nc
Experimental)
SST X ij X
2
Total n -1 SST
Aplicación 1
Se realiza un estudio para comparar la eficacia
de tres programas terapéuticos para el
tratamiento del acné de tipo medio a moderado.
Se emplean tres métodos:
CMe trat
Fc
CMe ee
3,3158
Si {Fc>3,3158} se rechaza la Hp, en caso contrario se acepta.
4. Cálculos
Resolviendo tenemos los siguientes resultados:
Fuente de
variabilidad SC GL CMe F cal p-valor F teórico
Tratamientos 2107.20727 2 1053.60364 300.680769 1.42117E-20 3.31583294
Total 2212.32909 32
UNSA Dr. Armin Becerra Guzmán 449
6. Conclusiones
A. Se rechaza la hipótesis planteada, se acepta la hipótesis
alterna a un nivel de significación de 0,05. La prueba fue
significativa.
B. Al menos un método de capacitación es diferente a los
demás
T1 T2 T3
X11 X12 X13
X42 X43
X52
Xij2
Dentro de los SC ee X r t - t
2
r
ij SC ee
grupos (Error j CMe
Experimental) GL
X2
Xij
2
SC total
Total
rj r t -1
UNSA Dr. Armin Becerra Guzmán 452
Aplicación 2
Metodo 1 15 18 19 22 11
Metodo 2 22 27 18 21 17
Metodo 3 18 24 19 16 22 15
1. Planteamiento de hipótesis:
Hp : 1= 2= 3
Ha : 1= 2= 3 (no todas las medias son iguales)
2. Nivel de significación
a = 0.05
3. Prueba estadística
CMe trat
Fc
CMe ee
3,81
Si {Fc>3,3158} se rechaza la Hp, en caso contrario se acepta.
4. Cálculos
Obtenemos los siguientes resultados:
ANÁLISIS DE VARIANZA
Fuentes de Variabilidad SC GL CMe F cal p-valor F tabular
Total 232 15
UNSA Dr. Armin Becerra Guzmán 456
6. Conclusiones
A. Se acepta la hipótesis planteada, se rechaza la
hipótesis alterna a un nivel de significación de 0,05. La
prueba no resultó significativa.
B. Los datos muestrales no proporcionan evidencia para
afirmar que los tratamientos son diferentes.
Y • Y Y
• •• • • • ••
•• •
•• • •• • • •
• •• • • • • ••
• ••
• ••• •• • • •
••• •
• •
X X X
(d) Curvilinea inversa (e) Lineal inversa (d) Ninguna relación
con más dispersión
PACIENTE 1 2 3 4 5 6 7 8 9 10
COMPLEMENTO
1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5
EN Kg: X
AUMENTO DE
8 10 9 12 14 13 15 17 14 14
PESO : Y
NIÑOS 1 2 3 4 5 6 7 8 9 10
COMPLEMENTO
1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5
EN Kg: X
AUMENTO DE
8 10 9 12 14 13 15 17 14 14
PESO : Y
20
15
10
0
0.0 2.0 4.0 6.0
20
15
10
0
0.0 2.0 4.0 6.0
UNSA Dr. Armin Becerra Guzmán 464
4to Paso: Agregue toda la información que
puede ser de utilidad para entender el diagrama,
tal como: título del diagrama, período de tiempo,
número de pares de datos, nombre de la
variable y unidades de cada eje, entre otros.
20
Aumento de peso (Kg)
15
10
5
0
0.0 2.0 4.0 6.0
Complemento nutricional (Kg)
UNSA Dr. Armin Becerra Guzmán 465
Las Ecuaciones Lineales Simples
Ejemplo:
En Y = 10 + 2X
cuando X aumenta en 1, Y aumenta en 2
En Y = 5 - 0,8X
cuando X aumenta en 1, Y disminuye en 0,8
Y = b0 + b1 X
Variable Variable
Dependiente Independiente
X
UNSA Dr. Armin Becerra Guzmán 470
Cuando cambios en X, provoca variaciones en Y en
sentido inverso (X aumenta, Y disminuye o viceversa),
las variables están inversamente relacionadas. Se
observa en la ecuación el signo -.
Y
Ejemplo: o
Y = 20 - 3X
o o
o o
o
o
X
UNSA Dr. Armin Becerra Guzmán 471
C) Grado de la ecuación:
La ecuación es de primer grado si la variable
independiente está elevada al exponente 1. Su
gráfica genera una línea recta (por lo que
también se le llama ecuación lineal)
Ejemplo: Y = 30 + 4 X
X 1 2 3 4 5
Y 4 ,5 6 ,0 7 ,5 9 ,0 1 0 ,5
12
11
10
. . (5,10.5)
9
8
7
6
. . (3,7.5)
(4,9)
5
4
3
2
.
(1,4.5)
(2,6)
UNSA 1 2 Becerra
Dr. Armin 3 4
Guzmán5 X 475
E) Forma general:
La ecuación simple de primer grado tiene la siguiente forma
general
Y = b0 + b1 X
Donde:
b1: pendiente, o sea, el cambio en Y cuando X = 1.
b0: el valor autónomo, es decir, Y = b0 cuando X = 0. En
la gráfica es la intersección con el eje Y
Ejemplo:
Y
Y = 3 + 1.5X
b0 = 3
.
X
= error
Yi - Y
10
8
. Línea de
estimación
6
Ŷ
Min Y - Y
2
4 Error= -6
•
i
2
•
•
. Error= 2
X
2 4 6 8 10 12 14
X Y X2 XY
Y nb + b X
1.0 8.0 1.0 8.0
0 1 1.5 10.0 2.3 15.0
XY b X b X
0 1
2 2.0
2.5
9.0
12.0
4.0
6.3
18.0
30.0
3.0 14.0 9.0 42.0
3.5 13.0 12.3 45.5
Para aplicar las fórmulas,
4.0 15.0 16.0 60.0
tenemos que confeccionar un 4.5 17.0 20.3 76.5
cuadro como el siguiente: 5.0 14.0 25.0 70.0
5.5 14.0 30.3 77.0
32.5 126.0 126.3 442.0
X Y X XY
2
Ŷ 7,479 1,576X
UNSA Dr. Armin Becerra Guzmán 482
c) Interpretación
Y
.
Yi
Y
1.5
2.0
10.0
9.0
9.843
10.630
.
2.5 12.0 11.418
3.0 14.0 12.206
Valor 3.5 13.0 12.994
observado Valor 4.0 15.0 13.782
estimado 4.5 17.0 14.570
5.0 14.0 15.358
2
(Y - Ŷ)
S yx =
n2
14
21,20 21,20
S yx = 2,65
10 2 8
Syx =1,628
variacion explicada
r2
variacion total
2
r2 = Ŷ - Y 2
Y - Y
i
Se elevan al cuadrado, para evitar que Y - Y 0
obteniéndose un número positivo.
9 5 7 14 10 45
Y=
5 5
Y = 9 unidades
51,2
r2 = 0,707
72,4
r= r2
Sus valores oscilan entre -1 y 1
Cuando r es positivo, indica que X e Y
están directamente relacionados.
r = 0,707
r = 0,84
i = Yi - Ŷi
El gráfico muestra un
adecuado ajuste entre el 3
incremento de peso y el 2
0
plemento nutricional. No se 0 1 2 3 4 5 6
-1
observa una tendencia. -2
-3
Variable X 1
UNSA i 1 Guzmán
Dr. Armin Becerra 504
Los valores estandarizados nos permiten tomar en
cuenta la magnitud de los residuos en unidades que
reflejen la variación estandarizada alrededor de la línea
de regresión.
1.5
1
0.5
0
-0.5 0 5 10 15 20
-1
-1.5
-2
b. Normalidad
n
i i1
2
D i2
n
i
2
i1
Change Statistics
R Square
Model Change F Change df1 df2 Sig. F Change Durbin-Watson
1 .707a 19.336 1 8 .002 1.517
a. Predictors: (Constant), Complemento
b. Dependent Variable: AUMENTO
ANÁLISIS DE VARIANZA
GL SC CMe F cal P-valor
Regresión 1 1116.62308 1116.62308 476.328138 2.60786E-05
Residuos 4 9.37692308 2.34423077
Total 5 1126
Yˆ f (X1 , X2 , X3 ,....)
Variable Variables
dependiente independientes
UNSA Dr. Armin Becerra Guzmán 515
REGRESIONES
MULTIPLES
La ventaja
Y nb b X b X
0 1 1 2 2
X Y b X b X b X X
1 0 1 1
2
1 2 1 2
X Y b X b X X b X
2 0 2 1 1 2 2
2
2
Syx
( Y Ŷ )2
n k 1
donde:
Y : Valores observados en la muestra
Yˆ : valores estimados a partir a partir de la ecuación
de regresión
n : número de datos
k : número de variables independientes
19950,57
r
2
0,95
20837,5
2
a
r 1 1 r
n 1
2
n k 1
8 1
r 1 1 0,95
2
0,9125
8 3 1
a
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.97 r
Coeficiente de determinación R2 0.95 r2
R2 ajustado 0.92 r2a
Error típico 14.89 Syx
Observaciones 8
S yx
Sb1 0,704
X nx
2 2
Resultados en Excel
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior Inferior Superior
95% 95.0% 95.0%
2,949 0
tc
0,704
t c 4,189