Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Nosotros Karen Fernanda Chalaco Vera con C.I 1725030801 y Leyton Orley Gallo
Guanotasig con C.I 1727337196 indicamos que este documento es de nuestra autoría,
por lo tanto está estrictamente prohibido la reproducción del material presentado a
continuación.
---------------------------------- ----------------------------------
Firma Firma
C.I 1725030801 C.I 1727337196
CAPITULO I
DEFINICIÓN DEL TEMA
Descripción
2.- A partir dela base de datos investigada, aplicar y verificar si tienen una tendencia
positiva lineal o negativa lineal.
Marco Introductorio
Introducción
CAPITULO 10
La probabilidad de cometer otro tipo de error, conocido como error tipo II, se expresa
con la letra griega beta β .
ERROR TIPO II Aceptar la hipótesis nula cuando es falsa.
3. Paso 3: Se selecciona el estadístico de prueba
x̄−μ
z=
σ
√n
VALOR p Probabilidad de observar un valor muestral tan extremo o más que el valor
observado, si la hipótesis nula es verdadera.
INTERPRETACIÓN DE LA IMPORTANCIA DE LA EVIDENCIA EN CONTRA
DE H0
Si el valor p es menor que
a) 0.10, hay cierta evidencia de que H0 no es verdadera.
b) 0.05, hay evidencia fuerte de que H0 no es verdadera.
c) 0.01, hay evidencia muy fuerte de que H0 no es verdadera.
d) 0.001, hay evidencia extremadamente fuerte de que H0 no es verdadera.
√
π (1−π )
n
Donde:
π es la proporción poblacional.
p es la proporción de la muestra.
n es el tamaño de la muestra.
Capítulo 13
Regresión lineal y correlación
Se estudia la relación entre dos variables en escala de intervalo (o de razón), es usual
comenzar con un diagrama de dispersión. Este procedimiento proporciona una
representación visual de la relación entre las variables.
ANÁLISIS DE CORRELACIÓN Grupo de técnicas para medir la asociación entre
dos variables. La idea básica del análisis de correlación es reportar la asociación entre
dos variables. Por lo general, el primer paso es trazar los datos en un diagrama de
dispersión. El coeficiente de correlación, creado por Karl Pearson alrededor de 1900,
describe la fuerza de la relación entre dos conjuntos de variables en escala de intervalo o
de razón. Se designa con la letra r, y con frecuencia se le conoce como r de Pearson y
coeficiente de correlación producto-momento. Puede adoptar cualquier valor de +1.00 a
-1.00, inclusive. Un coeficiente de correlación de +1.00 o bien de -1.00 indica una
correlación perfecta.
COEFICIENTE DE CORRELACIÓN Medida de la fuerza de la relación lineal entre
dos variables.
CARACTERÍSTICAS DEL COEFICIENTE DE CORRELACIÓN
1. El coeficiente de correlación de la muestra se identifica con la letra minúscula r.
2. Muestra la dirección y fuerza de la relación lineal (recta) entre dos variables en escala
de intervalo o en escala de razón.
3. Varía de +1 hasta -1, inclusive.
4. Un valor cercano a 0 indica que hay poca asociación entre las variables.
5. Un valor cercano a 1 indica una asociación directa o positiva entre las variables.
6. Un valor cercano a -1 indica una asociación inversa o negativa entre las variables.
COEFICIENTE DE CORRELACIÓN
Σ( x−x )( y− y )
r=
(n−1)S X S Y
Análisis de regresión
ECUACIÓN DE REGRESIÓN
Ecuación que expresa la relación lineal entre dos variables.
PRINCIPIO DE LOS MÍNIMOS CUADRADOS Determina una ecuación de
regresión al minimizar la suma de los cuadrados de las distancias verticales entre los
valores reales de Y y los valores pronosticados de Y.
FORMA GENERAL DE LA ECUACIÓN DE REGRESIÓN LINEAL
^y =a+bx
PENDIENTE DE LA RECTA DE REGRESIÓN
Sy
b=r
Sx
INTERSECCIÓN CON EL EJE Y
a= ý−b x́
Probar la significancia de la pendiente
PRUEBA DE LA PENDIENTE
b−0
t=
Sb
n−2 grados de libertad
ERROR ESTÁNDAR DE ESTIMACIÓN Medida de la dispersión de los valores
observados respecto de la recta de regresión para un valor dado de X.
y
y −¿^
¿
Σ¿
¿
S yx = √ ¿
COEFICIENTE DE DETERMINACIÓN
Proporción de la variación total de la variable dependiente Y que se explica, o
contabiliza, por la variación de la variable dependiente X.
La suma de cuadrados ANOVA se calcula como sigue:
Y^ −Ý ¿2
Suma de regresión de los cuadrados=SSR=Σ ¿
Y −Y^ ¿
2
Cuando se utiliza una ecuación de regresión, se pueden hacer dos predicciones distintas
para un valor seleccionado de la variable independiente.
El primer intervalo se denomina intervalo de confianza. Se utiliza cuando la ecuación
de regresión se emplea para predecir el valor medio de Y para una X dada.
x− x́ ¿2
¿
x− x́ ¿2
¿
Σ¿
¿
1
+¿
n
^y ± t SYx √ ¿
El segundo tipo de estimación se denomina intervalo de predicción. Se utiliza cuando la
ecuación de regresión se emplea para predecir una Y individual (n _ 1) para un valor
dado de
X.
INTERVALO DE PREDICCIÓN DE Y, DADA X
2
x− x́ ¿
¿
x− x́ ¿2
¿
Σ¿
¿
1
1+ + ¿
n
^y ± t SYx √ ¿
a) El intervalo de predicción será más amplio que el nivel de confianza.
b) El intervalo de predicción también se basa en el nivel de confianza, el tamaño del
error estándar de estimación, el tamaño de la muestra y el valor de la variable
independiente.
CAPITULO 16
TEMA: Series de tiempo y proyección
Para introducirnos en este capítulo primeo definamos lo que serie de tiempo.
Serie de tiempo.- Grupo de datos registrados durante un periodo determinado,
definido en periodos trimestrales, semanales y anuales.
Ejemplo:
Las ventas de Microsoft Corporation por trimestre desde 1985, y la producción anual de
ácido sulfúrico desde 1970. Un análisis de la historia, que es una serie de tiempo, es útil
para que la administración tome decisiones hoy y planee con base en una predicción, o
proyección, de largo plazo.
COMPONENTES DE UNA SERIE DE TIEMPO
PROMEDIO MÓVIL
Un promedio móvil es útil para suavizar una serie de tiempo y apreciar su tendencia, es
el método básico para medir la fluctuación estacional Para aplicar el promedio móvil a
una serie de tiempo, los datos deben seguir una tendencia muy lineal y tener un patrón
rítmico definido de las fluctuaciones (que se repita, por ejemplo,cada tres años).
a=Y −b t
Donde:
Y =Media de la variable Y
t=Media de la variable t
b=pendiente de larecta
PENDIENTE DE LA RECTA
Sy
b=r ( )
St
DONDE:
r=Coeficiente de correlación
S y =Desviación estándar de y
S t =Desviación estándar de t
ECUACIÓN DE TENDENCIA Y^ =6,1+1.3 t
TENDENCIAS NO LINEALES
La ecuación de la tendencia de una serie de tiempo que no se aproxime a una tendencia
curvilínea, se calcula con los logaritmos de los datos y el método de mínimos
cuadrados. La ecuación general de la ecuación de la tendencia logarítmica es:
MEDIA DE LA MUESTRA
22,8504902
MEDIANA
21,11538462
MODA
18,14516129
Desviación estándar
10,59485399
PRUEBA DE HIPOTESIS
PASO 1 Se establece la Hipótesis nula y la Hipótesis Alternativa
Hipótesis Nula Ho µ= 25 La media de la población es de 25
Hipótesis Alternativa H1 µ≠25 La media de la población es diferente de 25
Prueba de Dos colas porque la hipótesis alternativa no indica dirección alguna.
PASO 2 Se selecciona el nivel de significancia
α=5% 0,05
La probabilidad cometer un error tipo I que es la probabilidad de rechazar la hipótesis nula
verdadera.
PASO 3 Se selecciona el estadístico de prueba
En este caso es la distribución porque se desconoce la desviación estándar de la población y se
sustituye por la desviación estándar de la muestra.
Formula x́−µ
t= s
PASO 4 Se formula una regla para tomar decisiones
√n
Los grados de libertad gl está definido por n-1
GL=n-1 203
-
t tabla 1,65239446
√ π (1−π )
n
hipótesis alternativa y se concluye que la media poblacional no es de 25.
Base de datos
ALEMANIA
Guerras AñoBajas
muertes
heridos
Carros de Combate
Prisioneros
Desaparecidos
Reclutas
Gasto
Sucesión española
17141714
44569 34040 14520 9097 11640 9579 1341 14563
Napoleónicas 1815
181525630 12810 15310 2675 3692 6164 4154 13256
Segunda Guerra1939
Mundial
3869622
1939
415690
13498 85230 16360 9544 182415
245438
Balcanes 1945
13572 13110 1311 1671 13572 12310184354
534936
Barbarroja 1948
22815 3692 3692 2301 22815 9970 252435
395453
Tabla 2
Año t Bajas
1434 1 24162
1524 2 13572
1648 3 22815
1714 4 44569
1815 5 25630
1918 6 5660589
1939 7 386962
1941 8 32456
1945 9 13572
1948 10 22815
3000000
2000000
1000000
0 f(x) = 40595.27x + 401440.2
0 R²2= 0 4 6 8 10 12
T ( años)
Ilustración 1
Análisis
Podemos observar que el coeficiente de determinación no es mayor a 0,75. Por lo tanto
se concluye que la relación entre las variables año y bajas no es lineal.
Tabla 3
Año t muertes
1434 1 13110
1524 2 3692
1648 3 43110
1714 4 34040
1815 5 12810
1918 6 955662
1939 7 2415690
1941 8 20720
1945 9 13110
1948 10 3692
Muertes
3000000
2500000
2000000
1500000
1000000
500000
f(x) = 48224.34x + 86329.73
0 R² = 0.03
0 2 4 6 8 10 12
Ilustración 2
Análisis
Tabla 4
Año t heridos
1434 1 27237
1524 2 16600
1648 3 22656
1714 4 14520
1815 5 15310
1918 6 5307
1939 7 13498
1941 8 1864
1945 9 1311
1948 10 3692
Tabla 5
HERIDOS
Años (x) Heridos (y) (x-x ̅) (y-y ̅) Σ(x-x ) ̅ (y-y ̅) (x-x ) ̅ ^2 (y-y ̅)^2 a+bx
1 1434 27237 -348,6 15037,5 -5242072,5 121521,96 226126406 26178,2175
2 1524 16600 -258,6 4400,5 -1137969,3 66873,96 19364400,3 22569,2543
3 1648 22656 -134,6 10456,5 -1407444,9 18117,16 109338392 17596,905
4 1714 14520 -68,6 2320,5 -159186,3 4705,96 5384720,25 14950,332
5 1815 15310 32,4 3110,5 100780,2 1049,76 9675210,25 10900,2732
6 1918 5307 135,4 -6892,5 -933244,5 18333,16 47506556,3 6770,01533
7 1939 13498 156,4 1298,5 203085,4 24460,96 1686102,25 5927,92391
8 1941 1864 158,4 -10335,5 -1637143,2 25090,56 106822560 5847,72473
9 1945 1311 162,4 -10888,5 -1768292,4 26373,76 118559432 5687,32636
10 1948 3692 165,4 -8507,5 -1407140,5 27357,16 72377556,3 5567,02759
Σ 17826 121995 -13388628 333884,4 716841337 121995
(x ̅) 1782,6
(y ̅) 12199,5
192,609
Sx 103
8924,63
Sy 094
-
0,86541 valor cercano a -1 indica una asociación inversa o
Coeficiente de correlación 913 negativa entre las variables
Coeficiente de 0,74895
determinación 027
83681,0
INTERSECCIÓN CON EL EJE Y a 316
-
PENDIENTE DE LA RECTA DE 40,0995
REGRESIÓN b 914
Heridos (y)
30000
15000
10000
5000
0
1400 1500 1600 1700 1800 1900 2000
Ilustración 3
Análisis
PRUEBA DE LA PENDIENTE
Paso 1: Se establece la hipótesis nula (H0) y la hipótesis alternativa (H1)
H_0:B≤0 la pendiente de la recta de la regresión entre las variables es negativa
H_1:B>0 la pendiente de la recta de la regresión es positiva
Paso 2: Se selecciona un nivel de significancia
0,05
GL 8,00
t crítico 1,86
Paso 3: Se selecciona el estadístico de prueba
t=(b-0)/S_b 1
Paso 4: Se formula la regla de decisión
Análisis
El intervalo de confianza de la media de heridos, dada en los años está entre 26250 y 26105
heridos.
Análisis
El intervalo de predicción de la media de heridos, dada en los años está entre 26430 y 25925
heridos.
Tabla 6
Carros de Combate
90000
80000
70000
60000
50000
40000
30000
20000 f(x) = 650.01x + 16503.67
10000 R² = 0
0
0 2 4 6 8 10 12
Ilustración 4
Análisis
Tabla 7
PRISIONEROS
Años (x) Prisioneros (y) (x-x ̅) (y-y ̅) Σ(x-x ̅)(y-y ) ̅ (x-x ̅)^2 (y-y ̅)^2 a+bx
1 1 1357 -4,5 -10017,9 45080,55 20,25 100358320 641,690909
2 2 2281 -3,5 -9093,9 31828,65 12,25 82699017,2 3026,84848
3 3 3728 -2,5 -7646,9 19117,25 6,25 58475079,6 5412,00606
4 4 11640 -1,5 265,1 -397,65 2,25 70278,01 7797,16364
5 5 3692 -0,5 -7682,9 3841,45 0,25 59026952,4 10182,3212
6 6 15489 0,5 4114,1 2057,05 0,25 16925818,8 12567,4788
7 7 16360 1,5 4985,1 7477,65 2,25 24851222 14952,6364
8 8 22815 2,5 11440,1 28600,25 6,25 130875888 17337,7939
9 9 13572 3,5 2197,1 7689,85 12,25 4827248,41 19722,9515
10 10 22815 4,5 11440,1 51480,45 20,25 130875888 22108,1091
Σ 55 113749 196775,5 82,5 608985713 113749
(x ̅) 5,5
(y ̅) 11374,9
3,0276503
5
8225,8786
3
valor cercano a 1 indica una asociación positiva entre las
Coeficiente de correlación 0,8778908 variables
0,7706922
Coeficiente de determinación 6
-
1743,4666
INTERSECCIÓN CON EL EJE Y a 7
PENDIENTE DE LA RECTA DE 2385,1575
REGRESIÓN b 8
Prisioneros (y)
25000
15000
10000
5000
0
0 2 4 6 8 10 12
Ilustración 5
Análisis
DESAPARECIDOS
Años (x) Desaparecidos (x-x ̅) (y-y ̅) Σ(x-x ̅)(y-y ̅) (x-x ̅)^2 (y-y ̅)^2 a+bx
1 1 959 -4,5 -6111 27499,5 20,25 37344321 2085,30909
2 2 3131 -3,5 -3939 13786,5 12,25 15515721 3193,01818
3 3 2093 -2,5 -4977 12442,5 6,25 24770529 4300,72727
4 4 9579 -1,5 2509 -3763,5 2,25 6295081 5408,43636
5 5 6164 -0,5 -906 453 0,25 820836 6516,14545
6 6 7649 0,5 579 289,5 0,25 335241 7623,85455
7 7 9544 1,5 2474 3711 2,25 6120676 8731,56364
8 8 9301 2,5 2231 5577,5 6,25 4977361 9839,27273
9 9 12310 3,5 5240 18340 12,25 27457600 10946,9818
10 10 9970 4,5 2900 13050 20,25 8410000 12054,6909
Σ 55 70700 91386 82,5 132047366 70700
(x ) ̅ 5,5
(y ̅) 7070
3,0276
5035
3830,3
9548
0,8755 valor cercano a 1 indica una asociación
Coeficiente de correlación 6385 positiva entre las variables
0,7666
Coeficiente de determinación 1206
INTERSECCIÓN CON EL
EJE Y a 977,6
PENDIENTE DE LA RECTA 1107,7
DE REGRESIÓN b 0909
Desaparecidos
14000
12000
f(x) = 1107.71x + 977.6
R² = 0.77
10000
8000
6000
4000
2000
0
0 2 4 6 8 10 12
Ilustración 6
Análisis
Tabla 9
Año t Reclutas
1434 1 4156
1524 2 3456
1648 3 1534
1714 4 1341
1815 5 4154
1918 6 25474
1939 7 182415
1941 8 234154
1945 9 184354
1948 10 252435
Reclutas
300000
250000
200000 f(x) = 31687.51x - 84934
R² = 0.78
150000
100000
50000
0
0 2 4 6 8 10 12
Ilustración 7
Análisis
Tabla 10
Año t Gasto
1434 1 11000
1524 2 5456
1648 3 12485
1714 4 14563
1815 5 13256
1918 6 60356
1939 7 245438
1941 8 442454
1945 9 534936
1948 10 395453
Gasto
600000
500000
300000
200000
100000
0
0 2 4 6 8 10 12
Ilustración 8
Análisis
CAPÍTULO IV
Conclusiones
Recomendaciones
Glosario
Bajas.- Una baja es una persona víctima de un accidente, lesión o trauma
Muertes.- deceso, defunción, fallecimiento, óbito, expiración, perecimiento,
fenecimiento, cesación
Heridos.- es una lesión que se produce en el cuerpo pero no son dados de baja
Carros de Combate.- es un vehículo blindado de combate (AFV por sus siglas en
inglés) con tracción de orugas o ruedas, diseñado principalmente para enfrentarse a
fuerzas enemigas utilizando fuego directo. Un carro de combate se caracteriza por tener
armas de alto poder de fuego, un blindaje pesado, así como por un alto grado de
movilidad que le permite cruzar terrenos difíciles a velocidades relativamente altas.
Prisioneros.- es un soldado, piloto o marino que es hecho prisionero por el enemigo
durante o inmediatamente después de un conflicto armado. Existen leyes para
asegurarse de que los prisioneros de guerra serán tratados humana y diplomáticamente.
Las naciones varían en el cumplimiento de tales leyes.
Desaparecidos.- de una persona desaparecida debe incluir como mínimo a: los hijos
nacidos dentro o fuera del matrimonio, los hijos adoptados o los hijos del cónyuge; el
cónyuge, casado legalmente o no; los padres (incluidos suegro, suegra, padres
adoptivos); las hermanas y hermanos, nacidos de los mismos padres, de padres
diferentes o adoptados.
Reclutas.- Persona alistada para el servicio militar, hasta que acaba la instrucción básica
y va a su destino definitivo.
Gasto.- el dinero asignado para la guerra
Anexos