Está en la página 1de 18

1.

Buscar una base de datos que sea compatible con su carrera, con 20 datos
como mínimo.
Para el desarrollo del taller y análisis, se seleccionaron tres bases de datos a partir del
(DataBank) del banco mundial.
El Banco de datos (DataBank) es una herramienta de análisis y visualización que
contiene colecciones de datos de series cronológicas sobre diversos temas

ESPERANZA DE EMISIONES CO2


AÑO POBLACION VIDA Kts
1980 26,900,506 66.926 40.911
1981 27,496,617 67.380 41.447
1982 28,101,819 67.802 42.024
1983 28,714,190 68.870 44.097
1984 29,331,238 68.529 44.838
1985 29,750,350 68.823 46.397
1986 30,572,478 69.065 46.903
1987 31,195,413 69.266 48.876
1988 31,822,525 69.436 49.418
1989 32,457,499 69.591 50.949
1990 33,102,575 69.750 52.311
1991 33,758,337 69.936 54.007
1992 34,422,569 70.161 56.046
1993 35,091,275 70.433 59.320
1994 35,758,979 70.752 59.150
1995 36,421,438 71.112 62.001
1996 37,076,387 71.497 61.120
1997 37,723,800 71.887 66.603
1998 38,939,734 72.264 67.854
1999 39,526,669 72.619 59.419
2000 40,111,619 72.945 61.841
2001 40,696,434 73.241 61.160
2002 41,280,701 73.517 58.795
2003 41,862,320 73.777 58.307
2004 42,438,152 74.026 58.428
2005 43,004,897 74.265 60.668
2006 43,560,690 74.500 59.509
2007 44,105,196 74.732 61.215
2008 44,638,154 74.962 61.794
2009 45,158,968 75.193 64.098
2010 45,667,189 75.424 66.566
2011 46,162,274 75.655 72.173
2012 46,643,732 75.882 72.310
2013 47,111,691 76.105 77.656
2014 47,566,878 76.322 79.674
2015 48,010,049 76.531 79.533
2016 48,481,028 76.732 88.419
2017 49,436,892 76.925 86.233
2018 48,956,627 77.109 90.045

2. Determinar si la media es confiable para representar todos los datos (analice


la desviación estándar, la curtosis y el coeficiente de asimetría, también el de
Fisher y el de Pearson). Analice el histograma.

EMISIONES CO2
DATOS POLACION ESPERANZA DE VIDA Kts
Media 38796356.13 72.40876923 60.82345897
Error típico 1121100.331 0.489841381 2.052025611
Mediana 39526669 72.619 59.509
Moda #N/D #N/D #N/D
Desviación estándar 7001269.32 3.059058442 12.81489583
Varianza de la muestra 4.90178E+13 9.357838551 164.2215552
Curtosis -1.294563855 -1.308443687 -0.056807103
Coeficiente de
asimetría -0.141779884 -0.077821513 0.561635206
Rango 22536386 10.183 49.134
Mínimo 26900506 66.926 40.911
Máximo 49436892 77.109 90.045
Suma 1513057889 2823.942 2372.1149
Cuenta 39 39 39
Mayor (1) 49436892 77.109 90.045
Menor(1) 26900506 66.926 40.911
Nivel de
confianza(95.0%) 2269548.966 0.991632032 4.154108671
Media:
La media de la población es de 38796356.13, la media de la esperanza de vida es de
72.40876923 y la media de las emisiones de co2 es 60.82345897 Hallando los
coeficientes de variación para saber si es confiable.

• Para el coeficiente de variación de la Población.

• Para el coeficiente de variación de la Esperanza de vida.

• Para el coeficiente de variación de las Emisiones de co2.

R/ Como la variación con respecto al promedio es alta en las tres acciones la media es
no es confiable.

Desviación estándar: La desviación de la población con respecto a su media es


de7001269.32, 3.059058442 en la esperanza de vida y 12.81489583 en las Emisiones
de co2.
Curtosis: En las tres series de datos se obtienen valores de curtosis negativas, lo cual
nos dice que los datos no están distribuidos normalmente y que hay una menor
concentración de datos en torno a la media.
Coeficiente de asimetría de Fisher:
El coeficiente de asimetría de Fisher para la Población es de -0.131060169, para la
Esperanza de vida es de -0.071937572, y para las Emisiones de co2 es de
0.519171005.
Para los datos de la Población y Esperanza de vida el coeficiente de asimetría es
negativo, nos indica que la asimetría está comprendida a la izquierda. Para los datos
de Emisiones de co2, donde se hay coeficientes de asimetría positivos, la asimetría de
los datos está comprendida a la derecha.

3. Utilizar 3 variables (Activos financieros, o las variables elegidas en su base


de datos que sean numéricas ) de la base de datos. Analice los estadísticos,
de la estadística descriptiva.
Para el desarrollo del taller y análisis, se seleccionaron tres bases de datos a partir del
(DataBank) del banco mundial.

4. Justificar el criterio por el cual se determina el número de intervalos y el


tamaño de clase. Además verificar que no existan frecuencias absolutas en
cero.

• Para la Población.
Cuenta 39
Mínimo 26900506
Máximo 49436892
#de intervalos 6.250513203
Rango/#inrevalos 3608709.884

Tablas de frecuencias
Frecuenci
a absoluta
Límite Límite Marcas de Frecuenci Acumulad Frecuencia Frecuencia
inferior superior clase a absoluta a Relativa Acumulada
23291796.1 0.02564102 0.02564102
2 26900506 25096151.06 1 1 6 6
30509215.8 0.12820512 0.15384615
26900506 8 28704860.94 5 6 8 4
30509215.8 34117925.7 0.15384615 0.30769230
8 7 32313570.83 6 12 4 8
34117925.7 37726635.6 0.15384615 0.46153846
7 5 35922280.71 6 18 4 2
37726635.6 41335345.5 0.12820512
5 3 39530990.59 5 23 8 0.58974359
41335345.5 44944055.4 0.15384615 0.74358974
3 2 43139700.48 6 29 4 4
44944055.4 0.20512820 0.94871794
2 48552765.3 46748410.36 8 37 5 9
52161475.1 0.05128205
48552765.3 9 50357120.24 2 39 1 1

• Para la Esperanza de vida.


Cuenta 39
Mínimo 66.926
Máximo 77.109
# de intervalos 6.244997998
rango/#
intervalos 1.63058499

Tabla de frecuancias
Frecuenci
a absoluta
Limite Limite Marcas de Frecuenci Acumulad Frecuencia Frecuencia
inferior superior clase a absoluta a Relativa Acumulada
65.2954150
1 66.926 66.1107075 1 1 0.025641026 0.025641026
68.5565849
66.926 9 67.7412925 3 4 0.076923077 0.102564103
68.5565849 70.1871699 69.3718774
9 8 9 9 13 0.230769231 0.333333333
70.1871699 71.8177549 71.0024624
8 7 8 4 17 0.102564103 0.435897436
71.8177549 73.4483399 72.6330474
7 6 7 5 22 0.128205128 0.564102564
73.4483399 75.0789249 74.2636324
6 5 6 7 29 0.179487179 0.743589744
75.0789249 76.7095099 75.8942174
5 4 5 7 36 0.179487179 0.923076923
76.7095099 78.3400949 77.5248024
4 3 4 3 39 0.076923077 1

• Para las Emisiones de co2.


Cuenta 39
Mínimo 40.911
Máximo 90.045
# de intervalos 6.244997998
rango/#
intervalos 7.867736709
Tabla de frecuencias

Frecuencia Frecuencia
Limite Limite absoluta absoluta Frecuencia Frecuencia
inferior superior sencible Acumulada Relativa Acumulada
33.0432632
9 40.911 1 1 0.027777778 0.027777778
40.911 48.77873671 6 7 0.166666667 0.194444444
48.7787367
1 56.64647342 6 13 0.166666667 0.361111111
56.6464734
2 64.51421013 15 28 0.416666667 0.777777778
64.5142101
3 72.38194684 5 33 0.138888889 0.916666667
72.3819468
4 80.24968355 3 36 0.083333333 1
80.2496835
5 88.11742025 1 37 0.027777778 1.027777778
88.1174202
5 95.98515696 2 39 0.055555556 1.083333333

5. Analizar el intervalo de clase que más probabilidad tiene (el que tienen más
datos.). En la frecuencia relativa , que valor es máximo, interprete con el
histograma.

Tablas de frecuencia Poblacion


Frecuenci
a absoluta
Límite Límite Frecuenci Acumulad Frecuencia Frecuencia
inferior superior Marcas de clase a absoluta a Relativa Acumulada
23291796.1 0.02564102 0.02564102
2 26900506 25096151.06 1 1 6 6
0.12820512 0.15384615
26900506 30509215.88 28704860.94 5 6 8 4
30509215.8 0.15384615 0.30769230
8 34117925.77 32313570.83 6 12 4 8
34117925.7 37726635.65 35922280.71 6 18 0.15384615 0.46153846
7 4 2
37726635.6 0.12820512
5 41335345.53 39530990.59 5 23 8 0.58974359
41335345.5 0.15384615 0.74358974
3 44944055.42 43139700.48 6 29 4 4
44944055.4 0.20512820 0.94871794
2 48552765.3 46748410.36 8 37 5 9
0.05128205
48552765.3 52161475.19 50357120.24 2 39 1 1

Histograma
9 120.00%
8
100.00%
7
6 80.00%
5
60.00%
Frecuencia

4
3 40.00%
2
20.00%
1
0 0.00%
6 88 77 65 53 42 .3 19 ...
050 5. 5. 5. 5. 5. 65 5. yor
1 2 3 4 5 7 7
90 92 79 66 53 40 52 14
a
26 50 11 72 33 94 85 16 ym
30 34 37 41 44 4 52

ejex(intervalos de clase)

El intervalo con mayor frecuencia o máximo está comprendido entre 44944055.42 y


48552765.3.

Tablas de frecuencia Esperanza da vida


Frecuenci
a absoluta
Limite Limite Marcas de Frecuenci Acumulad Frecuencia Frecuencia
inferior superior clase a absoluta a Relativa Acumulada
65.2954150
1 66.926 66.1107075 1 1 0.025641026 0.025641026
68.5565849
66.926 9 67.7412925 3 4 0.076923077 0.102564103
68.5565849 70.1871699 69.3718774 9 13 0.230769231 0.333333333
9 8 9
70.1871699 71.8177549 71.0024624
8 7 8 4 17 0.102564103 0.435897436
71.8177549 73.4483399 72.6330474
7 6 7 5 22 0.128205128 0.564102564
73.4483399 75.0789249 74.2636324
6 5 6 7 29 0.179487179 0.743589744
75.0789249 76.7095099 75.8942174
5 4 5 7 36 0.179487179 0.923076923
76.7095099 78.3400949 77.5248024
4 3 4 3 39 0.076923077 1

HISTOGRAMA
10 1.2

9
1
8

Frecuencia Acumulada Sens


0.8
Frecuencia ABS Sens

5 0.6

4
0.4
3

2
0.2
1

0 0
3 6 9 2 5 8 1 4
66.9 68.5 70.1 71.8 73.4 75.0 76.7 78.3

ejex(intervalos de clase

El intervalo con mayor frecuencia o máximo está comprendido entre


68.55658499 y 70.18716998.

Tablas de frecuencia Emisiones co2

Limite Limite Frecuencia Frecuencia Frecuencia Frecuencia


absoluta absoluta
inferior superior sencible Acumulada Relativa Acumulada
33.0432632
9 40.911 1 1 0.027777778 0.027777778
40.911 48.77873671 6 7 0.166666667 0.194444444
48.7787367
1 56.64647342 6 13 0.166666667 0.361111111
56.6464734
2 64.51421013 15 28 0.416666667 0.777777778
64.5142101
3 72.38194684 5 33 0.138888889 0.916666667
72.3819468
4 80.24968355 3 36 0.083333333 1
80.2496835
5 88.11742025 1 37 0.027777778 1.027777778
88.1174202
5 95.98515696 2 39 0.055555556 1.083333333

HISTOGRAMA
16 1.2

14
1
12

Frecuencia Acumulada Sens


0.8
Frecuencia ABS Sens

10

8 0.6

6
0.4
4
0.2
2

0 0
1 8 5 1 8 5 2 9
40.9 48.7 56.6 64.5 72.3 80.2 88.1 95.9

El intervalo con mayor frecuencia o máximo está comprendido entre


56.64647342 y 64.51421013.
6. interprete los Deciles ,( Decil 1 y Decil 9) Cuartiles ( Q3 y Q1)y
percentiles( Solamente el P90, y el percientil P10.

POBLACIO ESPERANZA DE EMISIONES


  N VIDA CO2 Kts
32764659.5
Q1 6 69.59834762 52.3847827
Q3 45056827.6 72.63304747 66.4811443
28993557.7
D1 3 68.50223216 44.71373941
D9 47695696.7 76.4998633 77.88936253
28993557.7
P10 3 68.50223216 44.71373941
P90 47695696.7 76.4998633 77.88936253

Interpretando para la población


𝑐𝑢𝑎𝑟𝑡𝑖𝑙1 = 32764659.56
R/ El 25% o menos de la población es de 32764659.56
𝑐𝑢𝑎𝑟𝑡𝑖𝑙3 = 45056827.6
R/ El 75 % o menos de la población es de 45056827.6
𝐷𝑒𝑐𝑖𝑙 1 = 28993557.73
R/ El 10 % o menos de la población es de 28993557.73
𝐷𝑒𝑐𝑖𝑙 9 = 47695696.7
R/ El 90 % o menos de la población es de 47695696.
𝑃𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 10 = 28993557.73
R/ El 10 % o menos de la población es de 28993557.73
𝑃𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 90 = 47695696.7
R/ El 90 % o menos de la población es de 47695696.7
Interpretando para la esperanza de vida
𝑐𝑢𝑎𝑟𝑡𝑖𝑙1 = 69.59834762
R/ El 25% o menos de los índices de esperanza de vida están en 69.59834762
𝑐𝑢𝑎𝑟𝑡𝑖𝑙3 = 72.63304747
R/ El 75 o menos de los índices de esperanza de vida están en 72.63304747
𝐷𝑒𝑐𝑖𝑙 1 = 68.50223216
R/ El 10 % o menos de los índices de esperanza de vida están en 68.50223216
𝐷𝑒𝑐𝑖𝑙 9 = 76.4998633
R/ El 90 % o menos de los índices de esperanza de vida están en 76.4998633
𝑃𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 10 = 68.50223216
R/ El 10 % o menos de los índices de esperanza de vida están en 68.50223216
𝑃𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 90 = 76.4998633
R/ El 90 % o menos de los índices de esperanza de vida están en 76.4998633

Interpretando para la emisión de co2


𝑐𝑢𝑎𝑟𝑡𝑖𝑙1 = 52.3847827
R/ El 25% o menos de las emisiones de co2 por Kts están en 52.3847827
𝑐𝑢𝑎𝑟𝑡𝑖𝑙3 = 66.4811443
R/ El 75 % % o menos de las emisiones de co2 por Kts están en 66.4811443
𝐷𝑒𝑐𝑖𝑙 1 = 44.71373941
R/ El 10 % % o menos de las emisiones de co2 por Kts están en 44.71373941
𝐷𝑒𝑐𝑖𝑙 9 = 77.88936253
R/ El 90 % % o menos de las emisiones de co2 por Kts están en 77.88936253
𝑃𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 10 = 44.71373941
R/ El 10 % % o menos de las emisiones de co2 por Kts están en 44.71373941
𝑃𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 90 = 77.88936253
R/ El 90 % % o menos de las emisiones de co2 por Kts están en 77.88936253

7. Generar su propia interpretación de la Estadistica descriptiva. Recordar los


coeficientes de asimetría de Fisher y Pearson lo mismo que la curtosis.
8. Presentar El grafico de Frecuencia relativa Vs intervalos de clase, incluyendo
la ojiva ( frecuencia acumulada) . Debe ser el mismo histograma. Una sola
variable.
HISTOGRAMA PERSONAS

Histograma
9 120.00%
8
100.00%
7
6 80.00%
5
60.00%
4
Frecuencia

3 40.00%
2
20.00%
1
0 0.00%
.3 .
06
5.
88
5.
77
5.
65
5.
53
5.
42
65 5.
19 r..
005 1 2 3 4 5 7 7 a yo
9 92 79 66 53 40 52 14
26 50 11 72 33 94 85 16 ym
30 34 37 41 44 4 52

ejex(intervalos de clase)

HISTOGRAMA ESPERANZA DE VIDA

HISTOGRAMA
10 1.2
9
1
8 Frecuencia Acumulada Sens
7
Frecuencia ABS Sens

0.8
6
5 0.6
4
0.4
3
2
0.2
1
0 0
3 6 9 2 5 8 1 4
66.9 68.5 70.1 71.8 73.4 75.0 76.7 78.3
ejex(intervalos de clase
HISTOGRAMA EMISIONES DE CO2

HISTOGRAMA
16 1.2

14
1
12

Frecuencia Acumulada Sens


0.8
Frecuencia ABS Sens

10

8 0.6

6
0.4
4
0.2
2

0 0
1 8 5 1 8 5 2 9
40.9 48.7 56.6 64.5 72.3 80.2 88.1 95.9

9. Calcular la curtosis de datos agrupados utilizando la siguiente formula K =


½(Q3 –Q1)/(P90-P10)), este se compara siempre con 0.26, en vez del cero del
Excel

POBLACIO ESPERANZA DE EMISIONES


  N VIDA CO2 Kts
32764659.5
Q1 6 69.59834762 52.3847827
Q3 45056827.6 72.63304747 66.4811443
28993557.7
D1 3 68.50223216 44.71373941
D9 47695696.7 76.4998633 77.88936253
28993557.7
P10 3 68.50223216 44.71373941
P90 47695696.7 76.4998633 77.88936253
1
( 45056827.6−32764659.56 )
2
k= =0.32863000482
( 47695696.7−28993557.73 )

1
( 72.63304747−69.59834762 )
2
k= =0.18972491959
( 76.4998633−68.50223216 )

1
( 66.4811443−52.3847827 )
2
k= =0.21245059285
(77.88936253−44.71373941 )

10. En Stat Graphics correr la estadística descriptiva , utilizando sus datos


iniciales. . Presentar solo los pantallazos.
11. Verificar si tienen datos atípicos. ( investigar en la Red ) e interpretarlos

No se encontraron datos atípicos.

También podría gustarte