Está en la página 1de 17

Título

Análisis descriptivo de los registros administrativos de defunciones


generales del año 2019 del INEC

Autoría

David Alexis Urcuango Quinatoa

Steven Adrián Peralta Mendoza

Jorge Andrés Umajinga Valencia


Título (Introducción)

Título

Análisis descriptivo de los registros administrativos de defunciones generales del año


2019 del INEC

Introducción

Los fundamentos de la estadística están cambiando, no sólo en el sentido en que ellos


fueron y continuarán evolucionando, sino también en el sentido idiomático de que
ningún sistema es absolutamente estable (L. J. Savage).

Cuando queremos estudiar, y analizar un grupo de datos recurrimos a la estadística que


es una disciplina que usa las matemáticas para estudiar conjuntos de datos y poder
tomar decisiones basándonos en los cálculos matemáticos, por eso la estadística es
importante porque nos permite actuar basándonos en la razón y lograr así la máxima
eficiencia en el rendimiento de nuestras actividades.

Como veremos en este caso que nos ayudara a cuantificar la realidad y disponer de
elementos, formulas y definiciones que nos permitan interpretar su análisis, conocer esta
dicha realidad nos permite actuar de una forma más coherente ante alguna situación
presentada, con base en el conocimiento de esta causa, teniendo esto en mente y con
ayuda de la estadística descriptiva vamos a proceder a la tabulación de datos, su
presentación en forma gráfica o ilustrativa y el cálculo de medidas descriptivas.

En consecuencia, para reafirmar nuestros conocimientos realizamos este proyecto que


abordará los temas de estadística estudiados hasta ahora, para tener un buen análisis de
los registros administrativos de defunciones generales del año 2019 del INEC.

Actividades Proyecto IB

El objetivo del proyecto consiste en analizar un grupo de datos, previamente tabulados


de 600 personas de cada región y provincia del Ecuador respecto a sexo, edad, tipo de
muerte, autopsia. Mediante cálculos estadísticos; tipos de variables, tablas de
frecuencia, representación gráfica de datos y cálculo de probabilidades para establecer
conclusiones respecto a las variables de estudio.

1. Métodos:

1.1 Identificar el tipo y subtipo de variables analizadas.

En la muestra analizada de 600 personas se pueden observar seis tipos de variables que
se presenta a continuación:

 Región natural: Variable cualitativa nominal

R={ Costa ,Sierra , Oriente }


 Provincia: Variable cualitativa nominal.

P={“Azuay”, “Bolívar”, “Cañar”, “Carchi”, “Chimborazo”, “Cotopaxi”, “El


Oro”, “Esmeraldas”, “Galápagos”, “Guayas”, “Imbabura”, “Loja”, “Los
Ríos”, “Manabí”, “Morona Santiago”, “Napo”, “Orellana”, “Pastaza”,
“Pichincha”, “Santa Elena”, “Santo Domingo”, “Sucumbíos”, “Tungurahua”,
“Zamora Chinchipe”}

 Sexo: Variable cualitativa nominal.

S={ Hombre , Mujer }

 Edad: Variable cuantitativa discreta.

E={0,1,2 , … ,108 }

 Causa de muerte: Variable cualitativa nominal.

M={“Muertes causas no especificadas”, ”Muertes crónico degenerativas”,


“Muertes por causas prevenibles”, “Muertes por otras causas”, “Muertes
violentas”}

 Hubo autopsia: Variable cualitativa nominal.

M={"Si”, “No”, “Sin información”}

1.2 Tabla de frecuencias de la variable causa de muerte.

Para la elaboración de la tabla de frecuencias respecto a la variable “causa de muerte” se


obtienen la clasificación de la misma: = {“Muertes causas no especificadas”,” Muertes
crónico degenerativas”, “Muertes por causas prevenibles”, “Muertes por otras causas”,
“Muertes violentas”}. Posteriormente se utiliza el comando de Excel:

=CONTAR.SI(rango; criterio) (1)

Con respecto a la frecuencia relativa absoluta y absoluta acumulada se utilizaron las


fórmulas de estadística descriptiva:

fi
f r= (2)
n
Donde:
fi: frecuencia absoluta.
n=número de datos.

Fi
F r= (3)
n
Donde:
Fi= frecuencia absoluta acumulada.
n=número de datos.
1.3 Tabla de frecuencias e histograma de la variable EDAD.

Para elaborara la distribución de frecuencias se determinó el número de clases:

k =[ √ n] (3)

Donde k define el número de clases, se toma el entero menor del valor obtenido.
Seguido se calculó el ancho del intervalo, y por consiguiente la amplitud.

Rango= X max −X min (4)

Y finalmente el ancho del intervalo:


Rango
A= (5)
k
Se determinó la frecuencia absoluta de las edades con el comando (1) y se calculó fri y
Fr con la ecuación (2) y (3). Con las columnas de Fri y los intervalos de clase se
procedió a graficar el histograma.

1.4 Proporción de autopsias realizadas en el grupo de hombres y compárelo con las


autopsias realizadas en el grupo de mujeres.

En el cálculo de las proporciones hombres y mujeres que tuvieron autopsia se usaron


varios comando de Excel como el comando (1) y el comando (6):

=CONTAR.SI.CONJUNTO(rango_criterios1;criterio1;[rango_criterios2;criterio2];
[rango_criterios3;criterio3;…) (6)

1.5 Región del país en la que hay mayor proporción de muertes violentas (refiérase
a la variable CAUSA DE MUERTE).

Para determinar la mayor proporción de muertes violentas se utilizaron los comandos


(1) y (6) para determinar el número de muertes violentas en cada región del país; Costa,
Sierra, Amazonía.

Actividades:

1. Identifique el tipo y subtipo de las variables del conjunto de datos.

Las variables cualitativas son magnitudes cuyos valores no se manifiestan


numéricamente, pero se pueden diferenciar. (Álvarez, 2007). Las variables cualitativas a
su vez pueden ser ordinales si establecer grados diferenciales, caso contrario se
denominan nominales como: región natural, provincia, sexo, causa de muerte, si hubo o
no autopsia. (Álvarez, 2007). Por otra parte, a las variables cuantitativas se les puede
asignar un número, pueden ser discretas (número entero) o continuas (Walpole,2007).
En nuestro caso la variable “edad” es cuantitativa discreta.

2. Construya una distribución de frecuencias de la variable CAUSA DE MUERTE.


Tabla1. Distribución de frecuencias de la variable “causa de muerte”.

i Causa de muerte fi fri Fi Fri


Crónicas-
1 degenerativas 285 0,475 285 0,475
2 Por otras causas 84 0,14 369 0,615
3 Violentas 76 0,127 445 0,742
4 Prevenibles 146 0,243 591 0,985
5 No especificadas 9 0,015 600 1

600 1

3. Construya una distribución e histograma de frecuencias de la variable EDAD.

Tabla 2. Distribución de frecuencias de la variable “Edad” por intervalos de clase.

Edades mi fi fri Fi Fri


[0;5] 2,5 31 0,052 31 0,052
]5;10] 7,5 1 0,002 32 0,053
]10;15] 12,5 3 0,005 35 0,058
]15;20] 17,5 6 0,010 41 0,068
]20;25] 22,5 13 0,022 54 0,090
]25;30] 27,5 21 0,035 75 0,125
]30;35] 32,5 16 0,027 91 0,152
]35;40] 37,5 17 0,028 108 0,180
]40;45] 42,5 15 0,025 123 0,205
]45;50] 47,5 27 0,045 150 0,250
]50;55] 52,5 30 0,050 180 0,300
]55;60] 57,5 33 0,055 213 0,355
]60;65] 62,5 42 0,070 255 0,425
]65;70] 67,5 48 0,080 303 0,505
]70;75] 72,5 53 0,088 356 0,593
]75;80] 77,5 49 0,082 405 0,675
]80;85] 82,5 54 0,090 459 0,765
]85;90] 87,5 67 0,112 526 0,877
]90;95] 92,5 53 0,088 579 0,965
]95;100] 97,5 17 0,028 596 0,993
]100;105] 102,5 3 0,005 599 0,998
]105;110] 107,5 1 0,002 600 1,000
600 1,000

4. Determine la proporción de autopsias realizadas en el grupo de hombres y


compárelo con las autopsias realizadas en el grupo de mujeres.
En la muestra hay un total de 343 hombres y 257 mujeres.

64
Proporción hombres autopsia=
343
17
Proporción mujeres autopsia=
257

5. Determine la región del país en la que hay mayor proporción de muertes


violentas (refiérase a la variable CAUSA DE MUERTE).

45
Proporción muertes violentas en Costa=
76
29
Proporción muertes violentas en Sierra=
76
2
Proporción muertes violentas en Amazonía=
76

6. Determine si los hombres o las mujeres presentan la menor proporción de


muertes por causas prevenibles (refiérase a la variable CAUSA DE MUERTE).

En este caso tenemos el conteo general de personas que fallecieron por causas
prevenibles, lo cual nos da 146 el conteo total de hombres y de mujeres, este valor se lo
encontró con la función de Excel que nos permite clasificar una tabla mediante filtros
(Tabla Dinámica), de esto determinaremos la menor proporción entre ambos sexos con
ayuda de la siguiente tabla:

Los valores de las mujeres presentan la menor proporción de muertes, con un total de:
57
.
146

7. Determine la proporción de mujeres fallecidas de 0 a 17 años de edad.


Para encontrar el resultado, es primordial como primer paso, determinar el número de
mujeres fallecidas, tomando en cuenta, todos los tipos de muertes posibles, realizamos
un conteo de mujeres en toda la base de datos, una vez realizado este conteo,
procedemos a encontrar el valor de mujeres que se encuentran entre este rango de 0 a 17
años de edad con ayuda de la siguiente función:

= CONTAR.SI.CONJUNTO(rango 1; condición 1; rango 2; condición 2)


= CONTAR.SI.CONJUNTO(Edad;" >= 0"; Edad;" <= 17") = 14
Existen 14 mujeres de 0 a 17 años, del total de 257, tenemos que el total de mujeres
14
fallecidas es .
257

8. Determine la proporción de hombres fallecidos de 65 o más años de edad.

Para este resultado, como primer punto, procedemos a determinar el número de hombres
fallecidos, una vez realizado el conteo general en la base de datos de Excel, procedemos
a especificar el rango de edad, que para la práctica se calculará como:

= CONTAR.SI.CONJUNTO(rango 1; condición 1)
= CONTAR.SI.CONJUNTO(Edad;” >= 65”) = 182

182
La proporción de hombres fallecidos mayores o iguales a 65 años es de .
343

9. Determine la mayor causa de muerte del grupo de personas de 18 a 65 años de


edad.

Para la resolución tomaremos en cuenta todas las causas de muerte de la base de datos
sin excepción alguna, realizaremos un conteo total de las personas, acto seguido
definimos el rango de edad que en este caso es de 18 a 65 años de edad, este rango lo
calcularemos con la siguiente función:

= CONTAR.SI.CONJUNTO(rango 1; condición 1; rango 2; condición 2)


= CONTAR.SI.CONJUNTO(Edad;” >= 18”; Edad;” <= 65”) = 95

De la tabla tenemos el conteo final de personas fallecidas por dicha causa, en este caso
es “Muertes crónico-degenerativas” con un total de 95 personas de 18 a 65 años de
edad.
10. Construya una distribución de frecuencias de la variable provincia y determine
las 3 provincias con mayor cantidad de muertes y las 3 provincias con la menor
cantidad de muertes.

Para construir la tabla de distribución de frecuencias de la variable provincia vamos a


tener en cuenta que el número de provincias que hay en los datos es 22, no se toman en
cuenta ni Orellana ni Galápagos.
Luego con la ayuda de Excel vamos a contar en la tabla de datos las veces que se repiten
cada provincia, es decir vamos a encontrar la frecuencia absoluta. Con la frecuencia
absoluta vamos a encontrar la frecuencia absoluta acumulada que la encontramos
sumando las frecuencias relativas de la muestra.
Así mismo con la ayuda de Excel contamos el número total de muertes que son 450, ya
con este dato podemos calcular la frecuencia relativa con ayuda de la ecuación (1)
f ix
f r x= (1)
450
Después con la frecuencia relativa calculamos la frecuencia relativa acumulada
sumando las frecuencias relativas, luego la distribución de frecuencias quedaría de la
siguiente manera
frecuencia frecuencia
frecuencia frecuencia
x absoluta relativa
absoluta relativa
acumulada acumulada
azuay 25 25 0,0556 0,0560
bolivar 7 32 0,0156 0,0716
cañar 4 36 0,0089 0,0804
carchi 10 46 0,0222 0,1027
chimborazo 13 59 0,0289 0,1316
cotopaxi 12 71 0,0267 0,1582
el oro 21 92 0,0467 0,2049
esmeraldas 12 104 0,0267 0,2316
guayas 116 220 0,2578 0,4893
imbabura 17 237 0,0378 0,5271
loja 13 250 0,0289 0,5560
los rios 21 271 0,0467 0,6027
manabi 54 325 0,1200 0,7227
morona santiago 3 328 0,0067 0,7293
napo 2 330 0,0044 0,7338
pastaza 3 333 0,0067 0,7404
pichincha 76 409 0,1689 0,9093
santa elena 9 418 0,0200 0,9293
sto.domingo 12 430 0,0267 0,9560
sucumbios 2 432 0,0044 0,9604
tungurahua 17 449 0,0378 0,9982
zamora chinchipe 1 450 0,0022 1,0004

Para determinar las tres provincias con más cantidad de muertes lo que hicimos es
fijarnos en la frecuencia relativa de las provincias y coger las provincias que tienen la
mayor frecuencia relativa.

11. Realice diagramas de caja de la variable EDAD según la región. Determine si


existen datos atípicos. Interprete el Diagrama de caja para cada región y
compárelos entre regiones.

Para realizar el diagrama de caja primero encontramos los cuartiles en Excel con la
fórmula
¿ CUARTIL. EXC ( MATRIZ DE DATOS , CUARTIL)
Donde en la variable cuartil se va escribiendo 1, 2 o 3 según el cuartil que deseamos
encontrar
Una vez encontrados los tres cuartiles, vamos a calcular el rango intercuartil (RIQ) con
la ecuación (3)
RIQ=Q 3−Q1(3)
Posterior a esto calculamos el límite inferior (Li) con la ecuación (4) y el límite superior
(Ls) con la ecuación (5)
Li=Q 1−1.5 RIQ ( 4 )
Ls=Q3+ 1.5 RIQ ( 5 )
A continuación, comparamos el valor mínimo de los datos con el Li y el valor máximo
con el Ls para determinar si existen valores atípicos.
Finalmente, al reunir todos los datos obtenidos en cada una de las regiones nos queda la
siguiente tabla:

  sierra costa amazonia


MIN 0 0 0
MAX 100 104 108
Q1 54,75 50,5 0
mediana 76 69 56
Q3 88 83 85
RIQ 33,25 32,5 85
LI 4,875 1,75 -127,5
LS 137,875 131,75 212,5
valores
atípicos 0 0 no existe

A partir de la cual podemos hacer el diagrama de caja:

120 Diagrama de cajas Costa, Sierra,Amazonía


108
104
100
100
88 85
80 83
76
69
LI
60
54.75 56 Q1
50.5
valores
40 atípicos
LS
20 mediana
Q3
4.88 1.75
0 0 0 0
1 2 3

De esto finalmente obtenemos el diagrama de caja de la variable edad.

12. Determine la probabilidad de que una persona que murió por causa violenta
este entre 15 y 25 años.

Primero vamos a definir a los eventos como:


A=persona que murio por causa violenta
B=que la persona esté entre los 15 y 25 años
Al fijarnos en el enunciado notamos que nos está pidiendo calcular una probabilidad
condicional, por tanto, lo que nos está pidiendo calcular es
P(B ∩ A)
P ( B| A )=
P(A )
Ahora vamos a calcular B∩ A con la ayuda de Excel. Entonces lo que vamos a hacer es
usar filtros en Excel para encontrar la intersección de B y A
Nùmero registro Region Provincia Sexo Edad Causa de muerte Hubo autopsia
24 Costa Guayas Hombre 20 Muertes violentas Si
34 Sierra Imbabura Hombre 18 Muertes violentas Si
93 Sierra Loja Hombre 25 Muertes violentas Si
110 Costa Los Ríos Hombre 24 Muertes violentas Si
144 Costa Los Ríos Hombre 23 Muertes violentas Si
184 Sierra Carchi Hombre 23 Muertes violentas Sin información
203 Costa El Oro Hombre 24 Muertes violentas Si
208 Sierra Pichincha Mujer 22 Muertes violentas Si
327 Costa El Oro Mujer 15 Muertes violentas No
364 Sierra Pichincha Mujer 24 Muertes violentas Si
374 Sierra Pichincha Hombre 17 Muertes violentas Sin información
407 Costa Guayas Hombre 25 Muertes violentas Si
442 Costa Manabí Hombre 21 Muertes violentas Si
Luego, vemos que las muertes en la intersección de B y A son 13, por tanto
13
P ( B ∩ A )=
450
Después calculamos la P( A) que es
52
P ( A )=
450
Finalmente
13
450 13
P ( B| A )= =
52 52
450
P ( B| A )=0.25
Por tanto, la probabilidad de que una persona que murió por causa violenta este entre 15
y 25 años es de 0.25

13. Determine la probabilidad de que un hombre de la región Sierra haya muerto


por causas prevenibles.

Primero vamos a definir a los eventos como:


B= persona que sea de laregión sierra
A=que la persona haya muerto por causas prevenibles
Igual que en el ejercicio anterior notamos que nos está pidiendo calcular una
probabilidad condicional, por tanto, lo que nos está pidiendo calcular es
P(B ∩ A)
P ( B| A )=
P(A )
Ahora vamos a calcular B∩ A con la ayuda de Excel. Entonces lo que vamos a hacer es
usar filtros en Excel para encontrar la intersección de B y A
Nùmero registro Region Provincia Sexo Edad Causa de muerte Hubo autopsia
22 Sierra Loja Hombre 88 Muertes por causas prevenibles No
23 Sierra Pichincha Mujer 88 Muertes por causas prevenibles No
39 Sierra Tungurahua Hombre 92 Muertes por causas prevenibles No
49 Sierra Azuay Hombre 78 Muertes por causas prevenibles No
52 Sierra Bolívar Mujer 30 Muertes por causas prevenibles No
53 Sierra Cañar Hombre 80 Muertes por causas prevenibles No
59 Sierra Loja Mujer 81 Muertes por causas prevenibles No
67 Sierra Azuay Hombre 0 Muertes por causas prevenibles No
72 Sierra Imbabura Mujer 88 Muertes por causas prevenibles No
86 Sierra Pichincha Hombre 51 Muertes por causas prevenibles No
111 Sierra Pichincha Hombre 85 Muertes por causas prevenibles No
117 Sierra Cotopaxi Mujer 86 Muertes por causas prevenibles Sin información
132 Sierra Pichincha Hombre 0 Muertes por causas prevenibles No
139 Sierra Pichincha Hombre 89 Muertes por causas prevenibles No
155 Sierra Azuay Hombre 100 Muertes por causas prevenibles No
158 Sierra Chimborazo Hombre 66 Muertes por causas prevenibles Sin información
160 Sierra Bolívar Hombre 85 Muertes por causas prevenibles No
167 Sierra Bolívar Hombre 89 Muertes por causas prevenibles No
173 Sierra Pichincha Hombre 44 Muertes por causas prevenibles No
176 Sierra Chimborazo Mujer 95 Muertes por causas prevenibles Sin información
182 Sierra Pichincha Hombre 71 Muertes por causas prevenibles No
188 Sierra Cotopaxi Hombre 91 Muertes por causas prevenibles Sin información
195 Sierra Azuay Hombre 83 Muertes por causas prevenibles No
224 Sierra Imbabura Mujer 70 Muertes por causas prevenibles No
230 Sierra Chimborazo Hombre 75 Muertes por causas prevenibles Sin información
255 Sierra Imbabura Hombre 72 Muertes por causas prevenibles No
261 Sierra Loja Hombre 76 Muertes por causas prevenibles No
271 Sierra Pichincha Mujer 0 Muertes por causas prevenibles No
278 Sierra Chimborazo Mujer 0 Muertes por causas prevenibles No
318 Sierra Azuay Hombre 54 Muertes por causas prevenibles Sin información
330 Sierra Tungurahua Hombre 94 Muertes por causas prevenibles Sin información
362 Sierra Loja Hombre 0 Muertes por causas prevenibles No
365 Sierra Pichincha Hombre 0 Muertes por causas prevenibles No
371 Sierra Pichincha Mujer 98 Muertes por causas prevenibles No
378 Sierra Bolívar Hombre 92 Muertes por causas prevenibles No
379 Sierra Pichincha Mujer 72 Muertes por causas prevenibles No
382 Sierra Pichincha Hombre 90 Muertes por causas prevenibles Sin información
385 Sierra Pichincha Mujer 93 Muertes por causas prevenibles No
391 Sierra Azuay Hombre 88 Muertes por causas prevenibles No
393 Sierra Pichincha Mujer 90 Muertes por causas prevenibles No
398 Sierra Cotopaxi Mujer 71 Muertes por causas prevenibles Sin información
401 Sierra Bolívar Mujer 78 Muertes por causas prevenibles No
424 Sierra Loja Hombre 92 Muertes por causas prevenibles No
429 Sierra Azuay Mujer 90 Muertes por causas prevenibles No
432 Sierra Pichincha Hombre 46 Muertes por causas prevenibles No
441 Sierra Pichincha Mujer 58 Muertes por causas prevenibles No
443 Sierra Azuay Mujer 64 Muertes por causas prevenibles No

Haciendo un conteo vemos que en la intersección de B y A hay 47 muertes, luego


47
P ( B ∩ A )=
450
Después calculamos la P( A) que es
112
P ( A )=
450
Finalmente
47
450 47
P ( B| A )= =
112 112
450
P ( B| A )=0.4196

Por tanto, la probabilidad de que un hombre de la región Sierra haya muerto por causas
prevenibles es de 0.4196.
3. Resultados y Análisis

1. Identifique el tipo y subtipo de las variables del conjunto de datos.

En estadística se tienen fundamentalmente dos tipos de variables: cualitativas y


cuantitativas. Las variables cualitativas son magnitudes cuyos valores no se manifiestan
numéricamente, pero se pueden diferenciar. (Álvarez, 2007). Las variables cualitativas a
su vez pueden ser ordinales si establecer grados diferenciales, caso contrario se
denominan nominales como: región natural, provincia, sexo, causa de muerte, si hubo o
no autopsia. (Álvarez, 2007). Por otra parte, a las variables cuantitativas se les puede
asignar un número, pueden ser discretas (número entero) o continuas (Walpole,2007).
En nuestro caso la variable “edad” es cuantitativa discreta.

2. Construya una distribución de frecuencias de la variable CAUSA DE


MUERTE.

Con respecto a las causas de muerte se puede evidenciar en la tabla 1 que existe una
mayor tendencia a muertes por causas crónicas- degenerativas, puesto que de 600
personas un 47,5% mueren por esta causa. En contraparte se evidencia una menor
proporción en las muertes por causas no especificadas con apenas el 1.5%.

3. Construya una distribución e histograma de frecuencias de la variable


EDAD.

Fri En la muestra asignada se


Frecuencia absoluta acumulada

1.200 observa la variable edad que


1.000 está representada en la tabla 2
0.800 y la figura 1. En la misma se
0.600 observa que los datos se
0.400 centran mayoritariamente en
0.200
0.000
los rangos de edad más altos,
siendo la clase entre 85 y 90
]1 5]
]2 5]
]3 5]
]4 5]
]5 5]
]6 5]
]7 5]
]8 5]
]9 5]
00 ]

]
]1 95
05

años la mayoritaria con un


;
1
2
3
4
5
6
7
8
[0
0;

0;

0;
0;
0;

0;

0;
0;
0;
;1

11,2 % y las de menor


proporción
Edades

Figura1. Histograma edades.

4. Determine la proporción de autopsias realizadas en el grupo de hombres y


compárelo con las autopsias realizadas en el grupo de mujeres.

Se observa que de los 343 hombres a 64 se les realizó autopsia, en cuanto a las mujeres,
de las 257 mujeres, a 17 se les realizó autopsia. Finalmente existen mayor proporción de
autopsias en los hombres que en las mujeres.
5. Determine la región del país en la que hay mayor proporción de muertes
violentas (refiérase a la variable CAUSA DE MUERTE).

Se analizaron las muertes violentas en cada región del país y se observó que de las 76
muertes violentas en la muestra de 600 personas existe un predominio en la Costa con
45 muertes violentas, mientras que en la Amazonía apenas 2.

6. Determine si los hombres o las mujeres presentan la menor proporción de


muertes por causas prevenibles (refiérase a la variable CAUSA DE MUERTE).

Del previo cálculo y análisis de la pregunta podemos evidenciar, los valores de las
57
mujeres presentan la menor proporción de muertes, con un total de: con respecto al
146
89
de los hombres con un total de: .
146
A continuación, la representación gráfica del mismo:

7. Determine la proporción de mujeres fallecidas de 0 a 17 años de edad.

Del análisis de la pregunta y de los datos de esta, obtenemos que existen 14 mujeres de
0 a 17 años, del total de 257, visto esto como valor de proporción tenemos que el total
14
de mujeres fallecidas de 0 a 17 años de edad es .
257
A continuación, la representación gráfica del mismo:

8. Determine la proporción de hombres fallecidos de 65 o más años de edad.


Del análisis podemos concluir que la proporción de hombres fallecidos mayores o
182
iguales a 65 años es de , tomando en cuenta, todos los tipos de muertes posibles,
343
sin aplicar ningún tipo de filtro.
A continuación, la representación gráfica del mismo:

9. Determine la mayor causa de muerte del grupo de personas de 18 a 65


años de edad.

Del análisis de la tabla y los datos de esta, obtenemos todas las causas de muerte
posibles de la base de datos en Excel, con todas las personas fallecidas por cada causa,
una vez especificado nuestro rango, tenemos el conteo final de personas fallecidas por
dicha causa, analizamos y observamos que la mayor causa de muerte es “Muertes
crónico-degenerativas” con un total de 95 personas de 18 a 65 años de edad.
A continuación, la representación gráfica del mismo:

10. Construya una distribución de frecuencias de la variable provincia y


determine las 3 provincias con mayor cantidad de muertes y las 3 provincias
con la menor cantidad de muertes.

Con los datos que obtuvimos en la metodología podemos ver en la frecuencia relativa
las provincias que tienen más y menos muertes.
Las provincias que tienen más muertes son en orden de mayor a menor Guayas,
Pichincha y Manabí respectivamente, las provincias que tienen menos muertes son de
menor a mayor son Zamora Chinchipe, Napo y Sucumbíos respectivamente.
Podemos ver que las provincias que más cantidad de personas tienen son las que más
muertes tienen, así mismo en las provincias que menos personas tienen, menos muertes
son las que existen.
Por tanto, podemos decir que hay una relación directamente proporcional entre el
número de personas que tiene una provincia y el número de muertes que hay en la
misma.

11. Realice diagramas de caja de la variable EDAD según la región. Determine


si existen datos atípicos. Interprete el Diagrama de caja para cada región y
compárelos entre regiones.

120
Diagrama de cajas Costa, Sierra,Amazonía
108
104
100
100
88 85
80 83
76
69
LI
60
54.75 56 Q1
50.5
valores
40 atípicos
LS
20 mediana
Q3
4.88 1.75
0 0 0 0
1 2 3

En la región sierra podemos ver que el primer 25% de los datos está mucho más
disperso que en el restante 75% de datos, de aquí podemos concluir que el mayor
número de muerte está en las edades arriba de 54 años. Además, vemos que el número
cero es el único dato atípico.

También podemos ver que hay la misma dispersión de datos entre la mediana y el Q3 y
el Q3 y el bigote superior, además notamos que la mediana está en los 76 años,
finalmente podemos concluir que el 50% de muertes en la sierra se da entre los 76 y 100
años.

Al mirar el diagrama de caja de la región costa podemos ver que el primer 25% de los
datos está mucho más disperso que en el restante 75% de datos, de aquí podemos
concluir que el mayor número de muerte está en las edades arriba de 50.5 años.
También vemos que entre los 69 y 83 años están más concentrados los datos de las
muertes y vemos que tiene por dato atípico el número 0.

En el diagrama de caja de la región amazonia notamos que en el primer 25% de los


datos todas las muertes son de personas que no tienen ni un año de edad, luego
encontramos que en el segundo 25% es donde los datos están más dispersos. Además,
vemos que en la amazonia no hay datos atípicos.
Finalmente notamos que la mayor concentración de muerte en la amazonia se encuentra
entre los 56 y 86 años.
Al comparar los tres gráficos de caja entre las regiones vemos que en la región sierra y
la costa la dispersión de los datos es muy parecida. También vemos que el mayor rango
de edades de muerte está en la región amazonia.

12. Determine la probabilidad de que una persona que murió por causa
violenta este entre 15 y 25 años.
En base a la metodología y al análisis de los datos obtenidos de la pregunta se puede
concluir que la probabilidad de que una persona que murió por causa violenta este entre
15 y 25 años es de 0.25

13. Determine la probabilidad de que un hombre de la región Sierra haya


muerto por causas prevenibles.

En base a la metodología y al análisis de los datos obtenidos de la pregunta se puede


concluir que la probabilidad de que un hombre de la región Sierra haya muerto por
causas prevenibles es de 0.4196

3.1 Conclusiones.

La estadística descriptiva ayuda a observar de forma clara un conjunto de datos,


resumirlos en forma de tablas, tipos de variables y representaciones gráficas y con
ayuda de software especializado se puede manejar grandes conjuntos de datos de
manera sencilla.
En la muestra se observa que existe mayor frecuencia de muerte por causas crónicas
degenerativas seguido de muertes por causas prevenibles. La principal causa de muerte
va acorde con la edad de las personas de la muestra en mayor proporción (85 a 90 años).
Existe mayor tendencia a muertes violentas en la región Costa, en contraste a la
Amazonía cuya proporción es notablemente menor, las autopsias realizadas tanto a
mujeres y hombres distan entre sí ya que, de 343 hombres, a 64 se les realizó autopsia,
en cambio a las mujeres, de 257 apenas a 17 se les realizó autopsia.

Ahora podemos tener más claro que el número de muertes de un lugar está relacionado
de manera directa con el número de habitantes que hay en ese lugar como, además que
los datos entre en las provincias con mayor número de muertes son muy similares
mientras que donde hay menos muertes se rompe esta similitud entonces podemos
concluir que las diferencias entre las edades en las que las personas mueren en cada
provincia no están relacionadas con la región a la que pertenecen sino a la cantidad de
habitantes que hay en cada provincia.
Por otra parte, podemos concluir que las diferencias respecto a la dispersión en los datos
de las edades de muerte a diferencia de lo explicado en el párrafo anterior si están
relacionados a la región a la que pertenezca la provincia teniendo en cuenta que en la
amazonia están los datos más dispersos que en la costa y la sierra, aunque también nos
podemos dar cuenta en que la dispersión de datos entre la sierra y la costa no hay
muchas diferencias.
Finalmente debemos tener en cuenta que aparte del número de habitantes que hay en
cada provincia la muerte también está relacionada con otros tipos de factores por tanto
lo que podemos decir es que dependiendo de la información que estemos buscando
podremos concluir que parámetros son determinantes a la hora de hacer comparaciones.
Bibliografía:

Álvarez, R. (2007). Estadística aplicada a las Ciencias de la Salud. Madrid, España:


Díaz.

Walpole R., Myers R., Myers S., Ye K. (2007) Probabilidad y Estadística para
ingeniería y ciencias. Mexico, Mexico: Prentice Hall.

Estadísticas de defunciones generales en el Ecuador.


(https://www.ecuadorencifras.gob.ec/documentos/web-
inec/Poblacion_y_Demografia/Defunciones_Generales_2019/Presentacion_EDG
%20_2019.pdf)

También podría gustarte