Paso 3 Maria Martinez

Paso 3
Presentado por
Maria Jose Martinez_
Grupo: 28
Curso
Estadística_ 202107095A_1391
Docente
Betsy Rodriguez
Universidad Nacional abierta y a Distancia-UNAD
CEAD-Valledupar
2023
Introducción
En el análisis estadístico de una muestra de 330 mujeres en Tunja, se encontró que la mayoría
de las mujeres evaluadas pertenecen a los estratos 1, 2 y 3, siendo el estrato 1 el más común,
representando el 44% de la muestra. Además, se calculó la media, desviación media y
varianza del estrato socioeconómico de las mujeres, indicando que la variable tiene un valor
promedio de 1.5 en la muestra analizada y que los datos se encuentran relativamente cercanos
a la media. El estudio también reveló que el rango de edad más común en la muestra es de
22 a 33 años, con el 58.79% de las mujeres en este intervalo. El consumo de sustancias
psicoactivas durante el embarazo fue reportado por la mayoría de las mujeres encuestadas.
Este análisis de la distribución de los valores o estratos en el conjunto de datos puede ser útil
para entender mejor las características de la muestra y tomar decisiones informadas basadas
en él.
En base a los resultados obtenidos en el estudio, se puede inferir que el consumo de sustancias
psicoactivas durante el embarazo es una problemática presente en la muestra. El hecho de
que un buen porcentaje de las mujeres encuestadas reportaron haber consumido alguna
sustancia durante el embarazo, es preocupante, ya que esto puede tener graves consecuencias
en la salud del feto y de la madre.
Además, de que la mayoría de las mujeres encuestadas se encuentren en el rango de edad de

22 a 33 años, puede indicar que se trata de mujeres en plena etapa reproductiva, lo que resalta
aún más la importancia de abordar esta problemática. Es necesario llevar a cabo campañas
de prevención y concientización sobre los riesgos del consumo de sustancias psicoactivas
durante el embarazo, dirigidas específicamente a este grupo de mujeres.
Asimismo, los resultados obtenidos en relación al estrato socioeconómico de las mujeres en

la muestra también son relevantes para entender mejor las características del problema y
tomar decisiones informadas basadas en él. El hecho de que el estrato más repetido sea el
estrato 1, indica que las mujeres pertenecientes a este estrato pueden estar en mayor riesgo
de consumir sustancias psicoactivas durante el embarazo, ya sea por razones de acceso a
información y recursos para la prevención o por cuestiones culturales y socioeconómicas.
En resumen, los resultados obtenidos en el estudio sugieren la necesidad de abordar la
problemática del consumo de sustancias psicoactivas durante el embarazo desde una
perspectiva integral, que tenga en cuenta factores como la edad y el estrato socioeconómico
de las mujeres. Es importante llevar a cabo acciones de prevención y concientización, así
como también garantizar el acceso a recursos y servicios de atención adecuados para aquellas
mujeres que puedan estar en situación de riesgo.
Justificación
La interpretación y organización adecuada de las bases de datos es una tarea fundamental

para obtener una comprensión clara y completa del consumo de sustancias psicoactivas en
mujeres. En este sentido, es importante destacar que el uso de metodologías cuantificables y
estadísticas se convierte en una herramienta valiosa para plantear de manera rigurosa los
distintos aspectos que deben ser considerados en la evaluación de esta problemática.
Es necesario tener en cuenta que el consumo de sustancias psicoactivas en mujeres puede

estar relacionado con diversos factores, como la edad, la educación, el entorno social y el
estado de salud, entre otros. Por ello, la aplicación de técnicas estadísticas permitirá la
identificación de patrones y tendencias, así como la realización de comparaciones entre
distintos grupos de mujeres, lo que resulta clave para una adecuada caracterización del
fenómeno.
Además, el uso de metodologías cuantificables permite una mayor objetividad en el análisis

de los datos y una mayor precisión en las conclusiones obtenidas, lo que a su vez facilita la
toma de decisiones y la formulación de políticas públicas adecuadas en el ámbito de la
prevención y tratamiento del consumo de sustancias psicoactivas en mujeres.
En resumen, la interpretación y organización adecuada de las bases de datos a través de

metodologías cuantificables y estadísticas se convierte en una herramienta fundamental para
la comprensión rigurosa y completa del consumo de sustancias psicoactivas en mujeres, lo
que a su vez resulta en la formulación de medidas y políticas adecuadas para prevenir y tratar
este problema de salud pública.
Objetivo General
Desarrollar un informe estadístico robusto y escalable que permita recopilar, procesar y

analizar grandes cantidades de datos, con el fin de tomar decisiones informadas.
Objetivos específicos
• Recolectar, ordenar, cuantificar y analizar datos: El primer objetivo se enfoca en el análisis

riguroso de datos relevantes y suficientes para el estudio estadístico del tema en cuestión,
330 mujeres gestantes consumidoras de sustancias psicoactivas. Esto podría incluir el diseño
y provisión de gráficos y tablas, la recopilación de información de fuentes secundarias o la
extracción de datos de bases de datos existentes. Una vez que se recolecten los datos, se
deberá llevar a cabo un análisis estadístico adecuado, utilizando herramientas y técnicas
estadísticas apropiadas.
• Identificar patrones y relaciones: El segundo objetivo impera en identificar patrones y

relaciones en los datos provistos a través del análisis estadístico del tema en cuestión. Esto
podría implicar el uso de técnicas como la regresión, el análisis de varianza, el análisis de
series de tiempo o el análisis de componentes principales para identificar patrones o
relaciones significativas en los datos. Desviación estándar, rango, medidas de dispersión, etc.
• Comunicar resultados y conclusiones: El tercer objetivo está acotado en comunicar los

resultados y conclusiones del análisis estadístico de manera clara y concisa. Esto podría
implicar la creación de gráficos y visualizaciones para presentar los hallazgos de manera
efectiva, así como la elaboración de informes o interpretaciones que resuman los resultados
y proporcionen recomendaciones basadas en los mismos.
Actividad 1
- Mapa mental- Medidas de posición.
Enlace:
https://onx.la/96b2d
Actividad 2
a. Tabla de frecuencia datos no agrupados de la variable Estrato socioeconómico
Estrato Frecuencia Frecuencia Frecuencia Frecuencia relativa

socioeconómico absoluta acumulada Relativa acumulada
1 148 148 0,448484848 0,448484848
2 111 259 0,336363636 0,784848485
3 71 330 0,215151515 1
TOTAL 330 1
Interpretación: La tabla de frecuencia muestra que el conjunto de mujeres evaluadas en

relación a su estrato económico consiste en tres valores distintos: 1, 2 y 3. La frecuencia de
cada valor o estrato indica cuántas veces aparece en el conjunto de datos. En este caso, el
valor 1 aparece con mayor frecuencia, con una frecuencia absoluta de 148, seguido del valor
2 con una frecuencia absoluta de 111 y el valor 3 con una frecuencia absoluta de 71.
La frecuencia relativa indica la proporción de veces que cada valor aparece en el conjunto de
datos en relación al tamaño total del conjunto de datos. Por ejemplo, la frecuencia relativa
del valor 1 es 0.4485, lo que indica que el valor 1 representa el 44.85% de todos los valores
del conjunto de datos.
La frecuencia relativa acumulada indica la proporción acumulada de veces que cada valor
aparece en el conjunto de datos, a medida que avanzamos desde los valores más bajos a los
más altos. Por ejemplo, la frecuencia relativa acumulada del valor 2 es 0.7848, lo que indica
que el valor 1 y el valor 2 representan conjuntamente el 78.48% de todos los valores del
conjunto de datos.
En resumen, la tabla de frecuencia nos proporciona una descripción numérica de la

distribución de los valores o estratos en el conjunto de datos, lo que puede ser útil para
entender mejor las características del conjunto de datos y tomar decisiones informadas
basadas en él.
b. Medidas de tendencias central y de Posición: Calcular Media, Mediana y Moda
Media
𝑋1+𝑋2+𝑋3…𝑋3..
X̅= 𝑁
583
X̅= 330 = 1.76
En la siguiente tabla de Excel insertada, se puede verificar el paso requerido.

3
3
3
3
3
3
3
583 1,76666667
Seguido, procedemos a realizar el cálculo de la mediana en Excel
3
1
2
1
3
2
3
2
2 La mediana es 2
MODA
Estrato Frecuencia Frecuencia Frecuencia Frecuencia relativa
socioeconómico absoluta acumulada Relativa acumulada
1 148 148 0,448484848 0,448484848
Interpretación: La media del estrato socioeconómico de las mujeres en la muestra de 330

participantes se obtiene sumando todos los valores de estrato (1, 2 y 3) y dividiendo el
resultado por el tamaño de la muestra, lo cual da como resultado 1,76. Para determinar la
mediana de la variable discreta del estrato socioeconómico se utilizaron todos los datos y se
utilizó la función de Excel =MEDIANA (). La mediana resultante fue el estrato 2. En cuanto
a la moda, se encontró que el estrato que más se repite en nuestra variable es el estrato 1. De
esta forma, podemos concluir que el 44% de las mujeres en la muestra pertenecen al estrato
1 y que, al considerar el tamaño de la muestra de 330 participantes, el estrato mediano es el
estrato 2.
c. Medidas de Dispersión: Calcular Rango, varianza, desviación típica o estándar,

coeficiente de variación.
Formulas
• RANGO
R= (Max-min)
R= 3 - 1 = 2
Estrato N° de mujeres F x ̅|
|x-𝒙 ̅|
f| x-𝒙 ̅)2
(x-𝒙 ̅)2
f(x-𝒙
socioeconómico embarazadas
(x) (f)
1 148 148 0.5 74 0.25 37
2 111 222 0.5 55.5 0.25 27.75
3 71 142 1.5 106.5 2.25 159.75
∑fx = 512
∑f= 330
∑𝐟𝐱
̅=
𝒙 ∑𝐟
Reemplazamos
𝟓𝟏𝟐
̅=
𝒙 = 1.5
𝟑𝟑𝟎
∑ f| x-𝒙
̅|=6
• DESVIACION MEDIA
̅|
∑𝐟| 𝐱 − 𝒙
𝑫𝒎 =
∑𝒇
Reemplazamos
𝟔
𝑫𝒎 = = 𝟎, 𝟎𝟏
𝟑𝟑𝟎
• LA VARIANZA
̅)𝟐
∑𝒇(𝐱−𝒙
S2= ∑𝒇−𝟏
∑ f(x-𝒙
̅)2 = 224.5
∑f-1= 329
Reemplazamos
𝟐𝟐𝟒.𝟓
S2= . = 0,68
𝟑𝟐𝟗
• DESVIACIÓN ESTANDAR
̅)𝟐= 0,82
∑𝒇(𝐱−𝒙
S2√ ∑𝒇−𝟏
• COEFICIENTE DE VARIACIÓN
𝑆
Cv= 𝑥̅
Reemplazamos
0,82
Cv= = 0,54
1.5
Interpretación: a partir de estos resultados podemos determinar que el estrato
dentro de la muestra de las 330 mujeres en Tunja corresponde al estrato más
repetido es el estrato 1, por tanto, esta investigación se realizó pensando que
en dichos estratos es común el consumo de sustancias psicoactivas con o sin
embarazo. -En promedio de mujeres embarazadas de los diferentes estratos
que hay de la media con cada uno de los valores obtenidos en esta muestra es
de 0,01.
Como interpretación técnica se infiere que, en primer lugar, se calcula la

media (x ̅) a partir de la suma de los productos de la frecuencia y la variable
(∑fx) dividido entre la suma de las frecuencias (∑f). El resultado obtenido es
1.5. Esto indica que, en promedio, la variable estudiada tiene un valor de 1.5
en la muestra analizada.
A continuación, se calcula la desviación media (Dm) a partir de la suma de las frecuencias

por la diferencia entre cada valor de la variable y la media, dividido entre la suma de las
frecuencias. El resultado obtenido es de 0.01. La desviación media indica qué tan alejados
están los valores de la variable respecto a la media. Un valor bajo indica que los datos se
encuentran cercanos a la media.
Finalmente, se calcula la varianza (S2) a partir de la suma de las frecuencias por el cuadrado
de la diferencia entre cada valor de la variable y la media, dividido entre la suma de las
frecuencias menos uno. El resultado obtenido es 0.68. La varianza mide la variabilidad de
los datos en relación a la media. Un valor alto indica que los datos se encuentran muy
dispersos respecto a la media.
Actividad 3- Variable continua
a. Tabla de frecuencia datos agrupados, aplicadas a variable continua (Edad)
Para realizar la tabla de frecuencia de variable continua es necesario agrupar los datos
en intervalos. Para ello se puede utilizar el método de Sturges para determinar el número de
intervalos óptimo.
La fórmula para calcular el número de intervalos según el método de Sturges es:
k = 1 + log2(n)
Donde k es el número de intervalos y n es la cantidad de datos.
En este caso, como hay n=330 datos, se tiene:
k = 1 + log2(330)
k = 1 + 8.40
k = 9.40
Por lo tanto, se utilizarán 9 intervalos.
A continuación, se muestra la tabla de frecuencia:
Frecuencia
Intervalos Frecuencia Frecuencia relativa
acumulada
[4 – 7) 1 0.30% 1
[7 – 10) 7 2.12% 8
[10-13) 31 9.39% 39
[13 – 16) 63 19.09% 102
[16 – 19) 78 23.64% 180
[19 – 22) 66 20.00% 246
[22 – 25) 37 11.21% 283
[25 – 28) 23 6.97% 306
[28 – 31) 17 5.15% 323
[31 – 46) 7 2.12% 330
TOTAL 330
En esta tabla se observa que la mayoría de los datos (edad) se encuentran en el rango de 13
a 22, y que la distribución es simétrica en torno a la media.
Como complemento se realiza el cálculo del porcentaje acumulado, (%acu.) para ello he
decidido cambiar la cantidad de intervalos utilizados anteriormente a 5
Para calcular los porcentajes acumulados de la tabla de frecuencia, se debe seguir los
siguientes pasos:
1. Calcular la frecuencia acumulada (Fa) sumando la frecuencia actual con la frecuencia

anterior.
2. Calcular el porcentaje acumulado (Pa) dividiendo la frecuencia acumulada (Fa) entre
la frecuencia total (N) y multiplicando por 100.
A continuación, se muestra la tabla de frecuencia (con intervalos reducidos de 9 a 5)
Frecuencia
Intervalos Frecuencia (%acu.)
Acumulada
[4-10) 1 1 0.30 %
[10-15) 14 15 4.24 %
[16 – 21) 50 65 15.15 %
[22 – 27) 104 169 31.52 %
[28 – 33) 88 257 26.67 %
[34 – 39) 31 288 9.39 %
[40 – 46) 12 300 3.64 %
Total 330 100.00 %
120
Histograma y Polígono de Frecuencias
100
80
60
40
20
0
1 2 3 4 5 6 7
Figura 1
Interpretación de los resultados de la tabla y gráficos estadísticos asociados con la

problemática: Factores asociados al consumo de sustancia psicoactivas durante el
embarazo de gestantes de la ciudad de Tunja (Boyacá) entre julio del 2020 y febrero del
2022:
Según los datos presentados en la tabla, se puede observar que la mayoría de las mujeres se
encuentran en el rango de edad de 22 a 33 años, con un 58.79% de la muestra en este
intervalo. Además, se puede ver que el consumo de sustancias psicoactivas durante el
embarazo es una problemática presente en la muestra, ya que el 13.33% de las mujeres
encuestadas reportaron haber consumido alguna sustancia durante el embarazo.
El histograma de frecuencias muestra que la distribución de las edades en la muestra es

relativamente uniforme, con una mayor concentración en el rango de 22 a 33 años. Por otro
lado, el polígono de frecuencias muestra un comportamiento similar, con una distribución
uniforme de la frecuencia acumulada de las edades.
En cuanto a la relación entre los datos y la problemática de consumo de sustancias

psicoactivas durante el embarazo, se puede inferir que la edad puede ser un factor importante
a considerar, ya que la mayoría de las mujeres que reportaron haber consumido sustancias se
encuentran en el rango de 22 a 33 años. Sin embargo, es importante tener en cuenta que la
muestra es limitada y que se requieren más datos y análisis para poder establecer relaciones
significativas entre variables y la problemática en cuestión.
b. Medidas de tendencia central y posición: Moda, media, mediana, cuartil y
percentiles.
(Moda)
Para calcular la moda, se busca el valor o valores que aparecen con mayor frecuencia en los
datos. En este caso, la moda sería el valor más frecuente en la tabla de frecuencia. Observando
la tabla, se puede ver que el valor que más se repite es 22, con una frecuencia de 21. Por lo
tanto, la moda es 22.
(Media)
Para calcular la media, se suman todos los valores y se dividen por la cantidad de datos. En
este caso, podemos utilizar la siguiente fórmula:
Media = (suma de los datos) / (cantidad de datos)
La suma total de los datos es:
6602
Y como la cantidad de datos es 330, la media se calcula como:
media = suma / 330 = 20.0121
Por lo tanto, la media de los datos es aproximadamente 20.0121.
(Mediana)
Para calcular la mediana, primero debemos ordenar los datos de menor a mayor:
4, 7, 9, 10, 11, 12, 13, 14, 15, 15, 15, 16, 16, 16, 16, 17, 17, 17, 17, 17, 17, 18, 18, 18, 18, 18,
18, 18, 18, 18, 18, 19, 19, 19, 19, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 21, 21, 21, 21, 21,
21, 21, 22, 22, 22, 22, 22, 22, 22, 22, 22, 23, 23, 23, 23, 23, 23, 24, 24, 24, 24, 24, 24, 24, 24,
24, 24, 25, 25, 25, 25, 25, 25, 25, 25, 26, 26, 26, 26, 26, 26, 26, 26, 27, 27, 27, 27, 27, 27, 27,
27, 27, 28, 28, 28, 28, 28, 28, 28, 28, 28, 29, 29, 29, 29, 29, 29, 30, 30, 30, 30, 30, 30, 31, 31,
31, 31, 31, 31, 31, 31, 31, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 33, 33, 33, 33, 33, 33, 34, 34,
34, 34, 34, 34, 35, 35, 35, 35, 35, 36, 36, 36, 36, 37, 37, 37, 38, 38, 38, 38, 38, 39, 39, 40, 40,
40, 40, 40, 41, 41, 41, 42, 42, 43, 43, 44, 45, 45, 46, 47, 48, 50 (fracción de 194 datos para
ilustrar)
Hay 330 datos, un número par, por lo tanto, la mediana se calcula como la media aritmética
de los dos valores centrales de los datos ordenados. En este caso, los valores centrales son el
dato 165 y el dato 166, ambos con un valor de 27.
Entonces, la mediana de los datos es:
Mediana = (27 + 27) /2 = 27
(Cuartil)
Para calcular el(los) cuartil(es), primero debemos ordenar los datos de menor a mayor:
4, 7, 9, 10, 11, 12, 13, 14, 15, 15, 15, 16, 16, 16, 16, 17, 17, 17, 17, 17, 17, 18, 18, 18, 18, 18,
18, 18, 18, 18, 18, 19, 19, 19, 19, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 21, 21, 21, 21, 21,
21, 21, 22, 22, 22, 22, 22, 22, 22, 22, 22, 23, 23, 23, 23, 23, 23, 24, 24, 24, 24, 24, 24, 24, 24,
24, 24, 25, 25, 25, 25, 25, 25, 25, 25, 26, 26, 26, 26, 26, 26, 26, 26, 27, 27, 27, 27, 27, 27, 27,
27, 27, 28, 28, 28, 28, 28, 28, 28, 28, 28, 29, 29, 29, 29, 29, 29, 30, 30, 30, 30, 30, 30, 31, 31,
31, 31, 31, 31, 31, 31, 31, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 33, 33, 33, 33, 33, 33, 34, 34,
34, 34, 34, 34, 35, 35, 35, 35, 35, 36, 36, 36, 36, 37, 37, 37, 38, 38, 38, 38, 38, 39, 39, 40, 40,
40, 40, 40, 41, 41, 41, 42, 42, 43, 43, 44, 45, 45, 46, 47, 48, 50 (fracción de 194 datos para
ilustrar)
Como tenemos un total de 330 datos, el primer cuartil (Q1) se encuentra en el lugar (330 +
1) / 4 = 82.75. Como este número no es un entero, debemos tomar los valores de las
posiciones 82 y 83, calcular su promedio y ese será nuestro Q1. En este caso, los valores
correspondientes a las posiciones 82 y 83 son 18 y 19, respectivamente, por lo que:
Q1 = (18 + 19) / 2 = 18.5
Para el segundo cuartil (Q2), que es la mediana, ya la hemos calculado previamente, y su

valor es 27.
Para el tercer cuartil (Q3), el cálculo es similar al de Q1. Como:
(330 + 1)
𝑄1 = = 247.75
4
, debemos tomar los valores correspondientes a las posiciones 247 y 248, que son 28 y 29,
respectivamente:
(28 + 29)
𝑄3 = = 28.5
2
Por lo tanto, los cuartiles de los datos son:
Q1 = 18.5, Q2 (mediana) = 27, Q3 = 28.5.

(Percentiles 50 y 70)
Para calcular los percentiles 50 y 70, podemos utilizar la fórmula:
Percentil K =
𝑲
𝐏𝐞𝐊 = ∗ (𝑵 + 𝟏)
𝟏𝟎𝟎
Donde K es el percentil deseado y N es el número de datos en la muestra.
Para el percentil 50 (también conocido como la mediana), K = 50 y N = 330.
Percentil 50 =
𝟓𝟎
𝐏𝐞𝟓𝟎 = ( ) ∗ (𝟑𝟑𝟎 + 𝟏) = 𝟏𝟔𝟓. 𝟓
𝟏𝟎𝟎
Entonces, para encontrar el valor correspondiente al percentil 50, debemos promediar el valor
en la posición 165 y el valor en la posición 166 en los datos ordenados:
(14, 14, 14, 15, ..., 46, 50)
El valor en la posición 165 es 25 y el valor en la posición 166 es 25, por lo tanto, la mediana
es:
(𝟐𝟕 + 𝟐𝟕)
𝐌𝐞 = = 𝟐𝟕
𝟐
Para el percentil 70, K = 70 y N = 330.
Percentil 70 =
𝟕𝟎
𝐏𝐞𝟕𝟎 = ( ) ∗ (𝟑𝟑𝟎 + 𝟏) = 𝟐𝟑𝟏. 𝟕
𝟏𝟎𝟎
Entonces, el valor correspondiente al percentil 70 es el valor en la posición 232 en los datos

ordenados:
(14, 14, 14, 15, ..., 46, 50)
El valor en la posición 232 es 27. Por lo tanto, el percentil 70 es:
Percentil 70 = 27
Para determinar el tipo de asimetría y curtosis, es necesario calcular el coeficiente de

asimetría y el coeficiente de curtosis.
𝟑(𝑴𝒆𝒅𝒊𝒂 − 𝑴𝒆𝒅𝒊𝒂𝒏𝒂)
𝐀𝐬𝐢𝐦𝐞𝐭𝐫í𝐚 =
𝑫𝒆𝒔𝒗𝒊𝒂𝒄𝒊ó𝒏 𝑬𝒔𝒕á𝒏𝒅𝒂𝒓
Sustituyendo los valores obtenidos previamente, se tiene:
𝟑(𝟐𝟔. 𝟔𝟕 − 𝟐𝟓. 𝟓)
𝐀𝐬𝐢𝐦𝐞𝐭𝐫í𝐚 = = 𝟎. 𝟒𝟓𝟓𝟕
𝟕. 𝟔𝟖
Como el coeficiente de asimetría es positivo, se puede decir que la distribución de los datos
es ligeramente asimétrica hacia la derecha.
Por otro lado, el coeficiente de curtosis se puede calcular con la fórmula:

𝟑(𝟐𝟔. 𝟔𝟕 − 𝟐𝟓. 𝟓)
𝐀𝐬𝐢𝐦𝐞𝐭𝐫í𝐚 = = 𝟎. 𝟒𝟓𝟓𝟕
𝟕. 𝟔𝟖
Sustituyendo los valores, se tiene:
(𝟏 − 𝟐𝟔. 𝟔𝟕)𝟒 + ⋯ + (𝟏𝟐 − 𝟐𝟔. 𝟔𝟕)𝟒

𝐂𝐮𝐫𝐭𝐨𝐬𝐢𝐬 = − 𝟑 = −𝟎. 𝟔𝟒𝟎𝟔
𝟑𝟑𝟎 ∗ 𝟕. 𝟔𝟖𝟒
Como el coeficiente de curtosis es negativo, se puede decir que la distribución de los datos
es platicúrtica (aplanada) en comparación con una distribución normal.
Interpretación de los resultados estadísticos asociados con la problemática: Factores

asociados al consumo de sustancia psicoactivas durante el embarazo de gestantes de la
ciudad de Tunja (Boyacá) entre julio del 2020 y febrero del 2022:
Los datos encontrados muestran una distribución sesgada a la derecha, lo que sugiere que
hay una mayor concentración de valores en los intervalos más bajos de la escala, y una
dispersión más amplia de valores en los intervalos más altos. La moda, la media y la mediana
son diferentes, lo que indica que la distribución no es simétrica. Además, la curtosis es
negativa, lo que significa que la distribución es relativamente plana en comparación con una
distribución normal.
Estos resultados sugieren que existe una prevalencia significativa de consumo de sustancias
psicoactivas entre las mujeres embarazadas, pero que esta prevalencia no es uniforme en toda
la población. Es posible que ciertos factores, como la edad, la educación, el nivel
socioeconómico y el acceso a la atención médica, puedan influir en la distribución del
consumo de sustancias psicoactivas en esta población. Los resultados pueden ser útiles para
informar a los profesionales de la salud sobre la necesidad de abordar la problemática del
consumo de sustancias psicoactivas en mujeres embarazadas y diseñar intervenciones
específicas dirigidas a los subgrupos de mujeres con mayor riesgo de consumo de sustancias
psicoactivas durante el embarazo.
c. Medidas de Dispersión: Rango, varianza, desviación típica, desviación estándar,

coeficiente de variación.
(Rango)
Para calcular el rango de los datos proporcionados, se necesita conocer el valor máximo y el
valor mínimo.
El valor mínimo es 4 y el valor máximo es 50. Por lo tanto, el rango de los datos es:
Rango = Valor máximo - Valor mínimo = 50 - 4 = 46.
Entonces, el rango de los datos es 46.
(Varianza)
Para calcular la varianza se utiliza la siguiente fórmula:
varianza = sumatoria de
𝑥𝑖 − 𝑚𝑒𝑑𝑖𝑎2
𝑁
Donde xi es cada valor de la variable, media es la media aritmética y n es el número total de

datos.
Aplicando la fórmula:
((4 − 22.167)2 + (6 − 22.167)^2 + … + (50 − 22.167)^2 )

330
varianza = 134.515
Por lo tanto, la varianza de los datos es de 134.515
(Desviación estándar/típica)
Si la media es de 27, entonces se debe replantear el cálculo de la desviación estándar.
Para calcular la desviación estándar a partir de la media de 27, se debe sumar la diferencia al
cuadrado entre cada dato y la media, y luego se divide entre el número total de datos.
Después, se calcula la raíz cuadrada del resultado para obtener la desviación estándar.
Primero, se calcula la suma de las diferencias al cuadrado entre cada dato y la media:
(4 − 27)² + (10 − 27)² + (11 − 27)² + . . . + (50 − 27)² = 7678
Luego, se divide esta suma entre el número total de datos, que es 330:
7678
= 23.27
330
Finalmente, se calcula la raíz cuadrada del resultado anterior para obtener la desviación
estándar:
√23.27 = 4.825
Por lo tanto, la desviación estándar de los datos es de aproximadamente 4.825
(Coeficiente de Variación)
El coeficiente de variación se calcula dividiendo la desviación estándar entre la media y

multiplicando por 100:
𝐷𝐸
𝐶𝑉 = ( ) 𝑥 100
𝑚𝑒𝑑𝑖𝑎
Sustituyendo los valores que ya hemos calculado:
8.94
𝐶𝑉 = ( ) 𝑥 100 = 33.11%
27
Por lo tanto, el coeficiente de variación para los datos proporcionados es del 33.11%. Esto
indica que la variabilidad de los datos es moderada en relación a la media.
Interpretación de los resultados estadísticos de las medidas de dispersión asociados con

la problemática: Factores asociados al consumo de sustancia psicoactivas durante el
embarazo de gestantes de la ciudad de Tunja (Boyacá) entre julio del 2020 y febrero del
2022:
Con los datos obtenidos de las 330 mujeres en relación al consumo de sustancias psicoactivas
durante el embarazo, se puede observar que la media es de 27, lo que indica que en promedio
las mujeres que más consumieron estas sustancias se encuentran en ese rango de edad.
Además, la desviación estándar de 4.825 indica que los datos están relativamente dispersos
y que hay una variabilidad considerable en el consumo de sustancias psicoactivas durante el
embarazo.
El coeficiente de variación de 33.11% indica que la variabilidad relativa del consumo de

sustancias psicoactivas en las mujeres embarazadas es bastante alta, lo que sugiere que
existen factores que pueden influir en la cantidad de sustancias consumidas por cada mujer.
En cuanto a la simetría y la curtosis, se puede observar que la distribución es asimétrica hacia

la derecha, lo que indica que hay una mayor cantidad de mujeres que consumen una cantidad
menor de sustancias psicoactivas durante el embarazo, pero que hay algunas mujeres que
consumen cantidades más grandes.
En general, estos datos sugieren que el consumo de sustancias psicoactivas durante el

embarazo es un problema que debe ser abordado con medidas preventivas y de intervención
temprana para proteger la salud de la madre y el feto. Además, los resultados también
sugieren la necesidad de investigación adicional sobre los factores de riesgo asociados con
el consumo de sustancias psicoactivas durante el embarazo y su impacto en la salud materna
y fetal.
Actividad 4 – Consolidación
En resumen, se ha realizado un trabajo estadístico sobre la muestra de 330 mujeres en Tunja

y se han analizado varias variables relacionadas con el estrato socioeconómico, el consumo
de sustancias psicoactivas durante el embarazo y la edad. Se ha utilizado la tabla de
frecuencia para describir la distribución de los valores o estratos en el conjunto de datos, así
como para calcular la media, la mediana y la moda. Se ha encontrado que el estrato
socioeconómico más común en la muestra es el estrato 1 y que el 44% de las mujeres
pertenecen a este estrato. También se ha calculado la media, la desviación media y la varianza
para la variable del estrato socioeconómico, lo que indica que la variable está cerca de la
media, pero presenta una alta variabilidad. En cuanto a la edad, se ha encontrado que la
mayoría de las mujeres se encuentran en el rango de 22 a 33 años y que la distribución de las
edades en la muestra es relativamente uniforme. Por último, se ha observado que el consumo
de sustancias psicoactivas durante el embarazo es una problemática presente en la muestra,
ya que las mujeres encuestadas reportaron haber consumido alguna sustancia durante el
embarazo.
Es importante destacar que el análisis de la tabla de frecuencias y los cálculos estadísticos

nos permiten obtener información valiosa sobre la muestra de mujeres embarazadas de
diferentes estratos socioeconómicos y su relación con el consumo de sustancias psicoactivas
durante el embarazo.
Estos datos pueden ser utilizados para diseñar programas de prevención y tratamiento
específicos para esta población, teniendo en cuenta las características y necesidades de cada
estrato socioeconómico y de las mujeres embarazadas que lo componen.
Además, el uso de técnicas estadísticas en la investigación de la relación entre el consumo

de sustancias psicoactivas durante el embarazo y el estrato socioeconómico de las mujeres
puede contribuir a generar nuevas hipótesis y a profundizar en el conocimiento de este
fenómeno, lo que a su vez puede tener implicaciones importantes en la formulación de
políticas públicas y en la atención a la salud materno-infantil.

Paso 3 Maria Martinez

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Paso 3 Maria Martinez

Cargado por

Copyright:

Formatos disponibles

Paso 3

Maria Jose Martinez_

Universidad Nacional abierta y a Distancia-UNAD

Además, de que la mayoría de las mujeres encuestadas se encuentren en el rango de edad de

Asimismo, los resultados obtenidos en relación al estrato socioeconómico de las mujeres en

La interpretación y organización adecuada de las bases de datos es una tarea fundamental

Es necesario tener en cuenta que el consumo de sustancias psicoactivas en mujeres puede

Además, el uso de metodologías cuantificables permite una mayor objetividad en el análisis

En resumen, la interpretación y organización adecuada de las bases de datos a través de

Desarrollar un informe estadístico robusto y escalable que permita recopilar, procesar y

• Recolectar, ordenar, cuantificar y analizar datos: El primer objetivo se enfoca en el análisis

• Identificar patrones y relaciones: El segundo objetivo impera en identificar patrones y

• Comunicar resultados y conclusiones: El tercer objetivo está acotado en comunicar los

a. Tabla de frecuencia datos no agrupados de la variable Estrato socioeconómico

Estrato Frecuencia Frecuencia Frecuencia Frecuencia relativa

Interpretación: La tabla de frecuencia muestra que el conjunto de mujeres evaluadas en

En resumen, la tabla de frecuencia nos proporciona una descripción numérica de la

b. Medidas de tendencias central y de Posición: Calcular Media, Mediana y Moda

En la siguiente tabla de Excel insertada, se puede verificar el paso requerido.

Seguido, procedemos a realizar el cálculo de la mediana en Excel

Interpretación: La media del estrato socioeconómico de las mujeres en la muestra de 330

c. Medidas de Dispersión: Calcular Rango, varianza, desviación típica o estándar,

1 148 148 0.5 74 0.25 37

2 111 222 0.5 55.5 0.25 27.75

3 71 142 1.5 106.5 2.25 159.75

Como interpretación técnica se infiere que, en primer lugar, se calcula la

A continuación, se calcula la desviación media (Dm) a partir de la suma de las frecuencias

Actividad 3- Variable continua

a. Tabla de frecuencia datos agrupados, aplicadas a variable continua (Edad)

Donde k es el número de intervalos y n es la cantidad de datos.

En este caso, como hay n=330 datos, se tiene:

Por lo tanto, se utilizarán 9 intervalos.

A continuación, se muestra la tabla de frecuencia:

1. Calcular la frecuencia acumulada (Fa) sumando la frecuencia actual con la frecuencia

A continuación, se muestra la tabla de frecuencia (con intervalos reducidos de 9 a 5)

Interpretación de los resultados de la tabla y gráficos estadísticos asociados con la

El histograma de frecuencias muestra que la distribución de las edades en la muestra es

En cuanto a la relación entre los datos y la problemática de consumo de sustancias

Media = (suma de los datos) / (cantidad de datos)

La suma total de los datos es:

Y como la cantidad de datos es 330, la media se calcula como:

media = suma / 330 = 20.0121

Por lo tanto, la media de los datos es aproximadamente 20.0121.

Entonces, la mediana de los datos es:

Mediana = (27 + 27) /2 = 27

Q1 = (18 + 19) / 2 = 18.5

Para el segundo cuartil (Q2), que es la mediana, ya la hemos calculado previamente, y su

Para el tercer cuartil (Q3), el cálculo es similar al de Q1. Como:

Por lo tanto, los cuartiles de los datos son:

Q1 = 18.5, Q2 (mediana) = 27, Q3 = 28.5.

Para calcular los percentiles 50 y 70, podemos utilizar la fórmula:

Donde K es el percentil deseado y N es el número de datos en la muestra.

Para el percentil 50 (también conocido como la mediana), K = 50 y N = 330.

(14, 14, 14, 15, ..., 46, 50)

Para el percentil 70, K = 70 y N = 330.

Entonces, el valor correspondiente al percentil 70 es el valor en la posición 232 en los datos

(14, 14, 14, 15, ..., 46, 50)

El valor en la posición 232 es 27. Por lo tanto, el percentil 70 es:

Para determinar el tipo de asimetría y curtosis, es necesario calcular el coeficiente de

Sustituyendo los valores obtenidos previamente, se tiene:

Por otro lado, el coeficiente de curtosis se puede calcular con la fórmula:

Sustituyendo los valores, se tiene:

(𝟏 − 𝟐𝟔. 𝟔𝟕)𝟒 + ⋯ + (𝟏𝟐 − 𝟐𝟔. 𝟔𝟕)𝟒

Interpretación de los resultados estadísticos asociados con la problemática: Factores