Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Presentado por
Grupo: 28
Curso
Estadística_ 202107095A_1391
Docente
Betsy Rodriguez
CEAD-Valledupar
2023
Introducción
En el análisis estadístico de una muestra de 330 mujeres en Tunja, se encontró que la mayoría
de las mujeres evaluadas pertenecen a los estratos 1, 2 y 3, siendo el estrato 1 el más común,
representando el 44% de la muestra. Además, se calculó la media, desviación media y
varianza del estrato socioeconómico de las mujeres, indicando que la variable tiene un valor
promedio de 1.5 en la muestra analizada y que los datos se encuentran relativamente cercanos
a la media. El estudio también reveló que el rango de edad más común en la muestra es de
22 a 33 años, con el 58.79% de las mujeres en este intervalo. El consumo de sustancias
psicoactivas durante el embarazo fue reportado por la mayoría de las mujeres encuestadas.
Este análisis de la distribución de los valores o estratos en el conjunto de datos puede ser útil
para entender mejor las características de la muestra y tomar decisiones informadas basadas
en él.
En base a los resultados obtenidos en el estudio, se puede inferir que el consumo de sustancias
psicoactivas durante el embarazo es una problemática presente en la muestra. El hecho de
que un buen porcentaje de las mujeres encuestadas reportaron haber consumido alguna
sustancia durante el embarazo, es preocupante, ya que esto puede tener graves consecuencias
en la salud del feto y de la madre.
Objetivos específicos
Actividad 1
- Mapa mental- Medidas de posición.
Enlace:
https://onx.la/96b2d
Actividad 2
La frecuencia relativa indica la proporción de veces que cada valor aparece en el conjunto de
datos en relación al tamaño total del conjunto de datos. Por ejemplo, la frecuencia relativa
del valor 1 es 0.4485, lo que indica que el valor 1 representa el 44.85% de todos los valores
del conjunto de datos.
La frecuencia relativa acumulada indica la proporción acumulada de veces que cada valor
aparece en el conjunto de datos, a medida que avanzamos desde los valores más bajos a los
más altos. Por ejemplo, la frecuencia relativa acumulada del valor 2 es 0.7848, lo que indica
que el valor 1 y el valor 2 representan conjuntamente el 78.48% de todos los valores del
conjunto de datos.
Media
𝑋1+𝑋2+𝑋3…𝑋3..
X̅= 𝑁
583
X̅= 330 = 1.76
3
1
2
1
3
2
3
2
2 La mediana es 2
MODA
Estrato Frecuencia Frecuencia Frecuencia Frecuencia relativa
socioeconómico absoluta acumulada Relativa acumulada
1 148 148 0,448484848 0,448484848
Estrato N° de mujeres F x ̅|
|x-𝒙 ̅|
f| x-𝒙 ̅)2
(x-𝒙 ̅)2
f(x-𝒙
socioeconómico embarazadas
(x) (f)
∑fx = 512
∑f= 330
∑𝐟𝐱
̅=
𝒙 ∑𝐟
Reemplazamos
𝟓𝟏𝟐
̅=
𝒙 = 1.5
𝟑𝟑𝟎
∑ f| x-𝒙
̅|=6
• DESVIACION MEDIA
̅|
∑𝐟| 𝐱 − 𝒙
𝑫𝒎 =
∑𝒇
Reemplazamos
𝟔
𝑫𝒎 = = 𝟎, 𝟎𝟏
𝟑𝟑𝟎
• LA VARIANZA
̅)𝟐
∑𝒇(𝐱−𝒙
S2= ∑𝒇−𝟏
∑ f(x-𝒙
̅)2 = 224.5
∑f-1= 329
Reemplazamos
𝟐𝟐𝟒.𝟓
S2= . = 0,68
𝟑𝟐𝟗
• DESVIACIÓN ESTANDAR
̅)𝟐= 0,82
∑𝒇(𝐱−𝒙
S2√ ∑𝒇−𝟏
• COEFICIENTE DE VARIACIÓN
𝑆
Cv= 𝑥̅
Reemplazamos
0,82
Cv= = 0,54
1.5
Interpretación: a partir de estos resultados podemos determinar que el estrato
dentro de la muestra de las 330 mujeres en Tunja corresponde al estrato más
repetido es el estrato 1, por tanto, esta investigación se realizó pensando que
en dichos estratos es común el consumo de sustancias psicoactivas con o sin
embarazo. -En promedio de mujeres embarazadas de los diferentes estratos
que hay de la media con cada uno de los valores obtenidos en esta muestra es
de 0,01.
Finalmente, se calcula la varianza (S2) a partir de la suma de las frecuencias por el cuadrado
de la diferencia entre cada valor de la variable y la media, dividido entre la suma de las
frecuencias menos uno. El resultado obtenido es 0.68. La varianza mide la variabilidad de
los datos en relación a la media. Un valor alto indica que los datos se encuentran muy
dispersos respecto a la media.
Para realizar la tabla de frecuencia de variable continua es necesario agrupar los datos
en intervalos. Para ello se puede utilizar el método de Sturges para determinar el número de
intervalos óptimo.
La fórmula para calcular el número de intervalos según el método de Sturges es:
k = 1 + log2(n)
k = 1 + log2(330)
k = 1 + 8.40
k = 9.40
Frecuencia
Intervalos Frecuencia Frecuencia relativa
acumulada
[4 – 7) 1 0.30% 1
[7 – 10) 7 2.12% 8
[10-13) 31 9.39% 39
[13 – 16) 63 19.09% 102
[16 – 19) 78 23.64% 180
[19 – 22) 66 20.00% 246
[22 – 25) 37 11.21% 283
[25 – 28) 23 6.97% 306
[28 – 31) 17 5.15% 323
[31 – 46) 7 2.12% 330
TOTAL 330
En esta tabla se observa que la mayoría de los datos (edad) se encuentran en el rango de 13
a 22, y que la distribución es simétrica en torno a la media.
Como complemento se realiza el cálculo del porcentaje acumulado, (%acu.) para ello he
decidido cambiar la cantidad de intervalos utilizados anteriormente a 5
Para calcular los porcentajes acumulados de la tabla de frecuencia, se debe seguir los
siguientes pasos:
Frecuencia
Intervalos Frecuencia (%acu.)
Acumulada
[4-10) 1 1 0.30 %
[10-15) 14 15 4.24 %
[16 – 21) 50 65 15.15 %
[22 – 27) 104 169 31.52 %
[28 – 33) 88 257 26.67 %
[34 – 39) 31 288 9.39 %
[40 – 46) 12 300 3.64 %
Total 330 100.00 %
120
Histograma y Polígono de Frecuencias
100
80
60
40
20
0
1 2 3 4 5 6 7
Figura 1
Según los datos presentados en la tabla, se puede observar que la mayoría de las mujeres se
encuentran en el rango de edad de 22 a 33 años, con un 58.79% de la muestra en este
intervalo. Además, se puede ver que el consumo de sustancias psicoactivas durante el
embarazo es una problemática presente en la muestra, ya que el 13.33% de las mujeres
encuestadas reportaron haber consumido alguna sustancia durante el embarazo.
(Moda)
Para calcular la moda, se busca el valor o valores que aparecen con mayor frecuencia en los
datos. En este caso, la moda sería el valor más frecuente en la tabla de frecuencia. Observando
la tabla, se puede ver que el valor que más se repite es 22, con una frecuencia de 21. Por lo
tanto, la moda es 22.
(Media)
Para calcular la media, se suman todos los valores y se dividen por la cantidad de datos. En
este caso, podemos utilizar la siguiente fórmula:
6602
(Mediana)
Para calcular la mediana, primero debemos ordenar los datos de menor a mayor:
4, 7, 9, 10, 11, 12, 13, 14, 15, 15, 15, 16, 16, 16, 16, 17, 17, 17, 17, 17, 17, 18, 18, 18, 18, 18,
18, 18, 18, 18, 18, 19, 19, 19, 19, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 21, 21, 21, 21, 21,
21, 21, 22, 22, 22, 22, 22, 22, 22, 22, 22, 23, 23, 23, 23, 23, 23, 24, 24, 24, 24, 24, 24, 24, 24,
24, 24, 25, 25, 25, 25, 25, 25, 25, 25, 26, 26, 26, 26, 26, 26, 26, 26, 27, 27, 27, 27, 27, 27, 27,
27, 27, 28, 28, 28, 28, 28, 28, 28, 28, 28, 29, 29, 29, 29, 29, 29, 30, 30, 30, 30, 30, 30, 31, 31,
31, 31, 31, 31, 31, 31, 31, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 33, 33, 33, 33, 33, 33, 34, 34,
34, 34, 34, 34, 35, 35, 35, 35, 35, 36, 36, 36, 36, 37, 37, 37, 38, 38, 38, 38, 38, 39, 39, 40, 40,
40, 40, 40, 41, 41, 41, 42, 42, 43, 43, 44, 45, 45, 46, 47, 48, 50 (fracción de 194 datos para
ilustrar)
Hay 330 datos, un número par, por lo tanto, la mediana se calcula como la media aritmética
de los dos valores centrales de los datos ordenados. En este caso, los valores centrales son el
dato 165 y el dato 166, ambos con un valor de 27.
(Cuartil)
Para calcular el(los) cuartil(es), primero debemos ordenar los datos de menor a mayor:
4, 7, 9, 10, 11, 12, 13, 14, 15, 15, 15, 16, 16, 16, 16, 17, 17, 17, 17, 17, 17, 18, 18, 18, 18, 18,
18, 18, 18, 18, 18, 19, 19, 19, 19, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 21, 21, 21, 21, 21,
21, 21, 22, 22, 22, 22, 22, 22, 22, 22, 22, 23, 23, 23, 23, 23, 23, 24, 24, 24, 24, 24, 24, 24, 24,
24, 24, 25, 25, 25, 25, 25, 25, 25, 25, 26, 26, 26, 26, 26, 26, 26, 26, 27, 27, 27, 27, 27, 27, 27,
27, 27, 28, 28, 28, 28, 28, 28, 28, 28, 28, 29, 29, 29, 29, 29, 29, 30, 30, 30, 30, 30, 30, 31, 31,
31, 31, 31, 31, 31, 31, 31, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 33, 33, 33, 33, 33, 33, 34, 34,
34, 34, 34, 34, 35, 35, 35, 35, 35, 36, 36, 36, 36, 37, 37, 37, 38, 38, 38, 38, 38, 39, 39, 40, 40,
40, 40, 40, 41, 41, 41, 42, 42, 43, 43, 44, 45, 45, 46, 47, 48, 50 (fracción de 194 datos para
ilustrar)
Como tenemos un total de 330 datos, el primer cuartil (Q1) se encuentra en el lugar (330 +
1) / 4 = 82.75. Como este número no es un entero, debemos tomar los valores de las
posiciones 82 y 83, calcular su promedio y ese será nuestro Q1. En este caso, los valores
correspondientes a las posiciones 82 y 83 son 18 y 19, respectivamente, por lo que:
(330 + 1)
𝑄1 = = 247.75
4
, debemos tomar los valores correspondientes a las posiciones 247 y 248, que son 28 y 29,
respectivamente:
(28 + 29)
𝑄3 = = 28.5
2
Percentil K =
𝑲
𝐏𝐞𝐊 = ∗ (𝑵 + 𝟏)
𝟏𝟎𝟎
Percentil 50 =
𝟓𝟎
𝐏𝐞𝟓𝟎 = ( ) ∗ (𝟑𝟑𝟎 + 𝟏) = 𝟏𝟔𝟓. 𝟓
𝟏𝟎𝟎
Entonces, para encontrar el valor correspondiente al percentil 50, debemos promediar el valor
en la posición 165 y el valor en la posición 166 en los datos ordenados:
El valor en la posición 165 es 25 y el valor en la posición 166 es 25, por lo tanto, la mediana
es:
(𝟐𝟕 + 𝟐𝟕)
𝐌𝐞 = = 𝟐𝟕
𝟐
Percentil 70 =
𝟕𝟎
𝐏𝐞𝟕𝟎 = ( ) ∗ (𝟑𝟑𝟎 + 𝟏) = 𝟐𝟑𝟏. 𝟕
𝟏𝟎𝟎
Percentil 70 = 27
𝟑(𝑴𝒆𝒅𝒊𝒂 − 𝑴𝒆𝒅𝒊𝒂𝒏𝒂)
𝐀𝐬𝐢𝐦𝐞𝐭𝐫í𝐚 =
𝑫𝒆𝒔𝒗𝒊𝒂𝒄𝒊ó𝒏 𝑬𝒔𝒕á𝒏𝒅𝒂𝒓
𝟑(𝟐𝟔. 𝟔𝟕 − 𝟐𝟓. 𝟓)
𝐀𝐬𝐢𝐦𝐞𝐭𝐫í𝐚 = = 𝟎. 𝟒𝟓𝟓𝟕
𝟕. 𝟔𝟖
Como el coeficiente de asimetría es positivo, se puede decir que la distribución de los datos
es ligeramente asimétrica hacia la derecha.
Como el coeficiente de curtosis es negativo, se puede decir que la distribución de los datos
es platicúrtica (aplanada) en comparación con una distribución normal.
Los datos encontrados muestran una distribución sesgada a la derecha, lo que sugiere que
hay una mayor concentración de valores en los intervalos más bajos de la escala, y una
dispersión más amplia de valores en los intervalos más altos. La moda, la media y la mediana
son diferentes, lo que indica que la distribución no es simétrica. Además, la curtosis es
negativa, lo que significa que la distribución es relativamente plana en comparación con una
distribución normal.
Estos resultados sugieren que existe una prevalencia significativa de consumo de sustancias
psicoactivas entre las mujeres embarazadas, pero que esta prevalencia no es uniforme en toda
la población. Es posible que ciertos factores, como la edad, la educación, el nivel
socioeconómico y el acceso a la atención médica, puedan influir en la distribución del
consumo de sustancias psicoactivas en esta población. Los resultados pueden ser útiles para
informar a los profesionales de la salud sobre la necesidad de abordar la problemática del
consumo de sustancias psicoactivas en mujeres embarazadas y diseñar intervenciones
específicas dirigidas a los subgrupos de mujeres con mayor riesgo de consumo de sustancias
psicoactivas durante el embarazo.
(Rango)
Para calcular el rango de los datos proporcionados, se necesita conocer el valor máximo y el
valor mínimo.
El valor mínimo es 4 y el valor máximo es 50. Por lo tanto, el rango de los datos es:
(Varianza)
varianza = sumatoria de
𝑥𝑖 − 𝑚𝑒𝑑𝑖𝑎2
𝑁
varianza = 134.515
(Desviación estándar/típica)
Para calcular la desviación estándar a partir de la media de 27, se debe sumar la diferencia al
cuadrado entre cada dato y la media, y luego se divide entre el número total de datos.
Después, se calcula la raíz cuadrada del resultado para obtener la desviación estándar.
Primero, se calcula la suma de las diferencias al cuadrado entre cada dato y la media:
Luego, se divide esta suma entre el número total de datos, que es 330:
7678
= 23.27
330
Finalmente, se calcula la raíz cuadrada del resultado anterior para obtener la desviación
estándar:
√23.27 = 4.825
(Coeficiente de Variación)
𝐷𝐸
𝐶𝑉 = ( ) 𝑥 100
𝑚𝑒𝑑𝑖𝑎
8.94
𝐶𝑉 = ( ) 𝑥 100 = 33.11%
27
Por lo tanto, el coeficiente de variación para los datos proporcionados es del 33.11%. Esto
indica que la variabilidad de los datos es moderada en relación a la media.
Con los datos obtenidos de las 330 mujeres en relación al consumo de sustancias psicoactivas
durante el embarazo, se puede observar que la media es de 27, lo que indica que en promedio
las mujeres que más consumieron estas sustancias se encuentran en ese rango de edad.
Además, la desviación estándar de 4.825 indica que los datos están relativamente dispersos
y que hay una variabilidad considerable en el consumo de sustancias psicoactivas durante el
embarazo.
Estos datos pueden ser utilizados para diseñar programas de prevención y tratamiento
específicos para esta población, teniendo en cuenta las características y necesidades de cada
estrato socioeconómico y de las mujeres embarazadas que lo componen.