Está en la página 1de 14

Unidad 3

1 //Escenario
Escenario26
Lectura fundamental
Fundamental

Componentes
Etapas de un plan
de la
deestadística
comunicación
estratégica
descriptiva

Contenido

1 Medidas de tendencia central

2 Distribuciones de frecuencia

3 Medidas de variabilidad

Palabras clave: análisis descriptivos, distribuciones de frecuencia y variabilidad, promedio aritmético de los datos.
Introducción
En la Lectura fundamental de los Escenarios 6, 7 y 8 se referencia al análisis estadístico de los datos
cuantitativos que emergen de los instrumentos de acopio de información, para el desarrollo de este
objetivo se presentarán fórmulas basadas en análisis descriptivos e inferenciales y se desarrollarán
ejemplos que permitirán una mayor de las operaciones que aquí se describe, es importante
reconocer que aunque el proceso manual la resolución de las fórmulas puede resultar fatigante (y
más conociendo que existen programas estadísticos SPSS e incluso Microsoft Excel que pueden
desarrollar estas tareas de una manera más práctica y precisa) es necesario nombrarlo para exponer
claramente cómo se atribuye la interpretación de datos cuantitativos.

Hablando específicamente de esta Lectura fundamental, se abordarán temas relacionados


con las medidas de tendencia central, distribuciones de frecuencia y variabilidad, las cuales se
reconocen como parte de la estadística descriptiva, como sugerencia y dispositivo metodológico
se sugiere que el estudiante alterne la lectura con la realización de ejercicios prácticos en los
programas con anterioridad.

1. Medidas de tendencia central


Las medidas de tendencia central hacen referencia a los valores obtenidos a partir de un grupo de
datos en los cuales se identifican otros valores relacionados con promedios frecuencias y mitades
que permiten interpretar información de las variables que ha seleccionado un investigador. En
estadística descriptiva se reconocen tres medidas de tendencia central la moda, la mediana y
la media, la moda se explica cómo el valor que mayor frecuencia tiene en un grupo de datos, la
mediana es el dato que divide el conjunto de datos en la mitad, mientras que la media se refiere al
promedio aritmético de los datos.

Para una mejor comprensión de los elementos expuestos, se considera el siguiente grupo de datos.

25 22 36 36 49 43 46 50 51

POLITÉCNICO GRANCOLOMBIANO 2
1.1. Moda

A partir de estos datos se identifica que la moda es 36, ya que es el dato que aparece con mayor
frecuencia en el conjunto de valores, ahora bien, este dato por si solo aporta simplemente una
frecuencia numérica, sin embargo, al convertir los datos en sujetos y suponer que cada número
corresponde a la variable “edad” la interpretación de dicha información tomaría un sentido distinto
y, por consiguiente, una interpretación de la misma se podría argumentar por ejemplo que del grupo
de ocho sujetos dos se encuentran en el ciclo vital de la adultez media, de esta manera los datos
empiezan a aportar información acerca de la población.

1.2. Mediana

Continuando con el mismo conjunto de datos, se identifica a continuación la mediana a partir de la


siguiente fórmula en donde: n = número de datos.

De acuerdo con la fórmula y los datos expuestos se encuentra que (9+1)/2, en donde 10/2) = 5,
lo cual indica que el valor que se encuentra en el quinto lugar de las lista de valores es la mediana,
es decir “49” aspecto que se comprueba al identificar que antes y después de este dato hay
cuatro datos más.

25 22 36 36 49 43 46 50 51


4 4

POLITÉCNICO GRANCOLOMBIANO 3
1.3. Media

Por último, se revisa el concepto de media del conjunto de datos con el que venimos trabajando,
como se mencionaba con anterioridad corresponde al promedio aritmético, su fórmula es la siguiente
y correspondería a la sumatoria total de los datos dividido en el número de datos.

Tomando como referencia el ejemplo:

X = 25 + 22 + 36 + 36 + 49 + 43 + 46 + 50 + 51 = 39,7

Ahora bien, si se continúa suponiendo que los datos que sirvieron como ejemplo en este ejercicio
corresponden a la variable edad de un grupo de 9 sujetos podrían emerger análisis de tipo descriptivo
y otros de tipo interpretativo, un análisis descriptivo sería, por ejemplo:

observando la variable edad de los 9 sujetos pertenecientes al grupo experimental todos se


encuentran en un rango de edad 25 años y 51 años, la edad que más se repitió en el grupo fue 36
años con dos sujetos, mientras que el promedio de edades fue de 39, 7 años, encontrando que
el 50% de la población se ubicó según esta variable por debajo de 49 años y el 50% restante por
encima del mismo valor.

Un análisis de corte más explicativo poseería deducciones asociadas al contexto de investigación que
se respaldan por los datos numéricos, considerando que se plantea una situación hipotética, el análisis
podría estar enfocado a la discusión acerca de los ciclos vitales de los participantes.

POLITÉCNICO GRANCOLOMBIANO 4
2. Distribuciones de frecuencia
Es el proceso estadístico mediante el cual se describe la forma en que se agrupan los datos luego
de un proceso de recolección de información, se puede realizar tomado en cuenta una, dos o más
variables y se denomina distribución univariada, distribución bivariada y distribución multivariada,
respectivamente. Revisemos el siguiente ejemplo acerca de una distribución de frecuencia univariada
para la variable “consumo de sustancias psicoactivas”, tomado como referencia el siguiente ejemplo
de ítem de un instrumento que brinda las siguientes opciones de respuesta:

0 = Alcohol

1= Cigarrillo

2= Bazuco

3= Marihuana

4= Cocaína

5= Éxtasis

Tabla 1. Ejemplo ítem Escala Likert

Item 0 1 2 3 4 5
La primera sustancia psicoactiva que consumí fue

Fuente: elaboración propia

La tabla que se muestra a continuación presenta las respuestas dadas a este ítem por parte de
196 sujetos que fueron encuestados, mientras que la segunda tabla representa la distribución de
frecuencia de los datos.

POLITÉCNICO GRANCOLOMBIANO 5
Tabla 2. Ejemplo de acopio de datos

0 0 0 0 0 0 0 0 0 0
5 5 5 5 5 1 1 1 1 1
5 5 5 5 5 2 2 2 2 2
5 5 5 5 5 3 3 3 3 3
5 5 5 5 5 4 4 4 4 4
5 5 5 5 5 5 5 5 5 5
5 5 5 5 5 5 5 5 5 5
5 5 5 5 5 4 4 4 4 4
3 3 3 3 3 3 3 3 3 3
3 3 3 3 3 2 2 2 2 2
3 3 3 3 3 1 1 1 1 1
3 3 3 3 3 5 5 5 5 5
4 4 4 4 4 5 5 5 5 5
4 4 4 4 4 1 1 1 1 1
0 0 0 0 0 0 0 0 0 0
4 4 4 4 4 0 0 0 0 0
4 4 4 4 4 0 0 0 0 0
2 2 2 2 2 0 0 0 0 0
2 2 2 2 2 0 0 0 0 0
5 5 5 5 5 2

Fuente: elaboración propia

Tabla 3. Distribución de frecuencias

Frecuencia
Categorías Frecuencia % % Acumulado
absoluta
k ni Pi Fi
0 40 20,4% 20,4%
1 15 7,7% 28,1%
2 21 10,7% 38,8%
3 30 15,3% 54,1%
4 30 15,3% 69,4%
5 60 30,6% 100,0%
196 100,0%

Fuente: elaboración propia

POLITÉCNICO GRANCOLOMBIANO 6
Para la generación de esta tabla de frecuencia es necesario identificar algunos datos, en primer
lugar la columna “k” corresponde a las categorías encontradas en la base de datos, es decir cada
categoría evidenciada, para este ejemplo se cuenta con seis categorías correspondientes a cada uno
de las opciones de respuesta del ítem (alcohol, cigarrillo, bazuco, marihuana, cocaína y éxtasis), es
importante que los valores no se repitan en esta columna, el método tradicional consiste en identificar
manualmente el número de categorías, sin embargo en SPSS y Microsoft Excel existen fórmulas que
identifican las categorías existentes en una base de datos.

La segunda columna “ni” muestra la frecuencia absoluta de cada una de las categorías expuestas en
la columna “k”, lo que equivaldría al número de veces que se presentan los valores “k” en la base de
datos. La sumatoria de los valores “ni” debe ser igual al total de datos registrados (196). De acuerdo
con la tabla, se podría decir que de 196 sujetos encuestados hubo 40 sujetos que respondieron que el
alcohol fue la primera sustancia psicoactiva que consumieron, 15 contestaron que fue el cigarrillo, 21
consumieron bazuco, 30 sujetos consumieron marihuana, 30 cocaína y 60 éxtasis.

En relación con la tercera columna se relacionan los porcentajes de cada frecuencia o frecuencia
relativa, este valor surge a partir de la siguiente fórmula.

Pi = ni
n * 100

En donde:

Pi 0 = (40/196) *100% = 20,4%

Pi 1 = (15/196) *100% = 7,7%

Pi 2 = (21/196) *100% = 10,7%

Pi 3 = (30/196) *100% = 15,3%

Pi 4 = (30/196) *100% = 15,3%

Pi 5 = (60/196) *100% = 30,6%

POLITÉCNICO GRANCOLOMBIANO 7
De acuerdo con estos datos, se puede interpretar que:

• el 20,4% del total de la población encuestada consumió alcohol como primera sustancia psicoactiva.

• El 7,7% del total de la población encuestada consumió cigarrillo como primera sustancia psicoactiva.

• El 10,7% del total de la población encuestada consumió bazuco como primera sustancia psicoactiva.

• El 15,3% del total de la población encuestada consumió marihuana como primera


sustancia psicoactiva.

• El 15,3% del total de la población encuestada consumió cocaína como primera sustancia psicoactiva.

• El 30,6% del total de la población encuestada consumió éxtasis como primera sustancia psicoactiva.

En la cuarta columna se calculan los valores correspondientes a los porcentajes acumulados o


frecuencia relativa acumulada, mediante la fórmula que se expone a continuación, sumando el
porcentaje acumulado de cada categoría con la frecuencia relativa inmediatamente menor.

F =F + i
i i -1

En donde:

Fi 1= 20,4%

Fi 2= (20,4%) + (7,7%) = 28,1%

Fi 3= (28,1%) + (10.7%) = 38,8%

Fi 4= (38,4%) + (15,3%) = 54,1%

Fi 5= (54,1%) + (15,3%) = 69,4%

Fi 6= (69,4%) + (30,6%) = 100%

La frecuencia relativa acumulada permite identificar rangos, por ejemplo, si se toman en


consideración el tercer valor de esta casilla se podría afirmar que el 38,8% de la población encuestada
consumió alcohol, cigarrillo o bazuco.

POLITÉCNICO GRANCOLOMBIANO 8
3. Medidas de variabilidad
“Las medidas de la variabilidad indican la dispersión de los datos en la escala de medición de la variable
considerada y responden a la pregunta: ¿dónde están diseminadas las puntuaciones o los valores
obtenidos?” (Sampieri, Fernández y Baptista, 2014). Dicho de otra forma, estas medidas indican el
lugar donde se ubica los datos y las puntuaciones obtenidos en un proceso de acopio a partir de la
media aritmética. El rango, la desviación estándar y la varianza pertenecen a este grupo de medidas y
se analizarán a continuación.

3.1. Rango

El rango es la medida de dispersión que indica los valores extremos de la medición de la variable, la
fórmula para esta medida se calcula de la siguiente manera.

R = x(n) - x (1)

De donde se puede interpretar que x(n) corresponde al valor más alto de la variable y x (1) sería
el valor más bajo de la misma variable. Si se considera el siguiente conjunto de datos los valores
seleccionados para establecer el rango serían 51 y 25, por lo tanto, el rango corresponde a 26.

25 22 36 36 49 43 46 50 51

R = 51- 25

Ahora, se deben considerar el siguiente conjunto de datos en el cual se establece un rango a partir de
la fórmula planteada el cual corresponde a 6.

45 42 46 45 49 44 47 50 51

R = 51- 45

POLITÉCNICO GRANCOLOMBIANO 9
Tomando en cuenta los dos ejemplos anteriores y suponiendo que los datos corresponden a las
edades de grupos poblacionales se podría afirmar que el primer grupo tiene datos más dispersos que
el segundo, ya que la diferencia de valores entre el más alto y el más bajo es de 26 años, mientras que
los datos del segundo grupo tienen menos dispersión pues el intervalo comprendido en la edad más
alta y las más baja del grupo es solo de 6 años. Estos datos no pueden brindar información acerca de
la homogeneidad de los grupos en términos generacionales, por ejemplo.

3.2. Desviación estándar

La desviación estándar indica la dispersión de los datos de una variable respecto a la media aritmética
o promedio, esta medida se simboliza con la letra “S” si corresponde a una muestra y con la letra “σ”
(sigma minúscula) si se hace referencia a una población, la fórmula para definir la desviación estándar
es la siguiente:

para la muestra:

S= ∑Ni= 1(Xi - X) 2

N-1

Para la población:

σ= ∑Ni= 1(Xi - X) 2

Para ejemplificar el uso de la desviación estándar se propone la siguiente tabla que corresponde,
de manera hipotética, a los puntajes de tres grupos poblacionales en una prueba específica de
conocimiento en un tema X.

POLITÉCNICO GRANCOLOMBIANO 10
Tabla 4. Ejemplo de acopio de datos para desviación estándar

Puntajes Media σ
Grupo 1 15 16 17 17 18 19 17 1,3
Grupo 2 14 15 15 18 19 21 17 2,5
Grupo 3 13 14 15 17 20 23 17 3,5

Fuente: elaboración propia

Como se puede evidenciar, el promedio de puntaje de los tres grupos poblacionales es el mismo (17),
sin embargo, las puntuaciones de la desviación estándar varían significativamente, esto obedece a que
los datos de cada uno de los grupos también varían en cuanto a su dispersión respecto a la media. De
esta forma, se encuentra que el grupo con mayor dispersión de los datos es el grupo número 3 y el de
menos dispersión es el 1. Teniendo en cuenta los datos de las desviaciones de cada grupo se procede a
establecer el límite máximo y el límite mínimo de las desviaciones estándar en cada uno de los grupos,
los cuales se obtienen de la siguiente forma.

Límites máximos= σ + Media

Límites mínimos= σ – Media

Tabla 5. Límites máximos y mínimos de desviación estándar

Límites Límites
Interpretación
máximos mínimos

La mayoría de los datos de


Grupo 1 18,3 15,7 este grupo se encuentran
ubicados entre 15,7 y 18,3.

La mayoría de los datos de


Grupo 2 19,5 14,5 este grupo se encuentran
ubicados entre 14,5 y 19,5.

La mayoría de los datos de


Grupo 3 20,5 13,5 este grupo se encuentran
ubicados entre 13,5 y 20,5.

Fuente: elaboración propia

POLITÉCNICO GRANCOLOMBIANO 11
3.3. Varianza

Por otra parte, la varianza es la última medida de variabilidad y es la más utilizada en análisis de tipo
inferencial que descriptivo, motivo por el que no se ampliará en este capítulo, sin embargo, se debe
decir que corresponde a la desviación estándar elevada al cuadrado; la varianza, como su nombre lo
indica, muestra la forma en la que varían un conjunto de datos respecto a la media y se representa de
la siguiente forma.

n
1
s=
2
2
(Xi - 𝑥𝑥)
n - 1 i=1

Si se toman los dos siguientes grupos de datos: (1,2,3,4,8,6,4,8,9) y (12,12,12,12.12,12,12), para el


primer grupo la varianza es de 8,2, mientras que para el segundo la varianza es 0, esto se debe a la
forma en que cambian de los datos de cada grupo.

POLITÉCNICO GRANCOLOMBIANO 12
Referencias
Sampieri, R., Hernández, C. y Baptista, P. (2014). Metodología de la investigación. Ciudad de México,
México: SD Interamericana Editores.

POLITÉCNICO GRANCOLOMBIANO 13
INFORMACIÓN TÉCNICA

Módulo: Métodos Cuantitativos en Ciencias Sociales


Unidad 3: Análisis descriptivos y uso de herramientas
de análisis
Escenario 6: Medidas de tendencia central y distribuciones
de frecuencia

Autor: Héctor Alfredo Ramírez

Asesor Pedagógico: Alexandra Bolaños


Diseñador Gráfico: Cristofer Sánchez Sepúlveda
Asistente: Laura Delgado

Este material pertenece al Politécnico Grancolombiano.


Prohibida su reproducción total o parcial.

POLITÉCNICO GRANCOLOMBIANO 14

También podría gustarte