Está en la página 1de 20

17

Módulo
Estadística en fenómenos
naturales y procesos sociales

UNIDAD II
TRATAMIENTO DE LAS MEDIDAS
DE TENDENCIA CENTRAL
17
Módulo
Estadística en fenómenos naturales y procesos sociales

Contenido en extenso

CONTENIDO
Unidad II. TRATAMIENTO DE LAS MEDIDAS DE TENDENCIA CENTRAL 4

Presentación 4

1. Medidas de tendencia central 5

1.1 ¿Qué es la media aritmética, mediana y moda? 5

1.2 ¿Qué es un cuartil? 14

1.3 ¿Qué es una medida de dispersión? 14

1.4 ¿Qué es una medida de correlación? 18

2. Análisis de la información y toma de decisiones 19

2.1 ¿Qué información nos brindan las medidas de tendencia central? 19

2.2 ¿Cuándo se puede considerar que todas dan la misma información? 19

2.3 ¿En cualquier fenómeno tienen significado? 19

Cierre 20

Referencias por unidad 20

2
17
Módulo
Estadística en fenómenos naturales y procesos sociales

Contenido en extenso

Guía de navegación
En este documento encontrarás gran cantidad de información, lo cual demanda generar estrategias de
aprendizaje para analizarla y que te apropies de los conocimientos, haciéndolos útiles para tu entorno. Por ello,
te proporcionamos la siguiente guía de navegación para darle un mejor uso al contenido, describiendo los íconos
que te permitirán relacionar cada uno de estos elementos.

Con este ícono identificarás algún Tip de aprendizaje, es decir,


sugerencias de cómo poder reforzar tus conocimientos, a partir de
algunas actividades propuestas.

Éste es el ícono del recuadro ¿Sabías qué? que, mediante datos


curiosos, te permitirá conocer información adicional sobre el contenido
revisado.

Mediante este símbolo encontrarás Vocabulario, que puede contener


desde palabras nuevas y definiciones, hasta datos biográficos de
personajes importantes para sobre el contenido.

Cuando veas el ícono Acerca de, será momento de profundizar sobre


el contenido de tu lectura.

Para cuando quieres conocer más información sobre el contenido


que estés leyendo, en recursos de internet, donde se aborda más a
profundidad lo revisado, encontrarás este símbolo Para saber más.

Con este ícono identificarás la información de Mi mundo y yo,


dónde encontrarás algunos ejemplos contextualizados, reflexiones o
preguntas detonadoras sobre el contenido que estás revisando.

3
17
Módulo
Estadística en fenómenos naturales y procesos sociales

Contenido en extenso

UNIDAD II. TRATAMIENTO DE LAS MEDIDAS DE TENDENCIA CENTRAL


Presentación

En esta unidad revisarás todo lo relacionado a las medidas de tendencia central y sus implicaciones en distintos
ámbitos y, a partir de ello, desarrollarás las competencias necesarias que plantea el perfil de egreso en la
Educación Media Superior, es decir, para que logres aplicar de manera efectiva tus conocimientos, habilidades
y actiztudes en situaciones o problemas concretos.

Propósito formativo

Analizar medidas de tendencia central para ordenar, interpretar y explicar la información obtenida a partir de
fenómenos naturales y procesos sociales, con el fin de predecir y entender estos hechos en su contexto y de
orientar la toma de decisiones en el ámbito individual, así como de incidir en su comunidad.

Aprendizajes esperados

• Interpreta tablas y gráficas que representen la información de los hechos o fenómenos naturales y procesos
sociales vinculados dentro de su contexto.
• Utiliza las tecnologías de la información y la comunicación (TIC) para obtener información y procesarla a
través de una hoja de cálculo.
• Emite y fundamenta por escrito una opinión original basada en las aplicaciones de las medidas de tendencia central.
• Examina las limitaciones, veracidad y aportaciones de distintas fuentes de información en la red para la
realización del análisis sobre procesos sociales o fenómenos naturales.
• Discrimina información de fuentes actuales para la realización de análisis documentales.

Punto de partida

Te has detenido a preguntarte…

¿Cuáles son las medidas de tendencia central?

¿Cómo obtenemos dichas medidas?

¿Para qué nos sirve conocer estas medidas?

¿Siempre son útiles o hay otras que nos ayudan


para un correcto análisis de los datos?

En esta unidad podrás ir respondiendo


estas preguntas, ¡Adelante!

4
17
Módulo
Estadística en fenómenos naturales y procesos sociales

Contenido en extenso

Las medidas estadísticas que revisarás en esta unidad son las siguientes:

Medidas
Media
de magnitud

Mediana
Medidas
de posición
Cuartiles
De tendencia
central
Medidas Moda
de frecuencia

Medidas
estadísticas
Rangos Rango

De dispersión Rango
intercuartílico

Desvaciones Desviación
estándar

Varianza

1. Medidas de tendencia central

Ya que sabemos el significado de las medidas de tendencia central y su uso general en la vida cotidiana, ahora
profundizaremos cada una y veremos cómo calcularlas.

1.1. ¿Qué es la media aritmética, mediana y moda?


Media aritmética. La más común de estas medidas es La media aritmética es el promedio
la media aritmética o promedio, que es la más usada que resulta de sumar el valor de
en la vida diaria; por ejemplo, si quisiéramos calcular el todos los datos y dividirlo entre el
promedio de la edad de todos los estudiantes de tu grupo. número de datos.

Si se tiene un conjunto de datos x1,x2,…xn, la media aritmética será:

5
17
Módulo
Estadística en fenómenos naturales y procesos sociales

Contenido en extenso

Para ilustrar el cálculo de la media, consideraremos el siguiente ejemplo.

Nuestro grupo está conformado por estudiantes con diferentes edades, sin embargo, algunos coinciden en tener
la misma edad.

Frecuencia
Valor
(núm. de estudiantes
(edad)
con la misma edad)
25 16
22 13
31 7
38 5

Como podemos observar, no sólo tenemos 4 datos, sino que en realidad son 41, es decir, que en total tenemos
41 estudiantes en nuestro grupo. Para poder calcular la media necesitamos completar la tabla con las cantidades
que cada valor aportará a la suma para obtener la media; por lo que agregaremos una columna, a la que
llamaremos Valor ×Frecuencia. De esta manera será más sencillo calcular la suma de todos los datos.

Frecuencia
Valor
(núm. de estudiantes Valor x Frecuencia
(edad)
con la misma edad)
25 16 400
22 13 286
31 7 217
38 5 190
SUMA 41 1093

Por tanto, la suma total de los 41 datos es 1093. Para obtener la media lo hacemos de la siguiente manera:

Las operaciones anteriores pueden hacerse fácilmente


en una tabla de Excel. Esta herramienta permite
multiplicar y sumar los valores de las entradas de una Para saber más…
tabla, una a una. Además, si en una tabla de Excel,
se tiene la lista con todos los valores, y cada valor en Para saber más del uso básico de Excel, consulta
una celda, resulta sencillo calcular la media es con el el siguiente enlace: http://articulos.softonic.com/10-
comando: =PROMEDIO(). Los paréntesis indican que formulas-excel-nuy-utiles
ahí se enlistan las celdas con los valores que deseas
promediar.

¿Sabías qué?
Si se sustituye cada valor de los datos por la media
y se hace la suma se obtiene el mismo resultado que
si sumáramos todos los datos.

6
17
Módulo
Estadística en fenómenos naturales y procesos sociales

Contenido en extenso

Por ejemplo, si los datos están en la columna A, en las filas 4 a la 10, entonces el comando es =PROMEDIO(A4:A10),
o simplemente se anotan dentro del paréntesis todos los valores que se quieren promediar separados por comas.

Si los datos ya están, también es posible determinar una media aritmética, esto es, en la consideración de las
marcas de clase y las frecuencias absolutas o relativas de cada clase. La fórmula para la media aritmética de
datos agrupados es:

Recordando que mi es la marca de la clase i, la cual es el punto medio entre los límites superior e inferior de la
clase, fi es la frecuencia de la clase y fri es la frecuencia relativa.

Media geométrica. La media geométrica de un conjunto de datos es el resultado de multiplicarlos entre sí y


aplicar la n misma raíz. Si en la media aritmética sumábamos los valores para luego dividirlos, ahora debemos
multiplicarlos para aplicar la n-ésima raíz que corresponda.

Entonces, la media geométrica para n datos no negativos x1,x2,…,xn (esto es importante porque será necesario
obtener una raíz n-ésima, que no es posible de momento para números negativos) se obtiene mediante:

¿Dónde podemos emplear la media geométrica? Por ejemplo, si tenemos una caja que mide 4 cm de ancho, 6
cm de largo y 9 cm de alto: ¿qué dimensiones debe tener un cubo con el mismo volumen? La solución, dado que
el volumen es el producto de las tres cantidades, es la media geométrica, en este caso . En
la herramienta Excel es posible calcular esta media geométrica mediante el comando =MEDIA.GEOM(4,6,9).

Media armónica. Ésta se calcula dividiendo el número de observaciones por la suma total del inverso por cada
valor, es decir, si se tienen x1,x2,…,xn datos, el valor de la media armónica sería:

Un ejemplo de su uso es cuando recorremos la misma distancia varias veces, la media armónica de las distintas
velocidades con que realizamos cada recorrido, nos da la velocidad promedio global, es decir, si un amigo nos
quiere venir a visitar a nuestra casa, tiene que hacer un recorrido de su casa a la nuestra. De ida su velocidad es
de 20 km/h y de regreso es de 30 km/h: ¿cuál fue su velocidad promedio?

Para determinar la velocidad promedio podemos pensar en hacer el promedio directo de las dos velocidades, lo
que nos daría:

7
17
Módulo
Estadística en fenómenos naturales y procesos sociales

Contenido en extenso

Para desarrollar el problema con este resultado, supondremos que la distancia entre las dos casas es de 6 km,
entonces el tiempo que le tomó realizar el recorrido es de:

= 0.3 h = 18 minutos de ida = 0.2 h = 12 minutos de vuelta

Por lo tanto, recorrió una distancia de 12 km en un tiempo de 0.5 horas. De esta manera, su velocidad promedio fue:

El resultado no lo obtuvimos únicamente con promediar las velocidades, pero es posible llegar a él por medio de
la media armónica de las velocidades:

Para su cálculo en una hoja de Excel podemos usar la función =MEDIA.ARMO().

Mediana. En la mediana no cuenta el valor de cada


uno de los datos, sólo se considera el valor de un
dato y éste es el que divide al conjunto de datos en
dos mitades iguales. En caso de que se tenga una ¿Sabías qué?
cantidad par de datos, la mediana se construye como El uso de la mediana en lugar de la media
el promedio de los dos datos que se encuentran en el puede ser conveniente cuando existen valores
centro, por ejemplo, la mediana de una colección de 2n extremos en un conjunto de datos.
datos es el número .

Para poder encontrar la mediana de un conjunto de datos es necesario primero ordenarlos de manera creciente.

En una hoja de cálculo puede usarse la función =MEDIANA( ), seleccionando los datos a los cuales se les quiere
obtener la mediana.

Moda. Es simplemente el dato que más se repite, en otras palabras, es el de mayor frecuencia. Si más de un
dato se repite con la misma frecuencia (mayor), todos son la moda; pero si todos son distintos, no hay moda.

También para este caso los datos no necesitan ser números, pues sólo basta con que haya mayor frecuencia.

Puede determinarse en una hoja de cálculo mediante la función =MODA( ).

Rango medio. Es el promedio del valor mayor y el valor menor, o bien, es la mitad del camino entre el dato de
menor valor y el dato de mayor valor.

La fórmula es:

8
17
Módulo
Estadística en fenómenos naturales y procesos sociales

Contenido en extenso

Donde L representa el valor más bajo y H representa el valor más alto del conjunto de datos.

Por ejemplo, para el conjunto de datos {2,5,4,4,7,8}

¡Excelente, ahora ya conocemos las medidas de tendencia central!

Si aún tienes duda de cómo obtener alguna de las medidas de tendencia central, con la siguiente tabla de
distribución de frecuencias, practicarás la obtención de la media, la mediana, la moda y el rango medio.

Valor Frecuencia
25 18
31 8
42 6
59 4
94 3
Para obtener la media es necesario agregar la columna Valor x frecuencia y la fila de las sumas.

Valor Frecuencia Valor x Frecuencia


25 18 450
31 8 248
42 6 252
59 4 236
94 3 282
SUMA 39 1468

Entonces la media aritmética está dada por:

Para obtener la mediana:

Ya que tenemos 39 datos, el que se encuentra en el medio debe ser el dato 20, porque tiene 19 datos menores
o iguales que él y 19 mayores o iguales que él. De acuerdo con la tabla, los primeros 18 datos son 25, así que el
que se encuentra en el lugar 20 es 31.

Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Dato 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 31 31

Posición 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39
Dato 31 31 31 31 31 31 42 42 42 42 42 42 59 59 59 59 94 94 94

9
17
Módulo
Estadística en fenómenos naturales y procesos sociales

Contenido en extenso

Entonces, la mediana es igual a 31.

Para el caso de la moda es fácil de determinar, viendo la tabla donde el dato con mayor frecuencia es 25.

Y, por último, el rango medio es el promedio entre el dato menor 25 y el mayor 94:

Hasta aquí hemos calculado las medidas, en caso de


que los datos no sean agrupados, pero ¿qué sucede En Excel puedes generar datos
si tenemos muchos datos muy diferentes? También es aleatoriamente con ayuda de la
posible aproximar estos valores a partir de la tabla de fórmula =ALEATORI.ENTRE(,)
frecuencias agrupadas.

Consideraremos los datos de la siguiente tabla:

0 6 4 42 37 10 46 1
39 14 24 0 15 15 12 23
48 18 9 26 17 42 31 0
25 14 41 0 4 40 46 39
1 6 0 8 34 23 23 31
14 43 29 28 1 24 36 42
22 32 11 25 50 15 3 34
46 18 6 16 24 40 35 38
48 4 39 31 0 41 40 14
26 29 3 16 17 48 1 36

Primero, tenemos que elaborar la tabla de datos agrupados. Los valores usados los calculamos también con
ayuda de Excel, de tal manera que los valores necesarios nos quedan así:

Número Amplitud
Núm. Máximo Mínimo Rango
de clases de clase
80 50 0 50 7 7

Es importante señalar, que el rango al que se refiere la tabla no es el rango medio, sino una medida de dispersión
denominada rango, y que se calcula al restar el dato mayor con el menor de un conjunto de datos.

10
17
Módulo
Estadística en fenómenos naturales y procesos sociales

Contenido en extenso

La tabla de frecuencias de datos agrupados queda de la siguiente forma:

Clase Límites de clase Marca de clase Frecuencia


Núm.. Li Ls mi fi
1 0 7 3.5 18
2 8 15 11.5 12
3 16 23 19.5 10
4 24 31 27.5 13
5 32 39 35.5 11
6 40 47 43.5 12
7 48 55 51.5 4

Para determinar la media podemos considerar la marca de la clase y la frecuencia de la clase. Con este paso,
asumimos que la marca de la clase sustituye las apariciones de todos los elementos de la clase. De esta manera
construimos la tabla con los productos de la marca de la clase multiplicada por la frecuencia absoluta de la clase:

Marca x
Clase Límites de clase Marca de clase Frecuencia
frecuencia
Núm.. Li Ls mi fi mi×fi
1 0 7 3.5 18 63
2 8 15 11.5 12 138
3 16 23 19.5 10 195
4 24 31 27.5 13 357.5
5 32 39 35.5 11 390.5
6 40 47 43.5 12 522
7 48 55 51.5 4 206

De aquí que la aproximación de la media puede obtenerse como:

Este valor se aproxima al promedio de todos los datos que tenemos, ya que la media exacta es 22.9875, la cual
está bastante cerca del resultado de la media. También es necesario considerar que mientras tengamos más
datos es posible que el resultado mejore aún más.

11
17
Módulo
Estadística en fenómenos naturales y procesos sociales

Contenido en extenso

Para obtener la mediana agregamos la columna con la frecuencia acumulada y hacemos la operación del número
de datos entre dos. En este caso, como son 80 datos, la mediana debe estar entre las posiciones 40 y 41, por lo
que debe buscarse esas posiciones y promediar las marcas de clase correspondientes:

Clase
Marca x Frecuencia
Límites de clase Marca de clase Frecuencia
Frecuencia acumulada
No.

1 0 7 3.5 18 63 18

2 8 15 11.5 12 138 30

3 16 23 19.5 10 195 40

4 24 31 27.5 13 357.5 53

5 32 39 35.5 11 390.5 64

6 40 47 43.5 12 522 76

7 48 55 51.5 4 206 80

La posición 40 está en la clase 3 y la posición 41 en la clase 4, por lo que tenemos que promediar las marcas de
esas clases. Entonces, la mediana es 19.5+27.5
2
=23.5. Con ayuda de Excel también es posible hallar la media

exacta, la cual para este caso coincide con la estimación que hicimos.

De la misma manera, la moda la obtenemos con la marca de la clase que tiene la mayor frecuencia, es decir 3.5.
Para los datos completos, la moda es: 0, ya que es el dato que más se repite.

Para el rango medio tomamos en cuenta las marcas de clase máxima y la mínima: 3.5+51.5
2
=27.5. El resultado es
más grande que el rango mínimo exacto porque la última clase sobrepasa al dato mayor.

Como pudimos observar, las aproximaciones que obtenemos a partir de las tablas de datos agrupados son de
mucha utilidad cuando tenemos una gran cantidad de datos.

Tip de aprendizaje

Para reforzar el contenido abordado, responde las siguientes preguntas:

• Si quisiéramos saber la calificación grupal que obtuvieron todos los


estudiantes de la clase de matemáticas ¿Cuál medida te ayudaría a
obtener el resultado, la mediana o la media? ¿Por qué?
• ¿Cuál de las tres medidas de tendencia central (media, mediana y
moda) es la que más utilizas en tu vida cotidiana?

¡Fue sencillo, verdad!

12
17
Módulo
Estadística en fenómenos naturales y procesos sociales

Contenido en extenso

¿Sabías qué?

Las medidas de tendencia central dan información de los valores que pueden
pensarse puntos medios en diferentes sentidos, por tanto, es importante saber
si éstos coinciden, o su cercanía o variación. A este análisis se le conoce
como sesgo y relaciona la media, la mediana y la moda.

Forma de la distribución de datos.

Como se mencionó en la unidad 1, existen distintos tipos de distribución, y en este apartado se describe
brevemente las posibles formas que pueden tener.

De entrada, tenemos que identificar que las distribuciones pueden tener sesgo generado por la recopilación
de los datos y el cual describe la distribución de los datos, al indicar hacia dónde tienden a concentrarse. La
construcción de una gráfica facilita esta apreciación al mostrar los resultados de manera visual. De esta manera,
una distribución puede ser:

• Simétrica. Si la mayor concentración de datos se localiza en el centro de la distribución, es decir, el valor


de la media aritmética, la mediana y la moda coinciden.

• Asimetría positiva (sesgada a la derecha). Si la mayor concentración de datos está a la izquierda


de la distribución.

• Asimetría negativa (sesgada a la izquierda). Si la mayoría de los datos están concentrados a la derecha.

Recuerda que al mencionar que los datos


se encuentran a la izquierda o derecha de
la distribución, nos referimos a la media.

El comportamiento de las medidas de tendencia central es, a grandes rasgos, como observamos en la figura:

Asimetría negativa Simétrica Asimetría positiva


(sesgada a la izquierda) (sesgada a la derecha)

Media Moda Media Moda Media


Mediana Mediana Mediana
Moda

13
17
Módulo
Estadística en fenómenos naturales y procesos sociales

Contenido en extenso

1.2. ¿Qué es un cuartil?

Los cuartiles son valores que dividen una muestra de datos en cuatro partes iguales, se representan mediante el
símbolo Q. Los cuartiles sirven para evaluar rápidamente la dispersión y la tendencia central de un conjunto de
datos, que son los pasos iniciales importantes para comprender sus datos.

Cuartil Descripción

1er cuartil (Q1) De los datos 25% es menor que o igual a este valor.

2do cuartil (Q2) Es la mediana. De los datos 50% es menor que o igual a este valor.

3er cuartil (Q3) De los datos 75% es menor que o igual a este valor.

Es la distancia entre el primer cuartil y el tercer cuartil (Q1-Q3); de


Rango intercuartil
esta manera, abarca 50% central de los datos.

Por ejemplo, supongamos que tenemos los siguientes datos: 7, 9, 16, 36, 39, 45, 45, 46, 48, 51o.

Entonces, los valores de nuestros cuartiles serán:


• Q1 = 14.25
• Q2 (mediana) = 42
• Q3 = 46.50
• Rango Intercuartil = 14.25 a 46.50 o 32.25

1.3. ¿Qué es una medida de dispersión?

En el caso de las variables con valores que pueden definirse en términos de alguna escala de medida de
igual intervalo, puede usarse un tipo de indicador que permite apreciar el grado de dispersión o variabilidad
existente en el grupo de variantes en estudio. A estos indicadores les llamamos medidas de dispersión,
por cuanto que están referidos a la variabilidad que exhiben los valores de las observaciones, ya que, si no
hubiese variabilidad o dispersión en los datos interés, entonces no habría necesidad de la gran mayoría de las
medidas de la estadística descriptiva, porque no podríamos saber las diferencias que existen entre los distintos
conjuntos de valores.

Recordemos que las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor
representativo, por el contrario, las medidas de dispersión nos dicen hasta qué punto estas medidas de
tendencia central son representativas como síntesis de la información. Distinguimos entre medidas de medidas
de dispersión, que no son comparables entre diferentes muestras y las relativas que nos permitirán comparar
varias muestras.

¿Sabías qué?

Las medidas de dispersión cuantifican la separación, la dispersión,


la variabilidad de los valores de la distribución respecto al valor central.

14
17
Módulo
Estadística en fenómenos naturales y procesos sociales

Contenido en extenso

¿Por qué es importante conocer la dispersión?

Nos proporciona información adicional que permite juzgar la confiabilidad de la medida de tendencia central.
Como vimos anteriormente, si los datos se encuentran ampliamente dispersos, la posición central es menos
representativa de los datos. Ya que existen problemas característicos para datos ampliamente dispersos, por lo
que, debemos ser capaces de distinguir que presentan esa dispersión antes de abordar esos problemas.

Quizá se desee comparar las dispersiones de diferentes muestras. Si no se desea tener una amplia dispersión de
valores con respecto al centro de distribución o esto presenta riesgos inaceptables, necesitamos tener habilidad
de reconocerlo y evitar escoger distribuciones que tengan las dispersiones más grandes.

Pero si hay dispersión en la mayoría de los datos, debemos estar en capacidad de describirla. Ya que la
dispersión ocurre frecuentemente y su grado de variabilidad es importante, ¿cómo medimos la variabilidad
de una distribución empírica? Vamos a considerar sólo algunas medidas de dispersión absolutas: el rango, la
varianza, la desviación estándar y el coeficiente de variación.

La primera de estas medidas es el rango, ¿lo recuerdas?, en la construcción de la tabla de frecuencias


acumuladas vimos cómo obtenerlo, ¡exacto!, es la diferencia entre el dato mayor y el dato menor. Sin embargo,
este resultado puede no representar el comportamiento real si existe uno o varios datos que varían mucho del
resto. Estos son llamados datos aberrantes o atípicos.

¡Es importante no confundir el rango con el rango intercuartil!

Recordemos que el rango intercuartil mide la distancia entre el valor del cuartil 3 y del cuartil 1, por lo que, no
considera la dispersión de todos los datos del conjunto, sino únicamente la que existe entre los valores de Q3 y
Q1, de esta manera evita el sesgo de los valores extremos.

En el rango se considera la distancia que existe entre el dato


mayor y el menor, debido a esto su desventaja es que es muy
sensible a la existencia de valores extremos.

La Varianza es el promedio del cuadrado de las distancias de todos los datos a la media, es decir, si tenemos
los datos x1,x2,…,xn la varianza es:

La desviación estándar suele ser la más utilizada de las medidas de dispersión. Esta medida de dispersión permite
observar qué tan centrados están los datos, con ello podemos saber si la media es una buena representación
de los datos. Si la desviación estándar es pequeña, la mayoría de los datos están cerca del promedio; y si es
grande, entonces están más repartidos o dispersos. Se define como la raíz cuadrada de la varianza:

En una hoja de Excel es posible calcular la varianza y la desviación estándar


haciendo uso de las funciones =VAR.P() y =DESVEST.P() respectivamente.

15
17
Módulo
Estadística en fenómenos naturales y procesos sociales

Contenido en extenso

¡Ya conoces las medidas de dispersión! Ahora realizaremos un ejercicio para ver cómo obtenerlas.

De acuerdo con los datos del Instituto Nacional de Estadística y Geografía (Inegi) en 20151, la esperanza de vida
al nacer en años de edad de cada estado de la República Mexicana es:

Entidad federativa Edad Entidad federativa Edad Entidad federativa Edad

Aguascalientes 75.9 Guerrero 72.9 Quintana Roo 75.6

Baja California 74 Hidalgo 74.4 San Luis Potosí 74.7

Baja California Sur 76 Jalisco 75.5 Sinaloa 75.5

Campeche 75.2 México 75.2 Sonora 75.3

Coahuila de Michoacán de
75.7 74.7 Tabasco 74.8
Zaragoza Ocampo

Colima 75.9 Morelos 75.7 Tamaulipas 75.8

Chiapas 72.8 Nayarit 75.1 Tlaxcala 75.2

Veracruz de
Chihuahua 72.9 Nuevo León 76.4 74.1
Ignacio de la Llave

Distrito Federal 76.1 Oaxaca 73 Yucatán 75.5

Durango 75.6 Puebla 74.8 Zacatecas 75.3

Promedio
Guanajuato 75.5 Querétaro 75.4 75
nacional

1
Fuente: https://www.inegi.org.mx/app/indicadores/?ind=6204482233

16
17
Módulo
Estadística en fenómenos naturales y procesos sociales

Contenido en extenso

Ahora calcularemos la varianza y la desviación estándar para saber qué tan lejos están los datos en general
de la media.

Entidad federativa Edad Xi – X


Aguascalientes 75.9 0.7821
Baja California 74 1.0315
Baja California Sur 76 0.9690
Campeche 75.2 0.0340
Coahuila de Zaragoza 75.7 0.4684
Colima 75.9 0.7821
Chiapas 72.8 4.9090
Chihuahua 72.9 4.4759
Distrito Federal 76.1 1.1759
Durango 75.6 0.3415
Guanajuato 75.5 0.2346
Guerrero 72.9 4.4759
Hidalgo 74.4 0.3790
Jalisco 75.5 0.2346
México 75.2 0.0340
Michoacán de Ocampo 74.7 0.0996
Morelos 75.7 0.4684
Nayarit 75.1 0.0071
Nuevo León 76.4 1.9165
Oaxaca 73 4.0627
Puebla 74.8 0.0465
Querétaro 75.4 0.1477
Quintana Roo 75.6 0.3415
San Luis Potosí 74.7 0.0996
Sinaloa 75.5 0.2346
Sonora 75.3 0.0809
Tabasco 74.8 0.0465
Tamaulipas 75.8 0.6152
Tlaxcala 75.2 0.0340
Veracruz de Ignacio de la Llave 74.1 0.8384
Yucatán 75.5 0.2346
Zacatecas 75.3 0.0809
Suma 29.6822

17
17
Módulo
Estadística en fenómenos naturales y procesos sociales

Contenido en extenso

De esta manera, la varianza de los datos es:

Y la desviación estándar es:

Esto nos dice que los datos están cerca de la media, pero también que hay variaciones considerables en algunos
de los estados. Como podemos observar en la tercera columna de la tabla anterior, hay pocas variaciones en el
dato con respecto a su media, y sólo es notoria en algunos estados, por ejemplo, Chiapas, Oaxaca, Guerrero, etc.

Tip de aprendizaje

Para reforzar el contenido abordado, te sugerimos obtener la desviación estándar y la varianza a


partir de datos recabado del INEGI sobre natalidad o mortalidad de cada estado de la República
Mexicana, posteriormente compara tus resultados elaborando una hoja de Excel con esos datos
y calcula las medidas con las fórmulas =VAR.P() y =DESVEST.P() respectivamente.

1.4. ¿Qué es una medida de correlación?

El principal propósito de la correlación es medir la fuerza de la relación lineal entre dos variables, generalmente
denotadas con x y y (variable independiente y dependiente) como se vio en la unidad 1. Para conocer la relación
entre estas variables, recurrimos a la correlación.

Si, conforme x aumenta, no hay un desplazamiento definido en los valores de y, se dice que no hay correlación, o
no hay relación entre x e y. Si, conforme x aumenta, hay un desplazamiento en los valores de y, entonces existe
una correlación. La correlación es positiva cuando y tiende a aumentar, y negativa cuando y tiende a disminuir. Si
los pares ordenados (x,y) tienden a seguir un trayectoria en línea recta, existe una correlación lineal.

Los siguientes diagramas muestran estas ideas:

1. No hay correlación 2. Correlación lineal positiva 3. Correlación lineal positiva alta

4. Correlación lineal negativa 5. Correlación lineal negativa alta 6. No hay correlación lineal

18
17
Módulo
Estadística en fenómenos naturales y procesos sociales

Contenido en extenso

2. Análisis de la información y toma de decisiones

2.1. ¿Qué información nos brindan las medidas de tendencia central?

Supongamos que un determinado estudiante obtiene 35 puntos en una prueba de matemáticas. Este puntaje,
por sí mismo tiene muy poco significado a menos que podamos conocer el total de puntos que obtiene una
persona promedio al participar en esa prueba, saber cuál es la calificación menor y mayor que se obtiene, y cuán
variadas son esas calificaciones.

En otras palabras, para que una calificación tenga significado hay que contar con elementos de referencia
generalmente relacionados con ciertos criterios estadísticos.

Como ya vimos, las medidas de tendencia central más comunes son: media aritmética, mediana y moda.

De estas tres medidas de tendencia central, la media es reconocida como la mejor y más útil. Sin embargo,
recordemos que cuando en una distribución se presentan casos cuyos puntajes son muy bajos o muy altos
respecto al resto del grupo, es recomendable utilizar la mediana o la moda, porque dadas las características de
la media, esta es afectada por los valores extremos.

La media es considerada como la mejor medida de tendencia central, por las siguientes razones:

• Los puntajes contribuyen de manera proporcional al hacer el cómputo de la media.


• Es la medida de tendencia central más conocida y utilizada.
• Las medias de dos o más distribuciones pueden ser fácilmente promediadas mientras que las medianas
y las modas de las distribuciones no se promedian.
• La media se utiliza en procesos y técnicas estadísticas más complejas mientras que la mediana y la moda
en muy pocos casos.

2.2. ¿Qué información nos brindan las medidas de tendencia central?

Existen tres medidas comunes para identificar el centro de un conjunto de datos: la media, mediana y moda.
En cada caso, se ubican alrededor del punto en donde se aglomeran los datos, y para saber si estas medidas
nos dan la misma información o si coinciden, es mediante el sesgo, recordemos que este nos indica hacia dónde
tienden a concentrarse los datos, por lo que, de esta manera podríamos saber si la distribución es simétrica, es
decir, si la mayor concentración de datos se localiza en el centro de la distribución.

2.3. ¿En cualquier fenómeno tienen significado?

En los medios de comunicación, especialmente en Internet, es muy común que nos hayamos encontrado
con noticias que afirman que se ha comprobado científicamente algún resultado. Pero, seguramente te has
preguntado ¿a qué se refieren con decir “científicamente comprobado”? Lo común es que en algún lugar se
haya hecho un estudio en el que rara vez se dan detalles al respecto. Sin embargo, más importante que eso es
poder determinar un juicio propio sobre si el estudio referido puede tener algún sentido. En general, se trata de
análisis estadísticos, pero con hipótesis y afirmaciones que no tienen mucha relación entre ellas y que son en su
estructura falacias.

19
17
Módulo
Estadística en fenómenos naturales y procesos sociales

Contenido en extenso

Un ejemplo muy burdo sería si cargáramos una piedra todo el día durante una semana. Si en esta semana
ningún tigre nos ataca, entonces significa que ¡nuestra piedra funciona como un excelente repelente de tigres,
con una efectividad de 100%! ¿En verdad lo crees así? Como podemos ver, las afirmaciones ni siquiera se
relacionan de manera clara. Muchas estadísticas falsas en Internet se basan es supuestos como estos. Veremos
un ejemplo más, hace poco tiempo se difundió una noticia en la que supuestamente en cierto día se pronosticaba
un enorme terremoto en México debido a que los datos estadísticos de estos fenómenos en Japón y Perú así lo
decían. Esta información preocupó a mucha gente. Sin embargo, era totalmente falsa, como después personal
del Sismológico Nacional advirtió. Sin importar los datos estadísticos de la posición e intensidad de los sismos
previos, éstos no estaban relacionados con las fuentes de sismos en México y, aún más, a la fecha estos
fenómenos aún no se pueden predecir.

Cierre

¿Logras ver como todas estas medidas nos ayudan?

En esta unidad nos percatamos de que cuando se habla de método, se refiere a la forma ordenada y sistemática.
Cuando se hacen las cosas, tales como reflexiones, experiencias, incluso deportes o cualquier otra, de manera
rigurosa, entonces es posible alcanzar los objetivos que se proponen, aunque nunca habrá garantía absoluta de
lograrlo. Por ello, aun cuando hay diferentes formas de llegar al conocimiento, no todas las rutas resultan exitosas.

Con el estudio de este método de conocimiento y reflexión podemos saber el estado en que se encuentran las
cosas, así como tomar decisiones y realizar acciones de mejora tanto del ambiente que nos rodea como de
fenómenos sociales, políticos y económicos que nos competen.

Además, revisamos el razonamiento riguroso, con métodos de análisis y técnicas adecuadas, que también ofrecen
la posibilidad de tener una visión de aproximación al futuro, tema que retomaremos en la siguiente unidad.

Finalmente nos percatamos que, por el comportamiento de los eventos, se puede hacer un cálculo de probabilidad
y de aproximación, nunca con una visión infalible, de lo que podría pasar en el siguiente acontecimiento.

Referencias por unidad

• Batanero, Carmen, Razonamiento probabilístico en la vida cotidiana: Un desafío educativo. Universidad


de Granada, España, 2006, https://www.ugr.es/~batanero/pages/ARTICULOS/ConferenciaThales2006.
pdf (consultado el 19 de julio de 2019).
• Carrasco, Salvador, Aproximación a la Estadística desde las Ciencias Sociales, Universidad de Valencia,
2016, https://studylib.es/doc/5789468/aproximaci%C3%B3n-a-la-estad%C3%ADstica-desde-las-ciencias-
sociales (consultado el 19 de julio de 2019).
• Godino, Juan D., Matemáticas y su Didáctica para maestros. Manual para el estudiante, 2002, https://www.
ugr.es/~jgodino/edumat-maestros/manual/6_Estocastica.pdf (consultado el 19 de julio de 2019).
• Hernández, R. et al., Metodología de la investigación, México, Mc Graw Hill, 2014.
• Jhonson, R. y Kuby, P., Estadística Elemental, 11ª. ed., México, CENGAGE Learning, 2012.
• Wackerly, D. D., Mendenhall III, W. y Scheaffer, R. L., Estadística matemática con aplicaciones, 7 ª ed.,
México, CENGAGE Learning, 2010.

20

También podría gustarte