Documentos de Académico
Documentos de Profesional
Documentos de Cultura
M17 U2 Contenido en Extenso PDF
M17 U2 Contenido en Extenso PDF
17
Estadística en fenómenos
naturales y procesos sociales
UNIDAD II
TRATAMIENTO DE LAS MEDIDAS
DE TENDENCIA CENTRAL
17
Módulo
Estadística en fenómenos naturales y procesos sociales
Contenido en extenso
CONTENIDO
Unidad II. TRATAMIENTO DE LAS MEDIDAS DE TENDENCIA CENTRAL 4
Presentación 4
Cierre 20
2
17
Módulo
Estadística en fenómenos naturales y procesos sociales
Contenido en extenso
Guía de navegación
En este documento encontrarás gran cantidad de información, lo cual demanda generar estrategias de
aprendizaje para analizarla y que te apropies de los conocimientos, haciéndolos útiles para tu entorno. Por ello,
te proporcionamos la siguiente guía de navegación para darle un mejor uso al contenido, describiendo los íconos
que te permitirán relacionar cada uno de estos elementos.
3
17
Módulo
Estadística en fenómenos naturales y procesos sociales
Contenido en extenso
En esta unidad revisarás todo lo relacionado a las medidas de tendencia central y sus implicaciones en distintos
ámbitos y, a partir de ello, desarrollarás las competencias necesarias que plantea el perfil de egreso en la
Educación Media Superior, es decir, para que logres aplicar de manera efectiva tus conocimientos, habilidades
y actiztudes en situaciones o problemas concretos.
Propósito formativo
Analizar medidas de tendencia central para ordenar, interpretar y explicar la información obtenida a partir de
fenómenos naturales y procesos sociales, con el fin de predecir y entender estos hechos en su contexto y de
orientar la toma de decisiones en el ámbito individual, así como de incidir en su comunidad.
Aprendizajes esperados
• Interpreta tablas y gráficas que representen la información de los hechos o fenómenos naturales y procesos
sociales vinculados dentro de su contexto.
• Utiliza las tecnologías de la información y la comunicación (TIC) para obtener información y procesarla a
través de una hoja de cálculo.
• Emite y fundamenta por escrito una opinión original basada en las aplicaciones de las medidas de tendencia central.
• Examina las limitaciones, veracidad y aportaciones de distintas fuentes de información en la red para la
realización del análisis sobre procesos sociales o fenómenos naturales.
• Discrimina información de fuentes actuales para la realización de análisis documentales.
Punto de partida
4
17
Módulo
Estadística en fenómenos naturales y procesos sociales
Contenido en extenso
Las medidas estadísticas que revisarás en esta unidad son las siguientes:
Medidas
Media
de magnitud
Mediana
Medidas
de posición
Cuartiles
De tendencia
central
Medidas Moda
de frecuencia
Medidas
estadísticas
Rangos Rango
De dispersión Rango
intercuartílico
Desvaciones Desviación
estándar
Varianza
Ya que sabemos el significado de las medidas de tendencia central y su uso general en la vida cotidiana, ahora
profundizaremos cada una y veremos cómo calcularlas.
5
17
Módulo
Estadística en fenómenos naturales y procesos sociales
Contenido en extenso
Nuestro grupo está conformado por estudiantes con diferentes edades, sin embargo, algunos coinciden en tener
la misma edad.
Frecuencia
Valor
(núm. de estudiantes
(edad)
con la misma edad)
25 16
22 13
31 7
38 5
Como podemos observar, no sólo tenemos 4 datos, sino que en realidad son 41, es decir, que en total tenemos
41 estudiantes en nuestro grupo. Para poder calcular la media necesitamos completar la tabla con las cantidades
que cada valor aportará a la suma para obtener la media; por lo que agregaremos una columna, a la que
llamaremos Valor ×Frecuencia. De esta manera será más sencillo calcular la suma de todos los datos.
Frecuencia
Valor
(núm. de estudiantes Valor x Frecuencia
(edad)
con la misma edad)
25 16 400
22 13 286
31 7 217
38 5 190
SUMA 41 1093
Por tanto, la suma total de los 41 datos es 1093. Para obtener la media lo hacemos de la siguiente manera:
¿Sabías qué?
Si se sustituye cada valor de los datos por la media
y se hace la suma se obtiene el mismo resultado que
si sumáramos todos los datos.
6
17
Módulo
Estadística en fenómenos naturales y procesos sociales
Contenido en extenso
Por ejemplo, si los datos están en la columna A, en las filas 4 a la 10, entonces el comando es =PROMEDIO(A4:A10),
o simplemente se anotan dentro del paréntesis todos los valores que se quieren promediar separados por comas.
Si los datos ya están, también es posible determinar una media aritmética, esto es, en la consideración de las
marcas de clase y las frecuencias absolutas o relativas de cada clase. La fórmula para la media aritmética de
datos agrupados es:
Recordando que mi es la marca de la clase i, la cual es el punto medio entre los límites superior e inferior de la
clase, fi es la frecuencia de la clase y fri es la frecuencia relativa.
Entonces, la media geométrica para n datos no negativos x1,x2,…,xn (esto es importante porque será necesario
obtener una raíz n-ésima, que no es posible de momento para números negativos) se obtiene mediante:
¿Dónde podemos emplear la media geométrica? Por ejemplo, si tenemos una caja que mide 4 cm de ancho, 6
cm de largo y 9 cm de alto: ¿qué dimensiones debe tener un cubo con el mismo volumen? La solución, dado que
el volumen es el producto de las tres cantidades, es la media geométrica, en este caso . En
la herramienta Excel es posible calcular esta media geométrica mediante el comando =MEDIA.GEOM(4,6,9).
Media armónica. Ésta se calcula dividiendo el número de observaciones por la suma total del inverso por cada
valor, es decir, si se tienen x1,x2,…,xn datos, el valor de la media armónica sería:
Un ejemplo de su uso es cuando recorremos la misma distancia varias veces, la media armónica de las distintas
velocidades con que realizamos cada recorrido, nos da la velocidad promedio global, es decir, si un amigo nos
quiere venir a visitar a nuestra casa, tiene que hacer un recorrido de su casa a la nuestra. De ida su velocidad es
de 20 km/h y de regreso es de 30 km/h: ¿cuál fue su velocidad promedio?
Para determinar la velocidad promedio podemos pensar en hacer el promedio directo de las dos velocidades, lo
que nos daría:
7
17
Módulo
Estadística en fenómenos naturales y procesos sociales
Contenido en extenso
Para desarrollar el problema con este resultado, supondremos que la distancia entre las dos casas es de 6 km,
entonces el tiempo que le tomó realizar el recorrido es de:
Por lo tanto, recorrió una distancia de 12 km en un tiempo de 0.5 horas. De esta manera, su velocidad promedio fue:
El resultado no lo obtuvimos únicamente con promediar las velocidades, pero es posible llegar a él por medio de
la media armónica de las velocidades:
Para poder encontrar la mediana de un conjunto de datos es necesario primero ordenarlos de manera creciente.
En una hoja de cálculo puede usarse la función =MEDIANA( ), seleccionando los datos a los cuales se les quiere
obtener la mediana.
Moda. Es simplemente el dato que más se repite, en otras palabras, es el de mayor frecuencia. Si más de un
dato se repite con la misma frecuencia (mayor), todos son la moda; pero si todos son distintos, no hay moda.
También para este caso los datos no necesitan ser números, pues sólo basta con que haya mayor frecuencia.
Rango medio. Es el promedio del valor mayor y el valor menor, o bien, es la mitad del camino entre el dato de
menor valor y el dato de mayor valor.
La fórmula es:
8
17
Módulo
Estadística en fenómenos naturales y procesos sociales
Contenido en extenso
Donde L representa el valor más bajo y H representa el valor más alto del conjunto de datos.
Si aún tienes duda de cómo obtener alguna de las medidas de tendencia central, con la siguiente tabla de
distribución de frecuencias, practicarás la obtención de la media, la mediana, la moda y el rango medio.
Valor Frecuencia
25 18
31 8
42 6
59 4
94 3
Para obtener la media es necesario agregar la columna Valor x frecuencia y la fila de las sumas.
Ya que tenemos 39 datos, el que se encuentra en el medio debe ser el dato 20, porque tiene 19 datos menores
o iguales que él y 19 mayores o iguales que él. De acuerdo con la tabla, los primeros 18 datos son 25, así que el
que se encuentra en el lugar 20 es 31.
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Dato 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 31 31
Posición 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39
Dato 31 31 31 31 31 31 42 42 42 42 42 42 59 59 59 59 94 94 94
9
17
Módulo
Estadística en fenómenos naturales y procesos sociales
Contenido en extenso
Para el caso de la moda es fácil de determinar, viendo la tabla donde el dato con mayor frecuencia es 25.
Y, por último, el rango medio es el promedio entre el dato menor 25 y el mayor 94:
0 6 4 42 37 10 46 1
39 14 24 0 15 15 12 23
48 18 9 26 17 42 31 0
25 14 41 0 4 40 46 39
1 6 0 8 34 23 23 31
14 43 29 28 1 24 36 42
22 32 11 25 50 15 3 34
46 18 6 16 24 40 35 38
48 4 39 31 0 41 40 14
26 29 3 16 17 48 1 36
Primero, tenemos que elaborar la tabla de datos agrupados. Los valores usados los calculamos también con
ayuda de Excel, de tal manera que los valores necesarios nos quedan así:
Número Amplitud
Núm. Máximo Mínimo Rango
de clases de clase
80 50 0 50 7 7
Es importante señalar, que el rango al que se refiere la tabla no es el rango medio, sino una medida de dispersión
denominada rango, y que se calcula al restar el dato mayor con el menor de un conjunto de datos.
10
17
Módulo
Estadística en fenómenos naturales y procesos sociales
Contenido en extenso
Para determinar la media podemos considerar la marca de la clase y la frecuencia de la clase. Con este paso,
asumimos que la marca de la clase sustituye las apariciones de todos los elementos de la clase. De esta manera
construimos la tabla con los productos de la marca de la clase multiplicada por la frecuencia absoluta de la clase:
Marca x
Clase Límites de clase Marca de clase Frecuencia
frecuencia
Núm.. Li Ls mi fi mi×fi
1 0 7 3.5 18 63
2 8 15 11.5 12 138
3 16 23 19.5 10 195
4 24 31 27.5 13 357.5
5 32 39 35.5 11 390.5
6 40 47 43.5 12 522
7 48 55 51.5 4 206
Este valor se aproxima al promedio de todos los datos que tenemos, ya que la media exacta es 22.9875, la cual
está bastante cerca del resultado de la media. También es necesario considerar que mientras tengamos más
datos es posible que el resultado mejore aún más.
11
17
Módulo
Estadística en fenómenos naturales y procesos sociales
Contenido en extenso
Para obtener la mediana agregamos la columna con la frecuencia acumulada y hacemos la operación del número
de datos entre dos. En este caso, como son 80 datos, la mediana debe estar entre las posiciones 40 y 41, por lo
que debe buscarse esas posiciones y promediar las marcas de clase correspondientes:
Clase
Marca x Frecuencia
Límites de clase Marca de clase Frecuencia
Frecuencia acumulada
No.
1 0 7 3.5 18 63 18
2 8 15 11.5 12 138 30
3 16 23 19.5 10 195 40
4 24 31 27.5 13 357.5 53
5 32 39 35.5 11 390.5 64
6 40 47 43.5 12 522 76
7 48 55 51.5 4 206 80
La posición 40 está en la clase 3 y la posición 41 en la clase 4, por lo que tenemos que promediar las marcas de
esas clases. Entonces, la mediana es 19.5+27.5
2
=23.5. Con ayuda de Excel también es posible hallar la media
exacta, la cual para este caso coincide con la estimación que hicimos.
De la misma manera, la moda la obtenemos con la marca de la clase que tiene la mayor frecuencia, es decir 3.5.
Para los datos completos, la moda es: 0, ya que es el dato que más se repite.
Para el rango medio tomamos en cuenta las marcas de clase máxima y la mínima: 3.5+51.5
2
=27.5. El resultado es
más grande que el rango mínimo exacto porque la última clase sobrepasa al dato mayor.
Como pudimos observar, las aproximaciones que obtenemos a partir de las tablas de datos agrupados son de
mucha utilidad cuando tenemos una gran cantidad de datos.
Tip de aprendizaje
12
17
Módulo
Estadística en fenómenos naturales y procesos sociales
Contenido en extenso
¿Sabías qué?
Las medidas de tendencia central dan información de los valores que pueden
pensarse puntos medios en diferentes sentidos, por tanto, es importante saber
si éstos coinciden, o su cercanía o variación. A este análisis se le conoce
como sesgo y relaciona la media, la mediana y la moda.
Como se mencionó en la unidad 1, existen distintos tipos de distribución, y en este apartado se describe
brevemente las posibles formas que pueden tener.
De entrada, tenemos que identificar que las distribuciones pueden tener sesgo generado por la recopilación
de los datos y el cual describe la distribución de los datos, al indicar hacia dónde tienden a concentrarse. La
construcción de una gráfica facilita esta apreciación al mostrar los resultados de manera visual. De esta manera,
una distribución puede ser:
• Asimetría negativa (sesgada a la izquierda). Si la mayoría de los datos están concentrados a la derecha.
El comportamiento de las medidas de tendencia central es, a grandes rasgos, como observamos en la figura:
13
17
Módulo
Estadística en fenómenos naturales y procesos sociales
Contenido en extenso
Los cuartiles son valores que dividen una muestra de datos en cuatro partes iguales, se representan mediante el
símbolo Q. Los cuartiles sirven para evaluar rápidamente la dispersión y la tendencia central de un conjunto de
datos, que son los pasos iniciales importantes para comprender sus datos.
Cuartil Descripción
1er cuartil (Q1) De los datos 25% es menor que o igual a este valor.
2do cuartil (Q2) Es la mediana. De los datos 50% es menor que o igual a este valor.
3er cuartil (Q3) De los datos 75% es menor que o igual a este valor.
Por ejemplo, supongamos que tenemos los siguientes datos: 7, 9, 16, 36, 39, 45, 45, 46, 48, 51o.
En el caso de las variables con valores que pueden definirse en términos de alguna escala de medida de
igual intervalo, puede usarse un tipo de indicador que permite apreciar el grado de dispersión o variabilidad
existente en el grupo de variantes en estudio. A estos indicadores les llamamos medidas de dispersión,
por cuanto que están referidos a la variabilidad que exhiben los valores de las observaciones, ya que, si no
hubiese variabilidad o dispersión en los datos interés, entonces no habría necesidad de la gran mayoría de las
medidas de la estadística descriptiva, porque no podríamos saber las diferencias que existen entre los distintos
conjuntos de valores.
Recordemos que las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor
representativo, por el contrario, las medidas de dispersión nos dicen hasta qué punto estas medidas de
tendencia central son representativas como síntesis de la información. Distinguimos entre medidas de medidas
de dispersión, que no son comparables entre diferentes muestras y las relativas que nos permitirán comparar
varias muestras.
¿Sabías qué?
14
17
Módulo
Estadística en fenómenos naturales y procesos sociales
Contenido en extenso
Nos proporciona información adicional que permite juzgar la confiabilidad de la medida de tendencia central.
Como vimos anteriormente, si los datos se encuentran ampliamente dispersos, la posición central es menos
representativa de los datos. Ya que existen problemas característicos para datos ampliamente dispersos, por lo
que, debemos ser capaces de distinguir que presentan esa dispersión antes de abordar esos problemas.
Quizá se desee comparar las dispersiones de diferentes muestras. Si no se desea tener una amplia dispersión de
valores con respecto al centro de distribución o esto presenta riesgos inaceptables, necesitamos tener habilidad
de reconocerlo y evitar escoger distribuciones que tengan las dispersiones más grandes.
Pero si hay dispersión en la mayoría de los datos, debemos estar en capacidad de describirla. Ya que la
dispersión ocurre frecuentemente y su grado de variabilidad es importante, ¿cómo medimos la variabilidad
de una distribución empírica? Vamos a considerar sólo algunas medidas de dispersión absolutas: el rango, la
varianza, la desviación estándar y el coeficiente de variación.
Recordemos que el rango intercuartil mide la distancia entre el valor del cuartil 3 y del cuartil 1, por lo que, no
considera la dispersión de todos los datos del conjunto, sino únicamente la que existe entre los valores de Q3 y
Q1, de esta manera evita el sesgo de los valores extremos.
La Varianza es el promedio del cuadrado de las distancias de todos los datos a la media, es decir, si tenemos
los datos x1,x2,…,xn la varianza es:
La desviación estándar suele ser la más utilizada de las medidas de dispersión. Esta medida de dispersión permite
observar qué tan centrados están los datos, con ello podemos saber si la media es una buena representación
de los datos. Si la desviación estándar es pequeña, la mayoría de los datos están cerca del promedio; y si es
grande, entonces están más repartidos o dispersos. Se define como la raíz cuadrada de la varianza:
15
17
Módulo
Estadística en fenómenos naturales y procesos sociales
Contenido en extenso
¡Ya conoces las medidas de dispersión! Ahora realizaremos un ejercicio para ver cómo obtenerlas.
De acuerdo con los datos del Instituto Nacional de Estadística y Geografía (Inegi) en 20151, la esperanza de vida
al nacer en años de edad de cada estado de la República Mexicana es:
Coahuila de Michoacán de
75.7 74.7 Tabasco 74.8
Zaragoza Ocampo
Veracruz de
Chihuahua 72.9 Nuevo León 76.4 74.1
Ignacio de la Llave
Promedio
Guanajuato 75.5 Querétaro 75.4 75
nacional
1
Fuente: https://www.inegi.org.mx/app/indicadores/?ind=6204482233
16
17
Módulo
Estadística en fenómenos naturales y procesos sociales
Contenido en extenso
Ahora calcularemos la varianza y la desviación estándar para saber qué tan lejos están los datos en general
de la media.
17
17
Módulo
Estadística en fenómenos naturales y procesos sociales
Contenido en extenso
Esto nos dice que los datos están cerca de la media, pero también que hay variaciones considerables en algunos
de los estados. Como podemos observar en la tercera columna de la tabla anterior, hay pocas variaciones en el
dato con respecto a su media, y sólo es notoria en algunos estados, por ejemplo, Chiapas, Oaxaca, Guerrero, etc.
Tip de aprendizaje
El principal propósito de la correlación es medir la fuerza de la relación lineal entre dos variables, generalmente
denotadas con x y y (variable independiente y dependiente) como se vio en la unidad 1. Para conocer la relación
entre estas variables, recurrimos a la correlación.
Si, conforme x aumenta, no hay un desplazamiento definido en los valores de y, se dice que no hay correlación, o
no hay relación entre x e y. Si, conforme x aumenta, hay un desplazamiento en los valores de y, entonces existe
una correlación. La correlación es positiva cuando y tiende a aumentar, y negativa cuando y tiende a disminuir. Si
los pares ordenados (x,y) tienden a seguir un trayectoria en línea recta, existe una correlación lineal.
4. Correlación lineal negativa 5. Correlación lineal negativa alta 6. No hay correlación lineal
18
17
Módulo
Estadística en fenómenos naturales y procesos sociales
Contenido en extenso
Supongamos que un determinado estudiante obtiene 35 puntos en una prueba de matemáticas. Este puntaje,
por sí mismo tiene muy poco significado a menos que podamos conocer el total de puntos que obtiene una
persona promedio al participar en esa prueba, saber cuál es la calificación menor y mayor que se obtiene, y cuán
variadas son esas calificaciones.
En otras palabras, para que una calificación tenga significado hay que contar con elementos de referencia
generalmente relacionados con ciertos criterios estadísticos.
Como ya vimos, las medidas de tendencia central más comunes son: media aritmética, mediana y moda.
De estas tres medidas de tendencia central, la media es reconocida como la mejor y más útil. Sin embargo,
recordemos que cuando en una distribución se presentan casos cuyos puntajes son muy bajos o muy altos
respecto al resto del grupo, es recomendable utilizar la mediana o la moda, porque dadas las características de
la media, esta es afectada por los valores extremos.
La media es considerada como la mejor medida de tendencia central, por las siguientes razones:
Existen tres medidas comunes para identificar el centro de un conjunto de datos: la media, mediana y moda.
En cada caso, se ubican alrededor del punto en donde se aglomeran los datos, y para saber si estas medidas
nos dan la misma información o si coinciden, es mediante el sesgo, recordemos que este nos indica hacia dónde
tienden a concentrarse los datos, por lo que, de esta manera podríamos saber si la distribución es simétrica, es
decir, si la mayor concentración de datos se localiza en el centro de la distribución.
En los medios de comunicación, especialmente en Internet, es muy común que nos hayamos encontrado
con noticias que afirman que se ha comprobado científicamente algún resultado. Pero, seguramente te has
preguntado ¿a qué se refieren con decir “científicamente comprobado”? Lo común es que en algún lugar se
haya hecho un estudio en el que rara vez se dan detalles al respecto. Sin embargo, más importante que eso es
poder determinar un juicio propio sobre si el estudio referido puede tener algún sentido. En general, se trata de
análisis estadísticos, pero con hipótesis y afirmaciones que no tienen mucha relación entre ellas y que son en su
estructura falacias.
19
17
Módulo
Estadística en fenómenos naturales y procesos sociales
Contenido en extenso
Un ejemplo muy burdo sería si cargáramos una piedra todo el día durante una semana. Si en esta semana
ningún tigre nos ataca, entonces significa que ¡nuestra piedra funciona como un excelente repelente de tigres,
con una efectividad de 100%! ¿En verdad lo crees así? Como podemos ver, las afirmaciones ni siquiera se
relacionan de manera clara. Muchas estadísticas falsas en Internet se basan es supuestos como estos. Veremos
un ejemplo más, hace poco tiempo se difundió una noticia en la que supuestamente en cierto día se pronosticaba
un enorme terremoto en México debido a que los datos estadísticos de estos fenómenos en Japón y Perú así lo
decían. Esta información preocupó a mucha gente. Sin embargo, era totalmente falsa, como después personal
del Sismológico Nacional advirtió. Sin importar los datos estadísticos de la posición e intensidad de los sismos
previos, éstos no estaban relacionados con las fuentes de sismos en México y, aún más, a la fecha estos
fenómenos aún no se pueden predecir.
Cierre
En esta unidad nos percatamos de que cuando se habla de método, se refiere a la forma ordenada y sistemática.
Cuando se hacen las cosas, tales como reflexiones, experiencias, incluso deportes o cualquier otra, de manera
rigurosa, entonces es posible alcanzar los objetivos que se proponen, aunque nunca habrá garantía absoluta de
lograrlo. Por ello, aun cuando hay diferentes formas de llegar al conocimiento, no todas las rutas resultan exitosas.
Con el estudio de este método de conocimiento y reflexión podemos saber el estado en que se encuentran las
cosas, así como tomar decisiones y realizar acciones de mejora tanto del ambiente que nos rodea como de
fenómenos sociales, políticos y económicos que nos competen.
Además, revisamos el razonamiento riguroso, con métodos de análisis y técnicas adecuadas, que también ofrecen
la posibilidad de tener una visión de aproximación al futuro, tema que retomaremos en la siguiente unidad.
Finalmente nos percatamos que, por el comportamiento de los eventos, se puede hacer un cálculo de probabilidad
y de aproximación, nunca con una visión infalible, de lo que podría pasar en el siguiente acontecimiento.
20