Documentos de Académico
Documentos de Profesional
Documentos de Cultura
QUINTANA ROO(UQROO)
CONTROL DE LECTURA
Tema 2. Medidas de tendencia central
Carrera:
Economía y Finanzas
Alumna
Matricula
23-34164
PROFESOR
• Cuartiles
Usualmente, se recomienda dividir los datos en cuatro partes iguales, cada una de las
cuales contiene aproximadamente el 25% de las observaciones. Esto es útil para
comprender cómo se distribuyen los datos. Los puntos en los que se realiza esta
división se conocen como cuartiles y se definen de la siguiente manera:
o Q3, el tercer cuartil, equivale al percentil 75. Esto implica que el 75%
de las observaciones tienen valores iguales o menores que Q3.
Medidas de variabilidad
• Rango
El rango se puede denominar de la siguiente manera, “la diferencia entre el valor
máximo y el valor mínimo en un conjunto de datos”. Matemáticamente se
determina como:
𝑅𝑎𝑛𝑔𝑜 = 𝑣𝑎𝑙𝑜𝑟 𝑚𝑎𝑦𝑜𝑟 − 𝑣𝑎𝑙𝑜𝑟 𝑚𝑒𝑛𝑜𝑟
El rango proporciona una medida simple de la dispersión o variabilidad en un
conjunto de datos. Cuanto mayor sea el rango, mayor será la variabilidad entre los
valores en el conjunto de datos. Por otro lado, un rango pequeño indica que los valores
están más agrupados o tienen menos variabilidad entre ellos. El rango es una de las
medidas más básicas para evaluar la dispersión de datos, pero no proporciona
información sobre la distribución de los valores dentro del rango.
• Rango intercuartílico
El rango intercuartílico (RIC) es una forma de medir cuánto varían los datos en un
conjunto sin verse afectado por valores extremos. Se calcula tomando la diferencia
entre el tercer cuartil (Q3) y el primer cuartil (Q1) de los datos. Para entenderlo más
sencillamente, imagina que tienes una lista de números. Primero, encuentras el valor
que está en el medio del 25% de los números más bajos (Q1), y luego el valor que
está en el medio del 25% de los números más altos (Q3). El rango intercuartílico es
la diferencia entre estos dos valores. Mide cuánto varía la mitad central de tus datos,
sin importar los valores extremos que puedan estar muy arriba o muy abajo en la lista.
𝑅𝐼𝐶 = 𝑄3 − 𝑄1
• Varianza
La varianza es una forma de medir cuánto varían los datos en un conjunto. Se hace
comparando cada valor en los datos con la media. La diferencia entre cada valor
denominado xi y la media se llama "desviación respecto de la media". Cuando
calculamos la varianza, elevamos al cuadrado estas desviaciones.
Varianza poblacional:
2
∑(𝑥𝑖 − 𝜇)2
𝜎 =
𝑁
Varianza muestral:
∑(𝑥𝑖 − 𝑥̅ )2
𝑠2 =
𝑛−1
• Desviación estándar
La desviación estándar es la raíz cuadrada positiva de la varianza. Utilizando la
notación que se estableció para las varianzas, se emplea "s" para representar la
desviación estándar de una muestra y "σ" para la desviación estándar de una
población. La desviación estándar se obtiene a partir de la varianza de la siguiente
manera:
Desviación estándar poblacional:
𝜎 = √𝜎 2
Desviación estándar muestral:
𝑠 = √𝑠 2
• Coeficiente de variación
En ciertas ocasiones, queremos saber cuánto varían los datos en relación con su valor
promedio. Para medir esto, utilizamos algo llamado el "coeficiente de variación". Se
suele expresar como un porcentaje y nos muestra cuánta variabilidad existe en
comparación con la media. Se termina como:
𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟
( ∗ 100) %
𝑚𝑒𝑑𝑖𝑎
Imagina que tienes dos conjuntos de datos: uno tiene una media de 100 y una
desviación estándar de 10, y el otro tiene una media de 50 y una desviación estándar
de 5. A simple vista, ambos conjuntos tienen la misma cantidad de variabilidad (la
desviación estándar), pero si calculamos el coeficiente de variación, veríamos que el
primero tiene un coeficiente de variación del 10% (10 sobre 100), mientras que el
segundo tiene un coeficiente de variación del 10% (5 sobre 50). Esto nos ayuda a
comparar la variabilidad relativa entre conjuntos de datos con diferentes escalas. En
resumen, el coeficiente de variación es una medida que nos permite comprender
cuánto varían los datos en relación con su promedio, expresado como un porcentaje.
• Forma de distribución.
Cuando los datos están sesgados se nota en la forma de distribución de los datos
representados en histogramas con la información estando mas de un lado que
de otro, para calcular el sesgo se utiliza las siguiente formula:
𝑛 𝑥𝑖 − 𝑥̅ 3
𝑆𝑒𝑠𝑔𝑜 = ∑( )
(𝑛 − 1)(𝑛 − 2) 𝑠
• Valor Z
Además de las formas en que describimos nuestros datos, también es
importante entender cómo se ubican los valores dentro de un conjunto de datos.
Las medidas de posición relativa nos ayudan a saber cuán lejos está un valor
en particular de la media del conjunto.
𝑥𝑖 − 𝑥̅
𝑧𝑖 =
𝑠
Imagina que tienes una lista de números, y quieres saber cuán lejos está un
número específico de la media y en qué dirección. Para hacerlo, usamos dos
números especiales: la media y la desviación estándar (nos dice cuán dispersos
o agrupados están los números alrededor de la media).
Ahora, para cada número en la lista, calculamos algo llamado "valor z" Este
valor z nos muestra cuán lejos está ese número de la media en términos de la
desviación estándar. En otras palabras, nos ayuda a entender si un número está
por encima o por debajo de la media y cuántas desviaciones estándar lo separan
de ella.
• Teorema de Chebyshev
El teorema de Chebyshev nos dice cuántos de nuestros datos deben estar dentro
de un cierto rango alrededor de la media. En otras palabras, nos ayuda a
entender cuántos datos se agrupan cerca del valor promedio y cuántos pueden
estar más lejos de ese valor. Esto es útil para comprender la dispersión de los
datos en un conjunto, sin importar si siguen una distribución específica.
Cuantas más desviaciones estándar consideremos, más amplio será el rango en
el que se encuentran la mayoría de los datos.
• Covarianza
La covarianza es una medida estadística que nos dice cómo dos conjuntos de
datos diferentes cambian juntos. En otras palabras, nos ayuda a entender si
cuando uno de los conjuntos de datos aumenta, el otro también aumenta
(covarianza positiva), disminuye (covarianza negativa) o no muestra un patrón
claro de cambio (covarianza cercana a cero).
Muestral:
∑(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅)
𝑠𝑥𝑦 =
𝑛−1
Poblacional:
∑(𝑥𝑖 − 𝜇𝑥 )(𝑦𝑖 − 𝜇𝑥 )
𝑠𝑥𝑦 =
𝑁
• Coeficiente de correlación
El coeficiente de correlación de Pearson muestral se calcula como la
covarianza muestral dividida por el producto de las desviaciones estándar
muestrales de x e y.
𝑠𝑥𝑦
𝑟𝑥𝑦 =
𝑠𝑥 𝑠𝑦
• Media ponderada
La media ponderada es un promedio en el que algunos valores tienen más
"peso" o importancia que otros. En otras palabras, no todos los valores se
consideran igualmente en el cálculo. Los valores más importantes influyen más
en el resultado final.
∑ 𝑤𝑖 𝑥𝑖
𝑥̅ =
𝑤𝑖
Para concluir obtenemos que las herramientas y conceptos estadísticos presentados
en este capítulo proporcionan a las organizaciones las capacidades necesarias para
tomar decisiones informadas y respaldadas por datos. Algunas de las ideas clave que
se han discutido incluyen la mediana, la varianza, la desviación estándar, la Regla
Empírica y el Teorema de Chebyshev, así como la identificación y el manejo de
valores atípicos.
La relevancia de la estadística en este contexto se hace evidente al comprender cómo
esta disciplina puede ayudar a las empresas a comprender patrones, tomar decisiones
de mercado, evaluar el rendimiento financiero y mucho más. La estadística se
convierte en una herramienta poderosa para el éxito y la eficiencia de las
organizaciones en el siglo XXI.
Bibliografía
Anderson, D. R., Sweeney, D. J., William, T. A., Camm, J. D., & Cochran, J. J.
(2012). Estadística para negocios y economía. Onceava edición. Ciudad de México:
Cengage Learning. Páginas 85-147.