Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Universidad de Cuenca
Medias y Relaciones entre dos Variables 2
Extracto
población tenemos que sacar por lo menos tres medias para luego de compararlas
extraer de ellas conclusiones valederas. Se estudió también las relaciones entres dos
Media Geométrica
Definición
La media geométrica (expresada en algunos casos por Mg, Mo, G) es una medida de
tendencia central que se utiliza en algunos casos en los que la variable posee, ya sea valores
que tienen cierta relación constante o aproximadamente constante (Caballero, 1975) entre
ellos, o en las que la variable tiene un crecimiento geométrico con variaciones acumulativas,
es decir, con tendencia exponencial (Martínez, 1998); por ejemplo: en valores cuyas
variaciones son expresadas en forma de grados más que por sus diferencias absolutas
(Carson, 1954). La media geométrica se plantea como la enésima raíz del producto de N
Datos no Agrupados. La media geométrica (representada en este caso por G) para datos no
Ahora de una manera simbólica, si n es el número de valores representados por X1, X2, X3,…,
G = ( Πxi )1/n
“La letra griega π (pi) se lee como “multiplicación de”, es decir, corresponde al producto de
utilización de logaritmos (se acostumbra utilizar logaritmos en base 10), deduciendo entonces
la siguiente fórmula:
Dando una nueva definición para este caso se puede decir que el logaritmo de la
media geométrica es igual a “la media aritmética de los logaritmos de cada uno de los datos”
Datos Agrupados. En caso de que las medidas o valores a las que se estén refiriendo la media
anteriormente deben tener una leve modificación ya que a la vez también deben estar
ponderadas, es decir, la variable se multiplicará así misma tantas veces como sea su
respectiva frecuencia absoluta. Teniendo en cuenta esto, si f1, f2, f3,…, fn son las frecuencias
absolutas de los valores X1, X2, X3,…, Xk respectivamente, entonces la fórmula para hallar la
G = [ Πxifi ]1/n
continuas.
Propiedades
producto de n valores, por lo que, conocidos dos de estos es fácil encontrar el valor del
tercero, mas los valores individuales no se podrán determinar ya que son muy amplias las
2. Para calcular la media geométrica se utilizan todos los valores recogidos de la muestra, por
lo que cada uno de esos datos tienen una consecuencia en la media a encontrar; además de la
definición dada se puede apreciar rápidamente que si un valor es igual a cero la media
geométrica también lo será, por tanto en ese caso no será conveniente utilizar tal medida.
3. De haber el caso en el que un dato sea negativo y el número de elementos sea par, la raíz
de este producto será un número imaginario, además que si este producto es negativo y el
número de elementos es impar habrá un resultado que será tomado como media geométrica
pero que no será en realidad representativo puesto que será negativo también.
4. Los valores extremos que se utilizan para la obtención de la media geométrica afectan casi
de manera nula al resultado, caso que no es igual en el cálculo de la media aritmética por
5.
producto de las razones con respecto a la media geométrica de los valores inferiores a
los valores superiores a la misma. Por ejemplo, la media geométrica de los valores 1,
El producto de las razones de G con respecto a los valores individuales, los cuales son
Por lo tanto, los productos de las razones de los valores superiores e inferiores a la
Enunciando de una manera diferente: las desviaciones de los logaritmos de los valores
originales hacia arriba y hacia abajo del logaritmo de la media geométrica son iguales
6.
doble de su base es compensada por la otra que muestra la mitad de su base (…); la
razón que muestra cinco veces su base, es compensada por otra que muestra un quinto
porcientos. Puesto que la base de cada razón expresada en porciento es siempre igual
a 1 o 100%, el promedio de dos razones las cuales se compensan, deberá ser 100%
[ G = (1/2 ∙ 2)1/2 = √1 = 1 ]
7. “La media geométrica de las razones de los valores individuales con respecto a cada valor
precedente inmediato en una secuencia de valores es el único promedio apropiado para las
proporcionales.
Aplicaciones
razones en vez de diferencias absolutas, se suele necesitar aplicar la media geométrica; por
ejemplo se suele utilizar en series de datos como tipos de interés anuales, inflación, etc.,
Medias y Relaciones entre dos Variables 7
donde el valor de cada año tiene un efecto multiplicativo sobre el de los años anteriores; en la
cálculo del tanto por ciento de imposición de una suma de dinero a interés compuesto, cuando
se conoce el capital impuesto, la suma obtenida y el número de años que duró la imposición
(Mills, s.f.):
1º año, 100
¿Cuál es la tasa promedio de aumento durante estos (…) años? Se ve que el segundo
año es 125 por ciento del primero y el tercero 140 por ciento del segundo
Luego:(…)
(…)
[ {(1.25*1.40)1/2 }2 = (1.323)2 ]
1.75 = (1 + 0.323)2
P2 = P0 (1 + r)2
ecuación:
P1 = P0 + P0r = P0(1 + r)
y de manera análoga, tenemos que P10 = P0(1 + r)10. Y si sabemos que n es el número de años
Se menciona además una aplicación de esta medida de posición central en datos que se
población promedio entre dos censos (Carson, 1954; Martínez, 1998). Por ejemplo si una
empresa de censo reportó que la población de cierta nación ha crecido de 7621 en 1900 a
G = (7621 * 17932)1/2 = 11690.15706; lo cual indica que la población media en 1930 fue de
Ejemplos
Medias y Relaciones entre dos Variables 9
1. Se desea conocer cuál fue el crecimiento medio diario de una población de bacterias en un
Solución
primer día subiría ya de 1000 a 2000, el segundo a 4000 y el tercero a 8000, contra lo
dicho.
1000(1 + r)2
= 1000(1 + r)3
Esta última expresión debe dar 4000. Por tanto, 1000(1 + r)3 = 4000, (1 + r)3 = 4, 1 + r
ha sido de 58.7%.
Como se puede notar fácilmente se ha utilizado la fórmula del interés compuesto analizado
anteriormente.
2.
respectivamente.
(c) Si el porcentaje medio de crecimiento entre 1980 y 1990 es el de la parte (a), ¿cuál
Solución
aprendida:
Media Armónica
Definición
La media Armónica (expresada en algunos casos por Mn, M-1, MA, H1 ó H) es una
no tener errores en la elaboración de algunas clases de datos (AulaFacil S.L., 2000). “La
media armónica de una serie de medidas es el número recíproco de la media aritmética de los
(representada en este caso por G), como ya se expresó en la definición, está denotada por:
H = n / (Σ1/X ) i
Datos Agrupados. Para el caso de analizar datos que se manejen en forma agrupada el cálculo
valores originales debe ser ponderado por la frecuencia que representa el valor en el cálculo”
(Shao, 1971, p. 208). Teniendo entonces la siguiente fórmula para este caso:
Propiedades
por lo tanto cada uno de estos contribuye a que se vea perturbado el valor de la media, pero
este valor es menos afectado por los extremos que la media geométrica aun.
3. “La dificultad del cálculo de la media armónica disminuye su utilidad en al práctica del
4.
para promediar razones. La razón usualmente indica la relación entre dos tipos
donde la unidad del primer término es una milla y la unidad del segundo término es
donde la unidad del primer término es una hora y la unidad del segundo término es
Aplicaciones
general cuando se hace uso de la misma se emplea en casos en que la variable está dada en
Ejemplo
El siguiente ejemplo es usado para ilustrar cómo se debe usar la media armónica.
(…) Tres estudiantes hicieron una carrera de relevos de 3,600 millas. Cada uno de
ellos manejó 1,200 millas. Sus velocidades al manejar están dadas más abajo.
Encontrar la velocidad promedio por hora de los tres estudiantes durante la carrera.
Solución.
número de horas, la cual es aplicable a cada estudiante. Esto es, cada estudiante
manejó el mismo número de horas durante la carrera. (Note que la unidad de segundo
Medias y Relaciones entre dos Variables 13
término en la media y en cada razón dada es una hora; misma que la unidad del valor
constante usado en el supuesto.) Sin embargo, este no es el caso, puesto que el número
Total 74 horas
El número total de millas recorridas por los tres estudiantes al promedio de 50 millas
50 x 74 = 3,700 millas
el cual no está de acuerdo con la distancia dada, 3,600 millas de la carrera. Por lo
[ (1/40 + 1/50 + 1/60)/3 = (15/600 + 12/600 + 10/600)/3 = 37/1,800 horas por milla ]
hora es
El número real de millas recorridas (1,200 millas cada uno) no está incluido en
estudiante. Es decir, cada estudiante manejó el mismo número de millas. (Note que la
unidad del primer término en la media armónica y en cada razón dada es una milla,
misma que la unidad del valor constante usado en el supuesto.) Este supuesto es cierto
Media Cuadrática
Definición
negativos y se quiere despreciar estos signos en el cálculo. Se trata de elevar al cuadrado cada
valor de la variable para de esta manera eliminar los signos no positivos, luego calcular la
media aritmética de esos valores y finalmente extraer la raíz cuadrada de esta (Wikipedia,
2006, 16 de noviembre).
1/2
Q = [(Σ Xi2)/n]
Propiedades
Medias y Relaciones entre dos Variables 15
1. Para calcular la media cuadrática no se tienen en cuenta los signos positivos o negativos de
Aplicaciones
como es el caso de los errores de medida; además es utilizada a menudo en las aplicaciones
Ejemplos
La única excepción a estas dos últimas reglas se presenta cuando todas las cantidades
que forman la serie son iguales, pues en este caso las tres medias son también iguales.
entre la media aritmética y la armónica de ambas cantidades. Así, si las cantidades son
media geométrica, entre 31/5 y 5. Esto no ocurre cuando la serie contiene más de dos
La magnitud relativa de las tres diferentes medias para los mismos datos puede ser expresada
como sigue:
Lo que quiere decir que la media cuadrática es mayor a la media aritmética que a su vez es
Definición
mediante dos variables X e Y, en la que habrá una relación entre estas dos variables.
Representación Tabular
Con el fin de organizar toda la información recogida se la representa en una tabla con
Y y1 y2 … yj … yp
X
x1 n11 n12 … n1j … n1p n1∙
x2 n21 n22 … n2j … n2p n2∙
… … … … … … … …
xi ni1 ni2 … nij … nip ni∙
… … … … … … … …
xk nk1 nk2 … nkj … nkp nk∙
n∙1 n∙2 … n∙j … n∙p n∙∙
Frecuencia Absoluta. Es el número de individuos representados con nij que a la vez presentan
Distribuciones Marginales
k
N = n.. = Σ Σp nij
Medias y Relaciones entre dos Variables 17
Distribuciones Condicionales
población de la cual estamos interesados, que está formado por los elementos con modalidad
dado de manera exacta por una fórmula matemática o física. Ejm Y = X/100 => X = 100 Y.
por cualquier valor de la otra” (UMA, s.f., p. 78). Esto implicará que en la tabla todas las filas
Representación Gráfica
y
. .
.
. . .
x
. …. .
..
…
.
Representación Numérica
Covarianza. Es una medida de variabilidad común de dos variables cuantitativas que está
afectada por las unidades en las que cada variable se mide y está definida como sigue:
Medias y Relaciones entre dos Variables 18
La covarianza divide una nube de puntos en cuatro cuadrantes de los que están en el primer y
tercer cuadrante aportan positivamente a SXY y los que están en el segundo y cuarto lo hacen
de negativamente.
Interpretación de la covarianza
. Si SXY > 0 las dos variables crecen o decrecen a la vez (nube de puntos creciente).
. Si SXY < 0 cuando una variable crece, la otra tiene tendencia a decrecer (nube de
puntos decreciente).
. Si los puntos se reparten con igual intensidad alrededor de (x, y), SXY = 0 (no hay
Para que haya una medida de variabilidad que no sea afectada por las unidades en las
que cada variable se mide se divide la covarianza por el producto de las desviaciones típicas
de cada variable, para así conseguir tener un coeficiente adimensional llamado coeficiente de
r = (SXY)/(SXSY)
Propiedades
1. Es adimensional.
4. Si |r| ≈ 1, se tiene una relación lineal muy fuerte entre las variables.
5. Si r ≈ 0, se puede decir que las variables son incorreladas es decir que no existe relación
Regresión
Medias y Relaciones entre dos Variables 19
Permite hacer predicciones sobre posibles valores de una variable Y en función de otra
X o viceversa. Es una deducción a partir de una serie de datos observando las relaciones que
el criterio que se debe seguir para su elaboración es que la diferencia entre Y e Ŷ se lo más
pequeña posible.
Bondad de ajuste.
valores de Y conocidos los de X, debemos definir variable Ŷ = ƒ(X), que debe tomar los
valores
de modo que:
Y - Ŷ~>y1 - ŷ1 ≈ 0, y2 – ŷ2 ≈ 0,…, yn – ŷn ≈ 0
Ello se puede expresar definiendo una nueva variable E que mida las diferencias entre
y calculando Ŷ de modo que E tome valores cercanos a 0. Dicho de otro modo, E debe
ser una variable cuya media debe ser 0, y cuya varianza S2E debe ser pequeña (en
curva de regresión es buena. Este coeficiente analizado anteriormente sirve para medir el
grado de bondad del ajuste, es decir, para medir de qué manera las diferencias entre los
valores originales de una variable y los de la aproximación son pequeños en relación con los
Regresión Lineal. Esta regresión consiste en hallar los valores para las constantes a y b para
usar una relación funcional de tipo lineal que se puede escribir como Ŷ = a + b∙X buscando el
a = y – bx
b = SXY/S2X
(…)
∙ Si b < 0, cuando una variable aumenta, la otra disminuye (UMA, s.f., p. 87).
(…)
de X y viceversa).
tiene sentido hacer un ajuste lineal. Sin embargo no es seguro que las dos variables no
posean ninguna relación en el caso r = 0, ya que si bien el ajuste lineal puede no ser (…)
[procedente], tal vez otro tipo de ajuste sí lo sea (UMA, s.f., p. 89).
¿Existe una relación lineal importante entre ambas variables? Calcular la recta de
regresión de la edad en función del peso y la del peso en función de la edad. Calcular la
bondad del ajuste ¿En qué medida, por término medio, varía el peso cada año? ¿En
Solución
Para saber si existe una relación lineal entre ambas variables se calcula el coeficiente de
ya que
(…)
[ x = x media y = y media
Σx 2
i = 823 → S2X = 823/8 – 9,8752= 5,3594 años2
SX = 2,3150 años
Σy 2
i = 19,303 → S2Y = 19,303/8 – 48,6252 = 48,4844 Kg2
SY = 6,9631 Kg
Σ x y = 3,963 → S
i i XY = 3,963/8 – 9,875 x 48,625 = 15,2031 Kg ∙ año ]
Medias y Relaciones entre dos Variables 22
Por tanto el ajuste lineal es muy bueno. Se puede decir que el ángulo entre el vector
formado por las desviaciones del peso con respecto a su valor medio y el de la edad con
es decir, entre esos vectores hay un buen grado de paralelismo (sólo unos 19 grados de
desviación).
a1 = y – b1x = 20,6126 Kg
[X ↔ Ŷ]
sobre X.
por tanto podemos decir que el 88,94% de la variabilidad del peso en función de la
decir en cuanto a la variabilidad de la edad en función del peso. Del mismo modo puede
decirse que hay un 100 – 88,94% = 11,06% de varianza que no es explicada por las
rectas de regresión. Por tanto la varianza residual de la regresión del peso en función de
la edad es
Medias y Relaciones entre dos Variables 23
Por último la cantidad en que varía el peso de un paciente cada año es, según la recta
edad entre ambas se rige por la cantidad b2 = 0,3136 años/Kg de diferencia (UMA, s.f.,
pp. 92-94).
Medias y Relaciones entre dos Variables 24
Referencias
AulaFacil S.L. (2000). Medidas de Posición Central. Extraído el 11 de Abril del 2007 desde
http://www.aulafacil.com/CursoEstadistica/Lecc-4-est.htm
Carson McCormick, T. (1954). Técnica de la Estadística Social (1ª ed.). México: Fondo de
Martínez, C. (1998). Estadística Comercial (2da ed.). Santa Fe de Bogota, Colombia: Editorial
Norma. 1998.
desde http://es.wikipedia.org/wiki/Media_cuadrática