Está en la página 1de 4

2do Cuatrimestre- Año 2017

TURNO MAÑANA

Prof. M.F. Niño, C. Domínguez y W. Oviedo


FACEBOOK.COM/estadistica.com1.humanidades

FICHA Nº 4
Unidad IV
IMPORTANTE: Las “fichas de cátedra”, son documentos que contienen textos breves o esquemas explicativos que se
refieren a algunos contenidos específicos de la asignatura.
El propósito es ampliar o complementar la bibliografía obligatoria de algunos temas. De modo que, estas fichas sólo
deberán ser utilizadas para ese fin y nunca cómo único material de aprendizaje. Es necesario remitirse a la
bibliografía obligatoria y entonces sí, completar esa lectura con la de estas fichas.

NOTA: Para todos los temas que aquí ampliamos o complementamos, indicamos el/los números de página de la
Bibliografía principal de referencia de nuestro curso, en las que esos temas se desarrollan: AGUIRRE C.; NIÑO F.;
SIMONETTI E. (2004): Estadística aplicada en las Ciencias Sociales y Humanas. Estadística I. Ed. Universitaria de
Misiones. Posadas.

Complemento para las páginas 116 y 117


RELACIÓN ENTRE VARIABLES CATEGÓRICAS Y NUMÉRICAS1

Recuerda que aquí nos referimos al análisis de la relación en el caso en que la variable categórica
es la variable independiente y la numérica es la dependiente.

Existencia de la relación:
Cada “grupo o clase de individuos” (determinado por la variable categórica) tiende a presentar una
distribución de valores diferentes en la variable numérica.
Para comparar las distribuciones numéricas y determinar si son diferentes, una solución simple
(aunque incompleta) es comparar las medidas de tendencia central que mejor resumen a la
distribución.
Si las medias (medianas) por “grupo” son diferentes  existe relación
Si las medias (medianas) por “grupo” son iguales entre sí e iguales a la media (mediana) general 
no existe relación
Como ya hemos dicho, es necesario realizar un análisis gráfico de las distribuciones para determinar
la medida de tendencia central a utilizar. Además, limitarnos a las medidas de tendencia central,
puede resultar engañoso. En efecto, dado que una medida de tendencia central siempre es un
resumen incompleto de una distribución (debido a la variabilidad), para asegurarnos que el resto de
valores de las distribuciones también tienden a ser diferentes es necesario analizar la variabilidad.
En este sentido, la comparación de las distribuciones se puede completar usando otras medidas que
complementen las de tendencia central (ej.: mínimo, máximo, cuartiles). Gráficamente, los Box-plot
son especialmente útiles para comparar las distribuciones de cada grupo o clase de individuos
determinados por la variable categórica.

1
En la guía nº 4 también disponen de algunos comentarios y definiciones teóricas que es necesario leer.
TURNO MAÑANA
Prof. M.F. Niño, C. Domínguez y W. Oviedo FICHA Nº 4 – pág. 2/4
2do Cuatrimestre- Año 2017

Forma: Para describir este aspecto de la relación, intentaremos responder: ¿qué valores de la
variable categórica, se asocian (tienden a aparecer conjuntamente) con qué valores de la variable
numérica?
Fuerza: La relación entre las variables será tanto más fuerte cuánto más diferentes sean las
distribuciones de las variables numéricas entre los “grupos”.

 Complemento para la página 127 y 128


RELACIÓN ENTRE VARIABLES NUMÉRICAS2
Acordáte que el gráfico (diagrama de dispersión) es la herramienta principal a la hora de analizar la
relación entre dos variables numéricas. Siempre empezá por analizar el gráfico.

La primera pregunta que debemos plantearnos para ese análisis, es: ¿la nube de puntos, tiene una
forma aproximadamente elíptica (alargada, o de tubo)?, dicho de otro modo: ¿los puntos de la
nube, se disponen aproximadamente en torno a una línea recta? Si es así, podemos pensar que
estamos en presencia de una “relación lineal”.

Una ayuda para el análisis, consiste en calcular la media aritmética de cada variable y
representar esas medias, con líneas de puntos que atraviesan el diagrama de dispersión. La media
aritmética, servirá así para calificar a los valores de cada variable, como “bajos” (los que están por
debajo de la media aritmética) o “altos” (los que están por encima de la media).

 Si los individuos con valores “altos” en la variable independiente, tienden a presentar valores
“altos” en la dependiente y, simultáneamente, los individuos con valores “bajos” en la variable
independiente, tienden a presentar valores “bajos” en la dependiente, entonces, diremos que la
relación lineal es positiva.

2
En la guía nº 4 también disponen de algunos comentarios y definiciones teóricas que es necesario leer.
TURNO MAÑANA
Prof. M.F. Niño, C. Domínguez y W. Oviedo FICHA Nº 4 – pág. 3/4
2do Cuatrimestre- Año 2017

 Si, en cambio, los que presentan valores “altos” en una variable, tienden a presentar valores
“bajos” en la otra variable y, simultáneamente, los que presentan valores “bajos” en la primera
variable, tienden a presentar valores “altos” en la segunda, entonces diremos que la relación lineal
es negativa.
TURNO MAÑANA
Prof. M.F. Niño, C. Domínguez y W. Oviedo FICHA Nº 4 – pág. 4/4
2do Cuatrimestre- Año 2017

COEFICIENTE DE CORRELACIÓN LINEAL DE PEARSON

¿Qué es?: Una medida de la fuerza y el sentido de la relación lineal entre dos variables numéricas.
¿Cómo lo mide?: evaluando la dispersión de los puntos-individuos en torno a la recta que mejor
describe la nube de puntos (o “recta de mejor ajuste”).
¿Para qué sirve?: provee una valoración numérica y objetiva de la fuerza de la relación. Objetiva
porque cualquier persona puede llegar al mismo resultado siguiendo el procedimiento acordado
(fórmula), a diferencia de la evaluación subjetiva que podemos hacer solamente mirando el gráfico.
Dado que el coeficiente es un número, permitirá hacer comparaciones entre las fuerzas de las
relaciones de 2 o más pares de variables.

 Complemento para la página 128


VALORES POSIBLES DE r Y SU INTERPRETACIÓN
El coeficiente de correlación lineal de Pearson (simbolizado con r) puede tomar valores que van
desde -1 a 1.

 El SIGNO de r indica el sentido de la relación:


r negativo  relación lineal negativa o inversa
r positivo  relación lineal positiva o directa.
 El VALOR ABSOLUTO3 de r, indica la fuerza o intensidad de la relación.
Un r = 0 indica ausencia total de relación lineal
Un r = 1 o r = -1 indica una relación lineal perfecta (una relación lineal perfecta se expresa
en un diagrama de dispersión en el que todos los puntos están sobre la “recta de mejor
ajuste”).
Referencias para interpretar otros valores del coeficiente r
Valor absoluto de r Fuerza de la relación
0 a 0,20 No hay
0,2 0 a 0,40 Débil
0,4 0 a 0,60 Moderada
0,60 a 0,80 Fuerte
0,8 0 a 1,00 Muy Fuerte

Ejemplos: un r  0,86 indica una relación muy fuerte y negativa (o inversa)


un r  0,39 indica una relación débil y positiva (o directa)

3
El “valor absoluto” de un número es el número sin el signo. Ej.: valor absoluto de -5 es 5.

También podría gustarte