Está en la página 1de 4

Asociación, correlación, regresión

1. Actividades

1. Se quiere estudiar si un cierto medicamento produce trastornos digestivos en los ancianos. Para ello
se han observado durante un periodo suficiente de tiempo a 25 ancianos obteniendo los siguientes
resultados:
Molestias digestivas No tiene molestias Total
Toma la medicina 9 8 17
No la toma 7 1 8
Total 16 9 25

a) Utilizando los datos de la tabla, razona si en estos ancianos, el padecer trastornos digestivos
depende o no del medicamento.
b) A partir del ejemplo sobre trastornos digestivos en ancianos construye otros ítems tales que: 1) los
datos sean independientes;2) se presente una asociación directa.
c) Elabora una lista de las estrategias intuitivas que esperas sigan los alumnos para resolver el
problema propuesto. Analiza las propiedades matemáticas utilizadas en cada una de estas
estrategias.

Plot of TIME_DEC vs TIME_SEP 2. Un segundo problema es el estudio de la


11 relación entre dos variables numéricas a partir
de datos representados en un diagrama de
TIME_DEC

9 dispersión. Describe las variables que crees


7
que pueden afectar la dificultad de estas tareas
y las posibles estrategias intuitivas de los
5 alumnos para resolver estos problemas. ¿En
qué propiedades matemáticas se diferencian
3
3,3 5,3 7,3 9,3 11,3
estas estrategias de las utilizadas en las tablas
TIME_SEP de contingencia?

3. Al medir la presión sanguínea antes y después de haber efectuado un cierto tratamiento médico a un
grupo de 10 mujeres, se obtuvieron los valores siguientes:
Presión sanguínea en cada mujer
Mujer A B C D E F G H I J
Antes del tratamiento 15 12 07 19 15 38 26 05 04 15
Después del tratamiento 28 15 06 28 22 45 32 09 02 17

¿Cuáles son las estrategias que esperarías usar un alumno sin instrucción en el tema? ¿Y si las
muestras fuesen independientes?

4. Consideremos el modelo dado por las dos ecuaciones:


y1 = 11x1 + 1
y2 = 21y1 + 21x1 + 2 11 y1 1
en donde los errores 1 y 2 están incorrelacionados
entre sí y con x1 .
x1 21
El diagrama de la figura muestra la situación. 21
y2 2
Si, por error, un investigador omite la consideración
de x1 y usa:
y2 = 21y1 + *2
donde, *2 = 21x1 + 2, puede mostrarse que al tratar de estimar 21 obtenemos en su lugar *21 = 21 +
21b en donde b es el coeficiente de regresión de x1 sobre y1 .
Analiza las distintas situaciones que pueden presentarse según los valores tomados por los diferentes
coeficiente se resumen en la tabla 1.
Tabla 1 Relación entre los valores de b*21 = (b21 + 21b) y b21 cuando se omite la causa común
21 21b *21 versus 21 Relación entre y1 e y2
no 0 0
0 no0
>0 >0
<0 <0
>0 <0
<0 >0

5. Analizar las siguientes medidas de asociación entre variables cualitativas, desde el punto de vista
de su equivalencia por la información que proporcionan sobre la existencia de una relación causal
entre las variables intervinientes (Damos sólo la definición de asociación directa).

• Dos variables A y B se correlacionan positivamente si y solamente si la probabilidad de que


ocurran simultáneamente A y B es mayor que el producto de las probabilidades de A y B
(Kendall, Lazarsfeld y Nagel): P(A•B) - P(A)P(B) > 0
• Dos variables están positivamente correlacionadas si y solamente si la probabilidad de B
condicionada a A menos la probabilidad de B es mayor que cero (Reinchebach y Suppes). Esto
es, A y B están correlacionadas positivamente si y solamente si : P(B/A) - P(B) > 0
• Dos variables están positivamente correlacionadas si y solamente si la probabilidad de B
condicionada a A menos la probabilidad de B condicionado a no A es mayor que cero (Salmon
y Suppes). Esto es, A y B están correlacionadas positivamente si y solamente si:
P(B/A) - P(B/A) > 0

6. Analiza los distintos tipos de variables en el diseño experimental: explicativas, respuesta, variables
concomitantes. Estudiar los posibles tipos de control para las variables concomitantes y las
implicaciones de este control sobre los resultados del estudio estadístico.

7. Analiza un ejemplo de investigación en educación desde el punto de vista del diseño experimental
empleado, tipos de variables y control efectuado. ¿Cuáles son las posibilidades de generalización de
los resultados?

8. En las Figuras hemos representado la esperanza de vida del hombre en función de otras dos
variables. Discute en cada caso si la relación es directa o inversa, lineal o no. ¿Respecto a cuál variable
la relación es más intensa? ¿Cuál serviría mejor para predecir la esperanza de vida del hombre? ¿Qué
significa para ti una causa y un efecto? ¿En qué casos de los mostrados consideraría la relación entre la
esperanza de vida del hombre y otra variable de tipo causal ?
Esperanza de vida (hombre) vs PNB
Esperanza de vida (hombre) vs tasa mortalidad
78 7
68 8
6
58 8
5
evidahombre

48 8
hom b re

4
e. vid a

38 8
3
0 1 2 3 4 0 5 1 1 2 2
(X 8
PNB x10.000 1 00 0 ta sa m
5 o rta lid
0 ad 5

E spe r a nz a d e e v id a ( h om bre ) vs ta sa na ta li da d
Esperanza de vida (hombre) vs Esperanza de vida (mujer)
78
78

68 68
e.vida hombre

58
58
evida hombre

48
48
38
41 51 61 71 81 91
38
10 20 30 40 50 60 e. vida mujer
0
ta sa na ta li da d
2. Items de evaluación

1. Ordena los siguientes coeficientes de correlación según indiquen mayor o menor intensidad en la
relación de las variables X e Y. Indica cuáles corresponden a cada una de las gráficas 2, 3, 4 y 5.
r= 0.982; r=0.637; r=-0.7346; r= -0.8665; r=0.

2. Cuando la covarianza entre X e Y es mayor que cero, entonces:


1. La correlación entre X e Y es positiva
2. X e Y pueden tener una relación no lineal
3. La nube de puntos es decreciente
4. El coeficiente de correlación es positivo
5. La pendiente de la recta de regresión tiene un signo positivo.

3. Juan calcula la correlación entre pesos y alturas de los chicos de la clase. Mide el peso en
kilos y la altura en metros. Angela mide la altura en cm. y el peso en grs. y calcula también la
correlación ¿Cuál de los dos obtiene un coeficiente mayor?

4. Se quiere estudiar si el fumar produce trastornos respiratorios a un grupo de personas. Para ello se
han observado durante un periodo suficiente de tiempo a 250 peronas obteniendo los siguientes
resultados:
Molestias respiratoriasNo tiene molestiasTotal
Fuma 60 40 100
No fuma 90 60 150
Total 16 9 250
Utilizando los datos de la tabla, razona si en esta muestra, el padecer trastornos respiratorios depende o
no de fumar.

5. Cuando la intensidad de la relación entre dos variables decrece:


• La pendiente de la recta de regresión de Y sobre X crece
• La pendiente de la recta de regresión de X sobre Y crece
• Hay mayor dispersión en la nube de puntos
• La covarianza aumenta en valor absoluto

6. Si dos variables están correlacionadas positivamente:


• Cuando una aumenta la otra también aumenta
• Cuando una disminuye la otra también aumenta
• Cuando una disminuye la otra también disminuye
• La relación entre las variables es de tipo lineal

7. Si el coeficiente de correlación entre dos variables es nulo:


• Las rectas de regresión Y sobre X y X sobre Y son paralelas
• Las rectas de regresión Y sobre X y X sobre Y son perpendiculares
• Las rectas de regresión Y sobre X y X sobre Y coinciden
• La covarianza es nula
• Las variables podrían tener una relación no lineal

8. ¿Cuál de las siguientes afirmaciones sobre el coeficiente de correlación r es cierta?


• Si r=0 las variables son independientes
• Si las variables son independientes, r=0
• r puede interpretarse como un porcentaje de la varianza
• Si la relación es funcional r=1 0 r=-1

9. ¿En qué predicción tendría más confianza?


• La predicción de la estatura a partir del peso
• La predicción del peso a partir de la estatura
• Las dos me inspiran la misma confianza

10. ¿Cuál es el valor del coeficiente de correlación, si las dos rectas de regresión tienen la misma
pendiente?
a) 0; b) 1; c) -1

11. Si X e Y tienen una correlación perfecta, ¿Cuál es el ángulo que forman las dos rectas de
regresión?
a) 120 b) 90; c) 45; d) 0

12. Una recta de regresión tiene una pendiente igual a 16 y corta al eje de ordenadas en el punto Y= 4.
Si la media de la variable independiente es 8, ¿cuál es la media de la variable dependiente?

3. Recursos en Internet

• Significado del coeficiente de


correlación:

http://www.kuleuven.ac.be/ucs/java/inde
x.htm (correlacion). Simula muestras de
pares de puntos con una correlación
dada. Permite cambiar las medias y
varianzas, para estudiar el efecto sobre
la muestra.

• Efecto de los valores atípicos sobre la recta de regresión:


http://www.stat.sc.edu/~west/javahtml
/Regression.html

Permite estudiar el efecto de cada punto


particular sobre la recta de regresión y el
coeficiente de correlación.

• Regresión:
http://www.kuleuven.ac.be/ucs/java/index.
htm

Una serie de aplets para estudiar diversos


conceptos inferenciales asociados a la
regresión: rectas de regresión muestrales,
intervalos de confianza, estimación de la pendiente y ordenada en el origen, residuos, análisis de
varianza, regresión curvilínea, etc.

También podría gustarte