Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Diagrama de dispersión.
Un diagrama de dispersión o gráfica de dispersión o gráfico de burbujas es un tipo de
diagrama matemático que utiliza las coordenadas cartesianas para mostrar los valores de
dos variables para un conjunto de dato. En algunos casos el diagrama de dispersión puede
sugerir varios tipos de correlaciones entre las variables con un intervalo de confianza
determinado.
La correlación puede ser positiva (aumento), negativa (descenso), o nula (las variables no
están correlacionadas). Se puede dibujar una línea de ajuste (llamada también "línea de
tendencia") con el fin de estudiar la correlación entre las variables. Una ecuación para la
correlación entre las variables puede ser determinada por procedimientos de ajuste. Para
una correlación lineal, el procedimiento de ajuste es conocido como regresión lineal y
garantiza una solución correcta en un tiempo finito.
Ejemplo
Correlación lineal simple.
El coeficiente de correlación lineal es una medida de regresión que sirve para establecer
una relación lineal entre dos variables. De esta manera, su cálculo permite conocer con
exactitud el grado de dispersión de los valores de una variable en relación con una media
para dicha variable.
Ejemplo: Por ejemplo, si se analiza la estatura y el peso de los alumnos de una clase es muy
posible que exista relación entre ambas variables: mientras más alto sea el alumno, mayor
será su peso. El coeficiente de correlación lineal mide el grado de intensidad de esta posible
relación entre las variables. Este coeficiente se aplica cuando la relación que puede existir
entre las variables es lineal (es decir, si representáramos en un gráfico los pares de valores
de las dos variables la nube de puntos se aproximaría a una recta).
puede que exista una relación que no sea lineal, sino exponencial, parabólica, etc. En estos
casos, el coeficiente de correlación lineal mediría mal la intensidad de la relación las
variables, por lo que convendría utilizar otro tipo de coeficiente más apropiado.
La colinialidad ocurre cuando un predictor está linealmente relacionado con uno o varios de
los otros predictores del modelo o cuando es la combinación lineal de otros predictores.
Como consecuencia de la colinialidad no se puede identificar de forma precisa el efecto
individual que tiene cada una de las variables colineales sobre la variable respuesta, lo que
se traduce en un incremento de la varianza de los coeficientes de regresión estimados hasta
el punto de que resulta prácticamente imposible establecer su significancia estadística.
Sin embargo, la predicción de una variable (Y) a partir del conocimiento de otra única
puede resultar un análisis extremadamente simple de la realidad en la cual existen múltiples
factores que afectan a cualquier fenómeno que pretenda explicarse. En Psicología diremos
que la conducta de los sujetos, en sus diversas manifestaciones, constituye función de
múltiples variables que la condicionan y/o determinan. Por ejemplo, el comportamiento de
un sujeto en una situación conflictiva puede depender de su temperamento, del nivel de
conflictividad de la situación, de su experiencia en situaciones de este tipo por las que haya
pasado previamente, etc... Es importante, pues, estudiar con un modelo de análisis más
complejo que el de la regresión simple, de qué manera se producen estas relaciones entre la
conducta y una serie más o menos numerosa de factores que la condicionan. El modelo de
la regresión múltiple va a permitirnos acometer esta tarea
En un gráfico, la bondad del ajuste mide la distancia entre una línea ajustada y todos los
puntos de datos que están dispersos en el diagrama. El conjunto de datos ajustado tendrá
una línea de regresión que se acerca a los puntos y tiene un alto nivel de ajuste, lo que
significa que la distancia entre la línea y los datos es pequeña. Aunque un buen ajuste tiene
un R2 cercano a 1,0, este número por sí solo no puede determinar si los puntos de datos o
las predicciones están sesgados. Tampoco indica a los analistas si el valor del coeficiente de
determinación es intrínsecamente bueno o malo. Queda a discreción del usuario evaluar el
significado de esta correlación, y cómo puede aplicarse en el contexto de futuros análisis de
tendencias.
Si los sujetos más altos pesan más y los más bajitos pesan menos, entre peso y altura
tendremos una correlación positiva: a mayor altura, mayor peso. Si los de más edad corren
más despacio y los más jóvenes corren más deprisa, entre edad y velocidad tendremos una
correlación negativa; a mayor edad, menor velocidad.
En esta actividad cada estudiante deberá resolver un ejercicio de los que aparecen a continuación;
posterior a ello compartirá su elección en el foro del entorno de Aprendizaje Foro de discusión
Unidad 3- Paso 4 Descripción de la Información. En cada ejercicio deberá responder los siguientes
interrogantes:
Biomasa-Pureza.
El rendimiento del producto de un proceso químico está relacionado con la temperatura de
operación del proceso. Se desea establecer la relación que existe entre la pureza (Y) del
acetato de octilo producido y el porcentaje de biomasa (x) que está presente en el
condensador principal en un proceso de destilación, de acuerdo con los siguientes datos:
90
85
Series2
80 Linear (Series2)
75
70
0.8 0.9 1 1.1 1.2 1.3 1.4 1.5 1.6 1.7
X (g. de Biomasavegetal)
Con el anterior gráfico, podemos corroborar que si existe una correlación entre las dos
variables evaluadas. También se observa que existe una correlación con dirección positiva,
Así mismo, la línea de tendencia, que representa la correlación línea entre las variables nos
esta indicando que la fuerza o intensidad de la correlación es fuerte.
El modelo matemático que permite predecir el efecto de una variable sobre la otra es Y= a+
bxpara este caso se tiene que
Y= mx+b
Y = 12,207*x + 76,501
95
f(x) = 12.2 x + 76.5
90
85
80
75
70
0.8 0.9 1 1.1 1.2 1.3 1.4 1.5 1.6 1.7
Esto nos permite predecir el efecto de una variable sobre la otra, teniendo en cuenta que
R2= 0,49 no es tan cercano a 1 se puede determinar que es medianamente confiable
En el siguiente gráfico, podemos corroborar que si existe una correlación entre las dos
variables evaluadas. También se observa que existe una correlación dirección positiva, Así
mismo, la línea de tendencia, que representa la correlación lineal entre las variables nos esta
indicando que la fuerza o intensidad de la correlación es media.
Diagrama de dispercion para las variables
4.50
4.00
3.50
3.00
2.50
2.00
1.50
1.00
0.50
-
24 26 28 30 32 34 36 38 40 42 44
El modelo matemático que permite predecir el efecto de una variable sobre la otra es Y= a+
bx para este caso se tiene que
Y= mx+b
Y = 0,16*x + 3,0
Chart Title
4.50
4.00
3.50
3.00
2.50
2.00
1.50
1.00
0.50
-
24 26 28 30 32 34 36 38 40 42 44
TIEMPO DE GESTACIÓN DE LA
PESO RECIEN
MADRE AL TENER EL BEBÉ Y=m*x+b
NACIDO (en kg)
( semanas)
Descripción de la Actividad:
A partir de la base de datos suministrada Anexo 1. Caracterización del embarazo
adolescente, en el Departamento de Caldas entre el año 2014 y 2021, cada estudiante
deberá:
En el siguiente gráfico, podemos corroborar que si existe una correlación entre las dos
variables evaluadas. También se observa que existe una correlación dirección positiva, Así
mismo, la línea de tendencia, que representa la correlación lineal entre las variables nos esta
indicando que la fuerza o intensidad de la correlación es media.
Coef correlación para las variables edad de las madres y sobre talla de recién
nacido r = 0,18
El coeficiente de correlación nos esta indicando que no existe una correlación fuerte entre
las variables, en otras palabras, el efecto de la variable dependiente no esta influenciado por
la variable independiente.
Interpretando los resultados al caso, el coeficiente de correlación r= 0,18 esta indicando que
la variable que la talla de los recién nacidos, no esta fuertemente relacionada con la edad de
la madre.
El coeficiente de correlación nos está indicando que existe una correlación media entre las
variables, en otras palabras, el efecto de la variable dependiente esta medianamente
influenciado por la variable independiente.
Interpretando los resultados al caso, el coeficiente de correlación r= 0,50 está indicando que
la variable edad de inicio de relaciones sexuales, esta medianamente influenciado o
relacionada con la edad de la madre.
50
f(x) = 0.254813328324832 x + 45.722056560757
40
30
20
0
12 13 14 15 16 17 18 19
¿Cuál sería el tallaje de un bebe recién nacido si la madre tiene una edad de 25
años?
Para este caso hacemos uso de la formula
Y= mx+b
Y= (0,25* 25) + 45,722
Y = 51.9
Lo anterior significa que la probabilidad de talla de un bebe recién nacido si la madre tiene
una edad de 25 años puede ser de 51.9 cm
Bibliografía