Está en la página 1de 16

REPÚBLICA BOLIVARIANA DE VENEZUELA

MINISTERIO DEL PODER POPULAR PARA LA EDUCACIÓN SUPERIOR


UNIVERSIDAD NACIONAL EXPERIMENTAL “SIMÓN RODRÍGUEZ”
NÚCLEO CORO, ESTADO FALCÓN
UNIDAD CURRICULAR: ESTADÍSTICA II.

FACILITADORA: REALIZADO POR:

JAMILET ALMEDA. NOHELIANNY SEGOVIA.


CI.: 31.234.699.
ELEIDYS ROJAS.
CI.: 30.353.863.

SANTA ANA DE CORO; JUNIO DEL 2022.


ÍNDICE

Introducción………………………………………………………………………
¿Qué es correlación? Ejemplo………………………………………………...
¿Cómo se calcula la correlación?..............................................................
¿Cuáles son los tipos de correlación en estadística?................................
¿Qué es la correlación entre dos variables?..............................................
¿Qué es la correlación y regresión lineal?.................................................
Conclusión……………………………………………………………………….
Referencias bibliográficas……………………………………………………..
INTRODUCCIÓN:

La correlación subyacen en multitud de métodos estadísticos, que


generalizan la idea de dependencia funcional (Batanero, 2001). Disciplinas
como la Psicología, Sociología y la Didáctica Estadística aportan conocimiento
sobre estos tópicos, corroborando la dificultad intrínseca del ser humano en la
emisión de juicios de asociación. La importancia de estas investigaciones se
debe a que el razonamiento humano en situaciones de incertidumbre está
regido por valores y creencias del propio individuo. Por ello el procesamiento
de la información difiere de un proceso algorítmico que produce una solución
para cualquier problema, dentro de una clase dada (Batanero, 2001). La
exigencia de un diseño de enseñanza idóneo para estas nociones, no es banal,
pues observamos su limitada presencia en la normativa que regula el sistema
educativo, aunque autores, como King (2000) han tratado de inducir el
razonamiento covariacional desde la Educación Primaria.

Por otra parte, el día a día está repleto de ejemplos en los que tomamos
decisiones atendiendo al grado de asociación existente entre las variables que
consideramos influyentes. Los juicios sobre la posible asociación de variables,
acompañan al ser humano desde el comienzo de su existencia. A modo de
ejemplo podemos citar los juicios de asociación que en la civilización Egipcia se
realizaron entre la crecida del río Nilo y la periodicidad del ascenso (en igual
sentido que el Sol) de la estrella Sirio. Esta observación y su análisis, motivaron
cuestiones que dieron un avance considerable al conocimiento científico como
es la construcción de calendarios en cuanto a la medición del tiempo.

Los primeros trabajos científicos que encontramos sobre el tema proceden


de Galton (1822-1917). Según Hald (1998), Galton estudió medicina y
matemáticas en Londres y Cambridge. En 1844 murió su padre, dejándole una
inmensa fortuna que le permitió dedicar su vida a los estudios geográficos y
meteorológicos. En el periodo 1865-1890, su principal interés fueron los
estudios empíricos de las leyes de la herencia por medio de métodos
estadísticos donde, la labor investigadora desarrollada por investigadores como
Lambert-Adolphe-Jacques Quetelet (1796-1874 fueron de gran apoyo en
cuanto al desarrollo de las nociones de correlación y regresión (Hald, 1998).
Quetelet, (nacido en Ghent, Bélgica, obtuvo el doctorado en Matemáticas
con una tesis sobre secciones cónicas) fue director del observatorio
astronómico de Bruselas. En relación con la correlación sus aportaciones se
circunscriben a sus estudios sobre el hombre medio, estudiando medias y
desviaciones de medidas antropométricas, analizando la influencia de variables
independientes como el sexo, edad, profesión o nivel de educación. Relaciona
dos o más variables y llega a obtener una ecuación de una hipérbola que
relaciona la edad y la altura de las personas entre cero y 30 años. Introduce la
distribución normal en Biometría (Hald, 1998). Su originalidad es haber
considerado la dispersión y extender el uso de la ley normal (bien conocida en
Astronomía) al ajuste de medidas antropométricas, (Seal, 1967).

Otro avance consistió en el estudio conjunto de la variación de dos medias


realizado por Francis Galton, quien no conocía los refinados métodos
estadísticos de la época, debidos a Laplace y Gauss. Sin embargo, por medio
de investigaciones empíricas de las leyes de la herencia, estudia la variabilidad
de características humanas y desarrolla sus propios y rudimentarios métodos
para describir observaciones univariadas y bivariadas normalmente
distribuidas, explicando la utilidad y el significado de la correlación y regresión
no solamente en el contexto de la herencia, sino en forma general. Galton
utiliza el método de Quetelet para ajustar una distribución normal a sus datos.
Este método era muy simple, ya que, requiere solamente el cálculo de
frecuencias relativas y la interpolación en la tabla de la binomial acumulativa.
Es por ello, que en el presente trabajo se tratara sobre la Correlación (¿Qué
es? Ejemplo, ¿Qué es la correlación entre dos variables? ¿Cómo se calcula la
correlación? ¿Qué es la correlación y regresión lineal? ¿Cuáles son los tipos de
correlación en estadística?
1. ¿QUÉ ES CORRELACIÓN? EJEMPLO.

La correlación se refiere a una relación estadística entre dos cantidades. El


coeficiente de correlación a menudo se conoce con el nombre de "coeficiente
de correlación del producto-momento de Pearson", en honor a su descubridor
Karl Pearson. En general, un coeficiente de correlación superior a 0,8 (ya sea
positivo o negativo) representa una correlación fuerte, mientras que un
coeficiente inferior a 0,5 (una vez más, positivo o negativo) representa una
correlación débil. Por lo cual, el coeficiente de correlación es solo un número
que puedes calcular para cualquier par de conjuntos de puntos de datos. Este
número siempre estará entre -1 y +1 e indica qué tan estrechamente
conectados tienden a estar dos conjuntos de datos.
 Por ejemplo, si se midiera las estaturas y edades de niños de hasta 12
años de edad aproximadamente, sería esperable encontrar una fuerte
correlación positiva. A medida que los niños van creciendo, tienden a
aumentar su estatura.
 Un ejemplo de correlación negativa se podría obtener comparando el
tiempo que una persona dedica a practicar golf y la relación con el
puntaje que obtiene. A medida que la práctica aumenta, el puntaje debe
disminuir.
 Finalmente, podría esperarse una correlación muy baja (ya sea positiva
o negativa) entre el tamaño de zapatos de una persona y las
calificaciones que esa persona obtiene en la escuela, por ejemplo.

Por otra parte, en las correlaciones es importante tener presente la media


aritmética, o "promedio", ya que, de un conjunto de datos se calcula sumando
todos los valores de datos y luego dividiendo entre la cantidad de valores que
hay en ese conjunto de datos. Cuando se encuentre el coeficiente de
correlación de los datos, se tendrá que calcular la media de cada conjunto de
datos.
 La media de una variable se representa colocando una línea horizontal
sobre esa variable. A menudo, a la media de los conjuntos de datos
de x y y, se le dice "x barra" o "y barra" respectivamente. Otra notación
diferente para la media, es la letra griega mu en minúscula μ. Para
indicar que se trata de la media de los puntos de datos de x, por
ejemplo, puedes escribir μx or μ(x).
 Como ejemplo, si se tiene el conjunto de puntos de datos
de x (1,2,5,6,9,10), entonces la media de este conjunto se calcula de la
siguiente manera:



Al igual, es importante tener en cuenta la importancia de la desviación


estándar. En estadística, la desviación estándar mide la variación, mostrando
qué tan dispersos están los números en relación a la media. Si un conjunto de
números tiene una desviación estándar relativamente baja, significa que están
bastante agrupados. Si un conjunto de números tiene una desviación estándar
relativamente alta, significa que están ampliamente dispersos.
 Simbólicamente, la desviación estándar se expresa con la letra s
minúscula o con la letra griega sigma en minúscula, σ. Por lo tanto, la
desviación estándar de los datos de x, se puede escribir como sx o σx.

¿CÓMO SE MIDE LA CORRELACIÓN?

El coeficiente de correlación de la muestra, r, cuantifica la intensidad de la


relación. Las correlaciones también se someten a pruebas para establecer su
significancia estadística.

¿CUÁLES SON ALGUNAS LIMITACIONES DEL ANÁLISIS DE


CORRELACIÓN?

La correlación no puede medir la presencia o el efecto de otras variables


aparte de las dos que se están explorando. Es importante saber que la
correlación no nos informa sobre causas y efectos. Además, la correlación no
puede describir con precisión las relaciones curvilíneas.
2. ¿CÓMO SE CALCULA LA CORRELACIÓN?

El coeficiente de correlación, que se expresa con la letra r o ρ, es la medida


de la correlación lineal (relación, en términos de fuerza y dirección) entre dos
variables. Varía entre -1 y +1, y el signo (+,-) se usa para indicar si la relación
es positiva o negativa. Si el coeficiente de correlación es exactamente -1,
entonces la relación entre las dos variables es una correlación negativa
perfecta.

Si el coeficiente de correlación es exactamente +1, entonces la relación es


una correlación positiva perfecta. Las variables también pueden tener una
correlación positiva (valores entre 0 y 1), una correlación negativa (valores
entre -1 y 0) o directamente no tener correlación (0).

1. Se Reúnen los datos. Para comenzar a calcular el coeficiente de


correlación, primero se debe examinar los pares de datos.
Generalmente, es útil ponerlos en una tabla, ya sea vertical u horizontal.
Etiqueta cada fila o columna con x o y .
 Por ejemplo, supón que hay cuatro pares de datos para x y y.
 x || y
 1 || 1
 2 || 3
 4 || 5
 5 || 7

2. Se Calcula la media de x. Para calcular la media, se debe sumar todos


los valores de x y luego dividir entre la cantidad de valores.
 En el ejemplo anterior, se tiene cuatro valores para x. Para
calcular la media, se suman todos los valores dados para x y luego
divide el resultado entre 4.




3. Encontrar la media de y. Para encontrar la media de y, se deberá
seguir los mismos pasos, sumando los valores de y, y luego dividiendo
entre la cantidad de valores.
 En el ejemplo anterior, también había cuatro valores para y. se suman
todos y se divide el resultado entre 4.



4. Determinar la desviación estándar de x. Una vez que se tenga el valor
de las medias, ya se puede calcular la desviación estándar. Para
hacerlo, usa la siguiente fórmula:

 Con los datos del ejemplo, los cálculos deberán quedar así:



5. Se Calcula la desviación estándar de y. Usando los mismos pasos
básicos, se busca la desviación estándar de y. La fórmula es la misma,
solo que ahora se tiene que reemplazar los valores por los puntos de y.
 Con los datos del ejemplo, los cálculos deberán quedar así:



6. Revisa la fórmula básica para hallar el coeficiente de correlación. La
fórmula para calcular un coeficiente de correlación utiliza medias,
desviaciones estándar y la cantidad de pares del conjunto de datos (que
se representa a través de la letra n). El coeficiente de correlación en sí,
se representa con una letra r minúscula o con la letra griega rho
minúscula, ρ. En este caso se usará la fórmula que se conoce con el
nombre de "Coeficiente de correlación de Pearson", que es la que se
muestra a continuación:

 Es posible que se encuentre leves variaciones de la fórmula, aquí o en


otros textos. Por ejemplo, algunos usan la notación griega con rho y
sigma, mientras que otros usan r y s. Algunos textos pueden mostrar
fórmulas con pequeñas diferencias, pero matemáticamente son todas
equivalentes a esta.

7. Se Encuentra el coeficiente de correlación. Ahora que se tiene las


medias y las desviaciones estándar de las variables se puede proceder
a utilizar la fórmula del coeficiente de correlación. Recordando que n
representa la cantidad de valores que se tienen. En los pasos anteriores,
ya obtuvieron los demás datos importantes que se necesitan.
 Usando los datos del ejemplo, ahora debes reemplazar los valores en la
fórmula del coeficiente de correlación y hacer los siguientes cálculos:

8. Se Interpretan los resultados. Para este conjunto de datos, el


coeficiente de correlación es de 0,988. Este número indica dos cosas
acerca de los datos. Se observa el signo del número y su tamaño.
 Debido a que el coeficiente de correlación es positivo, se puede afirmar
que hay una correlación positiva entre los datos de x y los datos de y.
Esto quiere decir que a medida que se incrementan los valores de x,
también se incrementan los valores de y.
 Debido a que el coeficiente de correlación es un valor muy cercano a +1,
los datos de x y los datos de y están estrechamente relacionados.
3. ¿CUÁLES SON LOS TIPOS DE CORRELACIÓN EN ESTADÍSTICA?

CORRELACIÓN POSITIVA: Ocurre


cuando una variable aumenta y la otra
también. Por ejemplo, la altura de una
persona y el tamaño de su pie; mientras
aumenta la altura, el pie también. La recta
correspondiente a la nube de puntos de la
distribución es una recta creciente.

CORRELACIÓN NEGATIVA: Es
cuando una variable aumenta y la otra
disminuye. El tiempo de estudio y el tiempo
que pasas jugando videojuegos, tienen una
correlación negativa, ya que cuando tu
tiempo de estudio aumenta, no te queda
tanto tiempo para jugar videojuegos. La
recta correspondiente a la nube de puntos
de la distribución es una recta decreciente.

CORRELACIÓN NULA: No hay una relación aparente entre las variables.


Es decir, que la correlación nula se da cuando no hay dependencia de ningún
tipo entre las variables. En este caso se dice que las variables son incorreladas
y la nube de puntos tiene una forma redondeada. Los puntos en los
videojuegos y tu talla de zapato no parece tener ninguna correlación; mientras
un aumenta, la otra no tiene ningún efecto.

4. ¿QUÉ ES LA CORRELACIÓN ENTRE DOS VARIABLES?

La correlación es una medida de la relación (co-variación) lineal entre


dos variables cuantitativas continuas (x, y). La manera más sencilla de
saber si dos variables está correlacionadas es determinar si co-varían (varían
conjuntamente). Es importante hacer notar que esta co-variación no implica
necesariamente causalidad, la correlación puede ser fortuita, como en el caso
clásico de la correlación entre el número de venta de helados e incendios,
debido al efecto de una tercera variable, la temperatura ambiental.

La correlación es en esencia una medida normalizada de asociación o


variación lineal entre dos variables. Esta medida o índice de
correlación r puede variar entre -1 y +1, ambos extremos indicando
correlaciones perfectas, negativas y positivas respectivamente. Un valor de rr =
0 indica que no existe relación lineal entre las dos variables. Una correlación
positiva indica que ambas variables varían en el mismo sentido. Una
correlación negativa significa que ambas variables varían en sentidos opuestos.
La siguiente figura muestra ejemplos de pares de variables con correlación
positiva moderada, negativa fuerte, así como correlación despreciable.
5. ¿QUÉ ES LA CORRELACIÓN Y REGRESIÓN LINEAL?

La correlación cuantifica como de relacionadas están dos variables,


mientras que la regresión lineal consiste en generar una ecuación (modelo)
que, basándose en la relación existente entre ambas variables, permita
predecir el valor de una a partir de la otra. El cálculo de la correlación entre dos
variables es independiente del orden o asignación de cada variable a \(X\) e
\(Y\), mide únicamente la relación entre ambas sin considerar dependencias.
En el caso de la regresión lineal, el modelo varía según qué variable se
considere dependiente de la otra (lo cual no implica causa-efecto).

A nivel experimental, la correlación se suele emplear cuando ninguna de


las variables se ha controlado, simplemente se han medido ambas y se desea
saber si están relacionadas. En el caso de estudios de regresión lineal, es más
común que una de las variables se controle (tiempo, concentración de reactivo,
temperatura…) y se mida la otra. Por norma general, los estudios de
correlación lineal preceden a la generación de modelos de regresión lineal.
Primero se analiza si ambas variables están correlacionadas y, en caso de
estarlo, se procede a generar el modelo de regresión.

De cara a medir de alguna manera cómo ser relacionan entre sí dos


variables (por ejemplo, X e Y) es importante en primera instancia partir del
concepto de co-variación. La co-variación entre dos variables hace referencia a
la medida en que la variabilidad de los valores de X tiende a estar aparejada en
cierto sentido o tendencia con la variabilidad de los valores de Y.

De la manera que mejor se entiende la co-variación entre dos variables es


representando dicha relación en un eje de coordenadas. Pongamos unos
supuestos valores de X en el eje de abscisas y sus correspondientes de Y en la
ordenada. Por ejemplo, midamos de 0 a 10 el nivel de competencia auto
percibida (X) por una muestra de 10 sujetos para superar una asignatura y la
nota obtenida en la misma (Y).
Por lo cual, la recta de regresión no sólo permite formalizar la relación entre
las variables estudiadas asignándole un referente gráfico sino que, lo que es
casi más importante, permite predecir valores de Y a partir de valores de X que
no se encuentran inicialmente en la muestra de partida. A este respecto, sin
embargo, conviene apuntar la conveniencia de no estimar valores de X fuera
del rango de medida sobre la que ha versado la muestra original ya que lo que
en principio puede ser una relación de tipo lineal puede no serlo cuando se
exploran medidas de X fuera (hacia arriba o abajo) del rango en un principio
contemplado.

Pues bien, la recta de regresión constituye la recta que mejor representa la


nube de puntos representados en la gráfica del modo como hemos hecho
antes. Dicha recta puede estimarse por diversos procedimientos siendo la
intención identificar, de las infinitas rectas que pudieran pintarse, aquélla que
ajuste mejor con esta nube de puntos empírica. Con otras palabras, aquélla
recta respecto a la cual las distancias de los numerosos puntos respecto a la
misma sea mínima.

El procedimiento más utilizado y que comporta menor sesgo es el de


mínimos cuadrados. Consiste en hacer mínima la distancia de los variados
puntos de la nube respecto a los puntos que se encuentran en la recta, esto es,
que la definen.
CONCLUSIÓN:

La correlación es una medida estadística que expresa hasta qué punto dos
variables están relacionadas linealmente (esto es, cambian conjuntamente a
una tasa constante). Es una herramienta común para describir relaciones
simples sin hacer afirmaciones sobre causa y efecto.

Estas relaciones funcionales en las que las variables son medidas como
mínimo en escala de intervalo, pueden presentar dos sentidos diferentes. Si a
medida que aumentan, crecen o se hacen mayores los valores de X se produce
un incremento en los de Y la correlación es positiva; si por el contrario, valores
altos en Y se asocian con valores bajos en X y bajos en Y con altos en X la
correlación es de tipo negativo. Por ejemplo, sería el caso de observar menor
rendimiento en un examen cuanto más tiempo pasan los alumnos distraídos en
una clase: A más distracción (X), menos rendimiento (Y), es decir, a mayores
valores de X, menores son los de Y.

En el estudio de las correlaciones la asociación entre dos variables puede


manifestar diferentes grados. Cuanto mayormente estén asociadas X e Y
mayor será su correlación (positiva o negativa), mayor la fuerza en que se
encuentran ligadas. Cuando la correlación es perfecta se dice entonces que X
e Y se encuentran al 100% asociadas, es decir, comparten al máximo sus
variaciones y que la información suministrada por una de ellas informa
cabalmente de las variaciones que manifiesta la otra. Este tipo de relaciones
perfectas son propias de variables físicas, por ejemplo, la relación entre el
volumen y la presión (a determinados valores de volumen le corresponden
unos determinados y específicos valores de presión) o la del voltaje y la
corriente en un circuito eléctrico con resistencia constante.
Referencias Bibliográficas

Estepa, A. y Gea, M. M. (2010). El ori gen de la noción de correlación y la


enseñanza. En J. Berral, M. de la Fuente y España, F. (Eds.) Actas al XIII
Congreso de Enseñanza y Aprendizaje de las Matemáticas, (pp. 202-212).
Córdoba: Sociedad Matemática Andaluza de Educación Matemática Thales.

Estepa, A. y Gea, M. M. (2012). Conocimiento para la enseñanza de la


asociación estadística. En J. J. Ortiz (Ed.), Investigaciones actuales en
educación stadística y formación de profesores (pp. 23-40). Melilla:
Departamento de Didáctica de la Matemática. Facultad de Educación y
Humanidades. Universidad de Granada.

Gea, M., Contreras, J. M., Cañadas, G. y Arteaga, P. (2012).


Comprendiendo la correlación a partir de sus representaciones. XIV Congreso
sobre Enseñanza y Aprendizaje de las Matemáticas: "Diversidad y
Matemáticas". Thales. Málaga. 2012.

También podría gustarte