Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PLAN DE INVESTIGACIÓN
AUDITORÍA INTERNA
SALON: 211
EDIFICIO: S-12
INTEGRANTES
Nombre Carnet
Lurdes Mishell Macario Roca 200921295
Sheila Merarí Santay Campos 201011012
Pedro Tocay Monroy 201111228
Miguel Suy Méndez 201111664
Vivian Karina Macario Roca 201119888
Cindi Regina López Ramírez 201120023
Ana Cristina Juárez Cuyún 201214841
Yojana Betzaly Sapón Coyoy 201214869
Gabriela Mariel Reneau Pastor 201214916
Contenido Pág.
INTRODUCCIÓN................................................................................................................................... i
JUSTIFICACION ...................................................................................................................................1
PLANTEAMIENTO DEL PROBLEMA DEFINICION DEL PROBLEMA........................................................1
Tema: ............................................................................................................................................1
Planteamiento del problema. .......................................................................................................1
MARCO TEORICO................................................................................................................................2
1. REGRESIÓN Y CORRELACIÓN ........................................................................................2
REGRESIÓN................................................................................................................................2
CORRELACIÓN .........................................................................................................................4
CORRELACIÒN VALOR O RANGO ......................................................................................6
DISTRIBUCIÒN DIVARIANTE................................................................................................6
DEFINICIÒN: ..............................................................................................................................6
HIPOTESIS...........................................................................................................................................7
OBJETIVOS..........................................................................................................................................7
Objetivo General ..........................................................................................................................7
Objetivos Específicos ...................................................................................................................7
METODOS Y TECNICAS A EMPLEAR ....................................................................................................8
Métodos.........................................................................................................................................8
Técnicas.........................................................................................................................................9
BIBLIOGRAFÍA...................................................................................................................................10
i
INTRODUCCIÓN
El plan pretende preestablecer las bases para desarrollar la investigación sobre regresión y
correlación y elaboración del informe final.
JUSTIFICACION
Tema:
Regresión y correlación
MARCO TEORICO
1. REGRESIÓN Y CORRELACIÓN
Definición:
REGRESIÓN
El análisis de regresión es ampliamente utilizado para la predicción y previsión, donde su
uso tiene superposición sustancial en el campo de aprendizaje automático. El análisis de
regresión se utiliza también para comprender cuales de las variables independientes están
relacionadas con la variable dependiente, y explorar las formas de estas relaciones. En
circunstancias limitadas, el análisis de regresión puede utilizarse para inferir relaciones
causales entre las variables independientes y dependientes. Sin embargo, esto puede llevar a
ilusiones o relaciones falsas, por lo que se recomienda precaución, por ejemplo, la correlación
no implica causalidad.
La regresión como una técnica estadística, una de ellas la regresión lineal simple y la
regresión multifactorial, analiza la relación de dos o más variables continuas, cuando analiza
las dos variables a esta se le conoce como variable bivariantes que pueden corresponder a
variables cualitativas, la regresión nos permite el cambio en una de las variables llamadas
respuesta y que corresponde a otra conocida como variable explicativa, la regresión es una
técnica utilizada para inferir datos a partir de otros y hallar una respuesta de lo que puede
suceder.
Siendo así la regresión una técnica estadística, por lo tanto, para interpretar situaciones reales,
pero a veces se manipula de mala manera por lo que es necesario realizar una selección
adecuada de las variables que van a construir las formulas matemática, que representen a la
3
regresión, por eso hay que tomar en cuenta variables que tiene relación, de lo contraria se
estaría matematizando un galimatías.
3. Regresión logística
La regresión lineal técnica que usa variables aleatorias, continuas se diferencia del otro
método analítico que es la correlación, porque esta última no distingue entre las variables
respuesta y la variable explicativa por que las trata en forma simétrica.
La matematización nos da ecuaciones para manipular los datos, como por ejemplo medir la
circunferencia de los niños y niñas y que parece incrementarse entre las edades de 2 meses y
18 años, aquí podemos inferir o predecir que la circunferencia del cráneo cambiara con la
edad, en este ejercicio la circunferencia de la cabeza es la respuesta y la edad la variable
explicativa.
En la regresión tenemos ecuaciones que nos representan las diferentes clases de regresión:
Regresión Lineal: y = A + Bx
Para obtener un modelo de regresión es suficiente establecer la regresión para eso se hace
uso del coeficiente de correlación: R.
R = Coeficiente de correlación, este método mide el grado de relación existente entre dos variables,
el valor de R varía de -1 a 1, pero en la práctica se traba con un valor absoluto de R.
4
El valor del coeficiente de relación se interpreta de modo que a media que R se aproxima a
1, es más grande la relación entre los datos, por lo tanto, R (coeficiente de correlación) mide
la aproximación entre las variables.
CORRELACIÓN
La correlación es la forma numérica en la que la estadística ha podido evaluar la relación de
dos o más variables, es decir, mide la dependencia de una variable con respecto de otra
variable independiente.
Donde los puntos representan cada uno de los pares ordenados y la línea podría ser una recta
que represente la tendencia de los datos, que en otras palabras podría decirse que se observa
que a mayor edad mayor peso.
La correlación se puede explicar con la pendiente de esa recta estimada y de esta forma nos
podemos dar cuenta que también existe el caso en el que al crecer la variable independiente
decrezca la variable dependiente.
Ejemplo:
Se debe aclarar que el coeficiente de correlación sólo puede variar de la siguiente manera:
y que para entenderlo mejor se debe obtener el coeficiente de determinación que se obtiene
con “r “cuadrada, ya que este representa el porcentaje que se explica “y” mediante los datos
de “x”.
En nuestro ejemplo decimos que la correlación es casi perfecta, ya que, está muy cerca de 1
y que el porcentaje de datos que explican a “y “es (0.65638606)2= 0.430842 o sea el 43.08
%
Primero tendremos que pensar que se genera una matriz, ya que, ahora estamos juntando dos
tablas de distribución de frecuencias y por ello nuestros cálculos serán más laboriosos, por lo
que les recomiendo el uso de una hoja de cálculo o al menos una calculadora con regresión
para datos agrupados.
De cualquier forma, aquí también estamos evaluando numéricamente si existe relación entre
dos variables y lo haremos con la siguiente ecuación.
En donde podemos encontrar k como el número de clases para la variable "y" y l para el
número de clases de "x".
También podemos observar que hay varios tipos de "f" es decir, la que se encuentra sola (sin
subíndice) que nos habla de las frecuencias celdares (cada una de las frecuencias que se
encuentran en la intersección entre una columna y un renglón) y las "f" con subíndices que
representan las frecuencias de cada una de las variables.
6
1) Perfecta 1) R = 1
DISTRIBUCIÒN DIVARIANTE
DEFINICIÒN:
La distribución diváriate es cuando se estudia en una población dos variables, que forman
pares correspondientes a cada individuo, como, por ejemplo:
BIOLOGIA 2 4 5 5 6 6 7 7 8 9
LENGUAJE 2 2 5 5 5 7 5 8 7 10
Los pares de valores son: (2, 2) (4,2) (5,5) ……. (8,7) (9,10) forman una distribución
diváriate.
La correlación, método por el cual se relacionan dos variables se pude graficar con un
diagrama de dispersión de puntos, a la cual muchos autores le llaman nubes de puntos,
encuadrado dentro de un gráfico de coordenadas X Y en la cual se pude trazar una recta y
cuyos puntos más cercanos de una recta hablaran de una correlación más fuerte, ha esta recta
7
se le denomina recta de regresión, que puede ser positiva o negativa, la primera contundencia
a aumentar y la segunda en descenso o decreciente.
19
HIPOTESIS
OBJETIVOS
Objetivo General
Investigar por medio del método científico, aplicando técnicas como la observación
y la investigación documental sobre métodos aplicables a la regresión y correlación.
Explicar por medio de casos prácticos los conocimientos adquiridos y la forma
correcta de utilizar las regresión y correlación.
Objetivos Específicos
Establecer por medio de una investigación documental cual es la teoría de regresión
y correlación más acertada y útil.
Investigar mediante la observación documental cual es el marco técnico que se aplica
a las regresión y correlación.
Verificar mediante la observación y análisis de un caso práctico que proporcione los
procedimientos aplicables a las regresión y correlación.
8
Introducción
Regresión
Correlación
Correlación, valor o rango
Distribución Divariante
Casos Prácticos
Conclusiones
Recomendaciones
Bibliografía
Métodos
a) Método científico: Se aplicará el método científico en sus tres fases:
Técnicas
Las técnicas a utilizar se aplicarán para la recolección de la información según sea su origen,
(internet, Documentos físicos).
c) Análisis de Contenido: Ésta técnica forma parte del trabajo que se realiza y permitirá
ampliar la investigación, apoyando los diferentes contenidos que se obtengan de la
investigación documental.
10
BIBLIOGRAFÍA