Está en la página 1de 9

Regresión

Marco teórico
La regresión consiste en la búsqueda de una “función” que exprese lo mejor
posible el tipo de relación entre dos o más variables, una variable dependiente y,
las variables independientes x, y un término aleatorio
 Regresión lineal simple: solo se maneja una variable independiente por lo
que solo cuenta con dos parámetros.
 Regresión lineal múltiple: permite trabajar con una variable a nivel de
intervalo o razón así también se puede comprender la relación entre dos o
más variables, permitirá relacionar mediante ecuaciones una variable en
relación a otra variable.
 Recta de regresión : se ajustan a la nube de puntos o también llamados
diagramas de dispersión generada por una distribución binomial

Para cumplir los objetivos, el primer paso que debe realizar, es representar las
observaciones de ambas variables en un gráfico llamado diagrama de dispersión o
nube de puntos. A partir de esta representación el investigador puede especificar
la forma funcional de la función de regresión.

A menudo se supone que la relación que guardan la variable dependiente y las


independientes es lineal. En estos casos, se utlizan los modelos de regresión
lineal. Aunque las relaciones lineales aparecen de forma frecuente, también es
posible considerar otro tipo de relación entre las variables, que se modelizan
mediante otros modelos de regresión, como pueden ser el modelo de regresión
cuadrático o parabólico o el modelo de regresión hiperbólico.
Teoría de la regresión: consiste en la búsqueda de una “función” que exprese lo
mejor posible el tipo de relación entre dos o más variables.

Objetivos

 Determinar una función matemática sencilla que describa el


comportamiento de una variable dados los valores de otra u otras variables
 Pretende estudiar y explicar el comportamiento de una variable que
notamos y, y que llamaremos variable explicada, variable dependiente o variable
de interés, a partir de otra variable, que notamos x, y que llamamos variable
explicativa, variable independiente o variable de predicción.
 Encontrar la función que mejor explique la relación entre la variable
dependiente y las independientes.

TIPOS DE REGRESION
Regresion Lineal

Objetivos de aprendizaje

 Saber construir un modelo de regresión lineal simple que describa como


influye una variable X sobre otra variable Y
 Saber obtener estimaciones puntuales de los parámetros de dicho modelo
 Saber construir intervalos de confianza y resolver contrastes sobre dichos
parámetros
 Saber estimar el valor promedio de Y para un valor de X
 Saber predecir futuros de la variable respuesta, Y

CUARTILES

Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en
cuatro partes porcentualmente iguales.
Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es
precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del
cual queda un cuarto (25%) de todos los valores de la sucesión (ordenada); el
tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas
partes (75%) de los datos.
Datos Agrupados

Como los cuartiles adquieren su mayor importancia cuando contamos un número


grande de datos y tenemos en cuenta que en estos casos generalmente los datos
son resumidos en una tabla de frecuencia. La fórmula para el cálculo de los
cuartiles cuando se trata de datos agrupados es la siguiente:
k= 1,2,3
Donde:
Lk = Límite real inferior de la clase del cuartil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k.
fk = Frecuencia de la clase del cuartil k
c = Longitud del intervalo de la clase del cuartil k
Si se desea calcular cada cuartil individualmente, mediante otra fórmula se tiene lo
siguiente:
 El primer cuartil Q1, es el menor valor que es mayor que una cuarta parte
de los datos; es decir, aquel valor de la variable que supera 25% de las
observaciones y es superado por el 75% de las observaciones.
Fórmula de Q1, para series de Datos agrupados:

Donde:
L1 = limite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase
 El segundo cuartil Q2, (coincide, es idéntico o similar a la mediana, Q2 =
Md), es el menor valor que es mayor que la mitad de los datos, es decir el 50%
de las observaciones son mayores que la mediana y el 50% son menores.

Fórmula de Q2, para series de Datos agrupados:

Donde:
L1 = limite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase
 El tercer cuartil Q3, es el menor valor que es mayor que tres cuartas partes
de los datos, es decir aquel valor de la variable que supera al 75% y es
superado por el 25% de las observaciones.

Fórmula de Q3, para series de Datos agrupados:

Donde:
L1 = limite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase.
Otra manera de verlo es partir de que todas las medidas no son sino casos
particulares del percentil, ya que el primer cuartil es el 25% percentil y el tercer
cuartil 75% percentil.
Para Datos No Agrupados
Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las
siguientes fórmulas:
- El primer cuartil:
Cuando n es par:

Cuando n es impar:

 Para el tercer cuartil

Cuando n es par:

Cuando n es impar:
EJERCICIOS DE CUARTILES

Ejercicio 1

Encuentra los tres cuartiles de la siguiente Tabla de frecuencias que muestra el


tiempo de servicio de trabajadores de la empresa ABC.

Solución:
Completamos la tabla hallando F:

Encontramos las clase cuartil y la pintamos


Cuartil 1:

Respuesta: El 25% de empleados tiene 12,7 años de servicio o menos.

Cuartil 2:

Respuesta: El 50% de empleados tiene 21,7 años de servicio o menos.

Cuartil 3:

Respuesta: El 75% de empleados tiene 27,8 años de servicio o menos.


Ejercicio 2

Sea un conjunto de la edad de los veinte integrantes (N=20) de un club.


Supongamos que el conjunto está ordenado:

Primer cuartil

El primer cuartil será el sujeto (N+1)/4=21/4=5,25. Como es decimal, el


cuartil será un número entre el X5=28 y X6=29.

El número decimal es el 5,25, por lo que i=5 y d=0,25. El cuartil 1 es:

Segundo cuartil

El segundo cuartil es la mediana. Al ser un conjunto con un número par de


elementos, el cuartil es la media de los sujetos N/2=20/2=10 y N/2+1=20/2+1=11.

Es decir, será la media de X10=34 y X6=37.

Tercer cuartil

El tercer cuartil es el sujeto 3(N+1)/4=63/4=15,75. Como el número es


decimal, el cuartil estará entre X15=52 y X16=53.

El número decimal es el 15,75, por lo que i=15 y d=0,75. El cuartil 3 es:


Ejercicio 3

Calcular los tres cuartiles de la distribución de datos agrupados reflejados en


esta tabla:

Solución:
Se calculan las posiciones de los tres cuartiles. El número da datos N son 60:

Cada cuartil aparece en su intervalo, a partir de la columna de la frecuencia


acumulada Ni. Aparecen sombreadas las frecuencias acumuladas de los intervalos
anteriores Ni  –  1.
Con estos datos se calculan los tres cuartiles, sabiendo que la amplitud del
intervalo Ii es 4:

También podría gustarte