Está en la página 1de 6

TIPOS DE REGRESIÓN

La relación funcional con la que se busca ajustar los datos observados es del tipo y c = f (x).

- La regresión lineal: yc = a + bx

- La regresión parabólica: yc = a + bx + cx2


𝑎
- La regresión hiperbólica: yc = (hipérbola equilátera)
𝑥

𝑏
yc = a + (hipérbola equilátera desplazada)
𝑥

- La regresión polinomial: yc = a + bx + cx2 + dx3 + ex4 + …

Aplicando logaritmos se transforma en: log yc = log a + b log x


- La regresión potencial: yc = axb
Haciendo log a =   log yc =  + b log x
“linealizables”
- La regresión exponencial: yc = ab x Aplicando logaritmos se transforma en: log yc = log a + x log b

Haciendo log a =  ; log b =   log yc =  +  x

Que es una recta de regresión semi-logarítmica porque sólo yc está


expresada en logaritmos. Los parámetros que se deben determinar son
 y 

En este tipo de regresión para hallar a y b hay que encontrar los


correspondientes antilogaritmos de  y  de la siguiente forma:

a = antilog  → a = 10 b = antilog  → b = 10

Lo importante de la regresión exponencial es que al valor de b se lo


asocia con la relación b=1+ i, en la que i puede expresar la tasa de
crecimiento de la variable en el tiempo analizado.

LA REGRESIÓN MÚLTIPLE

yc = f (x1, x2, x3, x4, …)

El método de los mínimos cuadrados:

a = 0.7 144 nos dice que si el ingreso es 0


el consumo sería 0.7144 (miles de Bs)

b = 0.8052 nos dice que por cada 1


Xi (miles de Bs) que aumente el ingreso,
el consumo aumentará en 0.8052
(miles de Bs)
REGRESIÓN EN FUNCION DEL TIEMPO

-SERIE COMPLETA Y NÚMERO IMPAR DE DATOS


En este caso el artificio consiste en utilizar la variable t en lugar de los valores observados de X, dándole al periodo central el valor t = 0, a los posteriores

1, 2, 3, … y a los anteriores -1, -2, -3, …

a = 3.42 nos dice que cuando t = 0 y c = 3.42, es decir en el periodo 0 (año 2019) la población estimada por la recta de regresión fue de 3.42 miles de estudiantes inscritos. (interpolación).

b = 0.35 nos dice que cada año el número de alumnos inscritos aumenta en 0.35 miles de estudiantes.

-SERIE COMPLETA Y NÚMERO PAR DE DATOS


En este caso el artificio consiste en utilizar la variable ti en lugar de xi, dándole a los dos periodos centrales los valores t = -1 y t =1. Como quiera que entre
ellos, en la práctica existe una diferencia de 2, entonces a los periodos anteriores se les asigna -3, -5, -7, … y a los posteriores 3, 5, 7, ….

-SERIE COMPLETA Y NÚMERO PAR DE DATOS

Se presenta cuando falta uno o más de los periodos en los que se desarrolla la variable que se analiza. En este caso, se
empieza la serie de la variable t con 0 y se prosigue de 1 en 1, saltando el o los periodos que falten.

a = 2.43 nos dice que cuando t = 0 yc = 2.43, es decir en el periodo 0 la población estimada por la recta de regresión fue
de 2.43 miles de estudiantes inscritos. (interpolación).

b = 0.3353 nos dice que cada año el número de alumnos inscritos aumenta en 0.3353 miles de estudiantes.

VARIANZA RESIDUAL

Si este valor es grande significa que los errores o residuos son grandes y, por tanto, la función de ajuste no es confiable
para hacer estimaciones o proyecciones

esta fórmula solo es


válida para el caso del
ajuste con una recta

ERROR ESTÁNDAR DE ESTIMACIÓN


EL COEFICIENTE DE DETERMINACIÓN

La desviación total y sus componentes


DESVIACION EXPLICADA

Valor calculado- la media)

DESVIACION NO EXPLICADA

(valor observado- valor calculado)

La variación total y sus componentes

Varianza explicada Varianza NO explicada


DEFINICIÓN DEL COEFICIENTE DE DETERMINACIÓN

El coeficiente de determinación, al que se simboliza con R2, muestra qué proporción o porcentaje de la variación total
está explicado por la función matemática utilizada para el ajuste.

Este coeficiente tiene sus valores entre 0 y 1, ambos inclusive, es decir (0≤ R2≤ 1). .

El 99.21% de la variación total de la variable de interés está explicado por la recta de regresión hallada. En consecuencia,
se puede concluir que la recta de regresión y c = 0.7144 + 0.8052x es muy confiable para hacer estimaciones y/o
proyecciones del gasto en consumo en función de los ingresos familiares.

EL COEFICIENTE DE CORRELACIÓN LINEAL


La covariación

La covarianza
El coeficiente de correlación lineal de Pearson
Finalmente, para calcular un indicador del nivel de asociación entre las variables a través de una línea de
regresión, el estadístico Karl Pearson planteó un coeficiente (r) que sólo puede ser usado para medir el grado
de correlación lineal entre las variables, que se presenta así

El valor de r fluctúa entre -1 y +1, es decir: -1 ≤ 𝑟 ≤ 1.


Cov (x; y) es la covarianza de x e y, 𝑠𝑥 es la desviación típica de la variable x y 𝑠𝑦 es la desviación típica de la
variable y.

Cuando r tiende a 1 quiere decir que hay alta asociación positiva entre las variables y que la recta de regresión
creciente es altamente confiable para hacer estimaciones o proyecciones.

Cuando r tiende a − 1 quiere decir que hay alta asociación negativa o inversa entre las variables y que la recta
de regresión decreciente es altamente confiable para hacer estimaciones o proyecciones.

Cuando r tiende a 0, por derecha o por izquierda, quiere decir que hay baja asociación positiva (o negativa) entre
las variables y que la recta de regresión creciente (o decreciente) no es confiable para hacer estimaciones o
proyecciones.
Al valor del coeficiente de correlación lineal.

Se puede demostrar que la raíz cuadrada del coeficiente de determinación para un ajuste lineal es igual al valor del
coeficiente de correlación lineal. Es decir:

Cuando se usa esta relación hay que tener el cuidado de colocar adecuadamente el signo + o el signo – según que la recta
de ajuste sea creciente o decreciente, respectivamente.
Muestra alta correlación lineal positiva entre las variables. La recta creciente es altamente confiable para estimaciones
y/o proyecciones.
Las varianzas y desviaciones típicas:

∑𝑛 2
𝑖=1 𝑥𝑖
𝑠𝑥2 = -𝑥̅ 2 sx =
𝑛

∑𝑛 2
𝑖=1 𝑦𝑖
𝑠𝑦2 = − 𝑦̅2 sy =
𝑛
Teoría de PROBABILIDADES
2.- Evolución de la teoría de la probabilidad
2.1. Probabilidad clásica o a priori

2.2. Probabilidad clásica o a posteriori


2.2.1Espacio muestral
2.2.1.1.-Discreto
- Con número finito de puntos muestrales
- con número finito de puntos muestrales

2.2.1.2.-Continuo
2.6.1. Probabilidad conjunta

Probabilidad marginal

Probabilidad condicional

“toda probabilidad condicional es igual a la probabilidad conjunta entre la probabilidad de la


parte que condiciona”

Leyes básicas de la Probabilidad

Ley de la suma
Si los sucesos o eventos A1, A2, A3, …, Ah fueran mutuamente excluyentes (disjuntos) entonces
la ley de la suma se reduciría a:

Ley de la multiplicación

Sucesos o eventos independientes

Ley de la probabilidad total

Finalmente, la fórmula para hallar la probabilidad del evento E se expresa así:

P(E) = ∑ℎ𝑖=1 P(Ai)P(E/Ai)

El teorema de Bayes

Diagramas de árbol

También podría gustarte