Formulas Segundo Parcial

TIPOS DE REGRESIÓN
La relación funcional con la que se busca ajustar los datos observados es del tipo y c = f (x).
- La regresión lineal: yc = a + bx
- La regresión parabólica: yc = a + bx + cx2

𝑎
- La regresión hiperbólica: yc = (hipérbola equilátera)
𝑥
𝑏
yc = a + (hipérbola equilátera desplazada)
𝑥
- La regresión polinomial: yc = a + bx + cx2 + dx3 + ex4 + …
Aplicando logaritmos se transforma en: log yc = log a + b log x

- La regresión potencial: yc = axb
Haciendo log a =   log yc =  + b log x
“linealizables”
- La regresión exponencial: yc = ab x Aplicando logaritmos se transforma en: log yc = log a + x log b
Haciendo log a =  ; log b =   log yc =  +  x
Que es una recta de regresión semi-logarítmica porque sólo yc está

expresada en logaritmos. Los parámetros que se deben determinar son
 y 
En este tipo de regresión para hallar a y b hay que encontrar los

correspondientes antilogaritmos de  y  de la siguiente forma:
a = antilog  → a = 10 b = antilog  → b = 10
Lo importante de la regresión exponencial es que al valor de b se lo

asocia con la relación b=1+ i, en la que i puede expresar la tasa de
crecimiento de la variable en el tiempo analizado.
LA REGRESIÓN MÚLTIPLE
yc = f (x1, x2, x3, x4, …)
El método de los mínimos cuadrados:
a = 0.7 144 nos dice que si el ingreso es 0

el consumo sería 0.7144 (miles de Bs)
b = 0.8052 nos dice que por cada 1

Xi (miles de Bs) que aumente el ingreso,
el consumo aumentará en 0.8052
(miles de Bs)
REGRESIÓN EN FUNCION DEL TIEMPO
-SERIE COMPLETA Y NÚMERO IMPAR DE DATOS

En este caso el artificio consiste en utilizar la variable t en lugar de los valores observados de X, dándole al periodo central el valor t = 0, a los posteriores
1, 2, 3, … y a los anteriores -1, -2, -3, …
a = 3.42 nos dice que cuando t = 0 y c = 3.42, es decir en el periodo 0 (año 2019) la población estimada por la recta de regresión fue de 3.42 miles de estudiantes inscritos. (interpolación).
b = 0.35 nos dice que cada año el número de alumnos inscritos aumenta en 0.35 miles de estudiantes.
-SERIE COMPLETA Y NÚMERO PAR DE DATOS

En este caso el artificio consiste en utilizar la variable ti en lugar de xi, dándole a los dos periodos centrales los valores t = -1 y t =1. Como quiera que entre
ellos, en la práctica existe una diferencia de 2, entonces a los periodos anteriores se les asigna -3, -5, -7, … y a los posteriores 3, 5, 7, ….
-SERIE COMPLETA Y NÚMERO PAR DE DATOS
Se presenta cuando falta uno o más de los periodos en los que se desarrolla la variable que se analiza. En este caso, se
empieza la serie de la variable t con 0 y se prosigue de 1 en 1, saltando el o los periodos que falten.
a = 2.43 nos dice que cuando t = 0 yc = 2.43, es decir en el periodo 0 la población estimada por la recta de regresión fue
de 2.43 miles de estudiantes inscritos. (interpolación).
b = 0.3353 nos dice que cada año el número de alumnos inscritos aumenta en 0.3353 miles de estudiantes.
VARIANZA RESIDUAL
Si este valor es grande significa que los errores o residuos son grandes y, por tanto, la función de ajuste no es confiable
para hacer estimaciones o proyecciones
esta fórmula solo es

válida para el caso del
ajuste con una recta
ERROR ESTÁNDAR DE ESTIMACIÓN

EL COEFICIENTE DE DETERMINACIÓN
La desviación total y sus componentes

DESVIACION EXPLICADA
Valor calculado- la media)
DESVIACION NO EXPLICADA
(valor observado- valor calculado)
La variación total y sus componentes
Varianza explicada Varianza NO explicada

DEFINICIÓN DEL COEFICIENTE DE DETERMINACIÓN
El coeficiente de determinación, al que se simboliza con R2, muestra qué proporción o porcentaje de la variación total
está explicado por la función matemática utilizada para el ajuste.
Este coeficiente tiene sus valores entre 0 y 1, ambos inclusive, es decir (0≤ R2≤ 1). .
El 99.21% de la variación total de la variable de interés está explicado por la recta de regresión hallada. En consecuencia,
se puede concluir que la recta de regresión y c = 0.7144 + 0.8052x es muy confiable para hacer estimaciones y/o
proyecciones del gasto en consumo en función de los ingresos familiares.
EL COEFICIENTE DE CORRELACIÓN LINEAL

La covariación
La covarianza
El coeficiente de correlación lineal de Pearson
Finalmente, para calcular un indicador del nivel de asociación entre las variables a través de una línea de
regresión, el estadístico Karl Pearson planteó un coeficiente (r) que sólo puede ser usado para medir el grado
de correlación lineal entre las variables, que se presenta así
El valor de r fluctúa entre -1 y +1, es decir: -1 ≤ 𝑟 ≤ 1.

Cov (x; y) es la covarianza de x e y, 𝑠𝑥 es la desviación típica de la variable x y 𝑠𝑦 es la desviación típica de la
variable y.
Cuando r tiende a 1 quiere decir que hay alta asociación positiva entre las variables y que la recta de regresión
creciente es altamente confiable para hacer estimaciones o proyecciones.
Cuando r tiende a − 1 quiere decir que hay alta asociación negativa o inversa entre las variables y que la recta
de regresión decreciente es altamente confiable para hacer estimaciones o proyecciones.
Cuando r tiende a 0, por derecha o por izquierda, quiere decir que hay baja asociación positiva (o negativa) entre
las variables y que la recta de regresión creciente (o decreciente) no es confiable para hacer estimaciones o
proyecciones.
Al valor del coeficiente de correlación lineal.
Se puede demostrar que la raíz cuadrada del coeficiente de determinación para un ajuste lineal es igual al valor del
coeficiente de correlación lineal. Es decir:
Cuando se usa esta relación hay que tener el cuidado de colocar adecuadamente el signo + o el signo – según que la recta
de ajuste sea creciente o decreciente, respectivamente.
Muestra alta correlación lineal positiva entre las variables. La recta creciente es altamente confiable para estimaciones
y/o proyecciones.
Las varianzas y desviaciones típicas:
∑𝑛 2
𝑖=1 𝑥𝑖
𝑠𝑥2 = -𝑥̅ 2 sx =
𝑛
∑𝑛 2
𝑖=1 𝑦𝑖
𝑠𝑦2 = − 𝑦̅2 sy =
𝑛
Teoría de PROBABILIDADES
2.- Evolución de la teoría de la probabilidad
2.1. Probabilidad clásica o a priori
2.2. Probabilidad clásica o a posteriori

2.2.1Espacio muestral
2.2.1.1.-Discreto
- Con número finito de puntos muestrales
- con número finito de puntos muestrales
2.2.1.2.-Continuo
2.6.1. Probabilidad conjunta
Probabilidad marginal
Probabilidad condicional
“toda probabilidad condicional es igual a la probabilidad conjunta entre la probabilidad de la

parte que condiciona”
Leyes básicas de la Probabilidad
Ley de la suma
Si los sucesos o eventos A1, A2, A3, …, Ah fueran mutuamente excluyentes (disjuntos) entonces
la ley de la suma se reduciría a:
Ley de la multiplicación
Sucesos o eventos independientes
Ley de la probabilidad total
Finalmente, la fórmula para hallar la probabilidad del evento E se expresa así:
P(E) = ∑ℎ𝑖=1 P(Ai)P(E/Ai)
El teorema de Bayes
Diagramas de árbol

Formulas Segundo Parcial

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Formulas Segundo Parcial

Cargado por

Copyright:

Formatos disponibles

TIPOS DE REGRESIÓN

- La regresión parabólica: yc = a + bx + cx2

- La regresión polinomial: yc = a + bx + cx2 + dx3 + ex4 + …

Aplicando logaritmos se transforma en: log yc = log a + b log x

Haciendo log a =  ; log b =   log yc =  +  x

Que es una recta de regresión semi-logarítmica porque sólo yc está

En este tipo de regresión para hallar a y b hay que encontrar los

a = antilog  → a = 10 b = antilog  → b = 10

Lo importante de la regresión exponencial es que al valor de b se lo

yc = f (x1, x2, x3, x4, …)

El método de los mínimos cuadrados:

a = 0.7 144 nos dice que si el ingreso es 0

b = 0.8052 nos dice que por cada 1

-SERIE COMPLETA Y NÚMERO IMPAR DE DATOS

1, 2, 3, … y a los anteriores -1, -2, -3, …

-SERIE COMPLETA Y NÚMERO PAR DE DATOS

-SERIE COMPLETA Y NÚMERO PAR DE DATOS

esta fórmula solo es

ERROR ESTÁNDAR DE ESTIMACIÓN

La desviación total y sus componentes

Valor calculado- la media)

(valor observado- valor calculado)

La variación total y sus componentes

Varianza explicada Varianza NO explicada

EL COEFICIENTE DE CORRELACIÓN LINEAL

El valor de r fluctúa entre -1 y +1, es decir: -1 ≤ 𝑟 ≤ 1.

2.2. Probabilidad clásica o a posteriori

“toda probabilidad condicional es igual a la probabilidad conjunta entre la probabilidad de la

Leyes básicas de la Probabilidad

Sucesos o eventos independientes

Ley de la probabilidad total

Finalmente, la fórmula para hallar la probabilidad del evento E se expresa así:

P(E) = ∑ℎ𝑖=1 P(Ai)P(E/Ai)

También podría gustarte