Está en la página 1de 17

INSTITUTO TECNOLOGICO DE TIJUANA

ASIGNATURA: CARRERA: ELABORO:

ESTADISTICA INFERENCIAL I & II ING. INDUSTRIAL – ING. LOGISTICA M.A. JUAN MORALES
A DISTANCIA

Introduccion

Un Modelo Lineal se puede determinar de manera gráfica o


bien, por medio de una ecuación. Existen ocasiones en que en
una de las variables se quiere que cumpla varias condiciones a
la vez, entonces surge un conjunto de ecuaciones donde el
punto de intersección de dichas ecuaciones representa la
solución del problema.
Consiste en describir la relación entre las dos variables
mediante una recta.
INSTITUTO TECNOLOGICO DE TIJUANA
ASIGNATURA: CARRERA: ELABORO:

ESTADISTICA INFERENCIAL I & II ING. INDUSTRIAL – ING. LOGISTICA M.A. JUAN MORALES
A DISTANCIA

A.- Prueba de hipótesis en la regresión lineal simple


(UNA PRUEBA DE HIPÓTESIS)
Planteamiento de una hipótesis estadística:
Una hipótesis estadística es una afirmación sobre los valores de los parámetros de una
población o proceso, que es susceptible de probarse a partir de la información contenida en
una muestra representativa que es obtenida de la población sin embargo hablemos también
y no me nos importante.
Estadístico de pruébala hipótesis nula es verdadera mientras no se demuestre lo contrario.
El estadístico de prueba es un número calculado a partir de los datos y la hipótesis nula, cuya
magnitud permite discernir si se rechaza o no la H0.Para probar hipótesis acerca de la
pendiente y la ordenada en el origen del modelo de regresión, debe hacerse la suposición
adicional de que termino del error εi esta normalmente distribuido.
Por lo tanto, se supone que los errores εi son NID (0,σ2). Después se pueden probar es
suposiciones mediante el análisis de residuos.
INSTITUTO TECNOLOGICO DE TIJUANA
ASIGNATURA: CARRERA: ELABORO:

ESTADISTICA INFERENCIAL I & II ING. INDUSTRIAL – ING. LOGISTICA M.A. JUAN MORALES
A DISTANCIA

Supongamos que el experimentador desea probar la hipótesis de que


la pendiente es igual a un cierto valor, por ejemplo β1,0. Las hipótesis
Apropiadas son:

En donde t0 se calcula usando la Ecuación


Puede utilizarse un procedimiento similar para probar hipótesis acerca
de la ordenada en el origen.

Para probar: H0: β0 = β0,0


H1: β0 ≠ β0,0
Se usa el estadístico

Y se rechaza la hipótesis nula si

Un caso especial muy importante de la hipótesis


INSTITUTO TECNOLOGICO DE TIJUANA
ASIGNATURA: CARRERA: ELABORO:

ESTADISTICA INFERENCIAL I & II ING. INDUSTRIAL – ING. LOGISTICA M.A. JUAN MORALES
A DISTANCIA

Esta hipótesis se relaciona con la significación de la regresión.


No rechazar H0: β1 = 0 equivale a concluir que no existe una
relación lineal entre No rechazar H0: y. En otras palabras, el
mejor estimador de yi para cualquier valor de xj es ŷj = En
muchos casos esto puede indicar que no hay una relación
causal entre x y y, o que la relación real no es lineal.
El procedimiento para probar H0β1 = 0 se puede deducir
usando dos enfoques.
El primo consiste en descomponer la suma total de cuadrados
corregida de y:
INSTITUTO TECNOLOGICO DE TIJUANA
ASIGNATURA: CARRERA: ELABORO:

ESTADISTICA INFERENCIAL I & II ING. INDUSTRIAL – ING. LOGISTICA M.A. JUAN MORALES
A DISTANCIA

Los dos componentes de Syy miden, respectivamente, la


variabilidad de yi explicada por la recta de regresión y la
variación residual, no explica por la recta de regresión.

se conoce como la suma de cuadrados del error o residual y


denomina suma de cuadrados de regresión.
Por lo tanto, la Ecuación se transforma en: Syy = SSR + SSE
De la Ecuación
se obtiene que la fórmula para calcular SSR es
INSTITUTO TECNOLOGICO DE TIJUANA
ASIGNATURA: CARRERA: ELABORO:

ESTADISTICA INFERENCIAL I & II ING. INDUSTRIAL – ING. LOGISTICA M.A. JUAN MORALES
A DISTANCIA

Syy tiene n – 1 grados de liberta, y SSR y SSE tienen, respectivamente 1 y


n – 2 grados de libertad.
Es posible mostrar que

y que SSE y SSR son independientes. Por lo tanto, si H0β1 es verdadera, la


estadística
INSTITUTO TECNOLOGICO DE TIJUANA
ASIGNATURA: CARRERA: ELABORO:

ESTADISTICA INFERENCIAL I & II ING. INDUSTRIAL – ING. LOGISTICA M.A. JUAN MORALES
A DISTANCIA

B.- Calidad del ajuste en regresión lineal simple

En la sección anterior estudiamos pruebas de hipótesis para verificar que


hay una relación significativa entre y; sin embargo, no hemos visto si tal
relación permite hacer estimaciones con una precisión aceptable. Por
ejemplo, es de interés saber qué tanta de la variabilidad presente en fue
explicada por el modelo, además si se cumplen los supuestos de los
residuos.
Coeficiente de determinación Una vez ajustada la recta de regresión a la
nube de observaciones es importante disponer de una medida que
mida la bondad del ajuste realizado y que permita decidir si el ajuste
lineal es suficiente o se deben buscar modelos alternativos. Como
medida de bondad del ajuste se utiliza el coeficiente de determinación,
definido como sigue
INSTITUTO TECNOLOGICO DE TIJUANA
ASIGNATURA: CARRERA: ELABORO:

ESTADISTICA INFERENCIAL I & II ING. INDUSTRIAL – ING. LOGISTICA M.A. JUAN MORALES
A DISTANCIA

O bien

Como scE < scG, se verifica que 0 < R2 < 1.


El coeficiente de determinación mide la proporción de variabilidad
total de la variable
dependiente respecto a su media que es explicada por el modelo de
regresión. Es usual expresar esta medida en tanto por ciento,
multiplicándola por cien. Por otra parte, teniendo en
cuenta que i - = 1, se obtiene

Dadas dos variables aleatorias cualesquiera X e Y, una medida de la


relación lineal que hay entre ambas variables es el coeficiente de
correlación definido por
INSTITUTO TECNOLOGICO DE TIJUANA
ASIGNATURA: CARRERA: ELABORO:

ESTADISTICA INFERENCIAL I & II ING. INDUSTRIAL – ING. LOGISTICA M.A. JUAN MORALES
A DISTANCIA

Donde representa la desviación típica de la variable X (análogamente


para ).
Un buen estimador de este parámetro es el coeficiente de correlación
lineal muestral (o coeficiente de correlación de Pearson), definido por

Por tanto, r . Este coeficiente es una buena medida de la bondad del


ajuste de la recta de regresión. Evidentemente, existe una estrecha
relación entre r y 1aunque estos estimadores proporcionan diferentes
interpretaciones del modelo:
r es una medida de la relación lineal entre las variables X e Y.
* 1 mide el cambio producido en la variable Y al realizarse un cambio
de una unidad en la variable X.
De las definiciones anteriores se deduce que:
INSTITUTO TECNOLOGICO DE TIJUANA
ASIGNATURA: CARRERA: ELABORO:

ESTADISTICA INFERENCIAL I & II ING. INDUSTRIAL – ING. LOGISTICA M.A. JUAN MORALES
A DISTANCIA

Es importante estudiar si r es significativo (distinto de cero) ya que ello implica que el


modelo de regresión lineal es significativo. Desafortunadamente la distribución de r es
complicada pero para tamaños muestrales mayores que 30 su desviación típica es 1 / ,
y puede utilizarse la siguiente regla

En la interpretación del coeficiente de correlación se debe tener en cuenta que:


· r = ±1 indica una relación lineal exacta positiva (creciente) o negativa (decreciente),
· r = 0 indica la no existencia de relación lineal estocástica, pero no indica
independencia de las variables ya que puede existir una relación no lineal incluso
exacta, valores intermedios de r (0 < r < 1 ó -1 < r < 0) indican la existencia de una
relación lineal estocástica, más fuerte cuanto más próximo a +1 (ó -1) sea el valor de r.
Para poder interpretar con mayor facilidad el coeficiente de correlación muestral se
exponen varias nubes de observaciones y el ajuste lineal obtenido:
Existe una dependencia funcional lineal, las observaciones están sobre la recta de
regresión. r = R2 = 1, recta de regresión.
INSTITUTO TECNOLOGICO DE TIJUANA
ASIGNATURA: CARRERA: ELABORO:

ESTADISTICA INFERENCIAL I & II ING. INDUSTRIAL – ING. LOGISTICA M.A. JUAN MORALES
A DISTANCIA

C.- Estimación y predicción por intervalo en regresión lineal


simple

la probabilidad que asociamos con una estimación de intervalo se


conoce como el nivel de confianza. Esta probabilidad nos indica que
tanta confianza tenemos en que la estimación del intervalo incluya al
parámetro de la población. Una probabilidad más alta significa más
confianza. El intervalo de confianza es el alcance de la estimación que
estamos haciendo pero a menudo hacemos el intervalo de confianza
en términos de errores estándar, para esto debemos calcular el error
estándar de la media así:

es el error estándar de la media para una población infinita,  es la


desviación estándar de la población. Con frecuencia expresaremos los
intervalos de confianza de esta forma:
En la que :
INSTITUTO TECNOLOGICO DE TIJUANA
ASIGNATURA: CARRERA: ELABORO:

ESTADISTICA INFERENCIAL I & II ING. INDUSTRIAL – ING. LOGISTICA M.A. JUAN MORALES
A DISTANCIA

Relación entre nivel de confianza e intervalo de confianza

Podría pensarse que deberíamos utilizar un alto nivel de confianza,


como 99% en todos los problemas sobre estimaciones, pero en
algunos casos altos niveles de confianza producen intervalos de
confianza alto por lo tanto imprecisos. Debe tenerse un intervalo de
confianza que vaya de acuerdo al tema que se este estimando.
INSTITUTO TECNOLOGICO DE TIJUANA
ASIGNATURA: CARRERA: ELABORO:

ESTADISTICA INFERENCIAL I & II ING. INDUSTRIAL – ING. LOGISTICA M.A. JUAN MORALES
A DISTANCIA

Intervalos de predicción aproximados

Una forma de ver el error estándar de la estimación es concebirla


como la herramienta estadística que podemos usar para hacer un
enunciado de probabilidad sobre el intervalo alrededor del valor
estimado de , dentro del cual cae el valor real de Y. Cuando la
muestra es mayor de 30 datos, se calcula los intervalos de predicción
aproximados de la siguiente manera: si queremos estar seguros en
aproximadamente 65% de que el valor real de Y caerá dentro de + 1
error estándar de ^ Y . Podemos calcular los límites superior e inferior
de este intervalo de predicción de la siguiente manera:
INSTITUTO TECNOLOGICO DE TIJUANA
ASIGNATURA: CARRERA: ELABORO:

ESTADISTICA INFERENCIAL I & II ING. INDUSTRIAL – ING. LOGISTICA M.A. JUAN MORALES
A DISTANCIA

Si, en lugar decimos que estamos seguros en aproximadamente 95.5%


de que el dato real estará dentro de + 2 errores estándar de la
estimación de . Podríamos calcular los límites de este intervalo de la
siguiente manera:

y por último decimos que estamos seguros en aproximadamente el


99.7% cuando usamos + 3 errores estándar de la estimación de
Podríamos calcular los limites de este intervalo de la siguiente manera:
INSTITUTO TECNOLOGICO DE TIJUANA
ASIGNATURA: CARRERA: ELABORO:

ESTADISTICA INFERENCIAL I & II ING. INDUSTRIAL – ING. LOGISTICA M.A. JUAN MORALES
A DISTANCIA

Como ya habíamos mencionado solo se usa para grandes muestras


(mayores de 30 datos) para muestras más pequeñas se usan la
distribución T Debemos poner énfasis en que los intervalos de
predicción son solo aproximaciones, de hecho los estadísticos pueden
calcular el error estándar exacto para la predicción Sp, usando la
formula:

En la que: X0 = valor especifico de x en el que deseamos predecir el


valor de Y.
INSTITUTO TECNOLOGICO DE TIJUANA
ASIGNATURA:

ESTADISTICA INFERENCIAL I & II

Conclusion
El análisis de regresión y correlación lineal constituyen métodos que se
emplean para conocer las relaciones y significación entre series de
datos.
Lo anterior, es de suma importancia para la industria ya que
es aquí en donde se presentan variables de respuesta e independientes
las cuales interactúan para originar las características de un proceso en
particular y por ende; analizar, predecir valores de la variable
dependiente y examinar el grado de fuerza con que se relacionan dichas
variables.
Bibliografias

Instituto Tecnológico Latinoamericano. (2021-2022). Prueba de


hipótesis en la regresión lineal simple. p. https://www.studocu.com/.

calidad del ajuste en regresión lineal simple. (n.d.). p.


https://www.studocu.com/.
Estimación y predicción por intervalo en regresión lineal simple.
(n.d.). p. https://cursos.aiu.edu/.
REGRESIÓN LINEAL SIMPLE. (2011-2012). p. http://eio.usc.es/.

También podría gustarte