Está en la página 1de 16

19-2-2021

ESTADISTICA
INFERENCIAL II
PROBLEMARIO 1

ALUMNOS
1. DIANA LAURA VERDEJA
ELIZONDO
2. CHELSEA HERRERA PEDROZA
3. VANESA SOTO MONSIVAIS
4. IRMA FERNANDA GARCIA
CHAVARRIA

DOCENTE:
Claudia Espinosa Guzmán
GRADO: 6º
FECHA DE ENTREGA:
Sabado 20 DE FEBRERO 2021
INTRODUCCION

En la industria con mucha frecuencia es necesario resolver problemas que implican


conjuntos de variables, cuando se sabe que existe alguna relación inherente entre ellas. A
partir de lo anterior, es necesario establecer modelos que expliquen dicha relación.
Cuando, simultáneamente, contemplamos dos variables continuas, aunque por extensión
se pueden emplear para variables discretas cuantitativas, surgen preguntas y problemas
específicos. Esencialmente, se emplearán estadísticos descriptivos y técnicas de
estimación para contestar esas preguntas, y técnicas de contraste de hipótesis específicos
para resolver dichos problemas.
La mayoría de estos métodos están encuadrados en las técnicas regresión y correlación
En forma más especifica el análisis de correlación y regresión comprende el análisis de
los datos muestrales para saber qué es y cómo se relacionan entre si dos o más variables
en una población. El análisis de correlación produce un número que resume el grado de
la fuerza de relación entre dos variables; y el análisis de regresión da lugar a una ecuación
matemática que describe dicha relación. La técnica de regresión lineal simple está
indicada cuando se pretende explicar una variable respuesta cuantitativa en función de
una variable explicativa cuantitativa también llamada variable independiente, variable
regresora o variable predictora. Por ejemplo, se podría intentar explicar el peso en función
de la altura. El modelo intentaría aproximar la variable respuesta mediante una función
lineal de la variable explicativa.
A partir de la presente investigación, se pretende mostrar la aplicación práctica de la
regresión y correlación lineal simple; Ya que la aplicación de las técnicas estadísticas
contribuye a la optimización de los procesos.
EJERCICIOS DE LA UNIDAD I

Ejercicio Nº 1: Las calificaciones de un grupo de estudiantes en su reporte de medio año (x) y en los
exámenes finales ( y ) fueron los siguientes: (Xº = 85)

X 77 50 71 71 81 94 96 96 96 99 67 67 81 50
y 82 66 78 44 55 85 99 95 97 99 70 68 70 60

a) Elaboración de un diagrama de dispersión: Existe una dispersión ascendente y aproximadamente lineal.

b) Obtención de la recta de predicción (ecuación de la recta de mínimos cuadrados)

Col_2 = 16,075 + 0,769115*Col_1

c) Interpretación de los coeficientes b0 y b1


b0= 16,075 Representa la puntuación del examen de aprovechamiento cuando la calificación del examen de
cálculo es igual a cero.
b1 = 0,769115 representa la calificación de cálculo aumenta en 0,769115 conforme aumenta la puntuación del
examen de aprovechamiento de matemáticas.

d) Prueba de hipótesis T (El valor de significancia es α = 0.05)


B0= 16,075 El estadístico R-Cuadrada indica que el modelo 54,015% de la variabilidad en Col_2
B1= 00,769115, El coeficiente de correlación es igual a 0,769115, indicando una relación moderadamente
fuerte entre las variables.
Si P < α aceptamos B1 y rechazamos B2.
Si P > α aceptamos B0 y rechazamos B1

Coeficientes
Mínimos Cuadrados Estándar Estadístico

Parámetro Estimado Error T Valor-P


Intercepto 16,075 16,3699 0,981985 0,3455
Pendiente 0,769115 0,204857 3,75439 0,0027

0.0027 < 0.05: Si por lo tanto se rechaza B0. Por lo tanto, existe una cantidad significancia que se explica el
aprovechamiento en las calificaciones.
e) Prueba de ANOVA (α = 0.05)
B0= 16,075 El estadístico R-Cuadrada indica que el modelo 54,015% de la variabilidad en Col_2
B1= 00,769115, El coeficiente de correlación es igual a 0,769115, indicando una relación moderadamente
fuerte entre las variables.

Análisis de Varianza
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P

Modelo 2126,49 1 2126,49 14,10 0,0027


Residuo 1810,37 12 150,864
Total (Corr.) 3936,86 13

Si por lo tanto se rechaza B0. Por lo tanto, existe una cantidad significancia que se explica el aprovechamiento en las
calificaciones.

f) Coeficiente de correlación
Coeficiente de Correlación = 0,734949
Por lo tanto, existe una relación del 74% entre la variable x (la resistencia normal) con respecto a la variable
y (la resistencia del corte)
g) Coeficiente de determinación
R-cuadrada = 54,015 porciento
Por lo tanto, existe una relación del 55%
h) Proyección de la ecuación
Resistencia de corte = 16,075 + 0,769115*Col_1
Resistencia corte = 16,075 + 0,769115 * (85) = 1.431.74
Regresión Simple - Col_2 vs. Col_1

Variable dependiente: Col_2


Variable independiente: Col_1
Lineal: Y = a + b*X

Coeficientes
Mínimos Cuadrados Estándar Estadístico

Parámetro Estimado Error T Valor-P


Intercepto 16,075 16,3699 0,981985 0,3455
Pendiente 0,769115 0,204857 3,75439 0,0027

Análisis de Varianza
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P

Modelo 2126,49 1 2126,49 14,10 0,0027


Residuo 1810,37 12 150,864
Total (Corr.) 3936,86 13

Coeficiente de Correlación = 0,734949


R-cuadrada = 54,015 porciento
R-cuadrado (ajustado para g.l.) = 50,1829 porciento
Error estándar del est. = 12,2827
Error absoluto medio = 8,82866
Estadístico Durbin-Watson = 1,14568 (P=0,0267)
Autocorrelación de residuos en retraso 1 = 0,40649

El StatAdvisor
La salida muestra los resultados de ajustar un modelo lineal para describir la relación entre Col_2 y Col_1.
La ecuación del modelo ajustado es

Col_2 = 16,075 + 0,769115*Col_1

Puesto que el valor-P en la tabla ANOVA es menor que 0,05, existe una relación estadísticamente
significativa entre Col_2 y Col_1 con un nivel de confianza del 95,0%.

El estadístico R-Cuadrada indica que el modelo ajustado explica 54,015% de la variabilidad en


Col_2. El coeficiente de correlación es igual a 0,734949, indicando una relación moderadamente
fuerte entre las variables. El error estándar del estimado indica que la desviación estándar de los
residuos es 12,2827. Este valor puede usarse para construir límites de predicción para nuevas
observaciones, seleccionando la opción de Pronósticos del menú de texto. El error absoluto medio
(MAE) de 8,82866 es el valor promedio de los residuos. El estadístico de Durbin-Watson (DW)
examina los residuos para determinar si hay alguna correlación significativa basada en el orden
en el que se presentan en el archivo de datos. Puesto que el valor-P es menor que 0,05, hay
indicación de una posible correlación serial con un nivel de confianza del 95,0%. Grafique los
residuos versus el número de fila para ver si hay algún patrón que pueda detectarse.
Ejercicio Nº 2: Se llevo a cabo un estudio acerca de la cantidad de azúcar refinada obtenida (y) mediante
un cierto proceso a varias temperaturas (x) diferentes. Los datos se codificaron y se registraron con la
siguiente tabla. (xº = 1.75)

X 1.0 1.1 1.2 1.2 1.2 1.3 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0
y 8.1 7.8 8.5 8.8 8.2 9.6 9.9 9.5 8.9 8.6 10.2 9.3 9.2 10.5

a) Elaboración de un diagrama de dispersión: Existe una dispersión ascendente y aproximadamente lineal.

b) Obtención de la recta de predicción (ecuación de la recta de mínimos cuadrados)

Col_2 = 75,8649 + 1,07716*Col_1

c) Interpretación de los coeficientes b0 y b1


b0= 75,8649 Representa la puntuación de la cantidad de azúcar cálculo es igual a cero.
b1 = 1,07716 Representa la puntuación de la cantidad de azúcar. Si 1,07716 conforme aumenta la puntuación de
la cantidad de azúcar.

d) Prueba de hipótesis T (El valor de significancia es α = 0.05)


B0= 75,8649 El estadístico R-Cuadrada indica que el modelo ajustado explica 38,5942% de la variabilidad
en Col_2.
B1= 1,07716 El coeficiente de correlación es igual a 0,621242, indicando una relación moderadamente fuerte
entre las variables.
Si P < α aceptamos B1 y rechazamos B2.
Si P > α aceptamos B0 y rechazamos B1

Coeficientes
Mínimos Cuadrados Estándar Estadístico
Parámetro Estimado Error T Valor-P
Intercepto 16,075 16,3699 0,981985 0,3455
Pendiente 0,769115 0,204857 3,75439 0,0027

0.0027 < 0.05: Si por lo tanto se rechaza B0. Por lo tanto, existe una cantidad significancia que se explica el
aumento de las cantidades de azúcar.
e) Prueba de ANOVA (α = 0.05)
B0= 75,8649 El estadístico R-Cuadrada indica que el modelo ajustado explica 38,5942% de la variabilidad
en Col_2.
B1= 1,07716 El coeficiente de correlación es igual a 0,621242, indicando una relación moderadamente fuerte
entre las variables.
Análisis de Varianza
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P

Modelo 2126,49 1 2126,49 14,10 0,0027


Residuo 1810,37 12 150,864
Total (Corr.) 3936,86 13

Si por lo tanto se rechaza B0. Por lo tanto, existe una cantidad significancia que se explica el aumento en las cantidades
de azúcar.

f) Coeficiente de correlación
Coeficiente de Correlación = 0,621242
Por lo tanto, existe una relación del 62% entre la variable x (la resistencia normal) con respecto a la variable
y (la resistencia del corte)
g) Coeficiente de determinación
R-cuadrada = 38,5942 porciento
Por lo tanto, existe una relación del 39%
h) Proyección de la ecuación
Resistencia de corte = Col_2 = 75,8649 + 1,07716*Col_1
Resistencia de corte = Col_2 = 75,8649 + 1,07716*1.75 = 134.64
Regresión Simple - Col_2 vs.
Col_1 Variable dependiente:
Col_2 Variable independiente:
Col_1 Lineal: Y = a + b*X

Coeficientes
Mínimos Cuadrados Estándar Estadístico
Parámetro Estimado Error T Valor-P
Intercepto 75,8649 5,68674 13,3407 0,0000
Pendiente 1,07716 0,392222 2,74629 0,0177

Análisis de Varianza
Fuente Suma de Gl Cuadrado Razón-F Valor-P
Cuadrados Medio
Modelo 327,609 1 327,609 7,54 0,0177
Residuo 521,248 12 43,4373
Total (Corr.) 848,857 13

Coeficiente de Correlación =
0,621242 R-cuadrada = 38,5942
porciento
R-cuadrado (ajustado para g.l.) = 33,477
porciento Error estándar del est. = 6,5907
Error absoluto medio = 5,54176
Estadístico Durbin-Watson = 1,99316
(P=0,3874) Autocorrelación de residuos en
retraso 1 = -0,0676658

El StatAdvisor
La salida muestra los resultados de ajustar un modelo lineal para describir la relación entre
Col_2 y Col_1. La ecuación del modelo ajustado es

Col_2 = 75,8649 + 1,07716*Col_1

Puesto que el valor-P en la tabla ANOVA es menor que 0,05, existe una relación estadísticamente
significativa entre Col_2 y Col_1 con un nivel de confianza del 95,0%.

El estadístico R-Cuadrada indica que el modelo ajustado explica 38,5942% de la variabilidad en


Col_2. El coeficiente de correlación es igual a 0,621242, indicando una relación moderadamente
fuerte entre las variables. El error estándar del estimado indica que la desviación estándar de los
residuos es 6,5907. Este valor puede usarse para construir límites de predicción para nuevas
observaciones, seleccionando la opción de Pronósticos del menú de texto. El error absoluto medio
(MAE) de 5,54176 es el valor promedio de los residuos. El estadístico de Durbin-Watson (DW)
examina los residuos para determinar si hay alguna correlación significativa basada en el orden
en el que se presentan en el archivo de datos. Puesto que el valor-P es mayor que 0,05, no hay
indicación de una autocorrelación serial en los residuos con un nivel de confianza del 95,0%.
Residuos Atípicos
Predicciones Residuos
Fila X Y Y Residuos Studentizados

El StatAdvisor
La tabla de residuos atípicos enlista todas las observaciones que tienen residuos Estudentizados mayores a 2, en valor
absoluto. Los residuos Estudentizados miden cuántas desviaciones estándar se desvía cada valor observado de Col_2
del modelo ajustado, utilizando todos los datos excepto esa observación. En este caso, no hay residuos Estudentizados
mayores que 2.
Ejercicio Nº 3: En tipo de espécimen metálico de prueba, la resistencia normal (x) está funcionalmente
relacionada con la resistencia de corte (y). El siguiente es un conjunto de datos experimentales
codificados para las dos variables: (x0 = 24.5)

i) Elaboración de un diagrama de dispersión

Gráfico del Modelo Ajustado


Resistencia de corte = 42.5818 - 0.686077*Resistencia norm al

29
Resistencia de corte

27

25

23

21
22 24 26 28 30
Resistencia norm al

j) Obtención de la recta de predicción (ecuación de la recta de mínimos cuadrados)


Resistencia de corte = 42.5818 - 0.686077*Resistencia normal
k) Interpretación de los coeficientes b0 y b1
B0= 42.5818 El estadístico R-Cuadrada indica que el modelo ajustado explica 42.9768%
de la variabilidad en Resistencia de corte.
B1= 0.686077, El coeficiente de correlación es igual a -0.655567, indicando una relación
moderadamente fuerte entre las variables.
l) Prueba de hipótesis t (el valor de significación es α= 0.005)
H0: Β1=0, la resistencia normal está funcionalmente relacionada con la resistencia de
corte.
H1: B1≠0, la resistencia normal no está funcionalmente relacionada con la resistencia de
corte.
Coeficientes
Mínimos Cuadrados Estándar Estadístico
Parámetro Estimado Error T Valor-P
Intercepto 42.5818 6.50654 6.54447 0.0001
Pendiente -0.686077 0.249909 -2.74531 0.0206
Si p< α entonces aceptamos h1 y rechazamos h0
Si p > α entonces aceptamos h0 y rechazamos h1
0.0206>0.005 por lo tanto se rechaza h1
Por lo tanto: La resistencia normal está funcionalmente relacionada con la resistencia de
corte.
m) Prueba de anova (α= 0.005)
H0: Β1=0, la resistencia normal está funcionalmente relacionada con la resistencia de
corte.
H1: B1≠0, la resistencia normal no está funcionalmente relacionada con la resistencia de
corte.
Análisis de Varianza
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P
Modelo 20.2621 1 20.2621 7.54 0.0206
Residuo 26.8845 10 2.68845
Total (Corr.) 47.1467 11
Por lo tanto, rechazamos h1 ya que la resistencia normal está funcionalmente relacionada
con la resistencia de corte.
n) Coeficiente de correlación
Coeficiente de Correlación = -0.655567
Por lo tanto, existe una relación del 65% entre la variable x (la resistencia normal) con
respecto a la variable y (la resistencia del corte)
o) Coeficiente de determinación
R-cuadrada = 42.9768 porciento
p) Proyección
Resistencia de corte = 42.5818 - 0.686077*(24.5)
Resistencia de corte= 25.7729135
Ejercicio N.º 4 Las Cantidades De Solidos Eliminados (Y), En Gramos, De Un MaterialParticular
Cuando Se Les Expone A Periodos De Secado De Diferentes Duraciones (X), En Horas Se
Registraron Como Sigue:

a) Elaboración de un diagrama
Gráfico del Modelo Ajustado
secado = 1.08514 + 0.344707*solidos eliminados

8.4

7.4
secado

6.4

5.4

4.4
9 11 13 15 17 19
solidos eliminados

b) Obtención de la recta de predicción (ecuación de la recta de mínimos cuadrados)

Secado= 1.08514 + 0.344707 * solidos eliminados


c) Interpretacion de los coeficientes b0 y b1
B0= 1.08514 representa las horas de secado a las que se expusieron los materiales
B1= 0.344707 representa la cantidad de solidos eliminados en gramos
d) Prueba de hipótesis t (valor de significación de 0.05)
H0: b1= durante el periodo de secado se encuentran residuos
H1: b0= durante el periodo de secado no se encuentran residuos

Coeficientes
Mínimos Cuadrados Estándar Estadístico

Parámetro Estimado Error T Valor-P

Intercepto 1.08514 0.880332 1.23264 0.2336


Pendiente 0.344707 0.061566 5.59899 0.0000
Si p< α entonces aceptamos h1 y rechazamos h0
Si p > α entonces aceptamos h0 y rechazamos h1
0.05>0.000 rechazamos H0
e) Prueba de anova
H0: b1= durante el periodo de secado se encuentran residuos
H1: b0= durante el periodo de secado no se encuentran residuos
Análisis de Varianza
Fuente Suma de Gl Cuadrado Razón-F Valor-P
Cuadrados Medio
Modelo 16.4415 1 16.4415 31.35 0.0000
Residuo 9.44049 18 0.524472
Total (Corr.) 25.882 19
Rechazamos H0
f) Coeficiente de correlación
Coeficiente de Correlación = 0.797025
existe una relación estadísticamente significativa entre secado y solidos eliminados con un nivel de
confianza del 95.0%
g) Coeficiente de determinación
R-cuadrada = 63.5249 porciento
h) Proyección.
Secado= 1.08514 + 0.344707 * 20
Secado= 1.429847
Ejercicio Nº 5: se aplica una prueba de ubicación de matemáticas a todos los alumnos de
primer grado que están ingresando a una institución de educación superior. No se admiten
a los que obtienen una calificación inferior a 35 en el examen de matemáticas y se le
coloca en un curso de regularización. Las calificaciones del examen de ubicación y del
examen final de 20 estudiantes fueron los siguientes: (Xº = 60)

a) Elaboración de un diagrama de dispersión


Existe una dispersión ascendente y aproximadamente lineal

b) La obtención de la recta de producción (ecuación de la recta de mínimos cuadrados) Col_2


= 32.5059 + 0.471065*Col_1

c) Interpretación de los coeficientes bo y b1

B0=32.5059 representa la puntuación del examen de matemáticas, cuando la calificación es


igual a 0

B1=0.471065 significa la calificación del examen conforme aumenta la puntuación del examen

d) Prueba de hipótesis t (el valor de significancia es de α=0.005)

Ho:b1=0 las variaciones del examen de matemáticas resultado de fluctuaciones aleatorias que
son independientes a los valores de puntuación de aprovechamiento del examen de matemáticas

H1: b1≠0 existe una cantidad significativa en la calificación del examen de matemáticas que se
explica por la puntuación del

Mínimos Cuadrados Estándar Estadístico


Parámetro Estimado Error T Valor-P
Intercepto 32.5059 12.6386 2.57195 0.0192
Pendiente 0.471065 0.218199 2.15887 0.0446
Si p<α entonces aceptamos h1 y rechazamos ho
Si p> α entonces aceptamos ho y rechazamos h1
0.0446<0.05 por lo tanto se rechaza ho
Por lo tanto: existe una cantidad significativa en la calificación del examen de matemáticas que se
explica por la puntuación del examen
e) Prueba de anova (α=0.005)

Ho:b1=0 las variaciones del examen de matemáticas resultado de fluctuaciones


aleatorias que son independientes a los valores de puntuación de aprovechamiento del
examen de matemáticas

H1: b1≠0 existe una cantidad significativa en la calificación del examen de matemáticas
que se explica por la puntuación del examen

Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P


Modelo 1219.35 1 1219.35 4.66 0.0446
Residuo 4709.2 18 261.622
Total (Corr.) 5928.55 19
Por lo tanto, rechazamos ho
Por lo tanto: existe una cantidad significativa en la calificación del examen de matemáticas que se
explica por la puntuación del examen
f) Coeficiente de correlación

Coeficiente de Correlación = 0.453513 Por lo tanto, existe una relación del 45% entre el
examen de matemáticas con respeto a aprovechamiento

g) Coeficiente de determinación

R-cuadrada = 20.5674 por ciento El 21% de examen de matemáticas

h) Proyección
Col_2 = 32.5059 + 0.471065*35 La calificación de matemáticas esperada será de 48.99
CONCLUSIÓNES
Esta técnica estadística constituye una herramienta útil para el análisis de las variables de un
proceso ya que, a través de la aplicación de ésta, es posible conocer el modelo que siguen y la
fuerza con que se encuentran relacionadas. Asimismo, es posible explicar la relación que
guardan dos o más causas de un posible defecto.
La regresión lineal simple, analiza la relación de dos o más variables continuas, cuando analiza
dos variables a esta se le conoce como variables bivariantes que pueden corresponder a variables
cualitativas.
La finalidad de una ecuación de regresión es la de estimar los valores de una variable con base
en los valores conocidos de la otra. Del mismo modo, una ecuación de regresión explica los
valores de una variable en términos de otra. Es decir, se puede intuir una relación de causa y
efecto entre dos o más variables. El análisis de regresión únicamente indica qué relación
matemática podría haber, de existir un

También podría gustarte