Está en la página 1de 8

Universidad Católica Boliviana "San Pablo"

Probabilidad y Estadística II
Prácticas Segunda Parte
Docente: Yuri Miranda Gonzáles
Abril - 2022

1 Pruebas de hipótesis segunda parte


Con relación a la bibliografía proporcionada: "Probabilidad y estadística para ingeniería y ciencias", Walpole
Myers (el libro se encuentra en NEO), realizar los siguientes ejercicios:

1. Pruebas de hipótesis de proporciones: 10.55 a 10.65


2. Pruebas de hipótesis para varianzas: 10.73 a 10.78
3. Pruebas de hipotesis no paramétricas: 10.80 a 10.90

2 Regresión lineal simple


1. Se tienen los siguientes resultados de las observaciones de las variables x y y :
16
X 16
X 16
X 16
X 16
X
xi = 96; yi = 64; x2i = 657; yi2 = 526; xi yi = 492
i=1 i=1 i=1 i=1 i=1

(a) Calcular la recta de regresión mínimo cuadrádica, que estima a:

yi = 0 + 1 xi + "i

(b) Escribir las ecuaciones normales para el punto a)


(c) Calcular la recta de regresión mínimo cuadrática
0 0
xi = 0 + 1 yi + "i

(d) Escribir las ecuaciones normales para el punto c)

2. Un conjunto de datos bidimensional (X; Y ) tiene un coe…ciente de correlación r = 0:9, siendo las
medias de las distribuciones marginales X = 1; Y = 2:Se sabe que una de las cuatro ecuaciones siguientes
corresponde a la recta de regresión de Y sobre X:

y= x+2

3x y=1
2x + y = 4
y =x+1
Seleccionar razonadamente esta recta.
1
3. En una distribución bidimensional de frecuencias se sabe que la recta de regresión de mínimos cuadrados
es:
y^ = 73 0:6x
La media de x es 8, la desviación típica de x es 2, y la desviación estándar de y es 5. Calcular el
coe…ciente de correlación y la media aritmética de y.
4. Escribir las ecuaciónes normales que permitan ajustar una muestra de datos a una función cuando:

(a) ln y = 0 + 1 ln x
2
(b) y = 0 + 1x

5. Estimar por el método de mínimos cuadrados los parámetros a y b de la ecuación y = a + bx2 con la
muestra de tres punto siguientes
(y; x); (3; 1); (4; 0); (6; 1)

(a) Escribir las ecuaciónes normales


(b) Hallar la ecuación de regresión ajustada

6. Para ajustar una curva de Gompertz de la forma:


+ x
y = ee
Escribir las ecuaciones normales correspondientes para estimar los parámetros y .
7. Una publicación presenta datos sobre la resistencia a la comprensión (X) y la permeabilidad (Y ) de
varias mezclas y tratamientos de concreto. El resumen de cantidades es el siguiente:
X X X X X
n = 14; Xi = 43; Yi = 572; Xi2 = 157:42; Yi2 = 23530; Xi Yi = 1697:80

Suponga que las dos variables están relacionadas de acuerdo con el modelo de regresión lineal simple
Y = 0 + 1X +"
(a) Calcular las estimaciones de mínimos cuadrados de la pendiente y de la ordenada al origen
(b) Proporcionar una estimación puntual de la permeabilidad promedio cuando la resistencia a la
compresión sea X=3.7
(c) Suponga que el valor observado de la permeabilidad para X=3.7 es Y = 46.1. Calcular el valor
del residuo (error) correspondiente.

8. Para un conjunto de datos (x; y) se conocen los siguientes resultados :


n = 16; x = 6; y = 4; Sx = 2:324; Sy = 4:2427; r = 0:728
Calcular:

(a) La varianza residual Se2

9. De una aplicación del análisis de regresión se conocen los siguientes resultados:


n = 5; Sy2 = 20 y R2 = 0:845
Calcular la varianza residual S"2 :
10. Una aplicación importante de análisis de regresión a la contaduría es la estimación de costos. Con n = 6
datos sobre volumen de producción y costos y empleando el método de mínimos cuadrados, obtener
la ecuación de regresión estimada que relacione volumen de producción y costos. Se dispone de los
siguientes resultados:
X X X X X
x = 327; y = 30; xy = 1682; x2 = 18397; y 2 = 166
2
(a) Con estos datos obtener la ecuación de la regresión estimada para pronosticar los costos totales
dado un volumen de producción.
(b) Calcular el coe…ciente de determinación.
(c) interpretar el coe…ciente de determinación.
(d) Calcular SCT,SCE y SCR.

11. En un estudio referido al gasto total (x) y los gastos en alimentación (y) diaria sobre 16 familias de
ingresos altos, se obtuvo la siguiente información:
X X X X
yt = 1936; log xi = 38:4471; yi log xi = 4878:4049; (log xi )2 = 94:4289

Hallar las ecuaciones normales y determinar los coe…cientes a y b de la función del tipo:

yi = a + b log xi

3 Regresión Lineal Múltiple


1. Un análisis de regresión determinó los siguientes resultados:
0 1 0 1
30 0 0 50
X 0 X = @ 0 20 0 A X 0 Y = @ 40 A Y 0 Y = 500
0 0 10 10

(a) Hallar el modelo estimado: Y^ = ^ 0 + ^ 1 X1 + ^ 2 X2


(b) Hallar la varianza residual.

2. Se tiene la información de las siguientes variables, para realizar un modelo de regresión lineal múltiple
Y^ = ^ 0 + ^ 1 X1 + ^ 2 X2 .

3
(a) Hallar la matriz X 0 X suponiendo que el modelo inluye constante.
(b) Hallar la matriz X 0 X suponiendo que el modelo no inluye constante.
(c) Hallar la estimación de la recta de regresión: Y^ = ^ 0 + ^ 1 X1 + ^ 2 X2

3. Con la información de las siguientes matrices, hallar la tabla ANOVA y realizar la prueba F con un
= 10% para el modelo Y^ = ^ 0 + ^ 1 X1 + ^ 2 X2
0 1 0 1
20 214:2 206:8 195:1
X 0 X = @ 214:2 2593 2379 A X 0 Y = @ 2030 A Y 0 Y = 2102
206:8 2379 2556 2050

4. Resultado de un análisis de regresión se encontró las siguientes matrices:


0 1 0 1
0:494 0:128 0:027 195:1
(X 0 X) 1 = @ 0:128 0:088 0:015 A X 0 Y = @ 446:7 A Y 0 Y = 2102
0:027 0:015 0:012 1025

Realizar las pruebas individuales para los parametros del modelo Y^ = ^ 0 + ^ 1 X1 + ^ 2 X2


5. Se tienen las siguientes matrices, resultado del análisis de una base de datos:

50 736 732 -1233 1562 2923 1385


736 15504 15486 -27602 32478 61943 29857
X'X= 732 15486 15480 -27599 32451 61907 X'Y= 29844 Y'Y= 57597
-1233 -27602 -27599 49653 -57758 -110434 -53355
1562 32478 32451 -57758 68104 129782 62531
2923 61943 61907 -110434 129782 247729 119379

(a) Hallar el modelo estimado :Y = 0 + 1 X1 + 2 X2 + 3 X3 + 4 X4 + 5 X5 +e


(b) Hallar la varianza residual.

6. Un análisis del sector inmobiliario concluye que el precio de venta de una vivienda en dólares (y) depende
de su dimensión X1 en metros cuadrados de super…cie, el tamaño de la terraza en metros cuadrados
(X2 ), el número de dormitorios (X3 ) y el número de cuartos de baño (X4 ). Basándose en una muestra
aleatoria de 20 ventas de viviendas, se obtuvo el siguiente, modelo estimado por mínimos cuadrados:

y^ = 1998; 5 + 22; 352X1 + 1; 4686X2 + 6767; 3X3 + 2701; 1X4


(2;5543) (1;4492) (1820;8) (1000;2)

R2 = 0; 70

Los números entre paréntesis situados debajo de los coe…cientes son los errores típicos de los coe…cientes
estimados.

(a) Interprete en el contexto de este modelo el coe…ciente estimado de X1 :


(b) Interprete el coe…ciente de determinación.
(c) Suponiendo que el modelo está especi…cado correctamente, contraste al nivel del 5 por ciento la
hipótesis nula de que, manteniéndose todo lo demás constante, el precio de venta no depende del
número de cuartos de baño frente a la hipótesis alternativa unilateral adecuada.

7. En un análisis de regresión, se observaron los siguientes datos:


0 1 0 1
8 0 0 44
X 0 X = @ 0 62 0 A X 0 Y = @ 8 A Y 0 Y = 318
0 0 58 5
4
(a) Hallar la tabla ANOVA
(b) Realizar la prueba F para el modelo.
(c) Hallar el intervalo de con…anza para E(Y jX) cunado x0 = (2; 3)

8. Escribir las ecuaciones normales para estimar el siguiente modelo: Y = 0 + 1 X1 + 2 X2 + 3 X3 + ei


9. Se tienen los siguientes resultados de la estimación de un modelo de regresión lineal múltiple en R, donde
Y: Es el consumo en bs de una familia, X1: es el número de miembros de familia que son mujeres, X2:
es la edad promedio de los miembros de la familia, y X3: es el ahorro total de la familia

(a) Interpretar los coe…cientes del modelo


(b) Interpretar la signi…cancia conjunta del modelo
(c) Interpretar la signi…cancia individual de las estimaciones de los parametros del modelo al 10%.

10. Se tiene la siguiente salida del software R para la estimación de un modelo de regresión lineal.

(a) Hallar la tabla ANOVA


(b) Realizar la prueba conjunta del modelo con un = 5% y luego con = 10%
5
4 Trabajo práctico grupal en R y Excel
1. Se tiene el nivel de ventas en Bs y los años de experiencia en ventas, de un grupo de funcionarios de
una empresa. Suponiendo que se desea establecer el monto de ventas, como función de los años de
experiencia de los vendedores, mediante la función lineal

yt = 0 + 1 xi + "i

Considerando los siguientes datos, estimar la recta de regresión lineal mediante R:

Años de experiencia (X) 6 5 3 1 4 3 6 2 6 4


Montos de venta (Y) 9 6 4 3 3 5 8 2 7 4

(a) Crear los dos vectores correspondientes en R para las variables X, Y.


(b) Crear un data frame con su nombre.
(c) Hallar la estimación de la recta de regresión lineal con el comando lm
(d) Pegar el resultado como imagen
(e) Interpretar el ^ 1 ; y si tiene sentido también interpretar el ^ 0 .

2. El número de clientes de un centro comercial está en función de la distancia en kilómetros, con relación
al núcleo de la densidad poblacional de cierta región, los datos …guran en la siguiente tabla:

Nº de clientes (x) 8 7 6 4 2 1
Distancia (y) 15 19 25 23 34 40

(a) De…nir los vectores correspondientes en R y calcular el coe…ciente de correlación lineal


(b) En R estimar la recta de regresión lineal
(c) Si el centro comercial se sitúa a 2 km¿Cuántos clientes puede esperar?

3. Un inversionista desea conocer la relación que existe entre el ingreso anual de familias (X) y sus ahorros
anuales (Y ) en miles de dólares. De una muestra recogida entre 9 familias sobre sus ingresos y ahorros
anuales, se obtuvieron los siguientes datos.

Ingreso anual (X) 12 13 14 15 16 17 18 19 20


Ahorro anual (Y) 0 0,1 0,2 0,2 0,5 0,5 0,6 0,7 0,8

De…nido el modelo de regresión lineal ;


2
Y = 0 + 1 xi +" siendo " N (0; ) y corr ("i ; "j ) = 08 i 6= j

(a) Transcribir los datos a excel


(b) Mediante las opciones de excel hallar el modelo de regresión lineal para obtener estimaciones
puntuales de los parametros
(c) En excel realizar todos los calculos necesarios para hallar la suma de cuadrados.
(d) Hallar R2
(e) Interpretar R2
(f) Hallar la Se2
(g) En excel realizar todos los cálculos para probar la validez del modelo con el 5% de nivel de
signi…cación con:
i. La prueba t
ii. La prueba F
6
(h) En excel realizar todos los cálculos para estimar el coe…ciente 1 mediante un intervalo de con…anza
de 95% de con…abilidad. Interprete y comente el resultado
(i) Importar desde R los datos de excel del inciso a) a un data frame y responder los incisos b) a g)
mediante las salidas correspondientes de R

4. Una empresa desea determinar si existe relación entre el dinero gastado en investigación y las utilidades
anuales. La tabla siguiente contiene información de 6 años

Gastos (miles $us) x 5 11 4 5 3 2


Utilidad y 31 40 30 34 25 20

(a) Mediante excel hallar y^ = ^ 0 + ^ 1 x, y probar la hipótesis de que el coe…ciente de regresión 1 es


2.1. Usar = 0:10
(b) Hallar un intervalo de con…anza del 90% para una utilidad esperada cuando el gasto en investi-
gación fue de 9
(c) Hallar un intervalo de con…anza del 90% para una utilidad futura si el gasto en investigación fuera
de 7

5. Se disponen de 5 observaciones para dos variables, x y y.

Xi 1 2 3 4 5
Yi 3 7 5 11 14

(a) Mediante Excel hallar el diagrama de dispersión para estos datos y hallar la recta de regresión
lineal.
(b) ¿Qué indica el diagrama de dispersión obtenido en a) acerca de la relación entre las dos variables?
(c) Usar la ecuación de la regresión para producir el valor de y cuando x = 6
(d) Calcular SCT,SCR y SCE y el coe…ciente de determinación. Comentar la bondad de ajuste.
(e) Probar la signi…cación del modelo:
H0 : 1 =0 vs H1 : 1 6= 0 con = 0:05

(f) Veri…car la hipótesis anterior con un nivel de signi…cación 0.05, presentar en excel los resultados
en una tabla de análisis de varianza (ANOVA).

6. La información estadística obtenida de una muestra de tamaño 12 sobre la relación existente entre
la inversión hecha y el rendimiento obtenido en miles de euros para exportaciones agropecuarias se
muestra la tabla siguiente:

Inversión 11 14 16 15 16 18 20 31 14 20 19 11
Rendimiento 2 3 5 6 5 3 7 10 6 10 5 6

(a) Mediante R calcular el coe…ciente de correlación lineal, así como la recta de regresión. Calcular
además, la previsión de inversión que se obtendrá con un rendimiento de 8000
(b) Mediante la prueba t responder la siguiente pregunta: ¿Presenta la muestra su…ciente evidencia,
a un nivel de signi…cación de 0.05, como para rechazar la hipótesis nula sobre la pendiente de la
recta sea nula?

7. Los siguientes datos pertenecen al residuo de cloro que hay en una piscina en diferentes momentos
después de ser tratada con sustancias químicas:

Número de horas (x) 2 4 6 8 10 12


Residuo de cloro (y) 1.8 1.5 1.4 1.1 1.1 0.9

Realizar todos los incisos siguientes en Excel y veri…car sus resultados en R:


7
(a) Ajuste la recta de mínimos cuadrados a partir de la cual podamos predecir el residuo de cloro en
términos del número de horas transcurridas desde que la piscina fue tratada químicamente.
(b) Utilice la ecuación de la recta de mínimos cuadrados para determinar el residuo de cloro en la
piscina cinco horas después del tratamiento químico.
(c) Calcular SCT,SCR y SCE y el coe…ciente de determinación
(d) Interpretar el R2
(e) Hallar la tabla ANOVA
(f) Realizar el contraste F con un = 5%
(g) Realziar el contraste t con un = 1%
(h) Hallar el intervalo de con…anza para 1 al 95%

8. Se tienen los datos del archivo ejemplo.xlsx.

(a) Crear un data frame con el nombre de ejemplo


(b) Hallar la estimación de la recta de regresión lineal:

Y^i = 0 + 1 X1 + 2 X2 + 3 X3 + 4 X4 + 5 X5

(c) Pegar el resultado como imagen


(d) Interpretar la signi…cancia de cada variable con un = 0:05
(e) Interpretar la signi…cancia conjunta , mediante la prueba F con un = 0:05
(f) Interpretar cada ^ ;.
i
(g) Interpretar R2

9. Se tienen los datos del archivo Base01.xlsx

(a) Crear un data frame con el nombre de ejemplo


(b) Hallar la estimación de la recta de regresión lineal:

nota = 0 + 1 Horas + 2 materias+ 3 gasto + ei

(c) Pegar el resultado como imagen


(d) Interpretar la signi…cancia de cada variable con un = 0:05
(e) Interpretar la signi…cancia conjunta , mediante la prueba F con un = 0:05
(f) Interpretar cada ^ ;.
i
2
(g) Interpretar R

También podría gustarte