Está en la página 1de 7

Universidad Católica Boliviana "San Pablo"

Probabilidad y Estadística II
Práctica N 1
Yuri Miranda Gonzáles
Febrero 2021

Contenido
1 Distribuciones de Muestreo Fundamentales 1
1.1 Experiencia con R y Excel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

2 Estimación de una y dos muestras 4


2.1 Experiencia con RStudio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.1.1 Simulación de una población y obtención de muestras. . . . . . . . . . . . . . . . . . . 5

3 Pruebas de hipótesis de una y dos poblaciones 5


3.1 Experiencia con RStudio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1 Distribuciones de Muestreo Fundamentales


Con relación a la bibliografía proporcionada: "Probabilidad y estadística para ingeniería y ciencias", Walpole
Myers (el libro se encuentra en NEO), realizar los siguientes ejercicios:

1. Distribución muestral de medias y el teorema central del límite: 8.18 al 8.30 (plantear el ejercicio y
luego puede usar R o Excel en su proceso de solución)
2. Distribucion muestral de la varianza, distribucion t y distribucion F: 8.41, 8.48, 8.59, 8.64, 8.67, 8,69,
8.72, 8.73.
3. Usar R para hallar las siguientes probabilidades y veri…car los resultados con las tablas usadas en clases
o con la aplicación para celular:

a)P (Z < 1:56) b)P (Z < b) = 0:87 c)P (t(29) < 3:45) d)P (t(20) < k) = 0:90

2 2
e)P ( (10) < b) = 0:90 f)P ( (16) < 2:33) g)P ( 2:33 < Z < 2:33) h)P (1:40 < t(9) < 3:45)

4. Para una distrubución chi-cuadrada, hallar a; b, tal que (Hallar mediante R y veri…car sus resultados
mediante una aplicación para celular)
2
(a) P ( > a) = 0:99 cuando n = 4
2
(b) P ( > b) = 0:025 cuando n = 19
2
(c) P (a < < b) = 0:95 , para un intérvalo simétrico, cuando v = 25
2
(d) P (a < < b) = 0:90 , para un intérvalo simétrico, cuando v = 14
2
(e) P ( (19) 6)
1
2
(f) P ( (16) 10)
2
(g) P (1 (4) 8)

5. Calcule la probabilidad de que una muestra aleatoria de 20 observaciones, de una población normal
con varianza 2 =8, tenga una varianza muestral S 2

(a) Mayor que 9.1


(b) Entre 8 y 10
(c) P (S 2 < b) = 0:025

6. Para una distrubución t-student, hallar mediante R y veri…car sus resultados mediante una aplicación
para celular:

(a) Calcule P (t < 2:365)cuando v = 10


(b) Calcule P (t > 1:318)cuando v = 24
(c) Calcule P ( 1:356 < t < 2:179)cuando n = 7
(d) Calcule P (t > 2:567)cuando n = 15
(e) Calcule P ( k < t < k) = 0:95 para v = 20
(f) Calcule P ( k < t < k) = 0:80 para n = 25

7. Para una distrubución F isher(n; m) hallar mediante R y veri…car sus resultados mediante una apli-
cación para celular::

(a) F0:05 con n = 7 y m = 15


(b) F0:05 con n = 15 y m = 7
(c) F0;95 con n = 7 y m = 5
(d) F0:95 con n = 19y m = 24
(e) Calcule P (F (17; 29) 5; 678)
(f) Calcule P (F (3; 6) > 2:567)
(g) Calcule P ( k < F (12; 16) < k) = 0:95
(h) Calcule P ( k < F (28; 24) < k) = 0:80

FECHA DE ENTREGA 19 DE FEBRERO 2021

1.1 Experiencia con R y Excel


1. Descargar R y Rstudio (consultar la unidad de aprendizale "Software" en NEO, en la misma encontrará
una presentación y un video con los pasos para poder instalar R y RStudio)
2. Primeros pasos con R: escribir el script para realizar las siguientes operaciones:

(a) q
120 + 5:3 30; 2 + 37 ; 2
3 + log(3) 35
q p3 p
8
log( 2 + 23 ); p
4
64
; 2
3 + 3
7 23

(b) Crear un vector "a" con los valores 2,4,6,8,10. Hallar el tamaño del vector, la media , y varianza.
(c) Crear un vector "b" con los valores 1.2 , 1.4, 1.7, 1.9, 0.9, 0.5, 1.1, 2.5. Hallar el tamaño del vector,
la media, desviación estándar y varianza.
(d) Usar el comando summary para hallar la media, mediana, mínimo, máximo del ventor "b".
2
(e) Crear un vector "c" de cadena con los siguientes valores: aaa,bbb,ddd,eee,¤f,ggg, hhh. Hallar el
tamaño del vector
(f) Consultar la ayuda para el comando seq.

3. Escribir un script para realizar las siguientes operaciones:

(a) Almacenar en un vector con el nombre vector1, números consecutivos del 1 al 10.
(b) Sumar 3, a cada valor del vector1 y almacenar en nuevo vector, con el nombre de vector2.
(c) Multiplicar 10, a cada valor del vector1 y almacenar en nuevo vector, con el nombre de vector3.
(d) Sumar los valores del vector1 y el vector2 y almacenar en un nuevo vector con el nombre de vector4.
(e) Crear un data frame con el nombre "ejercicio3" que contenga como columnas los vectores anteri-
ores.

4. Crear en un libro excel, los mismos vectores del inciso a. al d. Desde R, importar a un data frame con
el nombre de ejemplo3.
5. Los siguientes datos indican los minutos (redondeados al entero superior) que ocuparon sus asientos 50
clientes de una cafetería:
73 65 82 70 45 50 70 54 32 75
75 67 65 60 75 87 83 40 72 64
58 75 89 70 73 55 61 78 89 93
43 51 59 38 65 71 75 85 65 85
49 47 55 60 76 75 69 35 45 63

(a) Transcribir los datos a una hoja en Excel y luego, desde Rstudio o R, importar los mismos en una
variable con el nombre de X
(b) Mediante Rstudio hallar la media, mediana y varianza de la variable X
(c) Veri…car las propiedades de la media y la varianza mediante:
i. La suma de 5 minutos a cada uno de los valores de X y luego hallar la nueva media y varianza.
ii. La multiplicación por 4 a cada uno de los valores de X y luego hallar la nueva media y varianza.
(d) Gra…car el histograma.
(e) Gra…car el diagrama de boxplot.

6. Usando las funciones estadísticas de Excel, calcular las tablas de probabilidad acumulada para las
siguientes distribuciones de probabilidad:

(a) T-student
(b) Chi-cuadrada
(c) (veri…car 4 datos de cada tabla con R y las tablas estadísticas)

7. Usar R para generar 1.000 números aleatorios con las siguientes distribuciones: Normal estándar,
Tstudent (n=3), Chi-cuadrada (n=4), Binomial(n=10,p=0.3).
8. Almacenar los resultados anteriores en tres vectores con nombres de: z, t, x, b respectivamente.

9. Hallar un resumen de estadísticos (media, varianza, desviación estándar, etc - usar el comando sum-
mary) de los datos almacenados en los vectores z; t; x; b y comparar con los respectivos valores teóricos
de las variables aleatorias.
10. Gra…car 4 histogramas para los anteriores vectores. Gra…car el box plot para los anteriores vectores.
3
2 Estimación de una y dos muestras
Respecto a la bibliografía proporcionada: "Probabilidad y estadística para ingeniería y ciencias", Walpole
Myers, realizar los siguientes ejercicios:
1. Intérvalos de con…anza para la media 9.3 a 9.13
2. Estimación de la diferencia de medias 1 2: 9.40 a 9.49
3. Estimación de una proporción p y diferencia de proporciones p1 p2 . Realizar los ejercicios pares de
9.52 a 9.67
2
2
4. Estimación de la varianza ; y del cociente de varianzas 1
2 : Realizar los ejercicios pares de: 9.71 a
2
9.80
FECHA DE ENTREGA 05 DE MARZO 2021

2.1 Experiencia con RStudio


1. Con referencia a la bibliografía proporcionada: "Probabilidad y estadística para ingeniería y ciencias",
Walpole Myers. Realizar los siguientes ejercicios en RStudio:
(a) Realizar el ejemplo 9.13 del libro página 293 mediante R y veri…car sus resultados.
(b) Realizar mediante R los ejercicios: 9.11, 9.40 y 9.44.
2. En la unidad de aprendizaje "Software" de la plataforma NEO se encuentra una encuesta para estu-
diantes (responder al link de referencia) en el archivo "base1.xlsx".
(a) Descargar el archivo base1.xlsx
(b) Hallar un resumen de estadísticos descriptivos de la variable nota y edad (media, varianza,
desviación estándar)
(c) Hallar un resumen de estadísticos descriptivos de la variable nota y edad por género.
(d) Hallar el intervalo de con…anza de 1 = 0:95 para la variable edad de los estudiantes.
(e) ¿Las mujeres obtienen una nota promedio superor a los varones?. Para responder realizar:
Hallar un grá…co de boxplot de la nota desagregada por genero
Hallar el intervalo de con…anza del 98% para la diferencia de medias, enuncie los supuestos e
interpretar los resultados.
(f) Probar si el porcentaje de mujeres que realizarían un curso de posgrado, es superior al pocentaje
de varones mediante un intervalo de con…anza adecuado.
3. Se tienen los siguientes datos de un grupo de personas de una empresa, donde "y" representa años de
experiencia despues del título profesional, x1 son los años de experiencia en general, x2 está expresado
en miles dólares y representa los ahorros acumulados durante un año:
y 1 3 0 5 8 2 12 9 5 7 1 3 0 5 8 2 12 9 5 7
x1 3 4 2 4 10 3 13 10 5 9 3 4 2 4 10 3 13 10 5 9
x2 5 5 1 6 10 5 15 10 6 12 5 5 1 6 10 5 15 10 6 12
género m m h m h m h m h h m m h m h m h m m m
(a) Almacenar las anteriores variables en un data frame, denominado ejercicio1.
(b) Hallar el intervalo de con…anza al 95% de con…anza para la media poblacional de la variable "y"
(c) Interpretar el IC anterior.
(d) Hallar el intervalo de con…anza para la diferencia de medias de la variable "y" entre hombres y
mujeres
i. Suponiendo varianzas poblacionales iguales
ii. Suponiendo varianzas poblacionales diferentes
iii. Interpretar el IC anterior.
4
2.1.1 Simulación de una población y obtención de muestras.
1. Simular una población de tamaño n = 100 con las siguientes variables:

y = 15x + z
w = 20x + z
Donde :

x P oisson( = 11)
z N ormal( = 0; = 1)

(a) Hallar los parámetros (media, varianza, desviación estandar) de la población mediante un resumen
de estadísticos descriptivos para los vectores y; w.
(b) Obtener una muestra de tamaño n=15
(c) Hallar los estimadores (media, varianza, desviación estandar) de la muestra y compararlos con los
parámetros mediante
error = ^
mediante un resumen de estadísticos descriptivos para los vectores y; w.
(d) Hallar un intervalo de con…anza del 95% para la media de la variable w, y veri…car si éste intervalo
incluye al verdadero parámetro
(e) Hallar un intervalo de con…anza del 80% para la media de la variable w, y veri…car si éste intervalo
incluye al verdadero parámetro
(f) Comparar las medias de los vectores x e y mediante un grá…co de boxplot. ¿El grá…co indica
alguna evidencia de diferencia de medias en las muestras?
(g) Para con…rmar la evidencia del anterior grá…co, hallar el intervalo de con…anza de la diferencia de
medias con los respectivos supuestos necesarios e interpretar los resultados

3 Pruebas de hipótesis de una y dos poblaciones


Con relación a la bibliografía proporcionada: "Probabilidad y estadística para ingeniería y ciencias", Walpole
Myers (el libro se encuentra en NEO), realizar los siguientes ejercicios:

1. Tipos de errores en una pruba de hipótesis: 10.9; 10.10; 10.14; 10.15; 10.17
2. Prueba de hipótesis respecto a la media : 10.19 a 10.26.
3. Prueba de hipótesis respecto a la diferencia de medias 1 2: 10.30; 10.34; 10.39 a 10.45.

FECHA DE ENTREGA 19 DE MARZO 2021

3.1 Experiencia con RStudio


1. Usar el archivo de la encuesta a estudiantes "base1.xlsx" de NEO, y considerar los datos como una
muestra aleatoria, obtenida de la población de todos los estudiantes de la UCB del año 2019.

(a) Hallar un resumen de estadísticos para la variable nota promedio, horas de estudio, edad: Q1,
mediana, Q3, la media y la desviación estandar.
(b) Interpretar el Q1 de horas de estudio
(c) Interpretar el Q3 de horas de la variable nota
(d) Hallar un resumen de estadísticos descriptivos de la variable nota desagregada por género.
(e) ¿Las mujeres obtienen una nota promedio superor a los varones?. Para responder esa pregunta,
realizar:
5
Un grá…co de boxplot de la nota desagregada por genero
Realizar las siguiente prueba de hipotes:
H0 : 1 = 2 H1 : 2 > 2

(f) Hallar e interpretar el intervalo de con…anza de 1 = 0:95 para la variable edad estudiantes.
(g) Probar la siguiente a…rmación: "el promedio de notas de los estudiantes de la UCB no supera 60
puntos"
2. Realizar todo el analisis para poder probar la siguiente a…rmación " el porcentaje de mujeres que
piensan que realizarían un curso de posgrado, es superior al pocentaje de varones"
3. Se tienen la siguiente información de una empresa, respecto a caracteristicas de un grupo de empleados.
Experiencia esta expresada en años, ingreso en Bs. mensuales, ahorro en Bs anuales:

(a) Almacenar las anteriores variables en un data frame, denominado ejercicio1.


(b) Hallar un resumen de estadísticos para la variable ingreso e interpretar: Q1, mediana, Q3, la media
y la desviación estandar.
(c) Hallar un resumen de estadísticos para la variable ahorro e interpretar: Q1, mediana, Q3, la media
y la desviación estandar.
(d) El gerente de la empresa en una reunión con sus empleados, indica que se hará un ajuste a los
ingresos debido a que el sueldo promedio de toda la empresa es superior a 12.500 Bs. mensuales.
Los datos de muestra, apoyan la a…rmación del gerente? use un = 4%: Enuncie los supuestos
necesarios para poder realizar la prueba.
(e) Gra…car el diagrama de boxplot para el ingreso mensual de hombres y mujeres. ¿El grá…co indica
alguna evidencia de diferencia de medias polacionales de toda la empresa?.
i. Probar la hipótesis correspondiente e interpretar sus resultados. Use el método del valor p
para tomar su decisión
ii. Enuncie los supuestos necesarios para poder realizar la prueba.
4. Simule una muestra aleatoria de tamaño n = 100 para las siguientes variables:
y = 15x + z
w = 20x + z
Donde :
6
x P oisson( = 11)
z N ormal( = 0; = 1)

5. Hallar un resumen de estadísticos descriptivos para los vectores y; w.


6. Realizar las siguientes pruebas de hipotesis:

a) H0 : y = 160 H1 : y 6= 160
b) H0 : y = 160 H1 : y > 160
c) H0 : y = 160 H1 : y < 160

7. Realizar las siguientes pruebas de hipotesis:

a) H0 : w = 0 H1 : w 6= 0
b) H0 : w = 0 H1 : w >0
c) H0 : w = 0 H1 : w <0

8. Comparar las medias de los vectores x e y mediante un grá…co de boxplot. ¿El grá…co indica alguna
evidencia de diferencia de medias en las muestras?
9. Para con…rmar la evidencia del anterior grá…co, probar una prueba de hipotesis
10. Descargar el archivo Base01.xlsx de www.yymiranda.com, luego importar el archivo desde R.
11. Considerar la información anterior como una muestra aleatoria, obtenida de la población de todos los
estudiantes.

(a) Hallar un resumen de estadísticos para la variable nota promedio: Q1, mediana, Q3, la media y
la desviación estandar.
(b) Hallar un resumen de estadísticos para la variable horas de estudio: Q1, mediana, Q3, la media y
la desviación estandar.
(c) Hallar un resumen de estadísticos para la variable edad: Q1, mediana, Q3, la media y la desviación
estandar.
(d) Hallar un resumen de estadísticos descriptivos de la variable nota y edad por género.
(e) ¿Las mujeres obtienen una nota promedio superor a los varones?. Para responder esa pregunta,
realizar:
Un grá…co de boxplot de la nota desagregada por genero
Realizar las siguiente prueba de hipotes:

H0 : 1 = 2 H1 : 2 > 2

12. Hallar

(a) El intervalo de con…anza de 1 = 0:95 para la edad de los estudiantes.


(b) Realizar la siguiente prueba de hipotesis:

H0 : 1 = 23 H1 : 1 > 23

13. Realizar todo el analisis para poder probar si el porcentaje de mujeres que piensan que realizarían un
curso de posgrado, es superior al pocentaje de varones.

TODOS LOS TRABAJOS PRÁCTICOS EN R SON EN GRUPOS DE 5 PERSONAS: FECHA DE


ENTREGA 22 DE MARZO 2021
7

También podría gustarte