Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ASIGNATURA: Estadstica Aplicada TEMA: Aplicacin de estadstica INTEGRANTES: . Romero Aguinaga Ivan Purisaca Chayan Daniel Soto Anacleto Osmar
LI 19 .10 1.96
LS 19 .10 1.96
2) despus de realizar una encuesta de 150 personas se tuvieron los siguientes datos de los promedios de edades tanto para hombres como para mujeres los cuales fueron
promedio de 19.30 y 18.94, una desviacin de 2.07 y 2.33 y una muestras de 71 y 83 Consultar un intervalo de confianza de 98%?
DATO:
Hombres Promedio(x) Desviacin () Muestra(n) SOLUCION 19.30 2.07 71 mujeres 18.94 2.33 83
[(x1 x 2 ) z1 / 2
12
n1
22
n2
1 2 ( x1 x 2 ) z1 / 2
12
n1
22
n2
2.07 2 71
33 2.83 0.47
2
2.07 2 71
33 2.83 1.18
2
3) Construir un intervalo de confianza para una muestra de 154 personas determin cunto tiempo sale los jvenes a los centro de diversin nocturna si se sabes que tiene un promedio de 5.54 y una desviacin de 1.93 al 99% de confianza.
[ x z1 / 2
s x z1 / 2 n
s ] n
LI 5.54 2.58
LI 5.54 2.58
El tiempo que salen los estudiante oscila entre los 5.14 horas y 5.94 horas.
4. construya un intervalo de confianza para la proporcin de estudiantes que consumen bebidas alcohlicas al 99% sabiendo que se sabe que de una muestra de 154 personas 97 dijeron que si se conoce la poblacin N=6591 DATO
n= 154 p= = = 0.63
[ p z1 / 2
p(1 p) N n p(1 p) N n . p p z1 / 2 ] n N 1 n N 1
0.6310.63 154 6591154 65911
LI 0.63 2.575.
0.53
LS 0.63 2.575.
0.6310.63 154
6591154 65911
0.73
En la poblacin de estudiantes que consumen bebidas alcohlicas est entre 53% y 73%
5.) Construya un intervalo de confianza para una muestra de 154 estudiantes para el gasto cuando de los estudiantes mayores de 18 aos al 97% si se sabe que tiene un promedio de 45.22 y una desviacin de 32.06. Dato
Media(x)= 45.22
[ x z1 / 2
s x z1 / 2 n
s ] n
LI 45 .22 2.17
LS 45 .22 2.17
El gasto de los estudiantes mayores de 18 aos est entre los 39,61 y 50,82
6.) construya un intervalo de confianza para la proporcin de estudiantes que fuman cuando salen a divertirse de una muestra de 154 personas si se sabe que los que respondieron si son 64 y se conoce la poblacin N=6591 con un nivel de confianza al 95%.
n= 154
p=
= 0.42
[ p z1 / 2
p(1 p) N n p(1 p) N n . p p z1 / 2 ] n N 1 n N 1
0.4210.42 154 6591154 65911
LI 0.42 1.96.
LS 0.42 1.96.
.
.
0.34
0.49
0.4210.42 154
6591154 65911
En la poblacin de estudiantes que fuman cuando salen est entre 34% y 49%
7.) construya un intervalo de confianza para la proporcin de estudiantes que consumen bebidas alcohlicas en vas pblicas de una muestra de 154 sabiendo que los que respondieron si son 29 con un nivel de confianza al 98%
n= 154 p= = = 0.19
[ p z1 / 2
p(1 p) N n p(1 p) N n . p p z1 / 2 ] n N 1 n N 1
0.1910.19 154 6591154 65911
LI 0.19 2..33.
LS 0.19 2..33.
.
.
0.12
0.26
0.1910.19 154
6591154 65911
En la poblacin de estudiantes que consumen bebidas alcohlicas en vas pblicas est entre 12% y 26%
EJERCICIOS DE ESTIMACIONES 1.) determinar el gasto que realizan los estudiante cuando salen a divertirse para esto se toma una muestra de 154 personas se tomas al azar 10 personas las cuales fueron 10 20 15 10 20 5 30 100 150 200 determinar cul es el gasto medio de alumno cuando salen? DATO: 20 15 10 20 5 30 100 150 200 SOLUCION
RPTA: 61.11 "el estimado del gasto medio que realizan en total de estudiantes cuando salen es de 61.1"
2.) sobre una muestra aleatoria de 154 alumnos se observa que 95 consumen alcohol a) sobre la poblacin total de alumno estime la proporcin que consumen alcohol b) estime el erro estndar del estimado. DATO:
n= 154 p= = = 0.62
N xito= 95
SOLUCION
0.039
3.) De una muestra de 154 personas se exagern a la zar los siguientes son promedio de gasto tanto de hombre como de mujeres
hombre 30 50 50 70 100 mujeres 15 100 10 12 25
Digamos que los datos constituyen muestras aleatorias independiente tomadas de poblaciones normales con varianzas iguales construir un intervalo de confianza del 99% de la diferencia entre el promedio real de los gatos de ambos sexos Hombres 30 50 50 70 100 mujeres 15 100 10 10 25
Para calcular la desviacin estndar se aplica la formula =desvest (base seleccionada) Desvest = 26.46 Desvest = 28.23 Muestra = 5 Para muestra pequea varianza de la poblacin desconocida igual Nivel 99% = valor T= 1-0.99 distrib.T.inv.(2*0.01;8)=2.90
3531.29
Segn los resultados al 99% los gastos de ambos sexos esta entre -81.26 y 136,46
4) sobre una muestra hecha en una determinada universidad se seleccionado al azar una muestra de 7 personas para determinar el promedio de las edades que suelen frecuentar lugares de diversin nocturna las edades fueron las siguientes
16 17 17 18 19 20 21
16 17 17 18 19 20 21
Para calcular la desviacin estndar se aplica la formula =desvest (base seleccionada) Para las edades: desvest= 1.80
5) un estudio determin que de una muestra seleccionad al azar de 10 personas el nmero de horas que salen los fines de semana fueron
3.17
3.50
2.00
2.43
3.00
2.14
2.00
2.33
2.00
1.83
Suponiendo que esta determinacin esta normalmente distribuida, construya un intervalo de confianza al 95% del porcentaje promedio de das que salen los estudiantes 3.17 3.50 2.00 2.43 3.00 2.14 2.00 2.33 2.00 1.83 DATO Calculando el promedio
Para calcular la desviacin estndar se aplica la formula =desvest (base seleccionada) Desvest = 0.58 Muestra = 10 Nivel 95% = valor T= 1-0.99 distrib.T.inv.(2*0.05;9)=1.83
Al 99% de confianza el porcentaje de das que salen los alumnos est entre 2.10 y 2.78
PRUEBA DE HIPOTESIS
1) Para tratar de estimar el promedio de las edades por persona encuestada acerca de
los lugares de diversin para jvenes se tomo una muestra de 154 jvenes durante un periodo de una semana. Si la media de las edades de la muestra es de 19.10 y una desviacin de la edad es de 2.21. Existe evidencia para decir que la edad promedio es mayor a 22 aos? utilizar un nivel de confianza del 95%.
No se rechaza Por lo tanto no existe evidencia estadstica para decir que el promedio de las edades sea mayor que 22
2) Una muestra aleatoria de 154 personas presenta que el promedio de consumo de cigarrillos es de 2.46 y una desviacin de 4.21 Se tiene evidencia para decir que el nmero promedio de cigarrillos consumidos es menor que 3? PRIMER PASO: Plantear hiptesis
Ho : = 3 H1 : < 3
Zc = -1.59 Una vez hecho esto se haya Z aplicando DISTR.NORM.ESTAND.INV (1-0,05) Z = 1.64
No se rechaza
NO existe evidencia para decir que el promedio de das que sale una persona en un fin de semana es menor que 3 3) Se realizo un anlisis para calcular la diferencia de gastos entre hombres y mujeres de la USAT en una salida del fin de semana con un promedio de 51.48 y 35.45 respectivamente de la misma manera una desviacin estndar de 35.89 y 21.88. con un nivel de significacin de 0.01 pruebe si la diferencia de gasto entre hombres y mujeres es 40 PRIMER PASO: Plantear hiptesis
Ho : h -m = 40 H1 : h -m 40
Se rechaza Existe evidencia estadstica para decir que la diferencia entre los gastos de hombres y mujeres es diferente de s/ 40.00 4) Para tratar de estimar el promedio de horas de salida en un fin de semana por persona encuestada se tomo una muestra de 154 jvenes durante un periodo de una semana. Si la media de horas de salida es de 5.54 y una desviacin de 1.93 horas . existe evidencia para decir que el promedio es mayor en 7 horas ? utilizar un nivel de confianza del 95%
No se rechaza No existe evidencia para decir que el promedio de horas de salida sea mayor que 7
Actividad en tiempo de ocio estar con los amigos practicar deportes salir a tomar o comer algo ver tele, pelculas Total general
TERCER PASO: Identificar datos V= (r- 1)* (v- 1) = (4 -1)*(4- 1) = 9 grados de libertad
CUARTO PASO: Aplicar Megastat Chi-square Contingency Table Test for Independence
Femenino 37 36,11 0,89 0,02 4 13,47 -9,47 6,66 6 6,47 -0,47 0,03
Masculino 30 30,89 -0,89 0,03 21 11,53 9,47 7,79 6 5,53 0,47 0,04
Total 67 67,00 0,00 0,05 25 25,00 0,00 14,45 12 12,00 0,00 0,07
practicar deportes
Total
2) Se pretende determinar si el numero de encuestados acerca de los lugares de diversin nocturna para jvenes se encuentran distribuidos de forma equitativa segn la actividad de ocio que realiza. con base en una muestra aleatoria de 154 estudiantes se obtuvo la siguiente informacin:
estar con los amigos 67 actividad e ocio practicar salir a tomar o comer deportes algo 25 12 ver tele, pelculas 50
Con una significacin de 0.01 existe alguna razn para decir que el numero de encuestados se encuentran bien distribuido segn su actividad de ocio en tiempo libre
Actividad de ocio Estar con los amigos Practicar deporte Salir a tomar o comer algo Ver tele, pelculas
n 67 25 12 50
Actividad de ocio Estar con los amigos Practicar deporte comer o tomar - ver tele, peliculas
n 67 25
62
TERCER PASO: Identificar datos (K- 1)= (2 1) = 1 grados de libertad CUARTO PASO: Aplicar Megastat
observed 67 25 62 154
Por lo tanto se puede concluir que el numero de encuestados no se encuentra distribuido equitativamente 3) Se pretende observar si existe alguna relacin entre el nmero de salidas en los fines de semana hacia diversos lugares de diversin y la atencin brindada en los mismos. Con un nivel de significacin del 0.05 determinar si existe relacin entre el nmero de salidas y la atencin brindada en los lugares de diversin.
n salidas de 2 a 4 fines de sema de 4 a mas fines de sema no salgo o salgo raramente Total general
buena 53 11 29 93
TERCER PASO: Identificar datos V= (r- 1)* (v- 1) = (3 -1)*(3- 1) = 4 CUARTO PASO: Aplicar Megastat
buena de 2 a 4 fines de sema Observed Expected O-E (O - E) / E de 4 a mas fines de sema Observed Expected O-E (O - E) / E no salgo o salgo Observed 53 53,75 -0,75 0,01 11 10,87 0,13 0,00 29 mala 1 1,16 -0,16 0,02 0 0,23 -0,23 0,23 1 regular 35 34,10 0,90 0,02 7 6,90 0,10 0,00 17 Total 89 89,00 0,00 0,06 18 18,00 0,00 0,24 47
grados de libertad
raramente Expected O-E (O - E) / E Total Observed Expected O-E (O - E) / E 28,38 0,62 0,01 93 93,00 0,00 0,03 0,61 0,39 0,25 2 2,00 0,00 0,50 18,01 -1,01 0,06 59 59,00 0,00 0,08 47,00 0,00 0,32 154 154,00 0,00 0,61
Femenino 49 27 7 0 83
sexo Masculino 24 31 14 2 71
Femenino 49 27 7
sexo Masculino 24 31 16
Total general 73 58 23
TERCER PASO: Identificar datos V= (r- 1)* (v- 1) = (4 -1)*(2- 1) = 3 CUARTO PASO: Aplicar Megastat
Femenino 5 A 30 Observed Expected O-E (O - E) / E 30 A 60 Observed Expected O-E (O - E) / E 60 -100 - 100 a mas Observed Expected O-E (O - E) / E Total Observed Expected O-E (O - E) / E 49 39,34 9,66 2,37 27 31,26 -4,26 0,58 7 12,40 -5,40 2,35 83 83,00 0,00 5,30 11,49 chi-square 2 df ,0032 p-value ,264 Coefficient of Contingency Masculino 24 33,66 -9,66 2,77 31 26,74 4,26 0,68 16 10,60 5,40 2,75 71 71,00 0,00 6,19 Total 73 73,00 0,00 5,14 58 58,00 0,00 1,26 23 23,00 0,00 5,09 154 154,00 0,00 11,49
grados de libertad
Por lo tanto podemos decir que existe relacin en el sexo y el gasto promedio en una salida
5) Se pretende determinar si el numero de encuestados acerca de los lugares de diversin nocturna para jvenes se encuentran distribuidos de forma equitativa segn el gasto promedio que realizan en una salida. Con base en una muestra aleatoria de 154 estudiantes se obtuvo la siguiente informacin
5 A 30 73
.Con una significacin de 0.06 existe alguna razn para decir que el numero de encuestados se encuentran bien distribuido con su gasto promedio en una salida.
Gasto promedio 5 A 30 30 A 60 60 A 100 100 A MAS Gasto promedio 5 A 30 30 A 60 60 a 100 - 100 a MAS
n 73 58 21 2 n 73 58 23
TERCER PASO: Identificar datos V= (r- 1)* (v- 1) = (3 -1)*(2- 1) = 2 CUARTO PASO: Aplicar Megastat Goodness of Fit Test
observed 73 58 23 154 Warning: sums should be equal. 346,50 chi-square 2 df 5,73E-76 p-value expected 18,250 14,500 5,750 38,500 O-E 54,750 43,500 17,250 115,500 (O - E) / E 164,250 130,500 51,750 346,500 % of chisq 47,40 37,66 14,94 100,00
grados de libertad
Por lo tanto podemos decir que no se encuentra distribuido equitativamente el numero de encuestados segn su gasto promedio en una salida.
REGRESIN LINEAL
1) En un estudio sobre los lugares de diversin nocturna para jvenes se recolecto los datos de la tabla y se desea determinar si existe una relacin en el costo de salidas y el tiempo suele salir los fines de semana. al 0,05 determinar si existe una relacin positiva?
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 total
tiempo de promedio de salida en gastos en una un fin de salida (X) semana (Y) 250 12 150 6 100 10 80 4 70 7 60 4 50 6 45 4 40 5 30 5 25 5 20 4 15 4 12 8 10 3 5 6 962 93
X*Y
X^2
Y^2
3000 900 1000 320 490 240 300 180 200 150 125 80 60 96 30 30 7201
62500 22500 10000 6400 4900 3600 2500 2025 1600 900 625 400 225 144 100 25 118444
Diagrama de Dispersin
14 12 10 8 6 4 2 0 0 100 200 300 tiempo de salida en un fin de semana (Y) Linear (tiempo de salida en un fin de semana (Y))
n xi y i xi y i n xi2 xi
2
yi 1 xi n
= 0.03
= 4.22
y 4.22 0.03x
n xi2 xi
n xi yi xi yi
2
n yi2 yi
R= 0.6952
d) Al 0.05 se puede concluir que existe una asociacin positiva entre las dos variable? Interpretar.
ho=p=0 ha=p> 0
2) De un estudio sobre lugares de diversin para jvenes se desea determinar si existe una relacin entre el nmero de das que sale un fin de semana y el dinero que gasta cuando sale. Se recopilan los siguientes datos de una muestra aleatoria a las personas encuestadas. determinar el intervalo de prediccin al 99% cuando se suele salir 2 fines de semana?
N 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 total
PREG 6 6 5 5 4 4 4 4 3 3 3 3 2 2 1 1 1 1 1 53
X*Y 150 250 150 240 120 80 40 300 240 180 150 200 160 250 100 40 35 30 2715
X2 36 25 25 16 16 16 16 9 9 9 9 4 4 1 1 1 1 1 199
Y2 625 2500 900 3600 900 400 100 10000 6400 3600 2500 10000 6400 62500 10000 1600 1225 900 124150
Diagrama de Dispersin
300 250 200 150 100 50 0 0 1 2 3 4 5 6 7
n xi2 xi
n xi yi xi yi
2
n yi2 yi
R= -0.4549
C ) intervalo de prediccin
n xi y i xi y i n xi2 xi
2
yi 1 xi n
y Y=78.65x 0 1