Está en la página 1de 16

PRÁCTICA DE ESTADÍSTICA

322022
INFERENCIAL
DESCRIPTIVA E
20
ÁREA CUANTITATIVA

ESTUDIANTE:
GUISELA ROSALIN
FLORES SALDAÑA
CARRERA:
ING. COMERCIAL

DOCE
NTE:
PRÁCTICO ESTADÍSTICA DESCRIPTIVA Y ESTADÍSTICA INFERENCIAL 
ÁREA CUANTITATIVA 
Tomando en cuenta los datos de las variables que se presentan a continuación, elaborar la tabla
de frecuencias y realizar sus representaciones gráficas, luego realizar la interpretación
correspondiente: 
1. X: Número de habitaciones, por vivienda. Siendo los datos: 
4 2   2   4   4  1  2  3  5  3  2  3  3   5  5  3  4  4  3  3  3  1  4  4  4  5  5  4  4  5   
Tabla N° 1: “Tabla de frecuencia para datos no agrupados”
Número de habitaciones por vivienda
Xi fi Fi hi Hi
1 2 2 0,07 0,07
2 4 6 0,13 0,20
3 8 14 0,27 0,47
4 10 24 0,33 0,80
5 6 30 0,20 1,00
∑ 30   1,00  
Fuente: Elaboración propia.
Gráfico N° 1:

Número de habitaciones por


vivienda
0.35

0.30

0.25

0.20
0.33
0.15 0.27
0.20
0.10
0.13
0.05 0.07
0.00
1 2 3 4 5

Fuente: Elaboración propia.


Interpretación:
De un total de 30 viviendas, 10 viviendas tienen 4 habitaciones, 8 viviendas tienen 3
habitaciones, 6 viviendas tienen 5 habitaciones, 4 viviendas tiene 2 habitaciones y por último 2
viviendas tienen 1 habitación, tomando en cuenta que el 33% representa las 10 viviendas en
mayoría que cuenta con 4 habitaciones.
2. X: Ventas mensuales de vino, por distribuidora, en miles de Bs. Siendo los datos: 
46   46   47   48    52   52   53    59   57   56   54   69 70  53   64  40  56   45  64 56 56   57  58
57    61   62   62   63   44   63   64   62   66   66   67   68  
Tabla N° 2: Tabla de frecuencia para datos agrupados
Li Ls fi Fi hi Hi %
40 45 2 2 0,06 0,06 5,6
45 50 5 7 0,14 0,19 13,9
50 55 5 12 0,14 0,33 13,9
55 60 9 21 0,25 0,58 25,0
60 65 9 30 0,25 0,83 25,0
65 70 6 36 0,17 1,00 16,7
∑ 36   1,00   100,0
Fuente: Elaboración propia.

R = 70 – 30 C = 30/6
R = 40
C=5
�=√3
��=6
6
Rango, Nº Intervalos y � Recorrido

Gráfica: Ventas de vino


30
25.0 25.0
25
20 16.7
13.9 13.9
Percent

15
10
5.6
5
0.0 0.0
0
40 - 45 40 45
45 - 50 50 -50
55 5555
- 60 6060
- 65 65 - 70 70

ventas

Gráfica N° 2
Fuente: Elaboración propia.
 Interpretación de datos relevantes
 Tomando en cuenta las dos variables más sobresalientes, 18 distribuidores venden
entre 55 a 65 mil bolivianos.
 De la misma manera tomando en cuenta las dos variables más sobresalientes; 21
distribuidores más 30 distribuidores, en total 51 distribuidores venden entre 40 a 65
mil bolivianos.
 De un total de 36 distribuidores de vino, el 50% venden entre 55 a 65 mil bolivianos.
 De un total de 36 distribuidores, el 83% venden entre 60 a 65 mil bolivianos.
3. En base a los siguientes datos, calcular: a) la media aritmética, b) la moda, c) la mediana, d)
la desviación estándar y e) la desviación media. 
Datos: X: Número de habitaciones por vivienda. 
Siendo los datos: 1) 2, 4, 6, 4, 8. 2) 5, 4, 6, 8, 6, 7 
1) 2, 4, 4, 6, 8.

∑ xi 24
a) x= x= =4,8 x=4,8 Media
n 5

b) M 0=Valor de la variable que mas veces se repite .


M 0=¿ 4 Moda
c) M e =¿ Valor de la variable ubicado al centro, una vez ordenado los datos.
M e =4 Mediana
a) Desviación estándar
S2=∑ ¿¿
2
S =¿ ¿
S= √ S
2

S= √5,200=S=2,2803
b) Desviación media
∑( x−x)
DM =
n
(2−4,8)+(4−4,8)+( 4−4,8)+(6−4,8)+(8−4,8)
DM = =DM=0
5

2) 4, 5, 6, 6, 7, 8

∑ xi 36
a) x= x= =6 x=6  
n 6
M 0=Valor de la variable que mas veces se repite .

M 0=¿ 6
d) M e =¿ Valor de la variable ubicado al centro, una vez ordenado los datos.
M e =6

a) Desviación estándar
S2=¿ ¿
S= √2=S=1,4142

b) Desviación media
(4−6)+(5−6)+(6−6)+(6−6)+( 7−6)+(8−6)
DM = = DM=0
6
4. En base a los datos que contienen las siguientes tablas: 
a) Completar con las frecuencias absolutas acumuladas y las frecuencias relativas. 
b) Elaborar los diferentes gráficos. 
c) Calcular sus medidas de tendencia central y de dispersión. 
X: Número de libros, por estudiante. 
a) Tabla N° 3: “Número de habitaciones por vivienda”
Xi Fi Fi hi Hi ∑x*f
1  5 5 0,1 0,1 5
2  8 13 0,17 0,27 16
3  9 22 0,19 0,46 27
4  12 34 0,25 0,71 48
5  10 44 0,21 0,92 50
6  4 48 0,08 1 24
∑ 48   1   170
Fuente: Elaboración propia.
b) Gráfico N° 3:

Número de libros por estudiante

0.25

0.20

0.15
0.25
0.21
0.10 0.19
0.17
0.10
0.05 0.08

0.00
1 2 3 4 5 6
Fuente: Elaboración propia.
c) Calcular sus medidas de tendencia central
Tabla N° 4: Tabla de frecuencias
xi fi Fi hi Hi ∑x*f ࢞െഥ ‫ ࢞ ࢌڄ‬െ
࢞ ഥ ૛ ‫ࢌڄ‬

1  5 5 0,1 0,1 5 12,7 32,26
2  8 13 0,17 0,27 16 12,32 18,97
3  9 22 0,19 0,46 27 4,86 2,62
4  12 34 0,25 0,71 48 5,52 2,54
5  10 44 0,21 0,92 50 14,6 21,32
6  4 48 0,08 1 24 9,84 24,21
∑ 48 1 170 59,84 101,92

Σ xi ⋅ f 170
x= x= =3,54 x =3,54 media
N 48

M 0=Valor de la variable que mas veces se repite .


M 0=¿ 4 Moda
M e =¿ Valor de la variable ubicado al centro, una vez ordenado los datos.
N 48
= ¿ 24 M e =4 Mediana
2 2
La mediana de libros por estudiante es de 4

c.1) Calcular sus medidas de dispersión


∑ ( x−x ) ⋅ f 58,84
D M= = =1,25 Desviación media
n 48
2
∑ ( x− x ) ⋅ f 101,92 =2,12
σ 2= =
n 48

σ =√ 2,12=1,46 Desviación estándar


La cantidad de libros por estudiante cuenta con una dispersión estándar de 1,46.
• Interpretación de datos relevantes
De una muestra de 48 estudiantes, 12 cuentan con 4 libros, por otro lado, también se
puede apreciar que hay 5 estudiantes que cuentan con un solo libro.

Gráfica: número de libros por estudiante


(frecuencia absoluta acumulada)

60
48
50 44
40 34
30 22
20 13
10 5
0
1 2 3 4 5 6
• Interpretación
En una muestra de 48 estudiantes, existen 44 que tienen entre 1 a 5 libros;
posteriormente 48 estudiantes cuentan con 1 a 6 libros.

X: Producción de trigo, por productor (en la comunidad “A”), en qq. 


Tabla N° 5: Tabla de frecuencias de datos agrupados
Li Ls fi  Fi Hi Hi
20  30  4 4 0,05 0,05
30  40  8 12 0,11 0,16
40  50  10 22 0,13 0,29
50  60  12 34 0,16 0,45
60  70  15 49 0,20 0,65
70  80  20 69 0,27 0,92
80  90  6 75 0,08 1,00
∑ 75   1,00  

Fuente: Elaboración propia


Gráfica N° 5
 

Producción de trigo, por productor (en la co-


munidad "A"), en qq.
0.30 0.27

0.25
0.20
0.20 0.16
0.13
0.15 0.11
0.08
0.10
0.05
0.05

0.00
30  40  50  60  70  80  90 
20  30  40  50  60  70  80 

Fuente: Elaboración propia

d) Calcular sus medidas de tendencia central


Tabla N° 6

∑x ( x−x ) ⋅ f ( x−x )2 ⋅ f
Xi Li Ls fi  Fi hi Hi *f    
25 20  30  4 4 0,05 0,05 100 138,68 4808,04
35 30  40  8 12 0,11 0,16 280 197,36 4868,87
45 40  50  10 22 0,13 0,29 450 146,7 2152,09
55 50  60  12 34 0,16 0,45 660 56,04 261,71
65 60  70  15 49 0,20 0,65 975 79,95 426,13
150
75 70  80  20 69 0,27 0,92 0 306,6 4700,18
85 80  90  6 75 0,08 1,00 510 151,98 3849,65
447
∑ 75   1,00 5 1077,31 21066,67

Σ xi ⋅ f 4475
x= x= =59,67 x=59,67 media
N 75

M 0=Valor de la variable que mas veces se repite .


fi−f i−1
M 0=Li + ∗c
( fi−f i −1 ) + ( fi−f l˙+1 )
20−15
M 0=70+ ∗10=72,63 Moda
( 20−15 ) + ( 20−6 )
M e =¿ Valor de la variable ubicado al centro, una vez ordenado los datos.
N 75
−F i−1 −49
2 2
Me=Li+ ∗ai=70+ ∗10=64,25 Mediana
fi 20
c.1) Calcular sus medidas de dispersión
R=90-20 = 70 Recorrido
∑ ( x−x ) ⋅ f 1077,31 4
D M= = =14,36 Desviación media
n 75

∑ ( x− x )2 ⋅ f 21066,67
2
σ = = =280 , 89
n 75

σ =√ 280,89=16,76 Desviación estándar

5. Tomando en cuenta los datos de la siguiente tabla, elaborar los gráficos que permitan realizar
una descripción detallada de su contenido. 
Tabla N°7

C. Empresariales C. Sociales Ingenierías Total


Excelente 10 12 15 37
Muy Bueno 28 25 18 71
Bueno 30 35 24 89
Total 68 72 57 197
Representación gráfica:

Nivel de desempeño de los estudiantes por ca-


rrera
40
35
35
30
30 28
25 24
25
20 18
15
15 12
10
10
5
0
C. Empresariales  C. Sociales  Ingenierías 

Excelente  Muy Bueno 


Linear (Muy Bueno ) Bueno 
Interpretación
 De los 197 estudiantes de todas las carreras, 37 estudiantes tienen un nivel de
desempeño excelente; 71 tienen un nivel de desempeño muy bueno y 89 tienen
un nivel de desempeño bueno.
 De los 68 estudiantes del área de ciencias empresariales, 10 tienen un nivel de
desempeño, excelente; como así también 28 presentan un nivel de desempeño
de muy bueno; y posteriormente 30 estudiantes presentan un nivel de
desempeño bueno.
 De los 72 estudiantes del área de ciencias sociales, 12 tienen un nivel de
desempeño excelente; como así también 25 presentan un nivel de desempeño
de muy bueno; y posteriormente 35 estudiantes presentan un nivel de
desempeño bueno.
 De los 57 estudiantes del área de ingenierías, 15 tienen un nivel de desempeño
excelente; como así también 18 presentan un nivel de desempeño de muy
bueno; y posteriormente 24 estudiantes presentan un nivel de desempeño
bueno.

 
6. En la siguiente tabla se resume las variables: X: Ingreso (alto = 1, medio =2, bajo = 3), Y:
Institución donde trabaja (Gobernación = 1, Municipio = 2). 
2).
X 1 1 2 1 2 1 2 1 2 2 3 3 3 2 1 2 3 3 2 1 1 2 1 2 3 2 1 1 2 3
Y 1 1 2 2 2 1 1 2 2 2 2 1 2 1 1 2 2 2 1 1 2 2 1 2 2 1 1 1 2 2

Realizar la tabulación en una tabla de doble entrada, luego realizar las representaciones
gráficas que sean pertinentes.
Tabla N° 8

Institución/ingresos Alto Medio Bajo Total

Gobernación 8 4 1 13

Municipio 3 8 6 17

Total 11 12 7 30

Interpretación

Gráfica: Nivel de ingreso segun la institución


donde trabaja
8 8

4
3

1
Alto Medio Bajo

Gobernación Municipio

 Se puede observar que en la gobernación existen 8 trabajadores con ingresos altos;


posteriormente 4 trabajadores con ingresos medios y 1 con ingreso bajo.
 Dentro de la institución municipal, existen 3 trabajadores con ingresos altos;
posteriormente 8 trabajadores con ingresos medios y 6 trabajadores con ingreso
bajos.
 De 30 trabajadore, 17 trabajan en municipio con ingresos altos, medios y bajos.
 De 30 trabajadores, 13 trabajan en la gobernación con ingresos altos, medios y
bajos.
ESTADÍSTICA INFERENCIAL
7. Calcular el tamaño de muestra requerido para estimar el número promedio de hijos, por
familia, con un nivel de confianza del 98% y un error máximo tolerable de 1.5. Con este fin
se toma una muestra preliminar de 6 familias, obteniéndose los siguientes datos: 2, 5, 4, 6, 5, 
8. 
Datos:
n=?
nc=98%=0,98
30
e=1,5 x= =5
6
z=2,32 σ 2=¿ ¿
20
σ =1,82 σ 2=9+0+ 1+1+ 0+9= =3,33
6
√ σ = √3,33
2

σ =1,82
Calculo del tamaño de la muestra
n= ( ) (
z ⋅ σ 2 2,32∗1,82 2
z
=
1,5 ) 2
= (7,92 ) =8

Interpretación:
Se concluye que el tamaño de la muestra para estimar el número promedio de hijos por
familia es de 8 con un nivel de confianza del 98% y un error de 1,5.

8. Calcular el tamaño de muestra para estimar la proporción de estudiantes que trabajan con un
nivel confianza del 95 y un error máximo tolerable del 6%. Se tiene referencias previas de
que el porcentaje de estudiantes que trabajan oscila entre el 10 a 20%. 
 Datos: Tabla N°9
NC= 95% e= 6% = 0,0 6 p= 20% = 0,20 q= 80% = 0,80

Z 2∗p∗q
n=
e2
(1,96)2∗0,20∗0,80
n= 2
= 170, 74
0,06
n¿ 171

Interpretación
Realizada la estimación correspondiente, se concluye que se requiere una muestra de
171 estudiantes, con un nivel de confianza del 95%
9. Se desea comparar los ingresos promedios mensuales entre los profesionales que trabajan
en la ciudad de Tarija y Potosí, mediante un intervalo de confianza del 95% para las
verdaderas diferencias medias. Para este fin se toman muestras de profesionales en ambas
ciudades y se calculan sus indicadores estadísticos, los cuales se resumen en la siguiente
tabla. 
Tabla N°10
Ciudad Tamaño de muestra Ingreso promedio (Bs) Varianza muestral
Tarija 60 4500 10000
Potosí 50 3400 10200
 
Datos:
Nc: 95%
z=1,96
Intervalo del 95% para:
ϵ
Mx−M Y =( X− y ) ±2 ⋅σ X − y
2


2 2
σ σ
σ x− y = +
nx ny
σ x− y =
√ 10000 10200
60
+
50
=19,25
4500 – 3400 – 1,96 * 19,25 = 4500 – 3400 + 1,96 * 19,25
1062,27=1137,73
Interpretación:
Los ingresos promedios de los profesionales de Tarija son mejores a comparación de los
ingresos promedio de los profesionales de Potosí con un nivel de confianza de 95%

10. Un investigador desea comparar la duración promedio de dos productos o marcas de


focos. Se conoce que las variables en análisis tienen una distribución normal. Calcular un
intervalo de confianza del 95% para la diferencia de las duraciones, en promedio. Los
datos se presentan en la siguiente tabla: 
Tabla N°11

MARCA Duraciones por unidad de producto (en horas)


Marca A 1200, 2000, 3500, 3800, 800, 1400
Marca B 4000, 5000, 6000, 5500, 8000, 9000, 10000, 8800

Datos:
NC= 95% = 1,96 ∑= 12700 / 6= 2116,67
nx= 6
ny= 8
x=∑ marca A=2116.67 ∑= 56300 / 8= 7037,50
y=∑ marca B=7037,50
Valor de t:
0,025
NC= 95% -> 5
0,05
t= =0,025
2
6+8=14 – 2= 12 12 2,17
9
Buscamos en la tabla t:
0,025 y 12

2
S2=∑ ¿¿ S x =1569666,68
2
S y =4782678,57
( n x −1 )∗S 2x + ( n y −1 )∗S 2y
S2C =
nx +n y −2
2 ( 6−1 )∗1569666,68+ ( 8−1 )∗47826788,57
SC = =3443923,62
6+8−2

SC = √ S c 2 SC = √3443923,62=1855 ;78

S X −Y =S c
√ 1 1
+
nx ny
S X −Y =1855,78
√ 1 1 = 1002,24
+
6 8

u x −u y = ( x − y ) ± t∗S x− y
u x −u y = ( 2116,67−7037,50 ) ± 2,179∗1002,24

Interpretación
Realizada la estimación correspondiente de la duración en promedio de ambos
productos se concluye que son iguales con un intervalo de confianza del 95%.

11. Se desea estimar un intervalo de confianza del 95% para la diferencia de los ingresos
medios de las familias que viven en la ciudad de Tarija y Potosí, en base a los siguientes
datos:  Tabla N°12

Ciudad Tamaño de muestra Ingreso promedio (Bs) Desviación estándar


X Tarija 80 3800 220
Y Potosí 120 3200 350
 
Intervalo de 1 – 6 p/ estimar
M X −M y =( X −Y ) ± z σ


X− y

σ σ
σ X − y= 1 + 2
nx nY
σ X − y=

2201 3502
+
80 120
=2,3805
M X −M y =( 3800−3200 ) ± 1,96∗2,3805
600 ¿ ± 4,6658
Li= 595,33; Ls= 604,67
Interpretación:
Una vez llegado a realizar la estimación correspondiente se concluye que los ingresos
promedio de todas las familias de la ciudad de Tarija son mayores a todos los ingresos de las
familias de Potosí, con un nivel de confianza del 95%.

12. Estimar un intervalo de confianza para la diferencia de la producción promedio de papa


entre las familias de las comunidades de San Andrés y El Puente. Se conoce que la
distribución de la variable que se analiza es normal. 
Tabla N°13
Comunidad Producción por familia (en qq)
X San Andrés 30   12   25   20   25   20 n=6
Y El Puente 40   50   22   60   40   50   60   40 n=8
Estimar el intervalo de confianza requerido con un nivel de confianza del 95%
Datos: P/S. A Int. De 95% p/ M x −M y =( x− y ) ±t Δ x y
( 22−45,25 ) ±2,179(5,61)
Datos:
−23,25 ±12,22
n=6 −35,47 ;−11,03
x = 22
Li=−3547 ; Ls=−11,03
Δ x =¿ 38
2
5 ( 38 ) +7(157,64)
Datos :P/y Δ 2 C=
6 +8−2
n=8 2
Δ C=107,79=ΔC=10,38
x = 22
Δ y =157,64
2

61=6+8 =14 √
1 1
Δ x y=10,38 + =5,61
6 8
14-2=12
Nc=95%
∝=0,05
t 0,025,12=2,179
Interpretación:
Se concluye que la producción promedio de papa de la comunidad de San Andrés es
mayor a la producción de papa de la comunidad del el Puente.

13. Estimar el intervalo de confianza requerido, con un nivel de confianza del 95% para la
diferencia de proporciones de familias que tienen casa propia, en base a los siguientes
datos: 
Tabla N°:14 Diferencia en proporciones de familias que tienen casa propia
Ciudad  Tamaño de muestra Nº de familias que tienen casa propia
Bermejo  60 40
Yacuiba  140 30
 
DATOS:

Nc =95% ; z= 1,96
σ p −p =
x y

0,67∗0,33 1021∗0,79
60
+
σ p − p =0,0698
x y
140

40
Px= =0,67
60
30
Py= =0,21
140
1 ep
Intervalo de π −π y =( Px−Py ) ± Z∗σPx−Py
estimar x

π x −π y =( 0,67−0,21 ) ± 1,96∗0,0698
¿ 0,46 ± 1,89
Li=−1,43 ; Ls=2,35

Interpretación:
Habiendo realizado la estimación se concluye que la cantidad de familia que tienen una casa
propia en Bermejo es igual a las que tienen casa en Yacuiba con un nivel de confianza del
95%

14. Un investigador afirma que: el número promedio de años de escolaridad son iguales.
Tomando en cuenta los datos que se presentan en la siguiente tabla, probar la hipótesis
planteada. Con un nivel de significancia del 5%. Se asume que la variable tiene una
distribución normal. 
Tabla N°15

Municipio Tamaño de muestra Media muestral Varianza


X Cercado 180 15.2 16
Y Entre Ríos 120 10.2 25
 
Ho: M x =M y :∝=0,05


( x− y )−(M X −M y ) σ σ 2 2
Interpretación:
z= σ x− y = x + y Habiendo realizado la
σ x− y nx ny verificación
zc=9,17 σ x− y =
√16 25
+
180 120
σ x− y =0,5452
correspondiente de la
hipótesis planteada, se
concluye que la misma se
RC RC rechaza debido a que se
R A encuentra en la región de
rechazo.
-1,96 0 1,96

15. El director de un Instituto, para ver la efectividad de los métodos de enseñanza, realiza un
experimento que consiste en probar 3 diferentes métodos: A, B y C. Después de
transcurrido el periodo de prueba, aplica una prueba y obtiene los siguientes resultados:
Probar la hipótesis de que los tres métodos son iguales en eficiencia, con un nivel de
significancia de 5%. 
Tabla N°:16

Método Calificaciones Tk X² X
A 40 50 60 40 50 55 295 14825 49,17
B 60 80 80 40 95 88 443 34769 73,83
C 50 30 20 90 48 45 283 16229 47,17
∑ 1021 65823  
Datos: Cálculo auxiliar
N = 18
∑ ¿ ¿ = ¿ ¿ = 60560,5 T 2 10212
nk = 6 = = 57913,39
N 18
k=3
Tabla N°: 17
Grado
Fuente de variación Suma cuadrada Cuadrado medio Coefici0ente f
libertad
Entre grupo de SCA= 60560,5 - 57913,39 CMA= 2647,11 / 2 F= 1323,55 / 350,97
2
tratamiento (A) ASC= 2647,11 CMA= 1323,55 F= 3,77
Error de muestreo SCE= 7911,61 - 2647,11 CME= 5264,5 / 15
15
(E) SCE= 5264,5 CME= 350,97
SCT= 65823 - 57913,39
Total 14
SCT= 7911,61

𝑔𝑙 = 𝐹 (𝑘 – 1) (𝑁 − 𝑘) 𝑔𝑙 = 𝐹 (2) (15)

R. de aceptación Interpretación:

Realizando la prueba de
hipótesis se concluye que los tres
métodos no son iguales en su
R. critica eficiencia, siendo el grado de
libertad 3,682 nos indica que
nuestro coeficiente f de 3,77 está
fuera del rango de aceptación, es
decir en región crítica.
3,682

También podría gustarte