Está en la página 1de 9

TAREA 05

DISTRIBUCIONES BIDIMENSIONALES

1. En una encuesta se recogieron datos de 10 sujetos respecto al


estado civil(X) y el sexo(Y):

Sujeto 1 2 3 4 5 6 7 8 9 10
Estado civil C S S D C D S S C D
Sexo M M F F M M F M F M
Donde:
M=Masculino, F= Femenino, S=Soltero, C=casado, D= Divorciado.
Se pide:
a) Construir la tabla bidimensional de frecuencias
b) Según a):
- ¿Cuántos hombres fueron encuestados?
- ¿Cuál es el porcentaje de mujeres encuestadas?
- ¿Cuál es el porcentaje de mujeres solteras?
- ¿Cuál es la proporción de hombres casados? casados?

ESTADO
SEXO CIVIL Total (ni.)
SOLTERO CASADO DIVORCIADO
MASCULINO 2 2 2 6
FEMENINO 2 1 1 4
Total (n.j) 4 3 3 10

ESTADO
SEXO CIVIL Total (hi.)
SOLTERO CASADO DIVORCIADO
MASCULINO 0.2 0.2 0.2 0.6
FEMENINO 0.2 0.1 0.1 0.4
Total (h.j) 0.4 0.3 0.3 1

ESTADO
Total (hi.
SEXO CIVIL
%)
SOLTERO CASADO DIVORCIADO
MASCULINO 20% 20% 20% 60%
FEMENINO 20% 10% 10% 40%
Total (n.j%) 40% 30% 30% 100%

RESPUESTAS
A. Fueron encuestados 6 hombres. = (n1.=6)
B. El porcentaje de mujeres encuestadas es:
n2. 4
h 2. %= ∗100= ∗100=0.4∗100=40 %
n 10
Del 100 % de personas encuestadas el 40 % de ellas eran mujeres .

C. El porcentaje de mujeres solteras es:


n21 2
h 21 %= ∗100= ∗100=0.2∗100=20 %
n 10
Del 40 % de mujeres encuestadas el 20 % de ellas son solteras .
D. La proporción de hombres casados es:

h 12=0.2 es la proporciónde hombres casados .

2. Sean las variables: grado de instrucción(X) y región de


procedencia(Y) de los empleados de una empresa de expendio de
alimentos:

Grado de Instrucción
Región de
Procedencia Primaria Secundaria
Superior
completa completa Total(nj.)
Costa 40 30 90 160
Sierra 35 15 10 60
Selva 30 15 5 50
Total (n.j) 105 60 105 270

Grado de Instrucción
Región de
Procedencia Primaria Secundaria
Superior
completa completa Total(hj.)
Costa 0.148 0.111 0.333 0.592
Sierra 0.129 0.055 h23=0.033 0.217
Selva h31= 0.111 0.055 0.018 h3.=0.184
Total (h.j) 0.388 0.221 0.384 1

Grado de Instrucción
Región de
Procedencia Primaria Secundaria
Superior
completa completa Total(hj.%)
Costa 14.8% 11% 33.3% 59%
Sierra 13% 5.5% 3.3% 21.8%
Selva 11% 5.5% 1.8% 18.3%
Total (h.j%) 38.8% 22% 38.4% 1

Hallar:
a) La tabla de distribución de frecuencias relativas simples.
Interpretar: h23, h41, h3., h.2.
- h23=0.0333; significa que es la proporción de empleados que su
región de procedencia es de la Sierra y tienen grado de
instrucción superior.
- h31= 0.111; significa que es la proporción de empleados que su
región de procedencia es la selva con un grado de instrucción
de primaria completa.
- h3. =0.184; significa que es la proporción de empleados
procedentes de la selva.
- h.2=0.221; significa que es la proporción de empleados con
grado de instrucción de secundaria completa.
b) La tabla de distribución de frecuencias porcentuales.
Interpretar: h23%, h41%, h3.%, h.2%.
- h23%=3.3%; significa que el 3.3% de los empleados procede de
la sierra y tiene grado de instrucción superior.
- h31%=11.1%, significa que el 11% de empleados procede de la
selva y tiene grado de instrucción primaria completa.
- h3.%=18.4%; significa que el 18.4% de los empleados procede
de la selva.
- h.2%=22.1%; significa que el 22.1% de los empleados tiene
grado de instrucción secundaria completa.
c) La distribución marginal de X e Y.

DISTRIBUCIÓN MARGINAL DE X

Región de ni.
Procedencia
Costa 160

Sierra 60

Selva 50

Total 270

DISTRIBUCIÓN MARGINAL DE Y

Grado de ni.
Instrucción
Primaria 105
Completa
Secundaria 60
Completa
Superior 105

Total 270

d) El porcentaje de empleados de la costa, sierra y selva.


- COSTA = 59%
- SIERRA=21.8%
- SELVA=18.3%

3. Se quiere saber si sufrir o no de alergia tiene relación con llevar


una vida sedentaria (llevar una vida sin realizar ningún tipo de
ejercicio físico). Los datos de 300 sujetos se presentan a
continuación
Enfermedad
Forma de vida Total
Sufre alergia No sufre alergia
Sedentaria 130 30 160
No sedentaria 20 120 140
Total 150 150 300

¿Qué conclusiones tienes sobre la asociación, teniendo en cuenta la


información que da cada celda sobre las variables?
- Según los datos que nos brindan en la tabla, el ser sedentario
no influye para sufrir de alguna alergia. Por lo tanto, ambas
variables son independientes, ya que ninguna depende de la
otra para su consecuencia.

4. De una población de 200 fábricas se seleccionó una muestra de 20


fábricas, obteniéndose información respecto al número de
trabajadores (X) y respecto a su producción (Y) en TM, como
sigue:

X 10 15 12 11 18 14 10 13 15 16 17 18 13 17 11
Y 6 8 7 9 8 6 7 10 10 8 8 9 7 9 5
nij 1 1 2 1 2 2 1 1 2 2 1 1 1 1 1

CONSTRUIR EL DIAGRAMA DE DISPERSIÓN Y ESTABLECER LA


TENDENCIA

10
9
8
PRODUCCIÓN
7
6
5
4
3
2
1
N° TRABAJADORES
10 11 12 13 14 15 16 17 18

TIENE UN MODELO DE TENDENCIA LINEAL- BUEN


AJUSTE
CUANDO “X” CRECE, “Y” CRECE

OBTENER LA ECUACIÓN DE REGRESIÓN Y TRAZAR SU


GRAFICA EN EL DIAGRAMA DE DISPERSIÓN.

La dispersión de los puntos genera una tendencia lineal de la forma Y = a + bX

N° PRODUCCIÓN
TRABAJADORE (Y) X2 Y2 XY
S (X)
10 6 100 36 60
10 7 100 49 70
11 5 121 25 55
11 9 121 81 99
12 7 144 49 84
13 7 144 49 91
13 10 169 100 130
14 6 169 36 84
15 8 225 64 120
15 10 225 100 150
16 8 256 64 128
17 8 289 64 136
17 9 289 81 153
18 8 324 64 144
18 9 324 81 162
210 117 3256 943 1666

15 ( 1666 )−210 ( 117 ) 24990−24570 420


-b= = =
48840−44100 4740
=0.08
15 (3256 )−2102

117 0.08∗210
- a= + =7.8+ 0.08∗14=7.8+1.12=8.92
15 15

POR LO TANTO EL MODELO ESTIMADO ES : ^y =8.92−0. 08 X

INTERPRETE SUS COEFICIENTES A, B.

A= 8.92, cuando no hay ningún trabajador el promedio de la


producción es de 8.92 ut aproximadamente

B= 0.08, significa que cada vez que hay un aumento de trabajador, la


producción disminuirá en 0.08 ut.

EVALUACIÓN DEL MODELO PARA LA PREDICCIÓN


r=
15 ( 1666 )−210 ( 117 ) 420 420 420
= = =
√15 ( 3256 ) −2102∗√15 ( 943−1172 ) √ 48840−44100∗√ 15∗−12746 68.8∗437.2 30.07
¿ 13.96

(e) Realice estimaciones para la variable dependiente Y en función


de la variable independiente X.

- si x=10 , entonces ^y =8.92−0. 08 X=8.92−0.08∗10=8.1


- si y =11 entonces ^y =8.92−0.08 X=8.92−0.08∗11=8.04
ii) Un editor tomó una muestra de 7 libros anotando el precio y el
número de páginas respectivo, obteniendo los siguientes datos.

N° de páginas 630 550 400 250 370 320 610


Precio ($) 10 8 7 4 6 6 9

5. Para cada uno de los ejercicios propuestos:


(a) Construir un diagrama de dispersión y establecer la tendencia

Precio

10

6
4
TIENE UN MODELO DE TENDENCIA LINEAL- BUEN
2 AJUSTE
N° páginas
CUANDO “X” CRECE, “Y” CRECE
250 320 370 400 550 610 630

OBTENER LA ECUACIÓN DE REGRESIÓN Y TRAZAR SU


GRAFICA EN EL DIAGRAMA DE DISPERSIÓN.

La dispersión de los puntos genera una tendencia lineal de la forma Y = a + bX

N° de páginas (X) Precio


X2 Y2 XY
(Y)
250 4 62500 16 1000
320 6 102400 36 1920
370 6 136900 36 2220
400 7 160000 49 2800
550 8 302500 64 4400
610 9 372100 81 5490
630 10 396900 100 6300
3130 50 1533300 382 24130

7 (24130 )−3130 ( 50 ) 168910−157500 11410


-a= 2
= =
10733100−9796900 936200
=0.01
7 ( 1533300 )−3130
50 1∗3130
- b= +0.0 =7. 14+ 0.01∗447.1=7.14+ 4.471=11.6
7 7

POR LO TANTO EL MODELO ESTIMADO ES : ^y =11.6−0. 01 X

INTERPRETE SUS COEFICIENTES A, B.

A= 0.01, cuando no hay ninguna página el promedio del precio


disminuye a 0.01soles aproximadamente

B= 11.6 , significa que cada vez que hay un aumento de página , el


libro tendrá un precio de en 11.6 aproximadamente.

EVALUACIÓN DEL MODELO PARA LA PREDICCIÓN


r=
7 ( 24130 )−3130 ( 50 ) 168910−156500 12410
= =
2
√7 ( 1533300 ) −210 ∗√ 7 ( 382−50 )2
√ 10733100−44100∗√7∗382−2500 3269∗121.7
¿ 0.03

(e) Realice estimaciones para la variable dependiente Y en función


de la variable independiente X.

- si x=20 , entonces ^y =11.6−0.0 1 X =11.6−0.0 1∗20=11.4


- si y =21 entonces ^y =11.6−0.0 1 X=11.6−0.01∗21=11.39

También podría gustarte