Está en la página 1de 12

Actividad 2.

Procesamiento de variables

Descripción de la actividad.

Caracterizar la variable cualitativa presentando: tabla de frecuencias,


diagrama de barras o circular, moda, tabla de contingencias y
conclusiones.

Las Variables cualitativas escogidas son el tipo de riesgo al que se


expone la población y el grado de Marginación.

Tipo de
Riego al
que se
expone la frecuen
población cia
Movimientos
en masa 11
Sequías 5
Vulcanismos 9
Heladas 4
Sismos 11
Avenidas
torrenciales 7
Desbordamie
Tipo de Riesgo al que se expone la población
ntos
Desbordamientos
3
Total
;3 50
Avenidas
torrenciales; 7
Movimientos en
masa; 11

Sequías; 5
Sismos; 11

Vulcanísmos; 9

Heladas; 4
La moda: Son Las variables Movimientos en masa y Sismos.

Tabla de Contingencia:

GRADO DE MAGINACIÓN
Muy alto Alto Medio Bajo Muy bajo
Movimiento en masa 1 7 2 1
QUE SE EXPONE LA
TIPO DE RIESGO AL

Sequía 2 2 1
POBLACIÓN

Vulcanismo 1 5 3
Heladas 1 3
Sismo 1 4 5 1
Avenidas torrenciales 3 3 1
Desbordamientos 1 2

Conclusiones: De la elaboración de la tabla de contingencia se puede


concluir que la población que está expuesta a mayor riesgo es la de
grado de marginación medio y el riesgo asociado es el de movimiento en
masa.

 Variable cuantitativa Discreta y Continua


Para la variable discreta elegida, se deberán calcular las medidas
univariantes de tendencia central: Media, Mediana, Moda. Todos
los cuartiles. Así mismo deberán calcular las medidas univariantes
de dispersión: Rango, Varianza, Desviación típica y Coeficiente de
variación.
Población Población
de 15 años de 15 años
o más sin o más sin
ሺܺ௜ െതሻ
ܺ ሺܺ௜ െതሻଶ
ܺ ሺܺ௜ െതሻ
ܺ ሺܺ௜ െതሻଶ
ܺ
N° Educación N° Educación
básica básica
primaria primaria
completa completa
1 678 -7.286,74 53.096.579,83 26 5585 -2.379,74 5.663.162,47
2 816 -7.148,74 51.104.483,59 27 6058 -1.906,74 3.635.657,43
3 1278 -6.686,74 44.712.491,83 28 6211 -1.753,74 3.075.603,99
4 1503 -6.461,74 41.754.083,83 29 6549 -1.415,74 2.004.319,75
5 1569 -6.395,74 40.905.490,15 30 6581 -1.383,74 1.914.736,39
6 1653 -6.311,74 39.838.061,83 31 6784 -1.180,74 1.394.146,95
7 1809 -6.155,74 37.893.134,95 32 7033 -931,74 868.139,43
8 1942 -6.022,74 36.273.397,11 33 7094 -870,74 758.188,15
9 2042 -5.922,74 35.078.849,11 34 7178 -786,74 618.959,83
10 2232 -5.732,74 32.864.307,91 35 7578 -386,74 149.567,83
11 2279 -5.685,74 32.327.639,35 36 7852 -112,74 12.710,31
12 2311 -5.653,74 31.964.775,99 37 8352 387,26 149.970,31
13 2960 -5.004,74 25.047.422,47 38 9159 1.194,26 1.426.256,95
14 3030 -4.934,74 24.351.658,87 39 9479 1.514,26 2.292.983,35
15 3192 -4.772,74 22.779.047,11 40 10054 2.089,26 4.365.007,35
16 3235 -4.729,74 22.370.440,47 41 12072 4.107,26 16.869.584,71
17 3240 -4.724,74 22.323.168,07 42 12178 4.213,26 17.751.559,83
18 3248 -4.716,74 22.247.636,23 43 13875 5.910,26 34.931.173,27
19 3697 -4.267,74 18.213.604,71 44 14404 6.439,26 41.464.069,35
20 3906 -4.058,74 16.473.370,39 45 16352 8.387,26 70.346.130,31
21 3940 -4.024,74 16.198.532,07 46 17058 9.093,26 82.687.377,43
22 4135 -3.829,74 14.666.908,47 47 17366 9.401,26 88.383.689,59
23 4202 -3.762,74 14.158.212,31 48 17995 10.030,26 100.606.115,67
24 4663 -3.301,74 10.901.487,03 49 23680 15.715,26 246.969.396,87
25 4854 -3.110,74 9.676.703,35 50 73296 65.331,26 4.268.173.533,19
 Medidas Univariantes de Tendencia

Central: 7.964,74

Media:

Media
N

∑ Xj 398.237
X́ = j=1 = =¿
N 50
X́ =7.964,74  

Mediana:

Mediana
Mediana= X 25=4.854
Mediana=4.854

Moda:
No existe la moda porque ningún dato se repite.

Cuartiles:

Primer Cuartil (Q1)


1 1
Q 1= ( X 12+ X 13) = ( 2.311+2.960 )=¿
2 2
Q1=2.635,5
Segundo Cuartil (Q2)
Q2=Mediana=4.854
Tercer Cuartil (Q3)
1 1
Q 3= ( X 37+ X 38 )= ( 8.352+9.159 )=¿
2 2
Q3=8.759
 Medidas univariantes de dispersión:

Rango (R)
R=X 50−X 1=73.296−678=¿
R=72.618
Varianza (s2):
N

∑ ( X i− X́)2
5.713.733 .527,62
s2= i=1 = =¿
N 50
s2=114.274 .670,55  
Desviación típica(s=)
s= √ s2
s= √114.274 .670,55=¿
s=10.689,93  
Coeficiente de variación (V)
s 10.689,93
V= = =¿
X́ 7.964,74
V =1,34

Para la variable continúa elegida, se deberán calcular las


medidas univariantes de tendencia central: Media, Mediana,
Moda. Todos los cuartiles Así mismo deberán calcular las
medidas univariantes de dispersión: Rango, Varianza, Desviación
típica y Coeficiente de variación.
% de % de
Población de Población de
N° 15 años o N° 15 años o
más más
analfabeta analfabeta
1 2,11 26 8,14
2 3,46 27 8,20
3 3,79 28 8,27
4 4,01 29 8,31
5 4,18 30 8,31
6 4,23 31 8,52
7 4,80 32 9,20
8 4,89 33 9,43
9 5,14 34 9,55
10 5,16 35 9,57
11 5,24 36 9,80
12 5,45 37 10,13
13 5,52 38 10,13
14 5,66 39 10,18
15 5,83 40 10,56
16 6,38 41 10,82
17 6,50 42 10,95
18 6,81 43 11,02
19 7,13 44 11,27
20 7,16 45 11,36
21 7,17 46 13,77
22 7,45 47 14,57
23 7,57 48 16,18
24 7,91 49 17,09
25 7,98 50 19,47
Fórmula de Sturges
c=1+3,322∗log ( N )
c=1+3,322∗log ( 50 )=¿
c=6,64 ≈ 7 clases
Amplitud (a)
Mayor−menor
a= =¿
c
19,47−2,11
a= =¿
7
a=2,48

Distribución de frecuencias

% de Población de 15
frecuencias
años o más analfabeta

2,10 4,58 6
4,59 7,07 12
7,08 9,56 16
9,57 12,05 11
12,06 14,54 1
14,55 17,03 2
17,04 19,52 2

50

 Medidas Univariantes de
Tendencia Central

Media:
N

∑ f i Xi 423,47
X́ = i=1 = =¿
N 50
X́ =8,47  
Mediana:
Mediana=L1 +¿
donde: La Moda
L1: Límite inferior de la clase ∆mediana
Medidas de
Moda=L1+
N: número de datos (frecuencia ( 1
)∗c
∆1 +∆ 2total)
¿Dispersión:
¿: suma de las frecuencias
L 1: Fronteradeinferior
las clases
de lainferiores a la clase mediana
clase modal
Rango (R): frecuencia
fmediana de la clase
∆ 1: Exceso de la mediana
frecuencia modal sobre la clase inferior inmediata
R=Mayor−menor=¿
c: anchura del intervalo
∆ : Exceso
de la
declase
la frecuencia
medianamodal sobre la clase superior inmediata
R=19,47−2,11=¿ 2
La clase medianac:esanchura
la tercera
del clase:
intervalo de la clase modal
R=17,36
50La clase modal es la tercera clase
Mediana=7,08+ ( )
2
−18
Moda=7,075+
16
Cuartiles
∗2,49=¿
5+
4
( ) 4
∗2,49=¿

Mediana=8,17 PrimerModa=8,18   (Q )
Cuartil 1 Varianza (s2)
N
Q 1=L1 +¿
∑ ( X j− X́ )2
donde: 211,95
s2= j=1 = =¿
L1: Límite inferior de la clase cuartil N 50
N: número de datos (frecuencia total) s2=4,24
¿ ¿: suma de las frecuencias de las clases inferiores a la clase cuartil
fcuartil: frecuencia de la clase cuartil
c: anchura del intervalo de la clase cuartil
Q 1=L1 +¿
La clase cuartil es la segunda
50
Q 1=4,59+

Q 1=5,94
( )
4
−6
12
∗2,49=¿

Segundo Cuartil (Q2) es igual a la mediana:


Q 2=8,17
Tercer Cuartil (Q3):
Q 3=L1 +¿
La clase cuartil es la cuarta clase
37,5−34
Q 3=9,57+ ( 11 )
∗2,49=¿
Q 3=10,36
Desviación Típica
(s):
s= √ s2 =√ 4,24
s=2,06

Coeficiente de Variación
(V):
s 2,06
V= = =¿
X́ 8,47
V =0,24

 Regresión y correlación entre variables cuantitativas

Identificar dos variables cuantitativas de la situación estudiada que


puedan estar relacionadas y:

Realizar el diagrama de dispersión de dichas variables y


determinar el tipo de asociación entre las variables.
Diagrama de dispersión
cantidad de servicios publicos disponibles 8
7 f(x) = 0 x + 3.2
R² = 0.14
6
5
4
3
2
1
0
0 100 000 200 000 300 000 400 000 500 000 600 000 700 000 800 000
poblacion total (habitantes)

Podemos concluir según el diagrama que si existe correlación entre las


dos variables, que su dirección es positiva

Encontrar el modelo matemático que permite predecir el efecto


de una variable sobre la otra. ¿Es confiable?

y=7E-06x+3,1979
R² = 0,1405

la intensidad se puede denominar débil, por lo tanto, no es


confiable

Determinar el grado de relación de las dos variables


r: 0,3748964

La correlación entre las variables es mínima.

Relacionar la información obtenida con el problema.

Podemos determinar que según la cantidad de población se puede


determinar la cantidad de servicios públicos disponibles, donde según el
grado de correlación lineal se determina que el grado de correlación es
mínima.

Realizar regresión múltiple en caso de que se determine


dependencia entre las variables cuantitativas.

Resumen

Estadísticas de la regresión
Coeficiente de0,41406899
correlación múltiple
Coeficiente de0,17145313
determinación R^2
R^2 ajustado 0,13619582
Error típico 3,32155862
Observaciones 50

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 2 107,302549 53,6512743 4,86290963 0,01203515
Residuos 47 518,539329 11,0327517
Total 49 625,841877

Superior 95,0% Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95,0%Superior 95,0%
Intercepción 10,7555246 1,11694065 9,62945048 1,0678E-12 8,50852989 13,0025194 8,50852989 13,0025194
Variable X 1 -8,0571E-06 5,4372E-06 -1,48184474 0,14505565 -1,8995E-05 2,8812E-06 -1,8995E-05 2,8812E-06
Variable X 2 -0,61933089 0,31147141 -1,98840366 0,05260798 -1,24593054 0,00726876 -1,24593054 0,00726876

y=10,75-8,057X1-0,619X2
En los datos obtenidos se observa que partir del coeficiente de
correlación r2 que nos da un valor de 0,136 un valor que se encuentra
entre menor a 0,30 y nos muestra que la relación que existe entre las
variables múltiples según el grado de correlación lineal en nula lo que
quiere decir que no hay correlación entre las variables múltiples.

También podría gustarte