Está en la página 1de 14

Encuesta Nacional 1500 Hogares

Actividad 2. Proyecto grupal

Curso:
Estadstica CNP

Julio Cesar Prez Daza - 1311020098


Luz Dary Villamil Barriga - 1311670098
Richard Alfonso Rueda Martnez - 1311020077
Gloria Roco Sachica Rocha - 1311020112
Jenny Andrea Lara Garca -1311670116

Tutora:
Diana Shirley Velsquez Rojas
Tutora Mster:
Patricia Castillo

09 de Diciembre de 2013

1. Variable Cuantitativa Discreta


VARIABLE: AD GASTOS ADICIONALES ANUALES
Clasificacin: Variable cuantitativa continua de Razn o proporcin.
ADGASTOS ADICIONALES
n = 517
Observacin: Anlisis 517 familias estrato 1 encuestadas en 100 municipios del territorio
colombiano.
Es decir 517 corresponde al 100% del estrato 1.

Procedemos hallar el valor mximo y el valor mnimo de la variable AD de acuerdo a la


informacin de la base de 1500 hogares, ubicados en el estrato 1.

Valor mnimo: 2.116


Valor mximo: 5.203

Hallamos el rango o recorrido que es la diferencia entre el valor mximo y el valor mnimo.

R= 5.203-2.116
R= 3.087

Hallamos el nmero de intervalos m con la frmula:


m=1+3,3 log ( n)

m=1+3,3 log (517)

m=1+3,3(2,713)
m=9,954

Aproximamos
m=10 N merodegrupos

C=

Calculamos la amplitud del grupo C


rango
m

C=

3087
=308 ,7 309
10

Procedemos a encontrar los grupos


GRUPOS
PRIMER GRUPO
SEGUNDO
GRUPO
TERCER GRUPO
CUARTO GRUPO

LI
2116

LS
2116+309=2425

2425

2425+309=2734

2734
3043

2734+309=3043
3043+309=3352

QUINTO GRUPO
SEXTO GRUPO
SEPTIMO GRUPO
OCTAVO GRUPO
NOVENO GRUPO
DECIMO GRUPO

3352
3661
3970
4279
4588
4897

3352+309=3661
3661+309=3970
3970+309=4279
4279+309=4588
4588+309=4897
4897+309=5206

Realizamos la tabla de distribucin de frecuencias.

Distribucin De Frecuencias De Los Gastos Adicionales Anuales Estrato 1


GASTOS
ADICIONALE
S ANUALES
LI
2116
2425
2734
3043
3352
3661
3970
4279
4588
4897

LS
2425
2734
3043
3352
3661
3970
4279
4588
4897
5206
TOTAL

NRO DE
FAMILIAS

INRESOS
MEDIOS

PROPORCION
DE FAMILIAS

ni
15
26
56
112
88
117
60
29
10
4
517

xi
2270.5
2579.5
2888.5
3197.5
3506.5
3815.5
4124.5
4433.5
4742.5
5051.5
36,610.00

hi
0.029
0.050
0.108
0.217
0.170
0.226
0.116
0.056
0.019
0.008
1.000

NRO
PROP.
ACUMULADO ACUMULADA
DE FLIAS
DE FAMILIAS
Ni
15
41
97
209
297
414
474
503
513
517

Hi
0.029
0.079
0.188
0.404
0.574
0.801
0.917
0.973
0.992
1.000

Se puede analizar lo siguiente lo siguiente para la variable gastos adicionales del estrato 1

15 familias tienen gastos adicionales entre 2116 y 2425


26 familias tienen gastos adicionales entre 2425 y 2734
56 familias tienen gastos adicionales entre 2734 y 3043
112 familias tienen gastos adicionales entre 3043 y 3352
88 familias tienen gastos adicionales entre 3352 y 3661
117 familias tienen gastos adicionales entre 3661 y 3970
60 familias tienen gastos adicionales entre 3970 y 4279
29 familias tienen gastos adicionales entre 4279 y 4588
10 familias tienen gastos adicionales entre 4588 y 4897
4 familias tienen gastos adicionales entre 4897 y 5203

Medidas De Tendencia Central, Media O Promedio Aritmtico


Las principales medidas son:
Media Aritmtica X
Mediana Med
Moda Md

Hallamos la media aritmtica para datos agrupados con la frmula


n

( xini )

X = i=1

n
GASTOS
ADICIONALES
ANUALES
LI
LS
2116
2425
2425
2734
2734
3043
3043
3352
3352
3661
3661
3970
3970
4279
4279
4588
4588
4897

NRO. DE
FAMILIAS

INRESOS
MEDIOS

ni
15
26
56
112
88
117
60
29
10

xi
2270.5
2579.5
2888.5
3197.5
3506.5
3815.5
4124.5
4433.5
4742.5

xini
34,057.50
67,067.00
161,756.00
358,120.00
308,572.00
446,413.50
247,470.00
128,571.50
47,425.00

4897

X=

5206
TOTAL

4
517

5051.5
36,610.00

20,206.00
1,819,658.50

1.819 .658,50
517

X =3.519,649

Hallamos la Mediana

Debemos ubicar los datos que se encuentran en el centro


n 517
=
=258,5
2
2

GASTOS
ADICIONALE
S ANUALES

# DE
FAMILIA
S

INRESOS
MEDIOS

PROPORCIO
N DE
FAMILIAS

NRO
ACUMULAD
O DE FLIAS

PROP.
ACUMULAD
A DE
FAMILIAS

Producto

(xi-)

(xi-)

(xi-)ni

LI

LS

ni

xi

hi

Ni

Hi

xini

2116

2425

15

2270.5

0.029

15

0.029

34,057.50

-1,390.50

1,933,490.25

29,002,354

2425

2734

26

2579.5

0.050

41

0.079

67,067.00

-1,081.50

1,169,642.25

30,410,699

2734

3043

56

2888.5

0.108

97

0.188

161,756.00

-772.50

596,756.25

33,418,350

3043

3352

112

3197.5

0.217

209

0.404

358,120.00

-463.50

214,832.25

24,061,212

3352

3661

88

3506.5

0.170

297

0.574

308,572.00

-154.50

23,870.25

2,100,582

3661

3970

117

3815.5

0.226

414

0.801

446,413.50

154.50

23,870.25

2,792,819

3970

4279

60

4124.5

0.116

474

0.917

247,470.00

463.50

214,832.25

12,889,935

4279

4588

29

4433.5

0.056

503

0.973

128,571.50

772.50

596,756.25

17,305,931

4588

4897

10

4742.5

0.019

513

0.992

47,425.00

1,081.50

1,169,642.25

11,696,423

4897

5206

5051.5

0.008

517

1.000

20,206.00

1,390.50

1,933,490.25

7,733,961

TOTAL

517

36,610.00

1.000

1,819,658.50

0.00

7,877,182.50

171,412,265

n 517
=
=258,5
2
2
Comparamos el resultado de n/2 con las frecuencias absolutas acumuladas hasta encontrar
la menor frecuencia que lo contenga en este caso es Ni=297
Ahora aplicamos la formula de la mediana:

n
N 1 )
(
2
Me=Li+
C
i

Me=3352+

(258.5209 )
309
88

Me=3 . 525 ,81

Hallamos la Moda: Es el valor ms frecuente en el que se observa mayor nmero de veces


n
comparados con los i que en este caso es 117.

Moda=Li+

( n ini1 )
C
( ni ni1 ) +( ni ni+1 )

Moda=3661+

( 11788 )
309
( 11788 )+ (11760 )

Moda=3661+

( 29 )
309
( 29 ) + ( 57 )

Moda=3661+

29
309
86

Moda=3765 ,19

Medidas De Localizacin

Vamos a hallar en este caso el 25% de las familias que menos gastan en gastos adicionales.
Trabajamos los CUARTILES (QK)

PRIMER CUARTIL = K=1 Si fuera el 50% seria K2; Si fuese el 75% seria K3, y si fuese el
100% seria K4
Kn
=
4

kn
N 1 )
(
4
Qk=Li+
C

( 1 ) ( 517 )
4

= 129.25

209

Qk=3043+

(129.2597 )
309
112

Qk=3043+

( 32.25 )
309
112

Qk=3131 ,97

Medidas De Dispersin O Variacin De Datos

Las principales medias son:

Rango
Varianza
Desviacin Estndar
Coeficiente de variacin

Hallamos el rango : Diferencia que existe entre el valor ms grande y el ms pequeo


RANGO = MAX MIN
RANGO = 5203-2116
RANGO = 309

Hallamos para poder hallar la varianza.

xini
n

36610
=3.661
10

Enseguida debemos hallar la diferencia entre Xi- ( Xi ) ; luego procedemos hallar el


cuadrado ( Xi )

, por ltimo debemos multiplicar por

ni

para poder aplicar la

frmula.(OBSERVAR TABLA ARRIBA)


Hallamos la varianza
N

2 =

2=

( Xi )2
I=1

171.412.265,25
517

2=331 . 551, 77

PESOS CUADRADOS

Procedemos hallar la Desviacin estndar.


= 331.551,77
=575,805

Hallamos el coeficiente de variacin


cv=

CV = 100

575,805
100
3661

CV =15 .72

Los datos son homogneos, es decir son unos datos ideales ya que se encuentran
0CV<25%

2. Informe
El Departamento Administrativo Nacional de Estadstica- DANE, realiza La Encuesta Nacional
de Hogares (ENH) anualmente a nivel nacional, hemos enfocado este informe en las familias

de Estrato 1 que conforman el 34.46% de los 1500 hogares analizados, representando 517
familias con un nmero de personas por familia de 1 a 6 en forma ascendente.
A. Introduccin
En el estrato 1 se analiza un conjunto de herramientas de Estadstica Descriptiva. Se
repasan algunos conceptos bsicos, los tipos de variables, las tablas de frecuencia, tipos de
grficos, medidas de tendencia central, medidas de localizacin y medidas de dispersin.

B. Base de Datos
La Base de Datos tomada de archivo en Excel del proyecto Politcnico Gran colombiano
Encuesta de Hogares 1500 unidades familiares. Mdulo Estadstica I.
C. Objetivos

Presentar un proceso descriptivo que utiliza estadstica para el manejo de sistemas


de informacin.
Explorar la base de datos.
Clasificar las variables
Analizar resultados
Calcular y analizar la informacin proporcionada por las medidas de tendencia
central.

D. Anlisis de Clasificacin de las variables y las escalas de medida.

Se presentan tres variables de tipo Cuantitativa discreta con escalas de medida ordinal, de
razn y nominal como son NID (Nmero de Orden), PE (Nmero de personas en la
familia), M(Municipios) Valores de 1 a 100, respectivamente. Estas variables se
caracterizan por ser nmeros enteros positivos.
Anlisis de tres variables de tipo Cuantitativa continua con escala de medida Razn o
Proporcin, en ING (Ingresos familiares anuales) AL (Gastos de alimentacin anuales) AD
(Gastos adicionales anuales). Estas variables permiten tomar valores comprendidos entre
dos nmeros.
Al realizarse el estudio estadstico sobre las familias de los estratos 1, 2 y 3 mediante
grficas, tablas y formulas donde nos arrojan los datos sobre el tema hablado y se refleja
que en:
Estrato 1 hay ms cantidad de personas se incrementa a un nivel alto por lo cual da una
apariencia de que tienen ms vehculos y menos computadores.

Vivienda
Propia
SI
NO
TOTAL

Estrato 2 la cantidad de
estrato 1 baja y por esto
y mayor cantidad de computadores.

Nmero De
Personas
310
207
517

%
59,960
40,040
100

personas es mayor que la de


refleja que hay ms vehculos

Estrato 3 la cantidad de personas es mucho menor que en los estratos 1 y 2 y se refleja que
hay ms vehculos y computadores viendo la proporcin de personas en este estrato aunque
es menor la de los vehculos y computadores.
Esto nos indica que el nmero de personas en el estrato 1 y 2 se incrementa por lo tanto los
recursos econmicos son ms difciles en todas las reas.
Por ltimo y segn el anlisis las variables de tipo Cualitativo en la escala nominal
presentan modalidades no numricas que no admiten un criterio de orden, tales como V
(Vivienda propia), A (Tiene Automvil), C (Tiene computador) con respuestas o positivas o
negativas (Si, NO).

VIVIENDA PROPIA
350
300
250
200
Nmero de Personas 150
100
50
0

Grafica 1.

Computadores
SI
NO
TOTAL

Nmero De
Personas
51
466
517

%
9,860
90,140
100

Grafica 2.

En la aplicacin de la encuesta realizada a la poblacin estrato 1 con el objetivo de conocer la


importancia de este sector de la poblacin respecto a la compra de un bien de primera necesidad
como lo es la vivienda propia y un bien de segunda necesidad pero actualmente de gran
importancia como lo son los computadores, se realiza una encuesta a 517 personas por medio de la
evaluacin de dos variables cualitativas con el fin de determinar qu porcentaje de personas
optaron por la adquisicin de cada uno de los dos bienes en mencin.
De acuerdo a la grafica 1 podemos observar que aproximadamente el 60% de la poblacin cuenta
con vivienda, lo cual nos muestra y nos lleva a la conclusin que ms de la mitad de este sector
encuestado presenta inters en invertir en un bien propio; al analizar la segunda variable que nos
presenta el inters de las personas del mismo sector en comprar un computador, percibimos que tan
solo el 10% de los encuestados ha realizado dicha inversin, por lo tanto nos indica que para el
90% de las personas estrato 1 un computador no es fundamental en su diario vivir.

Conclusiones

Pudimos conocer, manejar e interpretar resultados con base a un estudio en una muestra de una
poblacin, siendo este el punto de partida para aplicar los conocimientos adquiridos en las
distintas cartillas de estudio. Las medidas de tendencia central, nos permitieron identificar los
valores ms representativos de los datos, de acuerdo a la manera como se tienden a concentrar.
La Media nos indic el promedio de los datos, es decir, nos inform el valor que obtendra cada
uno de los individuos si se distribuyeran los valores en partes iguales (3.525,81). La Mediana
por el contrario nos inform el valor que separa los datos en dos partes iguales (258,5), cada
una de ellas cuenta con el cincuenta por ciento (50%) de los datos y la Moda nos revel el valor
que ms se repite dentro de los mismos (3765,19).

Con las medidas de variacin se determino el grado de acercamiento o distanciamiento de los


valores de una distribucin frente a su promedio de localizacin, sobre la base de que entre ms
grande sea el grado de variacin menor uniformidad tendrn los datos y por lo tanto menor

representatividad o confiabilidad del promedio de tendencia central o localizacin por haber


sido obtenido de datos dispersos; por el contrario, si este valor es pequeo (respecto a la unidad
de medida) entonces hay una gran uniformidad entre los datos y cuando es cero quiere decir
que todos los datos son iguales.

Por medio de las medidas de localizacin, que se les denomina CUARTILES (Q) pudimos
hallar en este caso el 25% de las familias que menos gastos adicionales tienen, esta funcin nos
inform el valor de la variable que ocupar la posicin que nos interes respecto de todo el
conjunto de variables.

Podemos decir que los Cuartiles son unas medidas de posicin que dividen a la distribucin en
un cierto nmero de partes, de manera que en cada una de ellas hay el mismo nmero de
valores de la variable, toda vez que su divisin de distribucin en cuatro partes iguales (3
divisiones) Q1, Q2, Q3 corresponden a 25%, 50%,75%, con la anterior informacin y
observando lo reflejado en el informe se concluye que de acuerdo a la formula, el resultado de
CV =15.72% nos demuestran que los datos son homogneos, es decir, son unos datos ideales
ya que se encuentran 0 CV< 25%.

Referencias

Aula Virtual Politcnico Gran Colombiano. (2013) Estadstica. Semana 1,2, 3, 4 y 5. En


https://poli.epic-sam.net/Learn/Player.aspx?enrollmentid=3947529
http://www.ehowenespanol.com/informe-analisis-estadistico-como_12795/
http://www.aprehender.net/Estadistica/BaseDatos/Informe.pdf

También podría gustarte