Está en la página 1de 33

TRABAJO COLABORATIVO NUMERO 2

JHON SEBASTIAN CALLE CORTES


CC 1088285332
JORDAN ANDRES CALLE CORTES
CC 1088310524
NATHALIA MARIA RENDON
CC 1089745976

TUTOR: ROBERTO MARIO DE LEON

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


ESTADSTICA DESCRIPTIVA
22/05/2013

Introduccin

En este segundo trabajo colaborativo se desarroll un taller con base en el manejo del
contenido visto en el mdulo de estadstica descriptiva unidad 2, con la finalidad de
profundizar sobre los temas y teoras planteados y observar la total comprensin de los
temas propuestos en la unidad 2 por los estudiantes del curso estadstica descriptiva.

1. Realizar un mentefacto conceptual sobre las medidas de dispersin.

2. Las estaturas en centmetros de los socios de un club juvenil de Bogot, son las
siguientes:

153
138
152
145
152

123
128
128
124
156

129
134
146
132
160

132
148
143
138
159

147
125
138
144
157

138
139
138
141
168

137
146
122
137
178

134
145
146
146
142

131
148
137
138
113

147
135
151
146
130

Realizar una tabla de distribucin de frecuencias para datos agrupados dado que la variable
es estatura (cuantitativa continua), Calcular varianza, desviacin estndar y coeficiente de
variacin. Interprete los resultados.
Rango = xmaxxmn
Rango: 178 113 = 65
K = 1 + 322.3 log n
Nmero de intervalos de clase: 1 + 3.322Log50 = 6,6 = 7
Amplitud de los intervalos= A = R
k
A = 65= 9,28 = 10
7
R* = (A) (K)
R* = 10 x 7 = 70
Exceso = R R*
Exceso =70 65 = 5

Limites de clase:

LCI Limite de Clase Inferior: 113


LCS Limite de Clase Superior: 178

LCI = 113 + 3 = 116


LCS = 178 - 2 = 176

Intervalos de Clase
Se agrega (A-1) = 10 1 = 9
116 + 9 = 125
125 + 9 = 134
134 + 9 = 143
143 + 9 = 152
152 + 9 = 161
161 + 9 = 170
170 + 9 = 179

Estatura en
cms
116 125
125 134
134 - 143
143 152
152 161
161 170
170 - 179
Total

Frecuencia
5
9
14
15
5
1
1
50

FRECUENCIAS
Frecuencia
Frecuencia absoluta
relativa (%)
acumulada
10%
5
18%
14
28%
28
30%
43
10%
48
2%
49
2%
50
100%

MEDIA
n = cantidad de elementos
Xi = valor de cada elemento
X = media aritmtica, o simplemente media x
X= Xi
n
X = 7.064 = 141,3
50

Frecuencia relativa
acumulada
10%
28%
56%
86%
96%
98%
100%

VARIANZA

Varianza: 7206,10 = 144.12


50
Xi
113
122
123
124
125
128
128
129
130
131
132
132
134
134
135
137
137
137
138
138
138
138
138
138
139
141
142
143
144
145
145
146
146

X
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3

(Xi X)
-28,3
-19,3
-18,3
-17,3
-16,3
-13,3
-13,3
-12,3
-11,3
-10,3
-9,3
-9,3
-7,3
-7,3
-6,3
-4,3
-4,3
-4,3
-3,3
-3,3
-3,3
-3,3
-3,3
-3,3
-2,3
-0,3
0,7
1,7
2,7
3,7
3,7
4,7
4,7

(Xi X)2
800,89
372,49
334,89
299,29
265,69
176,89
176,89
151,29
127,69
106,09
86,49
86,49
53,29
53,29
39,69
18,49
18,49
18,49
10,89
10,89
10,89
10,89
10,89
10,89
5,29
0,09
0,49
2,89
7,29
13,69
13,69
22,09
22,09

146
146
146
147
147
148
148
151
152
152
153
156
157
159
160
168
178

141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3
141,3

7064

Desviacin estndar o tpica

Varianza: 7206,1 = 144.12 Raz cuadrada: 12


50
Desviacin estndar o tpica = 12
Coeficiente de Variacin

CV = Desviacin estndar * 100%


Media
CV = 12 * 100% = 8.5%
141.3
Coeficiente de variacin = 8,5 %

4,7
4,7
4,7
5,7
5,7
6,7
6,7
9,7
10,7
10,7
11,7
14,7
15,7
17,7
18,7
26,7
36,7

22,09
22,09
22,09
32,49
32,49
44,89
44,89
94,09
114,49
114,49
136,89
216,09
246,49
313,29
349,69
712,89
1346,89
7206,10

3. Un empleado de la empresa de Acueducto de la ciudad de Cartagena, realiza un estudio


sobre los reclamos realizados en los 2 ltimos aos, para ello elige una muestra de 60
personas, con los siguientes resultados:

N
Reclamaciones

N De usuarios

26

10

Calcular:
a. El promedio de reclamos.
X=

94 = 1,6
60

b. La varianza y su desviacin tpica


Varianza:

356
60

-- (157)2= 3,5

Desviacin estndar o tpica


Raz cuadrada de 3,5 = 1,9
c. El coeficiente de variacin.
CV = 1,9 *100 = 118,7 %
1,6

4. En un examen final de Estadstica la puntuacin media de un grupo de 150 estudiantes


fue de 78 y la varianza 64. En lgebra, sin embargo, la media final del grupo fue de 73 y la
desviacin tipica7, 6. En que asignatura hubo mayor:
a. Dispersin absoluta
Para determinar la dispersin absoluta, basta con hacer una comparacin entre sus
desviaciones estndar.
EXAMEN DE ESTADISTICA
Puntuacin media: 78
Varianza: 64
Desviacin tpica: Raz cuadrada de 64 = 8
Coeficiente de variacin:

CV = 8 *100 = 10,25 %
78
EXAMEN EN ALGEBRA
Media final: 73
Desviacin tpica 7,6
Varianza: 57.76
Coeficiente de variacin:
CV = 7,6 *100 = 10,41 %
73
Estadstica = Desviacin Estndar = s = 8
Algebra = Desviacin Estndar = s = 7.6
Se tiene entonces que en Estadstica hubo una mayor dispersin absoluta, pues la
desviacin estndar de estadstica es de 8 > 7,6, desviacin estndar de Algebra.
b. Dispersin relativa
Para saber en cul hubo mayor dispersin relativa, se recurre al coeficiente de variacin:
Estadstica = CV = 8 * 100 = 10.25
78
Algebra = CV = 7.6 * 100 = 10.41
73
La dispersin Relativa muestra que el Coeficiente de Variacin de los exmenes de
Algebra es mayor que el de Estadstica 10.41 > 10.25.
Entonces de manera absoluta hay mayor dispersin entre los resultados de los exmenes de
estadstica pero de manera relativa hay mayor dispersin en los resultados de

Exmenes de algebra.
c. Si el estudiante consigui 75 en estadstica y 71 en lgebra. En qu asignatura fue su
puntuacin relativa superior?
Estandarizamos con Z= (valor - media)
desviacin
Estadstica Z = (75-78) = -0.375
8
Algebra Z = (71-73) = -0.2632
7,6
La puntuacin relativa mayor fue en lgebra (-0.2632)
Estos valores de puntuacin Z negativos indican que ambas calificaciones se encuentran por
debajo de la media.
Dado que -0.2632 se encuentra ms cerca a 0 (la media de la variable estandarizada), se
dice que la puntuacin relativa del estudiante fue superior Algebra.

5. Ingresar al blog de Estadstica Descriptiva que se encuentra en la pgina principal del


curso en el TOPICO DE CONTENIDOS, posteriormente buscar el LABORATORIO
(RERESIN Y CORRELACIN LINEAL EXCELL) y realizar el ejercicio nmero 1 que
se encuentra al final del laboratorio.
Se quiere estudiar la asociacin entre consumo de sal y tensin arterial. A una serie de
voluntarios se les administra distintas dosis de sal en su dieta y se mide su tensin arterial
un tiempo despus.
X (SAL)
1,8
2,2
3,5
4
4,3
5

Y (PRESION)
100
98
105
110
112
120

a. Realice el diagrama de dispersin y determine el tipo de asociacin entre las variables


b. Encuentre el modelo matemtico que permite predecir el efecto de una variable sobre la
otra. Es confiable?
c. Determine el porcentaje de explicacin del modelo y el grado de relacin de las dos
variables.
d. Si a un paciente se le administra una dosis de sal de 6,5. Cul es la tensin arterial
esperada?

6. A continuacin Se presentan las ventas nacionales de mviles nuevos de 1992 a 2004 en


la siguiente tabla. Obtenga un ndice simple para las ventas nacionales utilizando una base
variable:
Ao

Ventas (millones $)

1992

8.8

1993

9.7

1994

7.3

1995

6.7

1996

8.5

1997

9.2

1998

9.2

1999

8.4

2000

6.4

2001

6.2

2002

5.0

2003

6.7

2004

7.6

Si 8.8 es el 100%
9.7 ____ X

X= (9.7*100)/8.8= 110.2272

Si 9.7 es el 100%
7.3 ____X
Si 7.3 es el 100%

X=(7.3*100)/9.7= 72.2577

6.7 ____X

X=(6.7*100)/7.3= 91,7808

Si 6.7 es el 100%
8.5 ____X

X=(8.5*100)/6.7= 126,8656

Si 8.5 es el 100%
9.2 ____X

X=(9.2*100)/8.5= 108,2352

Si 9.2 es el 100%
8.4 ____X

X=(8.4*100)/9.2= 91,30437

Si 8.4 es el 100%
6.4 ____X

X=(6.4*100)/8.4= 76,1904

Si 6.4 es el 100%
6.2 ____X

X=(6.2*100)/6.4= 96,875

Si 6.2 es el 100%
5.0 ____X

X=(5.0*100)/6.2= 80,6451

Si 5.0 es el 100%
6.7 ____X

X=(6.7*100)/5.0= 134

Si 6.7 es el 100%
7.6 ____X

X=(7.6*100)/6.7= 113.4328

Medidas de dispersin

Total Hombres

Mujeres

Media 28,69 28,00 29,37


Varianza

415,91 407,42 423,16

Desviacin estndar 20,39 20,18 20,57


Coeficiente de variacin

71%

72%

70%

MEDIDAS ESTADSTICAS UNIVARIANTES


MEDIDAS DE TENDENCIA CENTRAL
Al ver la forma de representar los conjuntos de datos en histogramas y polgonos de
frecuencia se puso de relieve un comportamiento peculiar de estos, y es el de mostrar una
tendencia a agruparse alrededor de los datos ms frecuentes, haciendo de esta forma que
estas representaciones adquieran una forma de campana.

Media aritmtica
Es la medida ms conocida y la ms fcil de calcular. Se define como la suma de los
valores de una cantidad dada de nmeros dividido entre la cantidad de nmeros.
n
X
X
n
i
i =
=1
Donde: n = cantidad de elementos

Xi = valor de cada elemento


x = media aritmtica, o simplemente media
Media aritmtica para datos no agrupados
Podemos diferenciar la frmula del promedio simple para datos poblaciones y mustrales:
Observe que la variacin de ambas frmulas radica en el tamao de los datos (N identifica
el tamao de la poblacin, mientras que n el de la muestra).
Ejemplo: la media aritmtica para datos no agrupados
El profesor de la materia de estadstica desea conocer el promedio de las notas finales de
los 10 alumnos de la clase. Las notas de los alumnos son:

3,2

3,1

2,4

4,0

3,5

3,0

3,5

3,8

4,2

4,0

Cul es el promedio de notas de los alumnos de la clase?


SOLUCIN
Aplicando la frmula para datos no agrupados tenemos:
Cabe anotar que en el ejemplo estamos hablando de una poblacin correspondiente a todos
los alumnos de la clase (10 alumnos en total). El promedio de las notas es de 3,47.
Modifiquemos la primera nota por 0,0 y calculemos nuevamente la media aritmtica.
En este caso la media pasa de 3,47 a 3,15. Esta variacin notoria se debi a que la media
aritmtica es sensible a los valores extremos cuando tratamos con pocos datos. El 0,0 es
una nota atpica comparada con las dems, que estn ubicadas entre 3,0 y 4,2.

Media aritmtica para datos agrupados


En el capitulo 2 explicbamos dos tipos de tablas de frecuencias (A y B). Cuando los datos
se agrupan en tablas tipo A, la media aritmtica es igual a la divisin de la sumatoria del
producto de las clases por la frecuencia sobre el nmero de datos.
La sumatoria parte desde el primer intervalo de clase (i = 1) hasta el ltimo (Nc), siendo X i
la clase del intervalo i.
Cuando los datos se agrupan en tablas de frecuencias tipo B, el clculo de la media vara un
poco, ya que existe una prdida de informacin en el momento en que se trabaja con
intervalos de frecuencia y no con los datos directamente (los datos se agrupan por intervalo,
desconociendo el valor exacto de cada uno de ellos).
Las marcas de clases (Mc) cumple la funcin de representar los intervalos de clase.
Ejemplo: media aritmtica para datos agrupados en tablas tipo A
La siguiente tabla de frecuencia muestra el nmero de preguntas de 81 encuestados sobre
un Test que consta de solo seis preguntas.

Preguntas Buenas

Personas

15

13

19

21

SOLUCIN
PASO 1: Realizar la sumatoria del producto resultante de las clases por su frecuencia
absoluta. Para efectos del clculo de la media, deberamos sumar 15 veces el valor 1, 13
veces el valor 2, 8 veces el valor 3, hasta llegar a la ltima clase:
PASO 2: Dividir la sumatoria sobre el nmero total de datos.
En promedio los encuestados contestaron aproximadamente 3 (el valor exacto es 3,41)
preguntas buenas.
Ejemplo: media aritmtica para datos agrupados en tablas tipo B
Calcular la media para los datos distribuidos en la siguiente tabla de frecuencia:

Ni

Lm

Ls

Mc

40,0

48,1

44,1

48,1

56,1

52,1

56,1

64,1

11

60,1

64,1

72,1

32

68,1

72,1

80,1

21

76,1

80,1

88,1

18

84,1

88,1

96,1

14

92,1

96,1

104,0

100,1

SOLUCIN
Las marcas de clase representan a los intervalos de clase, por ejemplo, suponemos que la
marca de clase para el primer intervalo (44,1) se repite 3 veces, al desconocer los 3 valores
exactos que estn dentro de dicho intervalo.
PASO 1: Realizar la sumatoria del producto resultante entre las marcas de clase por su
frecuencia absoluta.
PASO 2: Dividir la sumatoria sobre el nmero total de datos.

Ejemplo: comparativa entre el clculo de la media aritmtica para datos no agrupados y


datos agrupados en tablas tipo B
Calcular la media aritmtica a los siguientes datos sin agrupar y agrupndolos en una tabla
de frecuencia tipo B (suponga que los datos son poblacionales):

47,8

23,1

12,4

35,4

44,0

26,2

18,6

11,0

32,0

12,4

49,4

41,4

18,6

21,0

26,3

11,1

21,4

30,6

12,8

43,1

18,1

38,1

16,8

12,4

33,6

40,9

15,2

33,2

48,2

37,0

SOLUCIN
Calculemos la media para los datos sin agrupar:

Luego construyamos la tabla tipo B y calculemos su media aritmtica con el fin de


comparar ambos resultados:

Ni Lm

Ls

Mc

11,00

17,41

14,21

17,41

23,81

20,61

23,81

30,21

27,01

30,21

36,61

33,41

36,61

43,01

39,81

43,01

49,40

46,21

Total

30

PASO 1: Realizar la sumatoria del producto resultante entre las marcas de clase por su
frecuencia absoluta.
PASO 2: Dividir la sumatoria sobre el nmero total de datos.
Podemos ver claramente una diferencia entre ambas medias: 27,74 para los datos no
agrupados y 28,29 para los datos agrupados. Esta diferencia radica que en la tabla tipo B

existe una perdida de informacin, al agrupar los datos en los intervalos de clase. El valor
de la media exacta es el calculado para los datos no agrupados, pero dada la proximidad de
la media para los datos agrupados, se tomar esta ltima como cierta.

Media aritmtica ( o): Es el valor resultante que se obtiene al dividir la sumatoria de un


conjunto de datos sobre el nmero total de datos. Solo es aplicable para el tratamiento de
datos cuantitativos.

Mediana
Se define como el valor que divide una distribucin de datos ordenados en dos mitades, es
decir, se encuentra en el centro de la distribucin. La mediana se simboliza como Me. Es
menos usada que la media aritmtica. Para su clculo es necesario que los datos estn
ordenados. Cuando la cantidad de datos es impar, fcilmente se identifica la mediana; pero
cuando el nmero de datos es par, la mediana se calcula hallando el valor medio entre los
dos valores centrales y no coincidir con ninguno de los valores del conjunto de datos.

Clculo de la mediana para datos agrupados

La med iana se encuentra en el interva lo donde la frecu encia acu mu lada llega hasta
la mit ad de la s u ma de las frecuen cias abs olut as .

Es decir tenemos que buscar el intervalo en el que se encuentre

L i es el lmite inferior de la clase donde se encuentra la mediana.

Es la semisuma de las frecuencias absolutas.


F i - 1 es la frecuenc ia acu mulad a anterior a la clase mediana.
a i es la amplitud de la clase.
La med iana es independi ente de las a mp litud es de los int ervalos .

Ejem plo: Calcu lar la m edian a de una dis tr ibucin es tads ti ca que vi ene
dada por la s iguiente tabla:

fi

Fi

[60, 63)

[63, 66)

18

23

[66, 69)

42

65

[69, 72)

27

92

[72, 75)

100

100

100/2 = 50

Clas e de la med iana: [66, 69)

Se ha solicitado a un grupo de 50 individuos informacin sobre el nmero de horas que


dedican diariamente a dormir y ver la televisin. La clasificacin de las respuestas ha
permitido elaborar la siente tabla:
N de horas dormidas (X)

6 7

8 9 10

N de horas de televisin (Y)

4 3 3 2

Frecuencias absolutas (fi)

3 16 20 10 1

a. Calcular el coeficiente de correlacin.


b. Determinar la ecuacin de la recta de regresin de Y sobre X.
c. Si una persona duerme ocho horas y media, cunto cabe esperar que vea la televisin?
X

XY

X2

Y2

24

36

16

16

21

49

20

24

64

10

18

81

10

10

100

40

13

50

97

330

39

Hallamos las medias:

X=40/50= 0.8
Y=13/50=0.26
Calculamos la covarianza
Covarianza= 97/50 (0.8*0.26) =
Covarianza= 1.94 0.208 = 1.732
Ahora calculamos las desviaciones estndar
Desviacin estndar X=330/50 0.82
Desviacin estndar= 6.6 0.64
Desviacin estndar= 5.96 = 2.44
Desviacin estndar X=2.44
Desviacin estndar Y= 39/50 0.262
Desviacin estndar Y=0.78- 0.0676
Desviacin estndar Y=0.7124= 0.8440
Desviacin estndar Y=0.8440
Coeficiente de correlacin= 1.732/2.44*0.8440=
Coeficiente de correlacin= 1.732/2.059=0.8411
Coeficiente de correlacin= 0.8411
Recta de regresin de Y sobre X
Calculamos las varianzas
X= 330/5-0.82=
X=66-0.64=65.36

Varianza de X= 65.36
Y=39/5-0262
Y=7.8-0.0676=7.7324
Varianza de Y= 7.7324
Y-0.26 = 1.732/0.8 (x-0.8)
Y-0.26 = 2.165 (x-0.8)
Y-0.26=2.168X-1.732
Y=2.168X-1.732+0.26
Y=2.168X-1.47200

7. II-ACTIVIDAD DE INVESTIGACIN Realizar un recorrido a travs de los resultados


del Censo General 2005, ingresando a la pgina Web del DANE:
ACTIVIDAD A REALIZAR:
En este segundo trabajo colaborativo, debern escoger previo acuerdo entre los integrantes
del grupo, de los temas que presenta la pgina del censo, un grupo de datos para los cuales
se pide Calcular:
1. Medidas de dispersin, Medidas de regresin y correlacin
2. Interpretar los resultados obtenidos
3. El grupo entregara una conclusin acerca del tema escogido con base en los resultados
Obtenidos.

Marca de
clase
2

Frecuencia

Fx

Fx2

4108861

8217722

16435444

4295913

30071391

210499737

12

4339046

52068552

624822624

17

3933754

66873818

1136854906

22

3641839

80120458

1762650076

27

3280767

88580709

2391679143

32

2917290

93353280

2987304960

37

2919161

108008957

3996331409

42

2732504

114765168

4820137056

47

2291308

107691476

5061499372

52

1835340

95437680

4962759360

57

1450658

82687506

4713187842

62

1104733

68493446

4246593652

67

921054

61710618

4134611406

72

702518

50581296

3641853312

77

504438

38841726

2990812902

82

278875

22867750

1875155500

87

210325

18298275

1591949925

Total

41468384

1188669828

51165138626

1. Medias de dispersin
Media

Varianza

Desviacin estndar

Coeficiente de variacin

Desviacin media

2. Medidas de regresin y correlacin.

XY

X2

4108861

8217722

4295913

30071391

49

12

4339046

52068552

144

17

3933754

66873818

289

22

3641839

80120458

484

27

3280767

88580709

729

32

2917290

93353280

1024

37

2919161

108008957

1369

42

2732504

114765168

1764

47

2291308

107691476

2209

52

1835340

95437680

2704

57

1450658

82687506

3249

62

1104733

68493446

3844

67

921054

61710618

4489

72

702518

50581296

5184

77

504438

38841726

5929

82

278875

22867750

6724

87

210325

18298275

7569

Coeficiente de correlacin

2. Analizando de los resultados obtenidos

El promedio de edad en Colombia es de un 28.66 aos, esto es debido a que la mayora de


las personas de Colombia son menores de 44 aos, con un estndar del 20.31 que por lo
tanto es caracterizada como una suma elevada.
Con un coeficiente de variacin de un 70.83%, esto significa que hay una gran variacin de
edades en los colombianos por lo tanto (la media no representa la variacin).
3. Conclusiones

De acuerdo a los resultados de la varianza podemos ver que hay menor dispersin
en el ao 2010 con respecto al 2011, es decir que hay menor diferencia de edad
entre los grupos de personas que recibieron asistencia escolar.
Segn la desviacin tpica en el ao 2010 hay menor estabilidad en los grupos de
edades con respecto a la media.
Tambin estos resultados nos permiten ver que hay una gran variacin en el grupo
de datos, o sea que hay datos muy distantes o mucha diferencia entre las edades de
los estudiantes.

Objetivos.
-

Que los estudiantes comprendan y interioricen todos los temas que la unidad 2
presenta.

Conclusin.
Se evidencia la satisfactoria comprensin y entendimiento de la unidad 2 del mdulo de
estadstica descriptiva al concluir este trabajo colaborativo satisfactoria mente, todos los
integrantes del grupo hemos puesto en prctica lo que se ha aprendido al leer y estudiar el
modulo y la unidad 2 de el mismo, tambin hemos realizado un trabajo en grupo el cual
ha dado buenos resultados siendo este documento la prueba de ello.

Bibliografa

http://estadisticadescriptivaunad100105.blogspot.com/
http://66.165.175.244/campus05_20131/file.php/23/2013-1-_2C/Nuevo_TC2-20131.pdf
http://www.dane.gov.co/#twoj_fragment1-4
MODULOS - CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica
Descriptiva

También podría gustarte