Está en la página 1de 28

Estadstica Descriptiva

Trabajo Colaborativo 2

Presentado Por:
Sandra Patricia Carrillo Velosa - 52100151
Luz Adriana Mndez - 52054696
Sandra Patricia Corredor - 52076652
Mara Roco Parra - 52104178

Tutor:
Amparo Prez

Grupo: 100105_210

Universidad Nacional, Abierta y a Distancia, UNAD


Bogot D.C. Mayo 29- 2014

Introduccin

Con el presente trabajo se pretende ahondar la temtica vista en la segunda unidad


del mdulo del curso, mediante la puesta en prctica de los temas tratados y dar
solucin a un taller de ejercicios de aplicacin, con el fin de entender, manejar y
practicas los temas relacionados con las Medidas de Dispersin y Estadsticas
Bivariantes.
As mismo comprobar la importancia y el lugar que la Estadstica ocupa en nuestra
vida cotidiana.
El anlisis estadstico se usa para recopilar, resumir e investigar datos con el fin de
obtener informacin til para la toma de decisiones.

Justificacin

A travs del presente escrito se pretende desarrollar un taller de ejercicios sobre los
contenidos de la Unidad 2 en el mdulo del curso Estadstica Descriptiva (Ortegn
Pava, 2010), los cuales permitirn profundizar las temticas tratadas a travs del
anlisis y desarrollo de mtodos de interpretacin de datos basados en el uso de
frmulas relacionadas con las medidas estadsticas univariantes, medidas de
dispersin y de asimetra, medidas estadsticas bivariantes y nmeros ndices.
As las cosas, las medidas de variabilidad indican que tan alejados estn los diferentes
datos de las medidas, con el fin de saber su similitud. Las medidas de asimetra
brindan la posibilidad de identificar caractersticas de la distribucin sin necesidad de
elaborar un grfico.
Con el desarrollo de cada uno de los ejercicio propuestos en la gua y rbrica del
Trabajo colaborativo 2, los integrantes de este grupo colaborativo se apropiaran de los
conceptos abordados durante el estudio de la Unidad 2, para lograr con la aplicacin
de las medidas de dispersin establecer la variacin de los datos con relacin a su
media para una adecuada interpretacin de stos, permitiendo as el uso de las
medidas estadsticas bivariantes, analizando en conjunto dos caractersticas de los
datos recogidos, con el fin de detectar posibles relaciones entre ellos, para aplicarlas
en la vida diaria de una organizacin.
En el campo laboral y personal se requiere contar con una herramienta que nos
permita recolectar, ordenar y representar series de datos cuyo anlisis nos entregue
resultados claros sobre las caractersticas de los datos. Adicionalmente debemos
comprender las tendencias de la informacin, todo esto con el fin de tomar decisiones
en algn momento dado, sobre algunas poblaciones o muestras. La herramienta es la
Estadstica Descriptiva.

Objetivos Generales
Analizar, interpretar y desarrollar problemas relacionados con medidas de
dispersin y estadsticas bivariantes.
Identificar los mtodos descriptivos adecuados a diferentes situaciones y
necesidades de la investigacin.

Objetivos Especficos
Estudiar y comprender los conceptos sobre medidas de tendencia central.
Desarrollar el taller de ejercicios propuesto sobre los contenidos de la Unidad 2
de curso Estadstica Descriptiva, los cuales permitirn profundizar en los temas
tratados.
Comparar las medidas de dispersin y seleccionar la ms adecuada para
determinada aplicacin.
Interpretar y utilizar las medidas de dispersin.
Reconocer el complemento de las medidas de dispersin en cuanto a la
descripcin que proporciona las medidas de tendencia central.

Desarrollo del trabajo


1. Los siguientes datos corresponden a las notas de los trabajo colaborativos 1 y 2
de 50 estudiantes de un curso virtual en la UNAD 2013-1 (Tabla No.1).
estudiante

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

Colaborativo 1

Colaborativo 2

estudiante

Colaborativo 1

Colaborativo 2

35
43
26
34
40
41
31
27
46
43
46
42
28
40
47
35
34
29
45
42
44
47
30
45
46
0
0
31
0
0
43
42
32
45
11
41
42
33
44
45
43
37
34
20
45
37
37
35
29
19
0
0
36
0
0
42
43
37
36
19
23
43
38
45
31
34
42
39
0
0
0
0
40
29
39
42
45
41
21
34
44
45
42
0
0
44
45
43
0
0
42
37
44
23
39
40
29
45
34
45
29
45
46
35
44
38
45
47
44
43
44
45
48
44
42
0
0
49
0
0
19
34
50
44
45
Tabla No.1. Datos suministrados en la gua del trabajo colaborativo 2

Determine:
1.1.
En cul trabajo se presenta mayor variacin?
Con base en los datos correspondientes a las notas de los trabajos colaborativos 1
y 2 de 50 estudiantes de un curso virtual en la UNAD 2013-1, (Tabla No.1).
Inicialmente se ordenan los datos con el fin de determinar la frecuencia (Tabla
No.2):
Donde X corresponde a la nota y F a la frecuencia de la nota

NOTAS
TRABAJO
COLABORATIVO 1

NOTAS
TRABAJO
COLABORATIVO 2

X
0
19
20
21
23
29
34
35
36
37
38
40
41
42
43
44
45
46
Total

x
0
11
19
29
31
34
37
39
40
42
43
44
45
46
47
Total

F
10
1
1
1
2
3
3
3
1
1
1
2
2
3
2
8
4
2
50

F
10
1
2
1
2
3
3
2
1
6
5
1
10
1
2
50

Tabla No.2. Comportamiento de los datos suministrados en la gua del trabajo colaborativo 2

Varianza trabajo colaborativo 1: (Tabla No.3)


TRABAJO COLABORATIVO 1
X
f
x*f
0
10
0
19
1
19
20
1
20
21
1
21
23
2
46
29
3
87
34
3
102
35
3
105
36
1
36
37
1
37
38
1
38
40
2
80
41
2
82
42
3
126
43
2
86
44
8
352
45
4
180
46
2
92
Total
50
1509

x
0
361
400
441
529
841
1156
1225
1296
1369
1444
1600
1681
1764
1849
1936
2025
2116

f*x
0
361
400
441
1058
2523
3468
3675
1296
1369
1444
3200
3362
5292
3698
15488
8100
4232
59407

Tabla No.3. Comportamiento de los datos trabajo colaborativo 1

Cuando los datos no se encuentran agrupados en el cuadro de datos del trabajo


colaborativo No.1, la varianza se calcula con la siguiente frmula:

Aplicando:

La varianza cuando los datos no estn agrupados, para el trabajo colaborativo 1 es de


277,3076.

Cuando los datos se encuentran agrupados en el cuadro de datos del trabajo


colaborativo No.1, la varianza se calcula con la siguiente Ecuacin:

Reemplazando:

La varianza desviacin tpica estndar del trabajo colaborativo 1 es:


Varianza trabajo colaborativo 2: (Tabla No.4)
TRABAJO COLABORATIVO 2
x
F
x *f
x
0
10
0
0
11
1
11
121
19
2
38
361
29
1
29
841
31
2
62
961
34
3
102
1156
37
3
111
1369
39
2
78
1521
40
1
40
1600
42
6
252
1764
43
5
215
1849
44
1
44
1936
45
10
450
2025
46
1
46
2116
47
2
94
2209
total
50
1572

F * x
0
121
722
841
1922
3468
4107
3042
1600
10584
9245
1936
20250
2116
4418
64372

Tabla No.4. Comportamiento de los datos trabajo colaborativo 2

Para hallar la varianza primero debemos hallar la media:

Cuando los datos no se encuentran agrupados en el cuadro de datos del trabajo


colaborativo No.2, la varianza se calcula con la siguiente frmula:

Aplicando:

La varianza cuando los datos no estn agrupados para el trabajo colaborativo 2 es de


298,9664.
Cuando los datos se encuentran agrupados en el cuadro de datos del trabajo
colaborativo No.2, la varianza es de origen a la desviacin tpica o estndar, la
siguiente (Ecuacin Mdulo Estadstica):

La varianza del trabajo colaborativo 2 es:


La varianza del trabajo colaborativo 1 es:

La varianza de los datos no agrupados y la desviacin tpica o estndar de los datos


agrupados en las notas del trabajo colaborativo 2 es mayor que las reflejadas en las
notas del trabajo colaborativo 1, se dice entonces que los datos del trabajo
colaborativo 2 tiene mayor variabilidad que los del trabajo colabroativo1, en otras
palabras, el grupo del trabajo colaborativo 2 tuvo mayor estabilidad en las notas
alrededor de su media: 31,44. Para hallar la media se us la frmula del mdulo que
muestra la (figura No.1), para hallar la varianza se usa la frmula del mdulo que
muestra la (figura No.2) Datos agrupados, ya que existe una desviacin tpica o
estndar. Utilizando men frmulas en Excel (Formato anexo en Excel, al final del
trabajo)
Media o Promedio:

10

Fig. No. 1. Imagen frmulas usadas para hallar la media

Varizanza:

Fig. No. 2. Imagen frmulas usadas en el ejercicio para hallar la varianza

1.2.
De manera relativa, en cul trabajo colaborativo los estudiantes
obtuvieron notas ms altas?

11

Se elabora tabla de frecuencia para el trabajo colaborativo 1 (Tabla No. 5)


TRABAJO COLABORATIVO 1
x

Fr/N

Fr

10

10/50

0.2

19

1/50

0.02

20

1/50

0.02

21

1/50

0.02

23

2/50

0.04

29

3/50

0.06

34

3/50

0.06

35

3/50

0.06

36

1/50

0.02

37

1/50

0.02

38

1/50

0.02

40

2/50

0.04

41

2/50

0.04

42

3/50

0.06

43

2/50

0.04

44

8/50

0.16

45

4/50

0.08

46

2/50

0.04

total

50

0.46

Tabla No.5. Comportamiento de los datos trabajo colaborativo 1

12

Se elabora tabla de frecuencia para el trabajo colaborativo 2 (Tabla No. 6)


TRABAJO COLABORATIVO 2
x

Fr/N

Fr

10

10/50

0.2

11

1/50

0.02

19

2/50

0.04

29

1/50

0.02

31

2/50

0.04

34

3/50

0.06

37

3/50

0.06

39

2/50

0.04

40

1/50

0.02

42

6/50

0.12

43

5/50

0.1

44

1/50

0.02

45

10

10/50

0.2

46

1/50

0.02

47

2/50

0.04

total

50

0.52

Tabla No 6. Comportamiento de los datos trabajo colaborativo 2

Se toma la frecuencia relativa de los estudiantes que obtuvieron notas mayores a 40,
tanto en el trabajo colaborativo 1 como en el trabajo colaborativo 2, se suman, dando
como resultado mayor frecuencia relativa en el trabajo colaborativo 1, es decir en el
trabajo colaborativo 1 los estudiantes obtuvieron notas ms altas.

13

1.3.
Qu tipo de asimetra presentan los resultados de cada trabajo
colaborativo?
El coeficiente de asimetra de Bowley se representa mediante la siguiente
ecuacin matemtica:
( )

Es igual al cuartil No.1 el cual se haya dependiendo el nmero total de


datos, en este caso en particular se tienen 50 datos, el cuartil 1 es la mediana
de los primeros 25 valores; para hallar ese valor se necesita establecer una
frecuencia acumulada mayor o igual a

o sea;

se ubica en la

tabla de frecuencias el valor corresponde a


Previo a ello se elabor una tabla de frecuencias (Tabla No.7) que se observa a
continuacin:
Trabajo colaborativo 1
N=50
0
19
20
21
23
29
34
35
36
37
38
40
41
42
43
44
45
46

10
1
1
1
2
3
3
3
1
1
1
2
2
3
2
8
4
2

10
11
12
13
15
18
21
24
25
26
27
29
31
34
36
44
48
50

20%
2%
2%
2%
4%
6%
6%
6%
2%
2%
2%
4%
4%
6%
4%
16%
8%
4%

20%
22%
24%
26%
30%
36%
42%
48%
50%
52%
54%
58%
62%
68%
72%
88%
96%
100%

Tabla No.7. Tabla de frecuencias datos trabajo colaborativo 1

14

Para hallar
Es igual al 75% del valor total de los datos es decir

El valor de la media se hall en el tem No.1.1, del presente trabajo cuyo


resultado

Con los valores hallados se aplica la frmula para determinar el Coeficiente de


Bowley:
( )

Reemplazando:
(

Segn el resultado el Coeficiente de Asimetra es positivo para los datos


proporcionados notas trabajo colaborativo 1. (Ver figura No.4)

Frecuencia

Curva Asimtrica positiva


Poligono de frecuencias de calificaciones trabajo
colaborativo 1 curso virtual
7
6
5
4
3
2
1
0

Frecuencia

Calificacin

Fig. No.4 .Grfica Polgono de frecuencias de calificaciones Trabajo colaborativo 2


curso virtual (Autora Excel)

15

En cuanto a los datos del trabajo colaborativo 2 se realiza lo siguiente:


Es igual al cuartil No.1 el cual se haya dependiendo el nmero total de
datos, en este caso en particular se tienen 50 datos, el cuartil 1 es la mediana
de los primeros 25 valores; para hallar ese valor se necesita establecer una
frecuencia acumulada mayor o igual a

o sea;

se ubica en la

tabla de frecuencias el valor corresponde a

Previo a ello se elabor una tabla de frecuencias (Tabla No.8) que se observa a
continuacin:
Trabajo colaborativo 2
N=50
0
19
20
21
23
29
34
35
36
37
38
40
41
42
43
44
45
46

10
1
1
1
2
3
3
3
1
1
1
2
2
3
2
8
4
2

10
11
12
13
15
18
21
24
25
26
27
29
31
34
36
44
48
50

20%
2%
2%
2%
4%
6%
6%
6%
2%
2%
2%
4%
4%
6%
4%
16%
8%
4%

20%
22%
24%
26%
30%
36%
42%
48%
50%
52%
54%
58%
62%
68%
72%
88%
96%
100%

Tabla No.8. Tabla de frecuencias datos trabajo colaborativo 2

16

Para hallar
Es igual al 75% del valor total de los datos es decir

El valor de la media se hall en el tem No.1.1, del presente trabajo cuyo


resultado

Con los valores hallados se aplica la frmula para determinar el Coeficiente de


Bowley:
(

Reemplazando:
(

Segn el resultado el Coeficiente de Asimetra es positivo para los datos


proporcionados notas trabajo colaborativo 2 (Ver figura 4).

17

Curva Asimtrica positiva


Poligono de Frecuencia
calificaciones Trabajo Colaborativo 2 curso virtual
7

Frecuencia

6
5
4
3

Frecuencia

2
1
0
0

Calificacin

Fig. No.5 .Grfica Polgono de frecuencias de calificaciones Trabajo colaborativo 2


curso virtual (Autora Excel)

1.4.
El estudiante 12 obtiene 42 puntos en el trabajo colaborativo 1 y 43
puntos en el trabajo colaborativo 2 de manera relativa en cul trabajo obtuvo
mejores resultados?
Para calcular la frecuencia relativa de una variable, se divide la frecuencia de
esa variable (frecuencia absoluta) por el nmero total de la poblacin.
Trabajo Colaborativo 1

Trabajo Colaborativo 2

El estudiante 12 obtuvo mejores resultados en el trabajo Colaborativo 2,


conforme al resultado de la Frecuencia Relativa
1.5.
Es en este caso el coeficiente de variacin, una medida fiable para
describir la dispersin de datos? Por qu?

18

Se elabora un cuadro en el que se muestra el coeficiente de variacin de los datos


suministrados (Tabla No. 9).

20,5
24,5
28,5
32,5
36,5
40,5
44,5

13
2
3
3
6
7
16

diferencia
27
7
3,9
xi.fr
266,5
49
85,5
97,5
219
283,5
712

SUMATORIAS
MEDIA (xm)=
xi.fr/N
Media
34,26
desviacin (S)
=
{([(xi)^2]fr)/N}-xm
Desviacin
1.268,57
C. V. =
S/xm
C. V.
9,74

50,00

1.713,00

63.428,50

1.173,75

94,82

9,74

34,26

0,28

28%

RANGO
NUMERO DE CLASES
ancho de clase
Clase
19 22
23 26
27 30
31 34
35 38
39 42
43 46

lim sup
46

lim inf
19

xi

fr

4
[(xi)^2]fr
5.463,25
1.200,50
2.436,75
3.168,75
7.993,50
11.481,75
31.684,00

fr% fr%Acum
0,26
0,26
0,04
0,3
0,06
0,36
0,06
0,42
0,12
0,54
0,14
0,68
0,32
1
1

1.173,75

El coeficiente de variacin es una medida de confiabilidad toda vez que su resultado muestra la
dispersin
de los datos frente a la media, en este caso como el resultado se acerca a cero, significa que los
datos son consistentes y concentrados con respecto a la Media lo que permite decir que los
resultados son confiables.
Tabla No.9. Coeficiente de variacin de los datos suministrados
1.6.
Determinar el tipo de curtosis presente en los resultados de cada trabajo
colaborativo
Se usa la frmula del mdulo Estadstica Descriptiva:

19

( (

Donde
representa el coeficiente de Curtosis,
cada uno de los valores, la
media de la muestra y
la frecuencia de cada valor.
Los resultados de esta frmula se interpretan:

(
) La distribucin es Mesocrtica: Al igual que en la Asimetra es
bastante difcil encontrar un coeficiente de Curtosis de cero (0), por lo
que se suelen aceptar valores cercanos (
)

)La distribucin es Leptocrtica

)La distribucin es Platicrtica (SPSS Free)

De acuerdo con el resultado del coeficiente de Curtosis, se puede concluir que


los datos de cada trabajo colaborativo estn concentrados alrededor de la
Media y su forma es Leptocrtica, (Fig. No.6 y 7), es decir puntiaguda, tal como
lo muestran las grficas:

Fig. No.6 .Grfica interpretacin de la Crtica (SPSS Free)

20

Curtosis Leptocrtica
Polgono de frecuencias calificaciones Trabajos
colaborativos 1 y 2
7
6
5
f

4
3

Series1

2
1
0
0

Mc

Fig. No.7 .Grfica interpretacin Curtosis datos trabajos colaborativos 1 y 2 (Autora


Excel)

21

2. Para determinar la relacin entre el nivel de profundidad de la represa del Sisga


en Cundinamarca, la temperatura del agua y su concentracin se oxgeno
disuelto con miras a valorar la aptitud como espacio de explotacin pisccola en
la regin, se han realizado 7 mediciones, los datos (Tabla No.10) son:
Determine: El diagrama de dispersin y la ecuacin que relacione la variable
profundidad del agua con temperatura del agua. El diagrama de dispersin y la
ecuacin que relacione la variable profundidad del agua con cantidad de oxgeno
disuelto.
Explique cul de las tres es la variable independiente, porque?
Demuestre con el coeficiente de correlacin, cul de las variables presenta mejor
correlacin con la profundidad del agua. Que indican los valores? La correlacin entre
profundidad y temperatura del agua es positiva o negativa? porque? Existir alguna
relacin entre la temperatura del agua y la cantidad de oxigeno disuelta? qu tan alta
ser la correlacin entre estas dos variables?

Profundidad agua vs Temperatura


20
18
16
14
12
10
8
6
4
2
0

y = -0,2312x + 14,806
R = 0,7152

10

20

30
Grafica 1

40

50

22

Profundidad agua vs Oxigeno


18
16

y = -0,1206x + 13,592
R = 0,7363

14
12
10
8
6
4
2
0
0

10

20

30

40

50

Grafica 2

La variable independiente pues es la que manda en el modelo sugerido anteriormente,


puesto que a dependiendo de la profundidad deseada las otras 2 variables tendran un
valor.
r
Grafica 1
Grafica 2

0,84569498
0,85807925

La variable independiente es la profundidad (X), pues de ella dependen claramente


las otras dos; es decir a medida que profundizamos en el lago la temperatura y la
cantidad de oxgeno disuelto disminuyen.
Ambas variables presentan una correlacin similar (aceptable) con la profundidad,
aunque el coeficiente de determinacin (el cuadrado del de correlacin) es ligeramente
mayor en el caso de la profundidad vs la cantidad de oxgeno disuelto.
La correlacin (en ambos casos) es negativa porque con el aumento de la
profundidad disminuyen tanto la temperatura como el oxgeno disuelto.

23

Temperatura vs Oxigeno
18
y = 0,5012x + 6,1002
R = 0,95

16
14
12
10
8
6
4
2
0
0

10

15

20

3. Se tienen los precios y las cantidades de cinco artculos para los periodos 2011
y 2013 (Tabla No. 17 Datos suministrados)

ARTICULOS
A1
A2
A3
A4
A5

2011
PRECIO CANTIDAD

2013
PRECIO
CANTIDAD

U DE
PRECIO
Lts
820
3
1.000
3
Doc
530
5
500
8
Mts
1.120
10
1.400
8
Kls
350
6
350
10
Un
200
2
400
3
Tabla No. 17.Datos proporcionados en la gua para desarrollar el ejercicio

Calcular los ndices ponderados de precios de: Laspeyres, Paashe y Fisher.

24

Para hallar el clculo de los ndices se deben determinar todos los valores que
interviene en ellos, en la siguiente tabla se resumen todos los clculos (Tabla
No.18):
ARTI
C.

U de
preci
o

P201
1

Q20
11

A1

Lts

820

A2

Doc.

530

A3

Mts

1.120

10

A4

Kls

350

P201 Q201 P2011*Q20


3
3
11

P2013*Q2
013

1.00
0
500
1.40
0

P2013*Q2
011

P2011*Q20
13

2.460

3.000

3.000

2.460

2.650

4.000

2.500

4.240

11.200

11.200

14.000

8.960

10

2.100

3.500

2.100

3.500

640

1.200

800

960

19.050

22.900

22.400

350
A5

Un

320

2
400

TOTA
L

Tabla No. 18.Interpretacin clculo de los ndices ponderados

El ndice de Laspeyres de precios:

Dnde:

Entonces:

20.120

25

Por el mtodo Laspeyres los precios de los productos aumentaron en un


7.58% durante el ao 2013 respecto al 2011.

El ndice de precios de Paashe:.

Dnde:

Entonces:

Por el mtodo Paashe los precios de los artculos A1, A2, A3, A4 y A5,
aumentaron en un 3.81% durante el ao 2013 respecto al 2011.
El ndice de precios de Fisher:

Dnde:

26

Entonces:

Segn el mtodo Fisher los productos A1, A2, A3, A4 y A5, aumentaron en
un 5.68% durante el ao 2013 respecto al 2011.

27

Conclusiones

- Se logra observar cmo se manejaron las medidas de dispersin en el primer


punto, donde el colaborativo 2 mostro una mayor varianza, dando a conocer
que sus datos estn ms dispersos respecto al colaborativo 1, tambin se
consiguen trabajar medidas como el apuntamiento de las grficas para conocer
su simetra o si esta lleva un comportamiento especial de gauss.
- En el segundo punto se consigue tratar la regresin lineal como tema central,
all se logra observar que es el coeficiente de determinacin y correlacin,
siendo el primero quien explica el modelo de las variables y el segundo la
correlacin que hay entre las variables, adems de entender la ecuacin lineal
y que puede significar.

- Para el tercer y ltimo punto nos enfrentamos a la construccin de nmeros


ndice, los cuales nos dan la facilidad de comprar diferentes datos de dos aos,
aplicando formulas establecidas por diferentes pensadores, sin tener que
realizar todo un trabajo exhaustivo de estadstica.

28

Bibliografa

Correlacin. (30 abril de 2014). Wilipedia, la enciclopedia libre, [citado 29 de abril de


2014] es.wikipedia.org/wiki/Correlacin.
Ortegn Pava, M. (2010). Estadstica Descriptiva. Ibagu: Universidad Nacional
Abierta y a Distancia UNAD.
Ortegn Pava, M. (2010). Nmeros ndice. En M. Ortegn Pava, Mdulo Estadstica
Descriptiva (pgs. 147, 148 y 149). Ibagu: Universidad Nacional Abierta y a
Distancia UNAD.
SPSS Free. (s.f.). Curso Estadstica Medidas de Distribucin . [citado 28 de abril de
2014] www.spssfree.com.