Está en la página 1de 20

Universidad Nacional Abierta y

a Distancia Estadstica Descriptiva

PASO 3. FASE INTERMEDIA


ESTADSTICA DESCRIPTIVA
ALUMNO
CINDY JOHANNA BARRERA JIMENEZ
COD: 1065896140
ESLENDY CAMILA RINCN SANCHEZ
COD: 1091666620
GRUPO: 100105A _291

TUTOR
SERGIO DANIEL CASTAEDA

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


ESCUELA DE CIENCIAS SOCIALES ARTES Y HUMANIDADES
PROGRAMA DE INGENIERIA AMBIENTAL
AGUACHICA-CESAR
2016

Universidad Nacional Abierta y


a Distancia Estadstica Descriptiva

INTRODUCCIN

Normalmente, el conjunto de las personas suele observar los nmeros y las


grficas considerando que en estas no hay ninguna interpretacin, sin embargo la
estadstica convierte las cifras y grficas en conceptos vlidos y aplicables a
cualquier rea del conocimiento humano.

La estadista descriptiva es una disciplina que aunque compleja, til y asertiva para
ser tomada en cuenta como soporte analtico que permite establecer
comparaciones, definir y concluir.

Este trabajo colaborativo es un espacio acadmico importante que favorece


compartir informacin y construir un informe que responde a la gua de actividades
de la materia estadstica descriptiva

Universidad Nacional Abierta y


a Distancia Estadstica Descriptiva

JUSTIFICACIN

A travs de este informe el grupo de estadstica descriptiva desea justificar por qu


los anlisis aqu presentados son un medio para llevar la teora a la prctica
mediante el anlisis de una base de datos. Igualmente es relevante esta actividad
porque es un espacio para compartir y desarrollar un verdadero trabajo
colaborativo basado en problemas.

Es para nosotros una oportunidad para practicar en un contexto acadmico y


luego replicar en un contexto laboral aplicando las diferentes tcnicas y mtodos
que mediante un anlisis matemtico nos permita generar soluciones reales a los
posibles escenarios que se nos puedan presentar

Universidad Nacional Abierta y


a Distancia Estadstica Descriptiva

OBJETIVOS

GENERAL

Aplicar mediante la herramienta de aprendizaje trabajo colaborativo; Los


conceptos y temas correspondientes a la segunda unidad del curso de estadstica
descriptiva; medidas de dispersin y estadsticas bivariantes, contextualizndolas
a una situacin problema como son los Principales factores que Influyen en el
rendimiento acadmico de estudiantes de educacin bsica primaria, en
instituciones educativas del Valle del cauca (Colombia).

ESPECFICOS
Calcular e interpretar adecuadamente las medidas estadsticas univariantes y
asociar sus resultados con posibles alternativas de solucin al problema.

Identificar las variables discretas y continuas dentro del problema de estudio y


calcular las medidas univariantes de tendencia central ms adecuadas
reconocer variables discretas y continuas y calcular las medidas de tendencia
central media, mediana, moda, los cuartiles, deciles 5 y 7; percentiles 30, 50 e
interpretar sus resultados.
Utilizacin de programas informticos como Excel e Infostat para la realizacin
de diagramas y grficos requeridos en el trabajo colaborativo.

Interpretar los resultados obtenidos y asociarlos con el problema objeto de


estudio.

Universidad Nacional Abierta y


a Distancia Estadstica Descriptiva

1- Identificar las variables discretas dentro del problema de estudio y


calcular las medidas univariantes de tendencia central ms adecuadas, a
aquellas que consideren sean relevantes para el problema de estudio.
Variables discretas:

Nmero de accidentes: {1,2,3,4 110 } accidentes de trnsito en total


Edad: entre {17,18,19,20 56 } aos de edad
Nmero de heridos: {1,2,3,4,5.. 403} heridos
Nmero de muertos: {1,2,3,4, 531 } muertos

2- Elegir una variable discreta que sea representativa y elaborar una tabla
de frecuencias para datos NO

agrupados, representarla grficamente,

calcular las medidas de tendencia central: media, mediana, moda, los


cuartiles, deciles 5 y 7 ; percentiles 30 , 50 e interpretar sus resultados.

29
38
52
46
21
18
54
33
52
38
46
29
17
22
55
60
33
32
46
55
19
21

42
46
36
35
43
32
24
44
31
50
30
48
53
35
46
45
32
45
31
33
23
56

EDADES
18
54
33
52
38
46
29
17
22
54
17
21
46
55
19
21
42
46
36
35
56
22

23
45
43
34
38
18
54
33
52
38
46
29
17
22
34
46
55
19
21
42
46
36

35
55
22
18
54
33
52
38
46
29
17
22
38
52
46
21
18
54
60
33
32
46

Universidad Nacional Abierta y


a Distancia Estadstica Descriptiva

Categor
a

EDAD

frecuencia
frecuenci absoluta
a
acumulad frecuencia
absoluta a
relativa
0,04385964
5
5
9
0,04385964
5
10
9
0,04385964
5
15
9
0,02631578
3
18
9
0,05263157
6
24
9
0,05263157
6
30
9

29

17

18

19

21

22

23

24

29

10

30

11

31

12

32

13

33

14

34

15

35

16

36

17

38

18

42

19

43

20
21

44
45

1
3

frecuencia
relativa
acumulada
0,0438596
5

0,0877193
0,1315789
5
0,1578947
4
0,2105263
2
0,2631578
9
0,2719298
31 0,00877193
2
0,2807017
32 0,00877193
5
0,04385964
37
9 0,3245614
0,3333333
38 0,00877193
3
0,3508771
40 0,01754386
9
0,03508771 0,3859649
44
9
1
0,06140350 0,4473684
51
9
2
0,4649122
53 0,01754386
8
0,03508771
57
9
0,5
0,02631578 0,5263157
60
9
9
0,06140350
67
9 0,5877193
0,02631578 0,6140350
70
9
9
0,6315789
72 0,01754386
5
0,6403508
73 0,00877193
8
76 0,02631578 0,6666666

Universidad Nacional Abierta y


a Distancia Estadstica Descriptiva

22

46

14

23

48

24

50

25

52

26

53

27

54

28

55

29
30

56
60
Total

2
2
114

9
7
0,12280701 0,7894736
90
8
8
0,7982456
91 0,00877193
1
0,8070175
92 0,00877193
4
0,05263157 0,8596491
98
9
2
0,8684210
99 0,00877193
5
0,05263157 0,9210526
105
9
3
0,04385964 0,9649122
110
9
8
0,9824561
112 0,01754386
4
114 0,01754386
1
1

edades de las personas accidentadas


100
90
80
70
60
50
40
30
20
10
0

Medida de tendencia central media:


Utilizamos la media para describir un conjunto entero de observaciones con un solo
valor que representa el centro de los datos. Muchos anlisis estadsticos utilizan la
media como un punto de referencia estndar. La media es la suma de todas las
observaciones dividida entre el nmero de observaciones.

Universidad Nacional Abierta y


a Distancia Estadstica Descriptiva

En este caso las edades de las personas accidentadas


suma de todaslas edades 4067
=
=36 anos de edad
numero de personas
110

Medida de tendencia mediana:


Utilizamos la mediana para describir un conjunto entero de observaciones con un
solo valor que representa el centro de los datos. La mitad de las observaciones
est por encima de la mediana y la otra mitad est por debajo de sta. Se
determina al jerarquizar los datos y hallar el nmero de observacin. Si hay un
nmero par de observaciones, la mediana se extrapola como el valor que est
justo en el medio entre el valor de las observaciones.
17,18,19,21,22,23,24,29,30,31,32,33,34,35,36,38,42,43,44,45,46,48,50,52,53,54,55,56,60

Nota: para estos datos ordenados la mediana el 36, es decir, el 50% delos valores
es menor que o igual a 36 y el 50% de los valores es mayor que o igual a 36.

Medida de tendencia moda:


La moda es el valor que ocurre con ms frecuencia en un conjunto de
observaciones. Minitab tambin muestra cuntos puntos de los datos son iguales
a la moda. La moda se puede utilizar con la media y la mediana para proporcionar
una caracterizacin general de la distribucin de los datos. Mientras que la media
y la mediana requieren un clculo, la moda se obtiene simplemente contando el
nmero de veces que cada valor ocurre en un conjunto de datos.

EDAD
17
18
19
21
22
23
24
29

frecuenci
a
absoluta
5
5
3
5
5
2
1
3

Universidad Nacional Abierta y


a Distancia Estadstica Descriptiva

29
30
31
32
33
34
35
36
38
42
43
44
45
46
48
50
52
53
54
55
56
60

5
1
2
4
7
2
4
3
7
3
2
1
3
14
1
1
6
1
6
5
2
2

Nota: La moda en este caso seria las personas con 46 aos de edad que sufrieron
accidentes, ya que se presentaron 14 casos segn la base de datos de la
secretaria de trnsito.
Medida de tendencia los cuartiles:

17,18,19,21,22,23,24,29,30,31,32,33,34,35,36,36,38,42,43,44,45,46,48,50,52,53,54,55,56,60,.

Q1

Q
2

n 30
n=30i= = =15 Q2
2 2
n=15i=

n+1 16
= =8 Q1
2
2

n=15i=

n+1 16
= =8 Q3
2
2

Es decir que el 25% de los datos es menor que 29


Es decir que el 50 % de los datos es menor que 36
Es decir que el 75% de los datos es menor que 48

EDADE
S
17-21
21-29
29-33
33-36
36-44
44-50
50-55
55-60

fi

Fi

18
16
14
9
13
19
18
4
111

18
34
48
57
70
89
107
111

Calculo del primer cuartil

Q
3

111 .1
=27.75
4
Q1=21+

27.7518
. 10=37.5
16

Calculo del segundo cuartil


111 .2
=55.5
4
Q2=33+

55.548
. 10=35.16
9

Calculo del tercer cuartil


111 .3
=83.25
4
Q3=44+

83.2570
=90.40
19

Calcular deciles 5 y 7
Los deciles son los nueve valores que dividen la serie de datos en diez partes
iguales, los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de
los datos.
Calcular el quinto decil
111 .5
=55.5
10
D5=33+

55.548
. 10=35.16
9

Calcular el sptimo decil


111.7
=77.7
10
D7=44+

77.770
. 10=84.85
19

Calcular percentiles 30 y 50
Los percentiles son los 99 valores que dividen la serie de datos en 100 partes
iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99%
de los datos.
Calcular percentil 30
111.30
=33.3
100
P30=21+

33.318
.10=43.05
16

Calcular percentil 50

111.50
=55.5
100
P50=33+

55.548
.10=35.16
9

- Elegir una variable Continua que sea representativa y siguiendo los


lineamientos, disear una tabla de frecuencia para datos agrupados,
representarla grficamente por medio de un histograma de frecuencias, un
polgono de frecuencias, calcular las medidas de tendencia central,
determinar el tipo de asimetra, los cuartiles , deciles 5 y 7 ; percentiles 25,
50 ( Interpretar sus resultados)

GRADOS DE
ALCOHOL
0.0
0.0

0.0

0.2

0.2

0.2

0.3

0.4

0.4

0.6
0.8
1.0
1.4
1.6
1.8
2.1
2.3

0.6
.08
1.0
1.4
1.6
1.8
2.1
2.3

0.6
0.8
1.1
1.4
1.6
1.9
2.1
2.4

0.6
0.8
1.1
1.4
1.7
1.9
2.2
2.4

0.6
0.9
1.2
1.4
1.7
1.9
2.2
2.4

0.7
0.9
1.2
1.5
1.7
1.9
2.2
2.4

0.7
0.9
1.2
1.5
1.8
2.0
2.2
2.4

0.7
0.9
1.2
1.5
1.8
2.0
2.3
2.5

0.7
1.0
1.2
1.6
1.8
2.0
2.3
2.5

Tabla de frecuencia de una variable continua.


GRADO
INTE
DE
RVA
ALCOHO
LO
L

1
2
3
4
5
6
7
8

0.0
0.4
0.8
1.3
1.7
2.1
2.6
3.0

---------

0.4
0.8
1.3
1.7
2.1
2.6
3.0
3.5

MARCA
DE
CLASE

0.2
0.6
1.05
1.5
1.9
2.35
2.8
3.25

FRECUENC
FRECUEN
IA
CIA
FRACCIO
ABSOLUTA
DECIMAL PORCENTUAL
ABSOLUT
N
ACUMULA
A
DA

9
15
15
17
17
17
6
14

9
24
39
56
73
90
96
110

9/110
15/110
15/110
17/110
17/110
17/110
6/110
14/110

0.081
0.136
0.136
0.154
0.154
0.154
0.054
0.127

8.1%
13.6%
13.6%
15.4%
15.4%
15.4%
5.4
12.7%

-Calcular las medidas de tendencia central

Hallar la media:
1867.6
=1.69
110

Hallar la mediana:
1.3+0.4

=1.6
( 5539
17 )

Hallar la moda
1.3+0.4

0
( 0+11
)

= 2.1

1.3+0.4

( 2+2 0 )=1.7

-Determinar el tipo de asimetra.

Utilic el coeficiente de Pearson, ste se define como la relacin que hay entre la
diferencia existente entre la media y la moda sobre la desviacin estndar. Por lo
tanto es de asimetra negativa.
1.692.1
=0.44
0.92

-Determinar los Cuartiles:

Cuartil 1
0.8+

0.4 [27.524]
=0.89
15

Cuartil 2
1.3+

0.4[5539]
= 1.67
17

Cuartil 3
2.11+

-Hallar los Deciles 5 y 7

0.4[82.573]
=
17

2.32

Decil 5
1.3+0.4

5539
=1.67
17

Decil 7
2.1+0.4

7773
=2.19
17

-Hallar los Percentiles 25 y 50

Percentil 25

Percentil 50

0.8+

0.4 ( 27.524 )
=0.89
15

1.3+

0.4(5539)
=1.67
17

Medidas univariantes de dispersin


_ Con la variable Discreta elegida calcular: rango, varianza, desviacin tpica y
coeficiente de variacin. Interpretar los resultados obtenidos y asociarlos con el
problema objeto de estudio.

La variable discreta elegida es EDADES DE LAS PERSONAS ACCIDENTADAS;


el objetivo que se busca con elegir esta variable es analizar de qu edades son las
ms frecuentes entre las personas accidentadas; luego es multipropsito pues es
un insumo para conductores el saber la situacin para mejorar en su tcnica de
manejo y dems factores de accidentalidad.
1.1 variable discreta edades de las personas accidentadas
Para los datos requeridos se utiliz Excel.

Tabla 1
Medidas univariantes
accidentadas)

de

dispersin

MEDIDA
Rango
Mnimo
Mximo
Varianza
Desviacin tpica o estndar
Coeficiente de variacin

(variable:

edades

de

las

personas

VALOR
43
17
60
20
45
1,25

Fuente propia.

Medidas de dispersin
Estas medidas nos informan sobre cuanto se alejan del centro los valores de
distribucin.

RANGO O RECORRIDO: Es de 60; para obtenerlo nos ubicamos en el mnimo


valor en este caso 17- y en el mximo valor en este caso 60-, luego tomamos el
rango que es sesenta. Esto significa que todas las medidas que aplicamos ocurren
dentro de este rango.

Las medidas de dispersin antes relacionadas permiten evidenciar lo alejados que


estn los datos del estudio estadstico respecto de la media aritmtica analizada
en el momento evaluativo. En este orden de ideas y teniendo en cuenta que la
media para el caso de la variable discreta (Edades de las personas accidentadas)
equivale a 36; A continuacin se analizan las dos medidas de dispersin ms
importantes:

Varianza de la muestra:

Con un resultado de 20 (valor cercano a la media) podemos inferir que los datos
de la variable no presentan una oscilacin considerable.
Desviacin tpica o estndar:
Se alcanz un valor es de 45 (valor igualmente cercano a la media).

Visto lo anterior es pertinente inferir que la mayora de las personas ms


accidentadas objeto de estudio, tendran entre 17 la edad ms joven y 45 aos
segn la base de datos de la secretaria de trnsito.
Anexo (formulas aplicadas):
maximominimo=rango

Varianza

2=

x 2fi =x 2
N

Desviacin tpica

= 2
Coeficiente variacin
desviacion tipica
media

_ Con la variable Continua elegida calcular: rango, varianza, desviacin


tpica y coeficiente de variacin. Interpretar los resultados obtenidos y
asociarlos con el problema objeto de estudio.

Con la siguiente tabla hallaremos lo requerido en el punto anterior.


Intervalo
0.0
0.4
0.8
1.3
1.7
2.1
2.6
3.0

---------

0.4
0.8
1.3
1.7
2.1
2.6
3.0
3.5

fi

xi

9
15
15
17
17
17
6
14
110

0.2
0.6
1.05
1.5
1.9
2.35
2.8
3.25

fi.xi
1.8
9
15.75
25.5
32.3
39.95
16.8
45.5
186.6

(xi-)
2.22
1.18
0.40
0.03
0.04
0.43
1.23
2.43

(xi-).f
19.98
17.7
6
0.51
0.68
7.31
7.38
34.02
93.58

-Hallar Rango:

3.5-0.0= 3.5

-Hallar Varianza:

93.58
110

= 0.85

-Hallar Desviacin Tpica (Raz cuadrada del resultado de variacin):

0.85=0.92
-Hallar Coeficiente De Variacin (Desviacin sobre Media):

0.92
.100 =54.43
1.69

Conclusin
La estadstica descriptiva Brinda herramientas para elaborar con cuidados la
observacin de hechos y fenmenos de la poblacin en general, para tomar una
muestra y aplicar sus herramientas en la obtencin de resultados, anlisis y
conclusiones de una investigacin, que ayudara a contribuir con el manejo de
informacin para ayudar con el contexto de la proyeccin social con el fin de lograr
una mejor calidad de vida.
la Estadstica, radica en la importancia que poseen relacin con el manejo de la
informacin de cualquier rea del saber, gracias a que arroja resultados, tomados
desde un componente terico-prctico, para la aprehensin del conocimiento de
cualquier profesional, de una manera cercana mediante la solucin de problemas,
que requieren interpretacin estadstica, en donde la sociedad actual se encuentra
dominada por el conocimiento, ms especficamente por la informacin, requiere
de sta disciplina que ayude a facilitar el manejo de la misma de una forma
pertinente, ordenada grficamente en la obtencin de resultados y conclusiones
acordes al proceso de investigacin on el cual se esta trabajando.

También podría gustarte