Está en la página 1de 27

ESTADÍSTICA DESCRIPTIVA

PASO 3. ANÁLISIS DE LA INFORMACIÓN

ESTUDIANTE EN FORMACIÓN
SANDRA MILENA ARAUJO

GRUPO: 204040_344

TUTOR
ALBA DORIS TORRES

PROGRAMA
PISCOLOGÍA

UNIVERSIDAD ABIERTA Y A DISTANCIA UNAD

SEDE PLATO MAGDALENA


2020

SANDRA MILENA ARAUJO


Contenido
Introducción:................................................................................................................................3

Justificación..................................................................................................................................4

Objetivos........................................................................................................................................5

Objetivos específicos......................................................................................................................5

Actividad 1. Mapa Mental...........................................................................................................6

Paso 3: Sandra_ laboratorio medidas_univariantes..................................................................7

MEDIDAS UNIVARIANTES: Desarrollar en el paso (3).........................................................7

Actividad 3. Variable Cuantitativa continúa............................................................................15

SANDRA MILENA ARAUJO


Introducción:
Podemos ver un análisis directo sobre regresión y correlación con la finalidad de buscar o
encontrar la relación en los mismo, dado de unas variables seleccionada de la base de datos
otorgada por la UNAD, en al cual se basa en la investigación de los Indicadores de
accidentalidad -220 municipios 2020 (16-1)

En el caso de la estadística descriptiva se sustituye o reduce el conjunto de datos obtenidos


por un pequeño número de valores descriptivos, como pueden ser: el promedio, la mediana,
la media geométrica, la varianza, la desviación típica, etc. por lo tanto en este trabajo
vemos temas como moda, media y la mediana, siendo estas material de análisis, en punto
central vemos las medidas univariantes viables cuantitativas discretas, también se
desarrollan laboratorios relacionados con regresión y correlación, Medidas Bivariantes y
Diagramas de dispersión para variables.

SANDRA MILENA ARAUJO


Justificación.
En este trabajo busca generar conocimiento, habilidades y destrezas, para el aprendizaje de
nuevos elementos relacionados con la estadística descriptiva, donde se pueda tomar
determinado tema y transformarlo en resuelto.

SANDRA MILENA ARAUJO


Objetivos.

Objetivos.
El estudiante reconoce los fundamentos básicos de la Estadística Descriptiva y las etapas
dentro de una investigación, por medio de datos tomados de un fenómeno real, de su
entorno.

Objetivos específicos
Identificar los diferentes conceptos de datos interpretados correspondiente a la

unidad presente.

Realizar la lectura de datos y proyectarlos por medio de esquemas.

Analizar la problemática presentada con el fin de obtener los resultados estadísticos.

SANDRA MILENA ARAUJO


Actividad 1. Mapa Mental.

SANDRA MILENA ARAUJO


Paso 3: Sandra_ laboratorio medidas_univariantes
MEDIDAS UNIVARIANTES: Desarrollar en el paso (3)
MEDIDAS UNIVARIANTES PARA VARIABLE CUANTITATIVA DISCRETA

A partir de la base de datos “Indicadores de accidentalidad -220 municipios 2020 (16-1)”,


encontrada en el entorno de aprendizaje Colaborativo Paso 2– organización y presentación,
cada estudiante deberá resolver para una variable cuantitativa discreta diferente, los
ejercicios que aparecen a continuación y socializarlos en el foro.

1. Medidas Univariantes de Tendencia Central.


a. Para la variable elegida, se deberán calcular las medidas univariantes de tendencia
central:

MODA 7
MEDIA 7,9
MEDIANA 7

b. Calcular:
 Todos los cuartiles

CUARTIL POSICION VALOR


Q1 50 6,5
Q2 100 7,5
Q3 150 5
Q4 200 7

 Deciles 5 y 7;

DECIL POSICON VALOR


D5 100 7,5
D7 140 7

 Percentiles 25, 50

PRECENTIL POSICION VALOR


P25 50 6,5
P50 100 7,5
Interpretar sus resultados
SANDRA MILENA ARAUJO
En los cuartiles consiste en dividir los datos obtenidos en 4 partes, en los deciles en 10 y en
los percentiles en 100, de esto podemos que el cuartil 2, el decil y percentil 50, deben ser el
mismo valor de la mediana o un valor aproximado.

1. Medidas univariantes de dispersión: usuarios pasajeros


a. Para la variable elegida, se deberán calcular las medidas univariantes de dispersión:
 Rango,

Rango: cosiste en la resta del valor máximo con el mínimo.

N 200
MAX 23
MIN 5
RANGO 18

 Varianza,

Obtener la varianza es necesario tener en cuenta la siguiente formula

n
2
∑ ( x j −x )
s2= i=1
n−1

(xi-
LIMITE MARCA DE FRECUECNA FRECUENCI (xi- media)^2*(fi
INFE LLIMITE SU C I AB A ACO RELATIVA media)^2 )
5 7 6 122 122 0,61 3,61 440,42
8 10 9 55 177 0,275 1,21 66,55
11 13 12 12 189 0,06 16,81 201,72
14 16 15 6 195 0,03 50,41 302,46
17 19 18 0 195 0 102,01 0
20 22 21 3 198 0,015 171,61 514,83
23 25 24 2 200 0,01 259,21 518,42
26 28 27 0 200 0 364,81 0
29 31 30 0 200 0 488,41 0
      200   1   2044,4

VARIANZA 10,222
Desviación típica y

SANDRA MILENA ARAUJO


Desviación típica. Al obtener la varianza podemos obtener la desviación sacando su raíz
cuadrada.

DESVIASIO 3,1971862
N 6

 Coeficiente de variación.

-
P 0,84449256

b. Interpretar los resultados obtenidos y asociarlos con el problema objeto de


estudio

En el caso de la variables estudiada usuarios pasajeros, el rango consiste en iindicar la


dispersión entre los valores extremos de la variable, la desviación se encarga de identificar
las diferencias de cada dato respecto a la media, la varianza también se encarga de  medir la
dispersión de los valores de una variable respecto a la media y el coeficiente de variación,
determina la razón existente entre la desviación estándar  y la media, entonces podemos
decir que el este caso de por muerte en esto municipios atribuidos al promedio de usuarios
pasajeros de 18, esto quiere decir que aproximadamente estas personas pueden ser
afectadas si no se toman medidas precaución
Usuario Pasajeros

13
8
9
8

SANDRA MILENA ARAUJO


6
7
13
5
5
9
7
11
9
6
7
5
7
7
8
9
7
10
7
9
7
5
7
6
6
8
9
14
5
8
20
7
7
5
6
6
7
13
5
5
9
7
11
SANDRA MILENA ARAUJO
9
6
7
5
7
7
8
9
7
10
7
9
7
5
7
6
8
9
14
5
8
20
7
7
5
6
5
7
5
9
7
8
5
7
9
6
10
8
11
16
7
8
7
SANDRA MILENA ARAUJO
6
9
9
7
11
9
6
6
6
9
6
7
7
5
6
11
8
7
5
5
7
9
23
14
7
7
7
6
8
9
6
6
6
9
6
7
7
5
6
11
8
7
5
SANDRA MILENA ARAUJO
5
7
9
23
14
7
7
7
6
8
7
7
6
7
13
5
5
7
8
9
7
10
7
9
7
7
8
7
5
6
9
8
7
6
7
13
5
5
9
7
11
9
6
SANDRA MILENA ARAUJO
7
5
7
7
8
9
7
10
7
9
7
5
7
6
6
8
9
14
5
8
20
7
7

Actividad 3. Variable Cuantitativa continúa


Descripción de la Actividad:

A partir de la base de datos “Indicadores de accidentalidad -220 municipios 2020 (16-


1)”,.

Posterior a la consulta resolver los siguientes ejercicios: velocidad aproximada


SANDRA MILENA ARAUJO
marca
de frecuencia frecuencia
f*x
límite límite clase absoluta Frecuencia frecuencia relativa o
inferior superior (x) (F) acumulada relativa acumulado
61 70 65,5 29 29 1899,5 0,145 14,5
71 80 75,5 31 60 2340,5 0,155 15,5
81 90 85,5 18 78 1539 0,09 9
91 100 95,5 31 109 2960,5 0,155 15,5
101 110 105,5 34 143 3587 0,17 17
111 120 115,5 31 174 3580,5 0,155 15,5
121 130 125,5 26 200 3263 0,13 13
131 140 135,5 0 200 0 0 0
TOTAL 200   19170 1 100
a. Tabla de frecuencia datos agrupada. Cada estudiante deberá elegir una variable
cuantitativa continua y diseñar una tabla de frecuencia para datos agrupados, a partir
de ella elaborar un histograma de frecuencias y un polígono de frecuencia

A partir de ella elaborar un histograma de frecuencias y un polígono de frecuencia

velocidad aprox
40
35
30
25
20
15
10
5
0
65.5 75.5 85.5 95.5 105.5 115.5 125.5 135.5

velocidad aprox
40
35
30
25
20
15
10
5
0
65.5 75.5 85.5 95.5 105.5 115.5 125.5 135.5

SANDRA MILENA ARAUJO


a. Medidas de tendencias central. Para la variable cuantitativa continúa elegida, cada
estudiante deberá calcular las medidas de tendencia central

b. (Media, Mediana y Moda)

Para calcular la moda la media y mediana para datos agrupados, la calculamos dato los
datos en la anterior tabla de frecuencia en este caso estamos estudiando el caso de velocidad
aproximada en el problema de estudio de accidentalidad en los municipio de Colombia de
los cuales se escogió una muestra de 200 municipios, entonces decimos que:

La moda

Es el valor que representa la mayor frecuencia absoluta. En tablas de frecuencias con datos

Li Extremo inferior del intervalo modal (intervalo que tiene mayor frecuencia absoluta).

Fi Frecuencia absoluta del intervalo modal.

Fi-1 Frecuencia absoluta del intervalo anterior al modal.

Fi+1 Frecuencia absoluta del intervalo posterior al modal.

Ti: Amplitud de los intervalos.

Entonces la moda para la velocidad aproximada es:

FI 34
FI-1 23
FI+1 25
LI 106
AI 8

MODA 11

SANDRA MILENA ARAUJO


  20
  0,55
  4,4
MODA 110,4

Mediana

Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de
menor a mayor. La mediana se representa por Me. La mediana se puede hallar sólo
para variables cuantitativas.

La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad


de la suma de las frecuencias absolutas. Es decir tenemos que buscar el intervalo en el que
se encuentre. N / 2

Luego calculamos según la siguiente fórmula:

Entonces la mediana para velocidad aproximada es:

N/2 100
K 200
FK-1 29
FK 31
AK 9
LK 71
MEDIANA 91,6129032

Media

Se calcula sumando todos los productos de marca clase con la frecuencia absoluta


respectiva y su resultado dividirlo por el número total de datos:

SANDRA MILENA ARAUJO


Entonces la media para velocidad aproximada es:

200   19170

MEDIA 95,85

Cuartiles Decil 5 y Percentil 25 y 50,

Cuartiles

Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos
ordenados en cuatro partes iguales

CUARTIL POSICION VALOR


Q1 50 81,5
Q2 100 77
Q3 150 92,5

Decil 5 y 7

DECIL POSICON VALOR


D5 100 77
D7 140 63,5

Percentil 25 y 50
PRECENTIL POSICION VALOR
P25 50 81,5
P50 100 77

c. determinar el tipo de Asimetría y Curtosis e interpretar los resultados y asociarlos


con la problemática: “¿Cuáles son los factores que influyen en la accidentalidad
de vehículos y en el grado de muertes asociadas a los accidentes de tránsito en
SANDRA MILENA ARAUJO
Colombia?”

Columna1

Media 95,8040201
Error típico 1,432324915
Mediana 97
Moda 109
Desviación estándar 20,20542941
Varianza de la muestra 408,2593777
Curtosis -1,205771643
Coeficiente de asimetría -0,083249034
Rango 69
Mínimo 61
Máximo 130
Suma 19065
Cuenta 199

De lo anterior podemos ver que es una asimetría positiva ya que la media es mayor que la
mediana y tiene una curtosis positiva, por lo que podemos afirmar que la su asimetría es
positiva para la problemática de accidentalidad en los municipios de Colombia con relación
a la velocidad aproximada, entonces también podemos ver que el coeficiente de asimetría es
-0,083249034, lo cual menor que cero por lo que dice que es negativo

marca
de f*x frecuencia
límite límite clase frecuencia Frecuencia frecuencia relativa o (xi- (xi-
inferior superior (x) absoluta (F) acumulada relativa acumulado media)^2 media)^2*(fi)
61 70 65,5 29 29 1899,5 0,145 14,5 920,2122 26686,15
71 80 75,5 31 60 2340,5 0,155 15,5 413,5122 12818,88
81 90 85,5 18 78 1539 0,09 9 106,8122 1922,62
91 100 95,5 31 109 2960,5 0,155 15,5 0,112225 3,478975
101 110 105,5 34 143 3587 0,17 17 93,41223 3176,016
111 120 115,5 31 174 3580,5 0,155 15,5 386,7122 11988,08
121 130 125,5 26 200 3263 0,13 13 880,0122 22880,32
131 140 135,5 0 200 0 0 0 1573,312 0
TOTAL 200   19170 1 100   79475,55
d. Medidas de Dispersión.

SANDRA MILENA ARAUJO


Para la variable cuantitativa continúa elegida calcular:

Rango

Obtenemos el rango para la velocidad aproximada

n 200
MAX 130
MIN 61
RANGO 69

Varianza

Obtenemos la varianza para la velocidad aproximada

varianza 397,377725

Desviación típica

Obtenemos la desviación típica para la velocidad aproximada

19,9343353
desviación 3

Coeficiente de variación obtenemos:

0,05844187
correlación 8

De lo anterior podemos inferir la problemática de los municipios tiende a empeorar por la


VELOCIDAD APROXIMADA y esto tienden a ser afectados por la accidentalidad, con
cifras de un rango de una velocidad de 69 sin lugar a duda todos los vehículos tienen causa
en este problema y también son responsables de la accidentalidad en Colombia.

En el caso de la variables estudiada VELOCIDAD APROXIMADA, el rango consiste en


iindicar la dispersión entre los valores extremos de la variable, la desviación se encarga de

SANDRA MILENA ARAUJO


identificar las diferencias de cada dato respecto a la media, la varianza también se encarga
de  medir la dispersión de los valores de una variable respecto a la media y el coeficiente de
variación, determina la razón existente entre la desviación estándar  y la media.

 Velocidad
APORX
102

91

90
97
115
114
114
98
110
77
112
109
130
125
66
76
65
121
62
73
108
109
117
89
101
94
72
121
105
61
SANDRA MILENA ARAUJO
74
100
109
120
94
66
70
92
119
115
89
72
115
69
95
68
130
102
65
95
68
117
70
81
94
112
109
69
117
108
108
78
92
107
72
75
91
78
78
99
90
95
127
SANDRA MILENA ARAUJO
63
124
96
107
75
106
115
88
117
128
102
77
96
65
109
74
123
102
121
77
127
112
128
73
78
78
66
88
76
86
62
111
77
115
105
91
102
107
110
79
67
81
127
SANDRA MILENA ARAUJO
61
95
66
117
63
78
73
78
84
128
92
122
112
64
93
97
77
66
83
115
112
67
125
64
63
114
107
105
73
118
92
128
102
97
88
129
69
113
93
97
115
94
89
SANDRA MILENA ARAUJO
98
69
94
117
104
113
86
75
109
122
109
72
108
76
102
86
106
93
83
72
115
63
82
61
97
117
82
121
109
125
109
126
114
99
130
126
111
125
80
130
104

SANDRA MILENA ARAUJO


Conclusión:
Por medio de la realización de esta actividad se pudo acumular la masa de datos numéricos
provenientes de la observación del problema presentado, procesándolos de forma razonable.

 Los datos se agrupan en clases con igual rango o amplitud.

 El rango se calcula sustrayendo el límite inferior del superior

SANDRA MILENA ARAUJO


Referencias bibliográficas
Martínez Bencardino; Ciro. Ecoe Ediciones. ISBN: 978-958-648-702-3,978-1-4492-7849-
6. Página 10 - 12

Montero, J. M. (2007). Características de Una Distribución de Frecuencias. Statistical


Descriptive. Cengage Learning Paraninfo, S.A. Página 4 – 10
García, J. E (2005). Análisis de Datos Unidimensionales.et al. Madrid: Paraninfo. (pp 26
-42). Recuperado de http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4052300007&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=03f8699ec7ccf10e87
45c0ceb7b85bf1

Montero, J. M. (2007). Características de Una Distribución de Frecuencias. Statistical


Descriptive. Cengage Learning Paraninfo, S.A. (pp 41-50). Recuperado de
http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea6
0961107ffc27a0

Ortegón Pava, M. (2017). Ova_Medidas_Univariantes.Colombia.Recuperado de


http://hdl.handle.net/10596/11577

SANDRA MILENA ARAUJO