Está en la página 1de 21

Estadística Descriptiva

Unidad 3: Paso 5 – Presentación de resultados

Presentado por:
Ruby Andrea Cifuentes Tovar
Código: 53.094.633

Presentado a:
Milton Eduardo Salgado
Tutor
Grupo: 204040_12

Universidad Nacional Abierta y a Distancia UNAD


Escuela de Ciencias Sociales Artes y Humanidades
Programa de Psicología
Cead Girardot
Mayo de 2020
Introducción

La estadística es una ciencia que utiliza conjuntos de datos numéricos para obtener, a partir
de ellos, inferencias basadas en el cálculo de probabilidades, también se emplea en los campos
científicos investigativos y analíticos.
Por lo cual podríamos definir la estadística como la ciencia que se encarga de recopilar,
organizar, procesar, analizar e interpretar datos con el fin de deducir las características de una
población objetivo.
Tomamos como referencia la tabla de “Indicadores de accidentalidad de 220 municipios en
2020 (16-1)”, para realizar diagramas de dispersión de las variables cuantitativas, determinando
el tipo de relación que hay entre cada una de las variables, también se hallaron los modelos
matemáticos, la correlación esta indica la fuerza y la dirección de una relación lineal y
proporcionalidad entre dos variables estadísticas, finalmente se relaciona la información obtenida
con el problema planteado, realizamos tablas de contingencia que nos permiten asociar y analizar
dos variables, también realizamos un histograma.
Donde podemos decir que la media es el promedio de los datos, la mediana es el valor de la
variable que ocupa la posición central, la moda es el valor de la variable que más se repite.
El presente trabajo se refiere al análisis realizado a los indicadores mencionados para
determinar el nivel de accidentalidad en las diferentes medidas cuantitativas o cualitativas y se ha
realizado un profundo estudio de las distintas variables en lo transcurrido del periodo académico
del curso Estadística Descriptiva.
La actividad se constituye como un proceso de determinación de cuanto incluye cada variable
en la situación presentada; para lo cual se utilizan distintas herramientas como diagramas de
dispersión, tablas de frecuencias, entre otros, que facilitan la compresión de los datos
permitiendo identificar las variaciones de estos.
A continuación, llegaremos a diferentes conclusiones, respecto a los resultados obtenidos
con cada uno de los ejercicios.
Justificación

Este trabajo se realiza con el fin de que los estudiantes adquieran conocimientos y aprendan la
importancia de la estadística en la vida laboral, y su vida cotidiana, además que es muy práctica y
dinámica ya que podemos realizar todo mediante graficas que nos permiten hacer más activa una
explicación y así poder trasmitirles a nuestros receptores lo que queremos de manera más
eficiente y eficaz. Con esta actividad aprendimos que la estadística nos hace más fácil nuestro
trabajo ya que nos brinda información exacta que nos permite organizar, direccionar, y realizar
planes de mejora entre otros a partir de los datos arrojados.
El ejercicio facilita la interpretación analítica y grafica de la situación para ello se utilizan
varias herramientas, el cual buscan disponer la mayor cantidad de información para ser puesta en
tela de juicio.
Realizar este ejercicio enseña una parte fundamental de cualquier carrera o trabajo de campo
que se pueda ejercer. El análisis y presentación de resultados es campo fundamental de la vida
laboral.
Objetivos

General

Conocer las condiciones del desarrollo vial y territorial, en el que viven los habitantes de 50
de los 220 municipios de Colombia aplicando los conceptos estadísticos y las diferentes maneras
de agrupar la información en relación con los datos obtenidos ordenándolos, representándolos en
diferentes diagramas, partiendo desde nuestra base de datos Indicadores de Accidentalidad.

Específicos

• Definir conceptos básicos asociados a Regresión y Correlación.


• Identificar dos variables cuantitativas discretas y continuas, y variables cualitativas de la
situación estudiada que puedan estar relacionadas.
• Realizar el diagramas de dispersión de las variables escogidas y determinar el tipo de
relación entre las variables.
• Relacionar la información obtenida con el problema.
• Realizar tablas de frecuencias para datos agrupados y no agrupados.
• Realizar graficas de las tablas de frecuencia obtenidas en los datos agrupados y no
agrupados.
• Calcular las medidas de tendencia central para las variables discretas y continuas (media,
mediana, moda)
• Calcular las medidas de dispersión para las variables discretas y continua.
• Analizar los resultados obtenidos.
• Reconocer los fundamentos básicos de la Estadística Descriptiva y las etapas dentro de
una investigación, por medio de datos tomados de un fenómeno real, del nuestro entorno.
• Aplicar las medidas estadísticas univariantes, en la solución de diferentes problemas.
• Aplicar las medidas estadísticas bivariantes, en función de la problemática de estudio.
Actividades para desarrollar

Aporte Sthefanny Dayana Ayala Rueda


Actividad 1. Ajuste de datos.
Descripción de la actividad.
Para dar inicio a su trabajo, el grupo deberá ajustar la base de datos “Indicadores socioeconómicos 120 municipios (2019) 16-2”
trabajada en el periodo, la cual se encuentra en el entorno de aprendizaje colaborativo, en la carpeta: guía de actividades y rúbrica
de evaluación - Paso 2– organización y presentación, el grupo dejará sólo los primeros 50 datos en cada una de las variables y
procederá a procesarlos como una muestra de la base original.
Actividad 2. Procesamiento de variables

Variable Cualitativa

Una vez ajustada la base de datos, el grupo deberá tomar mínimo cinco variables (al menos dos
cualitativas, una cuantitativa discreta y una cuantitativa continua) y procesará para cada variable
la información solicitada a continuación:

% Tasa de
Género Rural o Urbano Día Peatones Lesionados en
2019

Caracterizar la variable cualitativa presentando: tabla de frecuencias, diagrama de barras o


circular, moda, tabla de contingencias y conclusiones.

 Tablas de Frecuencias

Variable 1 Cualitativa = Género


Variable 2 Cualitativa = Rural o Urbano

Variable 3 Cualitativa = Día

 Diagramas Circulares
Variable 1 Variable 2 Variable 3

 Moda:

La moda se caracteriza por ser el valor que más se repite, por lo tanto con lo que podemos trabajar para
determinar esta medida de resumen es con la ayuda de las frecuencias, las cuales nos pueden determinar
que la moda en las tres variables cualitativas elegidas las cuales arrojan respectivamente los siguientes
resultados:
Variable 1 = GENERO: Los más accidentados son los hombres.
Variable 2 = RURAL O URBANO: En este caso cuando ambos resultados sostienen la misma
frecuencia NO HAY MODA
Variable 3 = DÍA: Dado que dos días sostienen la misma frecuencia esta distribución es BIMODAL

 Tablas de Contingencia

Variable 1 Cualitativa = Género - Rural o Urbana


Variable 2 Cualitativa: Rural y Urbana - Día

Variable 3 Cualitativa: Día y Genero


Conclusiones:

Conforme los datos hallados deducimos que los hombres son menos cuidadosos para
conducir, teniendo en cuenta que son datos tomados de 50 municipios diferentes y que
estadísticamente está comprobado con cifras exactas como estas que a diario así como tanto en
el área rural como en la urbana el hombre es más agresivo y osado a la hora de conducir lo que
podría también indicarnos la influencia que ejerce la cultura de nuestra sociedad, que
psicológicamente le inyecta en su sistema cognitivo-conductual la idea de que puede y debe ser
más arriesgado por el mero hecho de ser hombre.

Teniendo en cuenta los resultados anteriores sería bueno que los entes encargados tomen
medidas correctivas para ayudar a mitigar los riesgos que estas conductas impulsivas pueden
provocar tanto a nivel individual como colectivo.
Variables cuantitativas Discreta y Continua:

Para la variable discreta elegida, se deberán calcular las medidas univariantes de tendencia
central: Hallar media, mediana, moda. Todos los cuartiles. Así mismo deberán calcular las
medidas univariantes de dispersión: Rango, Varianza, Desviación típica y Coeficiente de
variación.

 Variable Cuantitativa Discreta: PEATON

Media: s =
168 / 50 =
3,36

 M
e
d
i
d
as Univariantes de Dispersión:

No. De PEATONES X FA X*F X-X% (x-x%)2*F


0 3 1,5 29 43,5 3,46 100,3284
3 6 4,5 14 63 1,2996 18,1944
6 9 7,5 5 37,5 17,1396 85,698
9 12 10,5 1 10,5 50,9796 50,9796
12 15 13,5 1 13,5 102,8196 102,8196
15 18 16,5 0 0 172,6596 0
18 21 19,5 0 0 260,4996 0
      50 168   358,02

Rango, Varianza, Desviación típica y Coeficiente de variación


Rango = Vlr Máximo – Vlr Mínimo
=15 – 0 = 15 Peatones

Varianza = S2 = 7,1604 peatones2

Desviación Típica = S2 = Raiz 7,1604 = 2,67589237 peatones

Coeficiente de Variación = Cv = 2,67589237/3,36*100 = 79% Son datos


Heterogeneos

• Para la variable continúa elegida, se deberán calcular las medidas univariantes de tendencia
central:

Media, Mediana, Moda. Todos los cuartiles Así mismo deberán calcular las medidas univariantes
de dispersión: Rango, Varianza, Desviación típica y Coeficiente de variación.

Variable Contínua Elegida: % Tasa de Lesionados en 2019

Media, Mediana y Cuartiles:


MEDIA PARA DATOS AGRUPADOS

Mediana,

MEDIANA PARA
DATOS NO 34,78
AGRUPADOS

MEDIANA
• Moda.

Cuartiles

• medidas univariantes de dispersión: Rango, Varianza, Desviación típica y Coeficiente de


variación.

MEDIA 35,95
MEDIA^2 1292,66
S^2 52,02
S 7,21
CV 20,1
Rango 34,8
La Moda

𝑀𝑜𝑑𝑎 𝑐

𝐿1: frontera inferior de la clase modal


∆1: exceso de la frecuencia modal sobre la clase inferior inmediata ∆2: exceso de la
frecuencia modal sobre la clase superior inmediata
c: anchura del intervalo de la clase modal La clase
modal es la tercera clase

4
𝑀𝑜𝑑𝑎=7,075+( )∗2,49=
5+4
𝑀𝑜𝑑𝑎

Cuartiles
Primer Cuartil (Q1)
𝑓
𝑄
𝑐
𝑓𝑐𝑢𝑎𝑟𝑡 𝑙
donde:
L1: Límite inferior de la clase cuartil
N: número de datos (frecuencia total)
: suma de las frecuencia de la clases inferiores a la clase cuartil fcuartil: frecuencia
de la clase cuartil c: anchura del intervalo de la clase cuartil

𝑓
𝑄
𝑐
𝑓𝑐𝑢𝑎𝑟𝑡 𝑙
La clase cuartil es la segunda

𝑄1 = 5,94
Segundo Cuartil (Q2) es igual a la mediana:
𝑄2 = 8,17
Tercer Cuartil (Q3):
𝑓

𝑄 𝑐
𝑓𝑐𝑢𝑎𝑟𝑡 𝑙
La clase cuartil es la cuarta clase
37,5 34
11
𝑄3=9,57 𝑄 3 = 10,36 +( )∗2,49=

Medidas de Dispersión:
Rango (R)
𝑅=𝑀𝑎𝑦𝑜𝑟 𝑚𝑒𝑛𝑜𝑟=
𝑅=19,47 2,11=
𝑅 =17,36
2
Varianza (s )
𝑠 𝑗
𝑁 50
𝑠2 = 4,24

𝑠 = √ 𝑠 2 = √4,24
Desviación Típica (s): 𝑠 = 2,06

Regresión y correlación entre variables cuantitativas

Identificar dos variables cuantitativas de la situación estudiada que puedan estar

Coeficiente de Variación (V):


𝑠
𝑉= ==

𝑉 =0,24

relacionadas y:

a. Realizar el diagrama de dispersión de dichas variables y determinar el tipo de asociación entre


las variables.
Podemos concluir según el diagrama que si existe correlación entre las dos variables, que su
dirección es positiva

b. Encontrar el modelo matemático que permite predecir el efecto de una variable sobre la otra.
¿Es confiable?
𝑦 = 7𝐸 06𝑥 + 3,1979
𝑅² = 0,1405

La intensidad se puede denominar débil, por lo tanto, no es confiable

c. Determinar el grado de relación de las dos variables

𝒓: 𝟎,𝟑𝟕𝟒𝟖𝟗𝟔𝟒
La correlación entre las variables es mínima

a. Realizar regresión múltiple en caso de que se determine dependencia entre las variables
cuantitativas
Actividad 3. Propuesta de solución a la problemática
Descripción de la actividad.
Finalmente, el grupo deberá responder a la pregunta: ¿Qué alternativa de solución plantea para la
problemática estudiada?, dicha respuesta deberá estar justificada descriptivamente, es decir para
ello (utilizará tablas, gráficos, medidas, diagramas, entre otros) a partir de los resultados
estadísticos descriptivos realizados en la actividad anterior (50 primeros datos) y la información
obtenida de la problemática planteada.
Del diagrama estadístico Tipo de Riesgo al que se Expone la Población se desprende que la
población con mayor exposición los Riesgos están asociados con los altos índices de
accidentalidad por las distintas variables. De la tabla de contingencia entre el Grado de
Lesionados y el Tipo de Riesgo al que se expone la población se desprende que la población
expuestas a los Riesgos de tienen un grado de conocimiento y autocontrol medio y bajo, es decir
que están próximos a entrar a cualquier programa de consciencia social. En cuanto a la población
de determinada por su genero pudimos encontrar que la conducta y precaución másculina varia en
un 40% con respecto al cuidado y precaución con el que conducen las mujeres sin la educación
básica completa en cuanto a normas viales se puede notar que el promedio de los municipios es
de 7.965 el cual es un número manejable, que se pueden identificar y reinsertarlos al sistema
educativo vial que no solo opere por multas económicas sino por conciencia, autocuidado y
demas con el objeto de disminuir las tasas de mortalidad y accidentalidad. De la tabla de
distribución se nota que está concentrada en ciertos municipios ya que la media, la mediana y la
moda tienen valores muy parecido lo que es un indicativo de la concentración de los datos, así
como el coeficiente de variación que cuando supera un resultado del 25% demuestra que sus
datos son dispersos. Esto sugiere que las políticas viales deben dirigirse a todos los lugares
objetos de estudio con el objeto de combatir esa debilidad en nuestra población.
Conclusiones

• La Estadística contribuye a documentar los datos y extraer información que no es posible


conocerla con solamente leer los datos.
• El diagrama de dispersión permite representar la relación entre la variables estudiadas
• El coeficiente de determinación y el de correlación son los parámetros utilizados para
determinar la confiabilidad del modelo y grado de correlación entre las variables.
• Los municipios estudiados son solo una cuarta parte de los que hemos venido analizando a lo
largo de este curso y que encontramos con altos índices de accidentalidad.
• Tanto las medidas de dispersión como los gráficos de dispersión sirven para observar el
comportamiento que tiene algunos datos que son objeto de estudio y que pretenden mostrar la
relación que existe entre los mismos o por el contrario una total desconexión que impiden
brindar soluciones.
• Se realizaron tablas de frecuencia para datos agrupados y no agrupados teniendo en cuenta
que los datos no agrupados son el conjunto de observaciones que se presentan en su forma
original tal y como fueron recolectados, para obtener información directamente de ellos.
mientras que los datos agrupados son aquellos que ordenamos y clasificamos cuando la
muestra es 20 o mayor.
• Es muy importante para nuestra vida profesional venidera, que manejemos los conceptos
estadísticos de manera clara y con facilidad, de igual forma le demos el uso más apropiado,
siempre en pro de buscar soluciones a cualquier tipo de problema que se nos pueda presentar
en nuestro diario vivir.
• Las variables cualitativas son aquellas que permiten la expresión de una característica, una
categoría, un atributo o una cualidad.
• las variables cuantitativas son aquellas que solo adoptan valores numéricos.
• La cantidad de información que se desprende de la realización de los estudios estadísticos es
muy completa y nos da una idea exacta de la situación que nos permite tomar las decisiones
adecuadas que conducen a las soluciones de los problemas de una población
• Cada estadístico nos da una información específica que nos permite interpretar la realidad de
la información recolectada para el momento que se hizo el estudio.

Referencias

Jarrell, Stephen B. (1994). Basic Statistics (Special pre-publication edición). Dubuque, Iowa:
Wm. C. Brown Pub. p. 492. ISBN 0-697-21595-4.
Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. (pp
151 – 158). Recuperado de http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4052100011&v=2.1&u=un
ad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219
Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City: Cengage
Learning. (pp 675 – 686). Recuperado de http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4058900232&v=2.1&u=un
ad&it=r&p=GVRL&sw=w&asid=e558184ed89e57d11ede116134cfce41
Churchill, G.A. (2009). "Análisis de Regresión Múltiple." Investigación de mercados. México
City: Cengage Learning. (pp 686 – 695). Recuperado de http://go.galegroup.com/ps/i.do?
id=GALE%7CCX4058900234&v=2.1&u=un
ad&it=r&p=GVRL&sw=w&asid=49575112db86a0eb46dae86bbaf74cb9
Ortegón Pava, M. (03,10,2018). Regresión y Correlación lineal. [Archivo de video]. Recuperado
de http://hdl.handle.net/10596/20621
https://campus21.unad.edu.co/ecbti52/mod/forum/discuss.php?d=16509#p 225368
García, J. E (2005). Análisis de Datos Unidimensionales.et al. Madrid: Paraninfo. (pp 26 -42).
Recuperado de http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052300007&v=2.1&u=un
ad&it=r&p=GVRL&sw=w&asid=03f8699ec7ccf10e8745c0ceb7b85bf1
Montero, J. M. (2007). Características de Una Distribución de
Frecuencias. Statistical Descriptive. Cengage Learning Paraninfo, S.A. (pp
41-50). Recuperado de http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4052100008&v=2.1&u=un
ad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0
Ortegón Pava, M. (2017). Ova_Medidas_Univariantes.Colombia.Recuperado de
http://hdl.handle.net/10596/11577
Monroy, S. S. (2005). Estadística descriptiva. México, D.F., MX: Instituto Politécnico Nacional.
(pp 55-79). Recuperado de http://site.ebrary.com/lib/unadsp/reader.action?
ppg=1&docID=10436604&t m=1471981857855

Matus, R., Hernández, Martha, and García, E (2010). Estadística. México, D.F., MX: Instituto
Politécnico Nacional, (2010). ProQuest ebrary. (pp 8-15). Recuperado de
http://site.ebrary.com/lib/unadsp/reader.action?ppg=12&docID=10365616& tm=1471981556569
Montero, J. M. (2007). Características de Una Distribución de
Frecuencias. Statistical Descriptive. Cengage Learning Paraninfo, S.A. (pp
41-50). Recuperado de http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4052100008&v=2.1&u=un
ad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0

También podría gustarte