Está en la página 1de 18

ESTADISTICA DESCRIPTIVA - (100105A_762)

Paso 5 – Presentación de resultados

Elbis Rafael Gómez Vargas


Leonardo Daza Muñoz
Manuel Andrés De Ávila C
Stefany Padilla León

Curso 100105 – Estadística Descriptiva


Grupo 46

Tutora
Vanessa Linares De la Rosa

Universidad Nacional Abierta y a Distancia-UNAD


Escuela de Ciencias Básicas, Tecnologías e Ingeniería-ECBTI
2020
Tabla de contenido

Introducción.....................................................................................................................................3
Justificación.....................................................................................................................................4
Objetivos..........................................................................................................................................5
Actividad 1. Ajuste de datos............................................................................................................6
Actividad 2. Procesamiento de variables.........................................................................................8
Conclusiones..............................................................................................................................10
Variable cualitativa 2:................................................................................................................10
Variable cuantitativa Discreta y Continua.....................................................................................12
Variable Cuantitativa Discreta Elegida.....................................................................................12
Variable Cuantitativa Continúa Elegida:...................................................................................13
Regresión y correlación entre variables cuantitativas...................................................................15
Propuesta de solución a la problemática........................................................................................17
Recomendaciones..........................................................................................................................17
Bibliografía....................................................................................................................................18
Introducción

Se tomó como base de estudio la base de datos PRUEBA SABER 11-200 2019 para realizar
diagramas de dispersión de las variables cuantitativas, determinando así el tipo de relación que
hay entre las variables, también hayamos los modelos matemáticos, la correlación y
proporcionalidad entre dos variables estadísticas, finalmente relacionamos la información
obtenida con el problema planteado, se realizaron tablas de contingencia que nos permitirán
asociar y analizar dos variables, se realizaron también los respectivos histogramas.
La actividad planteada se constituye como un proceso de determinación de cuanto incluye cada
variable en la situación presentada; por lo cual se utilizan distintas herramientas como diagramas
de dispersión, tablas de frecuencia, histogramas entre otros, todo esto para que facilite la
comprensión de los fatos permitiendo así identificar las variaciones de estos.
Cabe resaltar que la estadística es la ciencia que utiliza conjunto de datos numéricos para obtener
inferencias basadas en el cálculo de la probabilidad. Por lo tanto, podemos decir que la
estadística es la ciencia que se encarga de recopilar, organizar, procesar, analizar y/o interpretar
datos con el fin de deducir las características de una población u objeto de estudio.
Justificación

Dicho trabajo se realizó con el fin de que los estudiantes reafirmen sus conocimientos y aprendan
la importancia de la estadística descriptiva en la vida diaria, además de eso es una ciencia muy
práctica y dinámica ya que podemos realizar todo mediante graficas y diagramas que nos
permitan hacer más activa una explicación.
El ejercicio facilita la interpretación analítica y grafica de la situación para ello se utilizan
diferentes herramientas, las cuales buscan disponer la mayor cantidad de información.
Aplicando medidas estadísticas univariantes y bivariantes, la cual nos lleva a obtener resultados
que pueden ser analizados y llevados a un contexto crítico e imponer posibles soluciones a los
factores que actúan en el tema central como lo son los factores que influyen en el resultado de las
Pruebas Saber 11 2020(16-2).
Objetivos

 Definir conceptos básicos asociados a la correlación y la regresión lineal


 Identificar variables cualitativas y cuantitativas de la situación estudiada que puedan estar
relacionadas.
 Aplicar las medidas estadísticas bivariantes, en función de la problemática de estudio.
 Analizar los resultados obtenidos.
 Realizar tablas de frecuencia para datos agrupados y no agrupados.
 Relacionar la información obtenida con el problema.
 Realizar diagramas de dispersión de las variables escogidas y determinar el tipo de
relación.
 Reconocer lo fundamentos básicos de la Estadística Descriptiva y las etapas dentro de
una investigación, por medio de datos tomados en un fenómeno real.
 Calcular las medidas las medidas de tendencia central para las variables con que se estén
trabajando.
Actividad 1. Ajuste de datos.

Para iniciar su trabajo, el grupo deberá ajustar la base de datos: Pruebas SABER 11 - 200
estudiantes 2020 (16-2) trabajada en el periodo, la cual se encuentra en el entorno de aprendizaje
colaborativo, en la carpeta: guía de actividades y rúbrica de evaluación - Paso 2– organización y
presentación, el grupo dejará sólo los primeros 80 datos en cada una de las variables y procederá
a procesarlos como una muestra de la base original.
VARIABLES CUANTITAVAS
VARIABLES CUALITATIVAS VARIABLES CUANTITAVAS CONTINUAS
DISCRETAS
ID
Municipio de Estrato N°de libros de Horas de dedicación a Horas de dedicación
Genero
Residencia Familiar consulta la lectura a Internet
1 M TUNJA 2 11 0,5 1
2 M TUNJA 1 13 0,5 1
3 M TUNJA 2 13 0,5 1
4 F TUNJA 2 9 0,5 1
5 F TUNJA 2 8 0,5 1
6 F TUNJA 4 45 2,5 2,5
7 F TUNJA 3 26 0,5 2,5
8 M TUNJA 3 11 0,5 2,5
9 F PALMIRA 3 26 0,5 2,5
10 F PALMIRA 5 13 2,5 2,5
11 F PALMIRA 2 12 0,5 1
12 F PALMIRA 4 23 2,5 2,5
13 F PALMIRA 2 45 0,5 1
14 F PALMIRA 4 56 2,5 2,5
15 F PALMIRA 5 3 2,5 2,5
16 F PALMIRA 5 14 2,5 2,5
17 F PALMIRA 4 16 2,5 2,5
18 F PALMIRA 3 12 0,5 2,5
19 F PALMIRA 3 12 0,5 2,5
20 F PALMIRA 3 6 0,5 2,5
21 F PALMIRA 4 7 2,5 2,5
22 F PALMIRA 3 8 0,5 2,5
23 F PALMIRA 4 19 2,5 2,5
24 M PALMIRA 5 12 2,5 2,5
25 F PALMIRA 3 15 0,5 2,5
26 F PALMIRA 2 12 0,5 1
27 F PALMIRA 4 7 2,5 2,5
28 F PALMIRA 6 8 2,5 2,5
29 F PALMIRA 3 9 0,5 2,5
30 F PALMIRA 4 0 2,5 3,5
31 F PALMIRA 4 3 2,5 3,5
32 F PALMIRA 5 6 2,5 3,5
33 F PEREIRA 1 3 0,5 1
34 M PEREIRA 2 5 0,5 1
35 M EL PAUJÍL 1 6 0,5 1
36 M EL PAUJÍL 0 7 0,5 1
37 F EL PAUJÍL 1 0 0,5 1
38 M EL PAUJÍL 1 7 0,5 1
39 F EL PAUJÍL 2 7 0,5 1
40 M EL PAUJÍL 1 7 0,5 1
41 F EL PAUJÍL 1 7 0,5 1
42 F EL PAUJÍL 1 7 0,5 1
43 M EL PAUJÍL 1 4 0,5 1
44 F EL PAUJÍL 1 2 0,5 1
45 M EL PAUJÍL 1 3 1,5 1
46 M EL PAUJÍL 1 1 1,5 1
47 F EL PAUJÍL 1 2 1,5 1
48 F EL PAUJÍL 3 12 1,5 3,5
49 F EL PAUJÍL 2 12 1,5 1
50 F EL PAUJÍL 1 1 1,5 1
51 F EL PAUJÍL 1 2 1,5 1
52 F EL PAUJÍL 1 5 1,5 1
53 F EL PAUJÍL 1 6 1,5 1
54 F EL PAUJÍL 1 6 1,5 1
55 F EL PAUJÍL 1 6 1,5 1
56 M EL PAUJÍL 3 6 1,5 3,5
57 F EL PAUJÍL 1 6 1,5 1
58 M EL PAUJÍL 1 3 2,5 1
59 F EL PAUJÍL 1 4 2,5 1
60 F EL PAUJÍL 1 4 2,5 0,5
61 F EL PAUJÍL 1 4 2,5 0,5
62 F EL PAUJÍL 2 4 2,5 0,5
63 F EL PAUJÍL 1 3 2,5 0,5
64 M EL PAUJÍL 3 4 2,5 3,5
65 F EL PAUJÍL 1 4 2,5 0,5
66 M EL PAUJÍL 1 4 2,5 0,5
67 F EL PAUJÍL 1 4 2,5 0,5
68 F EL PAUJÍL 1 4 2,5 0,5
69 F EL PAUJÍL 1 7 2,5 0,5
SOGAMOS
70 F 1 7 2,5 0,5
O
71 F CALI 3 7 2,5 3,5
72 F CALI 3 9 2,5 3,5
73 F CALI 3 9 2,5 3,5
74 F CALI 3 9 2,5 3,5
75 F CALI 5 9 2,5 3,5
76 F CALI 4 9 2,5 3,5
77 F CALI 4 5 2,5 3,5
78 F CALI 4 4 2,5 3,5
79 F CALI 2 4 2,5 0,5
80 F CALI 4 4 2,5 3,5

Actividad 2. Procesamiento de variables

El grupo deberá tomar mínimo seis variables (al menos dos cualitativas, dos cuantitativas
discretas y dos cuantitativas continuas)

Clasificación de variables aplicada a la muestra de la población


correspondiente a los 200 estudiantes
Cuantitativas
  Cualitativas
Íte Discretas Continuas
m
1 Genero Numero de libros de consulta Horas de dedicaccion a Internet
2 Municipio de residencia Estrato Familiar Horas de dedicacion a la lectura

Descripción de la actividad Colaborativa


Caracterizar una de las variables cualitativas elegidas presentando: tabla de frecuencias, diagrama de
barras o circular, moda, tabla de contingencias y conclusiones.

Variable cualitativa 1:
La variable cualitativa a la cual se le realizará el estudio será:

 Genero
Tabla de frecuencias
Tabla de frecuencias
F F
acumula relati
Genero F absoluta da va F.R%
Masculi
no 16 16 0.20 20%
Femeni
no 64 80 0.80 80%
Total 80   1 100%
Diagrama de barras

Diagrama de barras

70 64
60
50
estudiantes

40
30
20 16
10
0
maculino femenino
genero

Moda:
La moda presente dado el tipo de género para los estudiantes que presentaron las Pruebas SABER 11 -
200 estudiantes 2020 es el género FEMENINO ya que se repite 64 veces a lo largo de la encuesta.

Tabla de contingencias

Municipio
Cali Sogamoso
Palmira
Genero
Tunja El Paujil Pereira Total

Masculino 1 4 11 1 17

23 4 24 1 63
Femenino
10 1
24 8 35 2 80

total
10 1

Conclusiones

Podemos concluir que de la encuesta realizada a 200 se tomó una muestra de 80 estudiantes del
cual existen 64 estudiantes de género femenino lo cual conforma el 80% de la muestra, mientras
que del género masculino participan 16 estudiantes que conforman un 20% de la muestra para
un total de 100%.
Variable cualitativa 2:
La variable cualitativa a la cual se le realizará el estudio será:
 Municipio de residencia
Caracterizar una de las variables cualitativas elegidas presentando: tabla de frecuencias,
diagrama de barras o circular, moda, tabla de contingencias y conclusiones
Tabla de frecuencias
Frecuencia Frecuencia Frecuencia Frecuencia
Absoluta Absoluta Relativa porcentual (%)
Municipio de residencia
Acumulada

Sogamoso 1 1 0.0125 1.25%


Pereira 2 3 0.025 2.5%
Tunja 8 11 0.1 10%
Cali 10 21 0.125 12.5%
Palmira 24 45 0.3 30%
El Paujil 35 80 0.4375 43.75%
TOTAL 80 1 100%

Diagrama de circular

Diagrama circular
1% 3%
10%
13%
44%

30%

Sogamoso Pereira Tunja Cali Palmira El Paujil


Moda:
La moda de la variable cualitativa es el municipio del PAUJIL ya que se repite en 35
estudiantes de la muestra tomada de la encuesta Pruebas SABER 11 - 200 estudiantes 2020 es
decir un 43.75% de los estudiantes.

Tabla de contingencias

Municipio
Cali Sogamoso
Palmira
Genero
Tunja El Paujil Pereira Total

Masculino 1 4 11 1 17

Femenino
10 1
23 4 24 1 63

total
24 10 1 8 35 2 80

Conclusión

Podemos decir que el Municipio con mayor cantidad de estudiantes encuestados es EL PAUJIL con el
43.75% de la totalidad de la muestra seguido de Palmira con un 30% de los estudiantes y el Municipio
con menos participación es SOGAMOSO con un 1.25% de los encuestados.
Variable cuantitativa Discreta y Continua

Para una de las variables discreta elegida, se deberán calcular las medidas univariantes de
tendencia central: Media, Mediana, Moda. Todos los cuartiles. Así mismo deberán calcular las
medidas univariantes de dispersión: Rango, Varianza, Desviación típica y Coeficiente de
variación.
Variable Cuantitativa Discreta Elegida
 Numero de libros de consulta

Conclusiones:
 Se concluye de este análisis a una muestra de 80 datos de la variable No de libros de consulta,
que el promedio de los libros consultados por los estudiantes en las pruebas saber realizadas en
noviembre de 2019 fue de 9,19.
 El máximo de libros consultado por los estudiantes en las pruebas saber realizados en algunos
departamentos de Colombia fue de 56.
 El 50% de los estudiantes consultaron una cantidad 7 libros para el análisis realizado a 80 datos.
Variable Cuantitativa Continúa Elegida:

 Horas de dedicación al internet

Para una de las variables continúa elegida, se deberán calcular las medidas univariantes de
tendencia central: Media, Mediana, Moda. Todos los cuartiles Así mismo deberán calcular las
medidas univariantes de dispersión: Rango, Varianza, Desviación típica y Coeficiente de
variación.

Medidas de resumen
Horas de dedicación a
Resumen Internet
n 80
Media 1,79
D.E. 1,09
Var(n) 1,17
CV 60,6
Mín 0,5
Máx 3,5
Mediana 1
Q1 1
Q3 2,5
P(25) 1
P(50) 1
P(75) 2,5
Rango 3

Media =1,79
1
Mediana
0,5
3,5
Dato
Dato Máximo
Mínimo
Q1=P (25) Q3=P (75)
2,5
75% 25%

Moda: La moda es 1 ya que el valor que más se repite, es decir es la cantidad de horas que
dedica a internet la mayoría de los 80 estudiantes seleccionados en la base de datos Pruebas
Saber 11-.
Conclusiones
 33 estudiantes de los 80 elegidos en la base de datos Pruebas Saber 11 – 200 estudiantes
2020 (16-2) dedican una hora al internet lo que corresponde a un 41,25%.
 Solo el 18,75% de los 80 estudiantes elegidos en la base de datos Pruebas Saber 11 – 200
estudiantes 2020 (16-2) dedican el máximo de horas al internet, es decir 3,5 horas.
 La cantidad de horas que dedican los 80 estudiantes seleccionados de la base de datos
Pruebas Saber 11 – 200 estudiantes 2020 (16-2) es de 143,5 horas.

Regresión y correlación entre variables cuantitativas

Identificar dos variables cuantitativas de la situación estudiada que puedan estar relacionadas y:
a. Realizar el diagrama de dispersión de dichas variables y determinar el tipo de asociación entre
las variables.
b. Encontrar el modelo matemático que permite predecir el efecto de una variable sobre la otra.
¿Es confiable?
c. Determinar el grado de relación de las dos variables.
d. Relacionar la información obtenida con el problema.
R./ Variable Independiente: Punt_Matematicas
Variable Dependiente: Promedio General
Realizar el diagrama de dispersión de dichas variables y determinar el tipo de relación
entre las variables.

La correlación que existe entre las dos variables es: Lineal creciente
Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la
otra. ¿Es confiable?
R./ R² = 0,8765
R² = 0,8765 x 100
El grado de confiablidad para el modelo empleado en el análisis es: Confiable en un 87,65%,
alta
Determine el grado de correlación de las dos variables.
R./ rcuadrada de 0,8765
r = 0,93
El grado de correlación de las dos variables es muy alta

Conclusiones
Podemos decir del análisis de estas dos variables que tienen una alta relación donde el promedio
general depende del puntaje obtenido en cada materia.

También se puede concluir en el gráfico de dispersión que la mayoría de los puntos se concentra
entre puntajes de 60-70 y el promedio general entre 70 y 80.

Propuesta de solución a la problemática

A continuación, se realizará el estudio de diferentes variables para posteriormente obtener


diferentes conclusiones que nos ayude a resolver la problemática planteada, este estudio se
realizara con la base de dato propuesta PRUEBA SABER 11-200 ESTUDIANTES; de esta base
de datos se tomara como muestra los 80 primeros datos de cada variable.
Del diagrama de barras se desprende que los estudiantes de género femenino conforman el
78.75% de la muestra por encima del género masculino que solo está conformado por un
21.25%.
Del diagrama circular se expone que el municipio con más estudiantes encuestados fue Paujil
con un 43.75% de la totalidad de la muestra y el municipio que menos participación tuvo fue
Sogamoso con un 1.25% de estudiantes encuestados.
Referente a los métodos utilizados por los estudiantes para prepararse a las pruebas saber
realizadas en el año 2019 se realizó estudio a el promedio de libros consultados y las horas
dedicadas al internet obtuvimos la siguiente información. De las medidas de frecuencia el
promedio de libros consultados por los estudiantes fue de 9.19%, solo el 50% de los estudiantes
consultaron una cantidad de 7 libros, y que la moda y la mediana tienen valores parecidos lo que
es indicativo de la concentración de datos, así como el coeficiente de valoración es alto con un
porcentaje de 26.14%. Del diagrama de dispersión se observa que el 41.25% de los estudiantes
dedica solo 1 hora al internet y que el 18.75% dedica el máximo de horas en internet, es decir 3.5
horas.

Recomendaciones

Tomando en cuenta todos los factores que actúan directamente en los resultados obtenidos por
los estudiantes encuestados y al ver la relevancia que tiene cada una de las variables, se
recomienda a los estudiantes póstumos a enfrentar las pruebas a dedicar más horas a la lectura y
a las buenas practicas del internet, ya que según los estudios y análisis realizados se pudo
percibir que los rangos de notas mas altos eran directamente proporcionales a las variables
numero de libros de consulta y horas de dedicación al internet. Cabe destacar que las demás
variables tienen una mínima intervención, pero se insiste en consultar más libros para poder
practicar la lectura, misma que intervendrá con resultados positivos a la hora de ver el promedio
general de dichas pruebas.

Bibliografía
 Montero, J. M. (2007). Características de Una Distribución de Frecuencias. Statistical
Descriptive. Cengage Learning Paraninfo, S.A. Página 4 – 10.
 OVI. Pacheco, P. N., Vergara, S .C (2013). Universidad Nacional de Colombia. Bogotá.
Estadística Fundamental.
 García, J. E (2005). Análisis de Datos Unidimensionales.et al. Madrid: Paraninfo. Página
26 -42
 Montero, J. M. (2007). Características de Una Distribución de Frecuencias. Statistical
Descriptive. Cengage Learning Paraninfo, S.A. Páginas 41-50
 Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. Paginas. 151
– 158
 Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City:
Cengage Learning. Páginas 675 – 686

También podría gustarte