Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tutora
Vanessa Linares De la Rosa
Introducción.....................................................................................................................................3
Justificación.....................................................................................................................................4
Objetivos..........................................................................................................................................5
Actividad 1. Ajuste de datos............................................................................................................6
Actividad 2. Procesamiento de variables.........................................................................................8
Conclusiones..............................................................................................................................10
Variable cualitativa 2:................................................................................................................10
Variable cuantitativa Discreta y Continua.....................................................................................12
Variable Cuantitativa Discreta Elegida.....................................................................................12
Variable Cuantitativa Continúa Elegida:...................................................................................13
Regresión y correlación entre variables cuantitativas...................................................................15
Propuesta de solución a la problemática........................................................................................17
Recomendaciones..........................................................................................................................17
Bibliografía....................................................................................................................................18
Introducción
Se tomó como base de estudio la base de datos PRUEBA SABER 11-200 2019 para realizar
diagramas de dispersión de las variables cuantitativas, determinando así el tipo de relación que
hay entre las variables, también hayamos los modelos matemáticos, la correlación y
proporcionalidad entre dos variables estadísticas, finalmente relacionamos la información
obtenida con el problema planteado, se realizaron tablas de contingencia que nos permitirán
asociar y analizar dos variables, se realizaron también los respectivos histogramas.
La actividad planteada se constituye como un proceso de determinación de cuanto incluye cada
variable en la situación presentada; por lo cual se utilizan distintas herramientas como diagramas
de dispersión, tablas de frecuencia, histogramas entre otros, todo esto para que facilite la
comprensión de los fatos permitiendo así identificar las variaciones de estos.
Cabe resaltar que la estadística es la ciencia que utiliza conjunto de datos numéricos para obtener
inferencias basadas en el cálculo de la probabilidad. Por lo tanto, podemos decir que la
estadística es la ciencia que se encarga de recopilar, organizar, procesar, analizar y/o interpretar
datos con el fin de deducir las características de una población u objeto de estudio.
Justificación
Dicho trabajo se realizó con el fin de que los estudiantes reafirmen sus conocimientos y aprendan
la importancia de la estadística descriptiva en la vida diaria, además de eso es una ciencia muy
práctica y dinámica ya que podemos realizar todo mediante graficas y diagramas que nos
permitan hacer más activa una explicación.
El ejercicio facilita la interpretación analítica y grafica de la situación para ello se utilizan
diferentes herramientas, las cuales buscan disponer la mayor cantidad de información.
Aplicando medidas estadísticas univariantes y bivariantes, la cual nos lleva a obtener resultados
que pueden ser analizados y llevados a un contexto crítico e imponer posibles soluciones a los
factores que actúan en el tema central como lo son los factores que influyen en el resultado de las
Pruebas Saber 11 2020(16-2).
Objetivos
Para iniciar su trabajo, el grupo deberá ajustar la base de datos: Pruebas SABER 11 - 200
estudiantes 2020 (16-2) trabajada en el periodo, la cual se encuentra en el entorno de aprendizaje
colaborativo, en la carpeta: guía de actividades y rúbrica de evaluación - Paso 2– organización y
presentación, el grupo dejará sólo los primeros 80 datos en cada una de las variables y procederá
a procesarlos como una muestra de la base original.
VARIABLES CUANTITAVAS
VARIABLES CUALITATIVAS VARIABLES CUANTITAVAS CONTINUAS
DISCRETAS
ID
Municipio de Estrato N°de libros de Horas de dedicación a Horas de dedicación
Genero
Residencia Familiar consulta la lectura a Internet
1 M TUNJA 2 11 0,5 1
2 M TUNJA 1 13 0,5 1
3 M TUNJA 2 13 0,5 1
4 F TUNJA 2 9 0,5 1
5 F TUNJA 2 8 0,5 1
6 F TUNJA 4 45 2,5 2,5
7 F TUNJA 3 26 0,5 2,5
8 M TUNJA 3 11 0,5 2,5
9 F PALMIRA 3 26 0,5 2,5
10 F PALMIRA 5 13 2,5 2,5
11 F PALMIRA 2 12 0,5 1
12 F PALMIRA 4 23 2,5 2,5
13 F PALMIRA 2 45 0,5 1
14 F PALMIRA 4 56 2,5 2,5
15 F PALMIRA 5 3 2,5 2,5
16 F PALMIRA 5 14 2,5 2,5
17 F PALMIRA 4 16 2,5 2,5
18 F PALMIRA 3 12 0,5 2,5
19 F PALMIRA 3 12 0,5 2,5
20 F PALMIRA 3 6 0,5 2,5
21 F PALMIRA 4 7 2,5 2,5
22 F PALMIRA 3 8 0,5 2,5
23 F PALMIRA 4 19 2,5 2,5
24 M PALMIRA 5 12 2,5 2,5
25 F PALMIRA 3 15 0,5 2,5
26 F PALMIRA 2 12 0,5 1
27 F PALMIRA 4 7 2,5 2,5
28 F PALMIRA 6 8 2,5 2,5
29 F PALMIRA 3 9 0,5 2,5
30 F PALMIRA 4 0 2,5 3,5
31 F PALMIRA 4 3 2,5 3,5
32 F PALMIRA 5 6 2,5 3,5
33 F PEREIRA 1 3 0,5 1
34 M PEREIRA 2 5 0,5 1
35 M EL PAUJÍL 1 6 0,5 1
36 M EL PAUJÍL 0 7 0,5 1
37 F EL PAUJÍL 1 0 0,5 1
38 M EL PAUJÍL 1 7 0,5 1
39 F EL PAUJÍL 2 7 0,5 1
40 M EL PAUJÍL 1 7 0,5 1
41 F EL PAUJÍL 1 7 0,5 1
42 F EL PAUJÍL 1 7 0,5 1
43 M EL PAUJÍL 1 4 0,5 1
44 F EL PAUJÍL 1 2 0,5 1
45 M EL PAUJÍL 1 3 1,5 1
46 M EL PAUJÍL 1 1 1,5 1
47 F EL PAUJÍL 1 2 1,5 1
48 F EL PAUJÍL 3 12 1,5 3,5
49 F EL PAUJÍL 2 12 1,5 1
50 F EL PAUJÍL 1 1 1,5 1
51 F EL PAUJÍL 1 2 1,5 1
52 F EL PAUJÍL 1 5 1,5 1
53 F EL PAUJÍL 1 6 1,5 1
54 F EL PAUJÍL 1 6 1,5 1
55 F EL PAUJÍL 1 6 1,5 1
56 M EL PAUJÍL 3 6 1,5 3,5
57 F EL PAUJÍL 1 6 1,5 1
58 M EL PAUJÍL 1 3 2,5 1
59 F EL PAUJÍL 1 4 2,5 1
60 F EL PAUJÍL 1 4 2,5 0,5
61 F EL PAUJÍL 1 4 2,5 0,5
62 F EL PAUJÍL 2 4 2,5 0,5
63 F EL PAUJÍL 1 3 2,5 0,5
64 M EL PAUJÍL 3 4 2,5 3,5
65 F EL PAUJÍL 1 4 2,5 0,5
66 M EL PAUJÍL 1 4 2,5 0,5
67 F EL PAUJÍL 1 4 2,5 0,5
68 F EL PAUJÍL 1 4 2,5 0,5
69 F EL PAUJÍL 1 7 2,5 0,5
SOGAMOS
70 F 1 7 2,5 0,5
O
71 F CALI 3 7 2,5 3,5
72 F CALI 3 9 2,5 3,5
73 F CALI 3 9 2,5 3,5
74 F CALI 3 9 2,5 3,5
75 F CALI 5 9 2,5 3,5
76 F CALI 4 9 2,5 3,5
77 F CALI 4 5 2,5 3,5
78 F CALI 4 4 2,5 3,5
79 F CALI 2 4 2,5 0,5
80 F CALI 4 4 2,5 3,5
El grupo deberá tomar mínimo seis variables (al menos dos cualitativas, dos cuantitativas
discretas y dos cuantitativas continuas)
Variable cualitativa 1:
La variable cualitativa a la cual se le realizará el estudio será:
Genero
Tabla de frecuencias
Tabla de frecuencias
F F
acumula relati
Genero F absoluta da va F.R%
Masculi
no 16 16 0.20 20%
Femeni
no 64 80 0.80 80%
Total 80 1 100%
Diagrama de barras
Diagrama de barras
70 64
60
50
estudiantes
40
30
20 16
10
0
maculino femenino
genero
Moda:
La moda presente dado el tipo de género para los estudiantes que presentaron las Pruebas SABER 11 -
200 estudiantes 2020 es el género FEMENINO ya que se repite 64 veces a lo largo de la encuesta.
Tabla de contingencias
Municipio
Cali Sogamoso
Palmira
Genero
Tunja El Paujil Pereira Total
Masculino 1 4 11 1 17
23 4 24 1 63
Femenino
10 1
24 8 35 2 80
total
10 1
Conclusiones
Podemos concluir que de la encuesta realizada a 200 se tomó una muestra de 80 estudiantes del
cual existen 64 estudiantes de género femenino lo cual conforma el 80% de la muestra, mientras
que del género masculino participan 16 estudiantes que conforman un 20% de la muestra para
un total de 100%.
Variable cualitativa 2:
La variable cualitativa a la cual se le realizará el estudio será:
Municipio de residencia
Caracterizar una de las variables cualitativas elegidas presentando: tabla de frecuencias,
diagrama de barras o circular, moda, tabla de contingencias y conclusiones
Tabla de frecuencias
Frecuencia Frecuencia Frecuencia Frecuencia
Absoluta Absoluta Relativa porcentual (%)
Municipio de residencia
Acumulada
Diagrama de circular
Diagrama circular
1% 3%
10%
13%
44%
30%
Tabla de contingencias
Municipio
Cali Sogamoso
Palmira
Genero
Tunja El Paujil Pereira Total
Masculino 1 4 11 1 17
Femenino
10 1
23 4 24 1 63
total
24 10 1 8 35 2 80
Conclusión
Podemos decir que el Municipio con mayor cantidad de estudiantes encuestados es EL PAUJIL con el
43.75% de la totalidad de la muestra seguido de Palmira con un 30% de los estudiantes y el Municipio
con menos participación es SOGAMOSO con un 1.25% de los encuestados.
Variable cuantitativa Discreta y Continua
Para una de las variables discreta elegida, se deberán calcular las medidas univariantes de
tendencia central: Media, Mediana, Moda. Todos los cuartiles. Así mismo deberán calcular las
medidas univariantes de dispersión: Rango, Varianza, Desviación típica y Coeficiente de
variación.
Variable Cuantitativa Discreta Elegida
Numero de libros de consulta
Conclusiones:
Se concluye de este análisis a una muestra de 80 datos de la variable No de libros de consulta,
que el promedio de los libros consultados por los estudiantes en las pruebas saber realizadas en
noviembre de 2019 fue de 9,19.
El máximo de libros consultado por los estudiantes en las pruebas saber realizados en algunos
departamentos de Colombia fue de 56.
El 50% de los estudiantes consultaron una cantidad 7 libros para el análisis realizado a 80 datos.
Variable Cuantitativa Continúa Elegida:
Para una de las variables continúa elegida, se deberán calcular las medidas univariantes de
tendencia central: Media, Mediana, Moda. Todos los cuartiles Así mismo deberán calcular las
medidas univariantes de dispersión: Rango, Varianza, Desviación típica y Coeficiente de
variación.
Medidas de resumen
Horas de dedicación a
Resumen Internet
n 80
Media 1,79
D.E. 1,09
Var(n) 1,17
CV 60,6
Mín 0,5
Máx 3,5
Mediana 1
Q1 1
Q3 2,5
P(25) 1
P(50) 1
P(75) 2,5
Rango 3
Media =1,79
1
Mediana
0,5
3,5
Dato
Dato Máximo
Mínimo
Q1=P (25) Q3=P (75)
2,5
75% 25%
Moda: La moda es 1 ya que el valor que más se repite, es decir es la cantidad de horas que
dedica a internet la mayoría de los 80 estudiantes seleccionados en la base de datos Pruebas
Saber 11-.
Conclusiones
33 estudiantes de los 80 elegidos en la base de datos Pruebas Saber 11 – 200 estudiantes
2020 (16-2) dedican una hora al internet lo que corresponde a un 41,25%.
Solo el 18,75% de los 80 estudiantes elegidos en la base de datos Pruebas Saber 11 – 200
estudiantes 2020 (16-2) dedican el máximo de horas al internet, es decir 3,5 horas.
La cantidad de horas que dedican los 80 estudiantes seleccionados de la base de datos
Pruebas Saber 11 – 200 estudiantes 2020 (16-2) es de 143,5 horas.
Identificar dos variables cuantitativas de la situación estudiada que puedan estar relacionadas y:
a. Realizar el diagrama de dispersión de dichas variables y determinar el tipo de asociación entre
las variables.
b. Encontrar el modelo matemático que permite predecir el efecto de una variable sobre la otra.
¿Es confiable?
c. Determinar el grado de relación de las dos variables.
d. Relacionar la información obtenida con el problema.
R./ Variable Independiente: Punt_Matematicas
Variable Dependiente: Promedio General
Realizar el diagrama de dispersión de dichas variables y determinar el tipo de relación
entre las variables.
La correlación que existe entre las dos variables es: Lineal creciente
Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la
otra. ¿Es confiable?
R./ R² = 0,8765
R² = 0,8765 x 100
El grado de confiablidad para el modelo empleado en el análisis es: Confiable en un 87,65%,
alta
Determine el grado de correlación de las dos variables.
R./ rcuadrada de 0,8765
r = 0,93
El grado de correlación de las dos variables es muy alta
Conclusiones
Podemos decir del análisis de estas dos variables que tienen una alta relación donde el promedio
general depende del puntaje obtenido en cada materia.
También se puede concluir en el gráfico de dispersión que la mayoría de los puntos se concentra
entre puntajes de 60-70 y el promedio general entre 70 y 80.
Recomendaciones
Tomando en cuenta todos los factores que actúan directamente en los resultados obtenidos por
los estudiantes encuestados y al ver la relevancia que tiene cada una de las variables, se
recomienda a los estudiantes póstumos a enfrentar las pruebas a dedicar más horas a la lectura y
a las buenas practicas del internet, ya que según los estudios y análisis realizados se pudo
percibir que los rangos de notas mas altos eran directamente proporcionales a las variables
numero de libros de consulta y horas de dedicación al internet. Cabe destacar que las demás
variables tienen una mínima intervención, pero se insiste en consultar más libros para poder
practicar la lectura, misma que intervendrá con resultados positivos a la hora de ver el promedio
general de dichas pruebas.
Bibliografía
Montero, J. M. (2007). Características de Una Distribución de Frecuencias. Statistical
Descriptive. Cengage Learning Paraninfo, S.A. Página 4 – 10.
OVI. Pacheco, P. N., Vergara, S .C (2013). Universidad Nacional de Colombia. Bogotá.
Estadística Fundamental.
García, J. E (2005). Análisis de Datos Unidimensionales.et al. Madrid: Paraninfo. Página
26 -42
Montero, J. M. (2007). Características de Una Distribución de Frecuencias. Statistical
Descriptive. Cengage Learning Paraninfo, S.A. Páginas 41-50
Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. Paginas. 151
– 158
Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City:
Cengage Learning. Páginas 675 – 686