Está en la página 1de 35

Unique results Saber Pro 2021

Resultados únicos Saber Pro 2021


Geraldine Castro Fernandez* Lina Bettin Santodomingo+
Edna Ibañez Cuadro~
2023-04-04

Abstract
This statistical report aims to analyze a database corresponding to the results of the saber pro
tests in the year 2021 to 611065 students. For this we took into account the notions and concepts
related to the analysis of numerical data; We chose this database because we considered that it
was very complete for the report that we wanted to carry out, we were left with the most
appropriate or apt variables for our statistical report within which we have 3 qualitative and 3
quantitative. It should be noted that we made use of the technological tool Statgrafics and
Rstudio for the development of the research work.
Keywords: Rstudio, Statgraphics, data, statistical, analysis, numerical, confidence intervals
Resumen
Este informe estadístico tiene como objetivo el análisis de una base de datos correspondientes a
los resultados de las pruebas saber pro en el año 2021 a 611065 estudiantes. Para esto tuvimos
muy en cuenta las nociones y conceptos relacionados con el análisis de datos numéricos;
escogimos esta base de datos porque consideramos que era muy completa para el informe que
queríamos llevar a cabo, nos quedamos con las variables más adecuadas o aptas para nuestro
informe estadístico dentro de las cuales tenemos 3 cualitativas y 3 cuantitativas. Cabe resaltar
que hicimos uso de la herramienta tecnológica Statgrafics y Rstudio para el desarrollo del
trabajo de investigación.
Palabras claves: Rstudio, Statgrafics, datos, estadístico, análisis, numéricos, intervalos de
confianza.

*Facultad de Economía y Negocios, Universidad Tecnológica de Bolívar, Colombia, e-mail:


gecastro@utb.edu.co
+Facultad de Economía y Negocios, Universidad Tecnológica de Bolívar, Colombia, e-mail:
lbettin@utb.edu.co
~Facultad de Economía y Negocios, Universidad Tecnológica de Bolívar, Colombia, e-mail:
eibanez@utb.edu.co
1
1. Introducción
En este informe estadístico se realizará un análisis estadístico de los resultados obtenidos de las
pruebas saber Pro del año 2021, buscamos conocer los resultados de las pruebas saber pro,
recopilamos toda la información de los datos abiertos. Tenemos una base de datos muy amplia,
analizaremos las variables tipo de documento, método programa, género, lectura crítica, inglés y
competencia ciudadana; cómo podemos ver tenemos una base de datos completa y muy bien
estructurada la cual nos permite analizar todo desde una perspectiva basada en información real.
Las pruebas Saber Pro-2021 están diseñadas por el ICFES (Instituto Colombiano para la
Evaluación de la Educación Superior) para evaluar el desempeño académico de los estudiantes
de educación media en Colombia. Estas pruebas se realizan una vez al año y tienen como
propósito medir el nivel de conocimiento, habilidades y destrezas de los estudiantes en los
contenidos de las asignaturas básicas. Estas pruebas son importantes para los estudiantes ya que
son un medio para evaluar su preparación para la educación superior y una forma de demostrar
su desempeño académico. Los estudiantes que deseen tomarlas deben asegurarse de que estén
familiarizados con los contenidos y los formatos de las pruebas para obtener buenos resultados.
Comparamos y analizamos cada uno de los aspectos que componen las pruebas saber pro para
así hacer su respectivo estudio y graficas para tener una mejor interpretación del tema, buscando
reconocer el nivel que tiene cada variable, describiremos los intervalos de confianza el cual nos
permitirá saber entre qué rango de valores se encuentra el valor real inaccesible de la variable en
la población, con un grado de incertidumbre que podamos determinar.

2
2. Revisión de la literatura
Al inicio de esta investigación, se tenía como objetivo analizar los resultados de las pruebas
saber pro para evaluar el desempeño académico de los estudiantes de educación media en
Colombia. Dentro de la revisión bibliográfica se encontraron 20 investigaciones que se
relacionan con el objeto de estudio del presente trabajo y que sirven como referente debido a su
metodología:
En primer lugar, se tiene una propuesta para el mejoramiento de la comunicación escrita en las
Pruebas Saber Pro, elaborado en la universidad Industrial de Santander (UIS), publicado en
2022 como una propuesta de mejoramiento, se tomó como referencia este trabajo por que toma
como referencia las pruebas saber pro y propone alternativas para minimizar los bajos resultados
del año 2021. [1]
Así mismo se realizó Análisis de Desempeño de Competencias en Pruebas Saber Pro Y Saber 11
de los Estudiantes de Enfermería de 10 Semestre, elaborado en la universidad de Santander
Campus Bucaramanga en el año 2020, este estudio se realizó con el fin de dar respuesta a la
pregunta de investigación planteada originalmente y conocer el nivel académico que tienen los
estudiantes de enfermería. [2]
Por otra parte, se realizó un análisis del desempeño en inglés de las ingenierías en el eje cafetero
a partir de resultados históricos en las pruebas Saber Pro en el marco de la virtualidad, elaborado
en la Universidad Tecnológica de Pereira en el año 2022, en este estudio se realizó un análisis
descriptivo comparativo sobre los resultados de las pruebas Saber Pro de los años 2018, 2019,
2020 y 2021 contemplado dentro de la metodología de minería de datos para la información de
los estudiantes de las carreras de ingeniería en los departamentos de Risaralda, Caldas y
Quindío. [3]
Con el mismo propósito encontramos un Pronóstico del resultado en las pruebas Saber Pro a
partir de variables socioeconómicas, del puntaje de las pruebas Saber 11 y del carácter de la
universidad para siete programas de ingeniería utilizando técnicas de aprendizaje automático,
elaborados por Soto Acevedo, Misorly del Carmen docente de la Universidad Tecnológica de
Bolívar, en el año 2021, en trabajo se realizó un modelo de predicción de los resultados en las
pruebas Saber Pro de los programas de ingeniería civil, eléctrica, electrónica, industrial,
mecánica, mecatrónica y química en Colombia, mediante técnicas de aprendizaje automático.
[4]
A partir de una Estrategia para el fortalecimiento de las competencias ciudadanas de los
estudiantes de Ingeniería en Colombia. Propuesta a partir de la revisión de las Pruebas Saber Pro
en tres universidades privadas con vecindad de comparación, elaborado por la universidad de la
Salle, en el año 2021. Este trabajo se realizó una propuesta de formación ciudadana para los
cursos básicos de los programas de Ingeniería en universidades colombianas, con una

3
integración de componentes académicos que necesitan fortalecerse y que están relacionados con
la Prueba Saber Pro y con los Resultados de Aprendizaje de la ABET. [5]
Teniendo en cuenta un trabajo acerca de la Predicción rendimiento estudiantes pruebas saber pro
según características socioeconómicas, elaborado por XI CONGRESO INTERNACIONAL DE
COMPUTACION MÉXICO – COLOMBIA, en el año 2021. En este trabajo se exponen
resultados obtenidos al aplicar la minería de datos al ámbito educativo de las pruebas saber pro
con el objeto de determinar las variables más influyentes en el desempeño de los estudiantes. [6]
Se realizó Análisis de los desempeños de estudiantes de psicología frente a las competencias de
razonamiento cuantitativo y competencias ciudadanas de la prueba SABER PRO durante el año
2020 a nivel nacional (Colombia), Elaborado por Fundación Universitaria Los Libertadores,
sede Bogotá en el año 2021. En este trabajo se analizó los desempeños de estudiantes de
psicología frente a la prueba SABER PRO a nivel nacional en relación con variables
sociodemográficas, específicamente en los puntajes de las competencias de razonamiento
cuantitativo y competencias ciudadanas. [7]
Del mismo modo se realizó un Análisis del desempeño de los estudiantes en las pruebas Saber
Pro: Un caso de estudio. Elaborado en la universidad Católica Luis Amigo (Colombia) en el año
2022, encontrado en el libro Revolución Educativa de la Nueva era vol. II. [8]
Con el mismo propósito encontramos un Análisis del desempeño de los estudiantes de
licenciatura en educación básica en las pruebas Saber Pro, elaborada por la revista de Oriental
educacional, en el año 2018. En este trabajo se analizaron las diferencias en los resultados de las
pruebas Saber Pro de los estudiantes en el año 2014 de la licenciatura en Educación Básica con
énfasis en Matemáticas, Humanidades y Lengua Castellana de modalidad a distancia con apoyo
virtual de la Facultad de Estudios a Distancia. [9]
También encontramos un sistema de información para el apoyo en la toma de decisiones, en
relación con los resultados de las pruebas saber pro, elaborado en la universidad Mariana, en el
año 2015. [10]
Teniendo en cuenta el trabajo “desempeño académico de los estudiantes de educación superior
en la prueba Saber Pro durante la pandemia del Covid-19”, elaborado en la universidad
Javeriana, en el año 2022, como tesis de grado, se tomó como referencia el trabajo ya que este
busca cuantificar la relación entre la pandemia del Covid-19 y el desempeño académico en
matemáticas de los estudiantes de educación superior, una de las variables a tratar en este
informe. [11]
Por otra parte, encontramos un trabajo relacionado al Rendimiento Académico y Resultados de
Pruebas Saber Pro en Estudiantes de Ingeniería Industrial, elaborado en la universidad Popular
del cesar en colaboración de la Universidad de Santander, en el año 2022. [12]

4
Así mismo encontramos un trabajo de los Factores que influyen en los resultados de la prueba
saber de undécimo grado presentadas en la institución educativa agrícola la Holanda durante el
periodo de 2017 a 2019, elaborado en la Universidad Nacional Abierta y a Distancia en el año
2021, en este trabajo se presentaron los factores demográficos, académicos y socioeconómicos
que intervienen en los puntajes de la prueba saber de undécimo grado por los estudiantes de la
Institución Educativa Agrícola la Holanda, ubicada en la región del Ariari. Teniendo como
fuente las bases de datos suministradas por el ICFES desde el año 2017 a 2019. [13]
De acuerdo con un análisis del valor agregado generado en las instituciones de educación
superior en relación a las pruebas saber 11 y saber pro-2010-2014, elaborado en la universidad
de Nariño en el año 2022. Este trabajo radico en la medición y análisis de los efectos generados
por la Universidad de Nariño en los estudiantes que culminaron los estudios de pregrado en el
periodo 2010-2014, especialmente en relación con las competencias genéricas evaluadas por el
Instituto Colombiano para la Evaluación de la Educación – ICFES. [14]
En consecuencia, con un proyecto de grado titulado Educación superior en Santander,
Colombia: determinantes del rendimiento académico de los estudiantes en las pruebas Saber Pro
2018, elaborado en la Universidad Santo Tomas, en el año 2021, se identificaron las variables
socioeconómicas que determinan el rendimiento académico de los estudiantes en las
Instituciones de Educación Superior de Santander (IES), Colombia en las pruebas Saber Pro
2018. [15]
De la misma manera diseño de estrategias para mejorar los resultados de las Pruebas Saber Pro
en los programas adscritos a la Facultad de Ciencias Administrativas, Económicas y Contables,
elaborado en la Institución superior UCEVA, en el año 2022, presentado como proyecto de
grado, en el cual plantea la importancia de diseñar lineamientos para mejorar los resultados de
las Pruebas Saber Pro en los programas adscritos a la Facultad de Ciencias Administrativas,
Económicas y Contables (FACAEC), de la Unidad Central del Valle del Cauca (UCEVA). [16]
Así mismo encontramos la Elaboración de una propuesta para el desarrollo de la competencia
estratégica en la presentación de la prueba de comunicación escrita del ICFES Saber Pro para
estudiantes sordos universitarios, elaborada en la universidad Pontificia Javeriana, en el año
2022. En este trabajo se identificaron las percepciones, experiencias personales y creencias
relacionadas con este examen de Estado en estudiantes que aún no han presentado la prueba,
otros que ya la aplicaron y con algunos docentes; además, se generaron una serie de encuentros
y ejercicios de escritura que permitieron evidenciar las necesidades que ellos tienen en cuanto a
las ayudas, insumos y adecuaciones que requieren. [17]
Por otra parte, se encontró un trabajo de Estrategias de aprendizaje para mejorar los resultados
de las pruebas saber pro en inglés, elaborado en la universidad La gran Colombia en el año
2018, en este trabajo se proponen estrategias de aprendizaje relacionadas con la prueba SABER
PRO para mejorar los resultados de los estudiantes del programa de licenciatura en inglés de la

5
Universidad La Gran Colombia. Debido a los resultados de los últimos años, donde solo la
mitad de los estudiantes alcanzan el nivel más alto en el módulo de inglés de esta prueba. [18]
De acuerdo con una Estrategia Pedagógica Para el Fortalecimiento de la Competencia Léxica en
Lengua Extranjera (Inglés) Mediante el uso de la App Augmented Class en Estudiantes de
Grado Séptimo, elaborada en la universidad de Santander, en el año 2021, se evalúa el efecto
que tiene implementar una estrategia pedagógica mediada por el uso de la app Augmented Class
(ACLASS), para fortalecer la competencia léxica de los estudiantes de grado séptimo basada en
la teoría de aprendizaje significativo de David Ausubel. [19]
Por último, se encontró un trabajo de grado titulado aporte de los exámenes de estado, saber pro,
al desarrollo curricular y la calidad en dos programas de psicología de Bogotá, d. C, elaborado
en la universidad católica de Colombia, en el año 2017. [20]

3. Metodología
En este trabajo analizamos los resultados obtenidos de las pruebas saber pro en el año 2021 a
611065. La metodología que implementamos fue realizar una amplia búsqueda de información
para así de esta forma tener un informe muy bien estructurado que a la hora de leer las personas
se sientan interesadas por él, gran parte de nuestra información se tomó de
https://www.datos.gov.co/Educaci-n/Resultados-nicos-Saber-Pro/u37r-hjmu, debido a que es
información oficial de la página datos abiertos y por la tanto es una base de datos reales,
analizaremos 3 variables cuantitativas y 3 cualitativas, dentro de las cuantitativas tenemos
lectura critica, inglés y competencia ciudadana, dentro de las cualitativas tenemos el tipo de
documento, método de programa y género; también usamos los programas de Statgraphics y
Rstudio, los cuales fueron de mucha ayuda, porque las gráficas fueron muy precisas y fáciles de
entender para todas aquellas personas que lean este informe estadístico y se interesen por él, ya
que a mi parecer tenemos un tema el cual es muy llamativo para las personas que lean este
informe.
También probaremos si los datos se encuentran en una normalidad determinada o no,
describiremos los intervalos de confianza el cual nos permitirá entre qué rango de valores se
encuentra el valor real inaccesible de la variable en la población, con un grado de incertidumbre
que podemos determinar.

6
4. Intervalos de confianza para los parámetros poblacionales y prueba de hipótesis

Intervalos de confianza para tipo de documento

Intervalos de confianza del 92% para la proporción de tipo de documento (CC): [0,988; 0,992]

Bajo un nivel de confianza del 92% los que tienen el tipo de documento cédula de ciudadanía
(CC) se encuentran en una proporción entre 0,988 y 0,992

Intervalos de confianza para método programa

Intervalos de confianza del 92% para la proporción de método programa presencial: [0,788;
0,782]

Bajo un nivel de confianza del 92% los que pertenecen al método programa presencial se
encuentran en una proporción entre 0,788 y 0,782

Intervalos de confianza para género

Intervalos de confianza del 92% para la proporción de género femenino: [0,589; 0,591]

Bajo un nivel de confianza del 92% los que pertenecen al género femenino se encuentran en una
proporción entre 0,589 y 0,591

Intervalos de Confianza para lectura critica

Intervalos de confianza del 95,0% para la media: 149,15 +/- 0,0778831 [149,072; 149,227]
Intervalos de confianza del 95,0% para la desviación estándar: [31,0077; 31,1178]

Bajo un nivel de confianza del 95%, la media se encuentra en un intervalo entre 149,072 y
149,227
Bajo un nivel de confianza del 95%, la desviación estándar se encuentra en un intervalo entre
31,0077 y 31,1178

Se muestra los intervalos de confianza del 95,0% para la media y la desviación estándar de
lectura critica. La interpretación clásica de estos intervalos es que, en muestreos repetidos, estos
intervalos contendrán la media verdadera ó la desviación estándar verdadera de la población de
la que fueron extraídas las muestras, el 95,0% de las veces. En términos prácticos, puede
establecerse con 95,0% de confianza, que la media verdadera de lectura critica se encuentra en
algún lugar entre 149,072 y 149,227, en tanto que la desviación estándar verdadera está en algún
lugar entre 31,0077 y 31,1178.

7
Ambos intervalos asumen que la población de la cual proviene la muestra puede representarse
por la distribución normal. Mientras que el intervalo de confianza para la media es bastante
robusto y no muy sensible a violaciones de este supuesto, los intervalos de confianza para la
desviación estándar son muy sensibles.

Prueba de Hipótesis para lectura critica

Media Muestral = 149,15


Mediana Muestral = 149,0
Desviación Estándar de la Muestra = 31,0626

Prueba t
Hipótesis Nula: media = 149,15
Alternativa: no igual

Estadístico t = -0,0110268
Valor-P = 0,991196
No se rechaza la hipótesis nula para alfa = 0,05.

Prueba de los signos


Hipótesis Nula: mediana = 149,15
Alternativa: no igual

Número de valores menores a la mediana hipotética: 309063


Número de valores mayores a la mediana hipotética: 302002

Estadístico para Grandes Muestras = 9,03152 (aplicada la corrección por continuidad)


Valor-P = 0
Se rechaza la hipótesis nula para alfa = 0,05.

Prueba de rangos con signo


Hipótesis Nula: mediana = 149,15
Alternativa: no igual

Rango medio de valores menores a la mediana hipotética: 261775,


Rango medio de valores mayores a la mediana hipotética: 307649,

Estadístico para Grandes Muestras = (aplicada la corrección por continuidad)


Valor-P = 0
Se rechaza la hipótesis nula para alfa = 0,05.

Prueba chi-cuadrada
Hipótesis Nula: sigma = 1,0
8
Alternativa: no igual

Chi-cuadrado calculado = 5,89608E8


Valor-P = 0
Se rechaza la hipótesis nula para alfa = 0,05.

Se muestra los resultados de las pruebas relativas a la población de la cual procede la muestra de
lectura critica. La prueba-t evalúa la hipótesis de que la media de lectura critica es igual a
149,15 versus la hipótesis alterna de que la media de lectura critica es no igual a 149,15. Debido
a que el valor-p para esta prueba es mayor o igual a 0,05, no se puede rechazar la hipótesis nula,
con un nivel de confianza del 95,0% de confianza. La prueba de los signos evalúa la hipótesis
de que la mediana de lectura critica es igual a 149,15 versus la hipótesis alterna de que la
mediana lectura critica es no igual a 149,15. Se basa en contar el número de valores arriba y
abajo de la mediana hipotética. Debido a que el valor-p para esta prueba es menor que 0,05, se
puede rechazar la hipótesis nula con un 95,0% de confianza. La prueba de rangos con signo
evalúa la hipótesis nula de que la mediana de lectura critica es igual a 149,15 versus la hipótesis
alterna de que la mediana lectura critica es no igual a 149,15. Se basa en comparar los rankeos
promedio de los valores arriba y abajo de la mediana hipotética. Debido a que el valor-p para
esta prueba es menor que 0,05, se puede rechazar la hipótesis nula con un 95,0% de confianza.
La prueba del signo y la del signo con rango son menos sensibles a la presencia de valores
aberrantes pero son un tanto menos potentes que la prueba-t si todos los datos provienen de la
misma distribución normal.

La prueba de chi-cuadrada evalúa la hipótesis nula de que la desviación estándar de lectura


critica es igual a 1,0 versus la hipótesis alterna de que la desviación estándar de lectura critica es
no igual a 1,0. Debido a que el valor-p para esta prueba es menor que 0,05, se puede rechazar la
hipótesis nula con un 95,0% de confianza.

Intervalos de confianza para inglés

Intervalos de confianza del 95,0% para la media: 153,212 +/- 0,0836794 [153,129; 153,296]
Intervalos de confianza del 95,0% para la desviación estándar: [33,3141; 33,4324]

Bajo un nivel de confianza del 95%, la media se encuentra en un intervalo entre 153,129 y
153,296
Bajo un nivel de confianza del 95%, la desviación estándar se encuentra en un intervalo entre
33,3141 y 33,4324

Este panel muestra los intervalos de confianza del 95,0% para la media y la desviación estándar
de inglés. La interpretación clásica de estos intervalos es que, en muestreos repetidos, estos
intervalos contendrán la media verdadera ó la desviación estándar verdadera de la población de
la que fueron extraídas las muestras, el 95,0% de las veces. En términos prácticos, puede
establecerse con 95,0% de confianza, que la media verdadera de inglés se encuentra en algún

9
lugar entre 153,129 y 153,296, en tanto que la desviación estándar verdadera está en algún lugar
entre 33,3141 y 33,4324.

Ambos intervalos asumen que la población de la cual proviene la muestra puede representarse
por la distribución normal. Mientras que el intervalo de confianza para la media es bastante
robusto y no muy sensible a violaciones de este supuesto, los intervalos de confianza para la
desviación estándar son muy sensibles.

Prueba de hipótesis para inglés

Media muestral = 153,212


Mediana muestral = 150,0
Desviación estándar de la muestra = 33,3731

Prueba t
Hipótesis nula: media = 153,212
Alternativa: no igual

Estadístico t = 0,00965891
Valor-p = 0,992288
No se rechaza la hipótesis nula para alfa = 0,05.

Prueba de los signos


Hipótesis nula: mediana = 153,212
Alternativa: no igual

Número de valores menores a la mediana hipotética: 330882


Número de valores mayores a la mediana hipotética: 280137

Estadístico para grandes muestras = 64,9168 (aplicada la corrección por continuidad)


Valor-p = 0
Se rechaza la hipótesis nula para alfa = 0,05.

Prueba de rangos con signo


Hipótesis nula: mediana = 153,212
Alternativa: no igual

Rango medio de valores menores a la mediana hipotética: 82804,4


Rango medio de valores mayores a la mediana hipotética: 323251,

Estadístico para grandes muestras = (aplicada la corrección por continuidad)


Valor-p = 0
Se rechaza la hipótesis nula para alfa = 0,05.
10
Prueba chi-cuadrada
Hipótesis nula: sigma = 1,0
Alternativa: no igual

Chi-cuadrado calculado = 6,80531e8


Valor-p = 0
Se rechaza la hipótesis nula para alfa = 0,05.

Se muestra los resultados de las pruebas relativas a la población de la cual procede la muestra de
inglés. La prueba-t evalúa la hipótesis de que la media de inglés es igual a 153,212 versus la
hipótesis alterna de que la media de inglés es no igual a 153,212. Debido a que el valor-p para
esta prueba es mayor o igual a 0,05, no se puede rechazar la hipótesis nula, con un nivel de
confianza del 95,0% de confianza. La prueba de los signos evalúa la hipótesis de que la
mediana de inglés es igual a 153,212 versus la hipótesis alterna de que la mediana inglés es no
igual a 153,212. Se basa en contar el número de valores arriba y abajo de la mediana hipotética.
Debido a que el valor-p para esta prueba es menor que 0,05, se puede rechazar la hipótesis nula
con un 95,0% de confianza. La prueba de rangos con signo evalúa la hipótesis nula de que la
mediana de inglés es igual a 153,212 versus la hipótesis alterna de que la mediana inglés es no
igual a 153,212. Se basa en comparar los rankeos promedio de los valores arriba y abajo de la
mediana hipotética. Debido a que el valor-p para esta prueba es menor que 0,05, se puede
rechazar la hipótesis nula con un 95,0% de confianza. La prueba del signo y la del signo con
rango son menos sensibles a la presencia de valores aberrantes pero son un tanto menos potentes
que la prueba-t si todos los datos provienen de la misma distribución normal.

La prueba de chi-cuadrada evalúa la hipótesis nula de que la desviación estándar de inglés es


igual a 1,0 versus la hipótesis alterna de que la desviación estándar de inglés es no igual a 1,0.
Debido a que el valor-p para esta prueba es menor que 0,05, se puede rechazar la hipótesis nula
con un 95,0% de confianza.

Intervalos de confianza para competencia ciudadana

Intervalos de confianza del 95,0% para la media: 145,11 +/- 0,0846231 [145,025; 145,195]
Intervalos de confianza del 95,0% para la desviación estándar: [33,691; 33,8107]

Bajo un nivel de confianza del 95%, la media se encuentra en un intervalo entre 145,025 y
145,195
Bajo un nivel de confianza del 95%, la desviación estándar se encuentra en un intervalo entre
33,691 y 33,8107

11
Este panel muestra los intervalos de confianza del 95,0% para la media y la desviación estándar
de competencia ciudadana. La interpretación clásica de estos intervalos es que, en muestreos
repetidos, estos intervalos contendrán la media verdadera ó la desviación estándar verdadera de
la población de la que fueron extraídas las muestras, el 95,0% de las veces. En términos
prácticos, puede establecerse con 95,0% de confianza, que la media verdadera de competencia
ciudadana se encuentra en algún lugar entre 145,025 y 145,195, en tanto que la desviación
estándar verdadera está en algún lugar entre 33,691 y 33,8107.

Ambos intervalos asumen que la población de la cual proviene la muestra puede representarse
por la distribución normal. Mientras que el intervalo de confianza para la media es bastante
robusto y no muy sensible a violaciones de este supuesto, los intervalos de confianza para la
desviación estándar son muy sensibles.

Prueba de hipótesis para competencia ciudadana

Media muestral = 145,11


Mediana muestral = 146,0
Desviación estándar de la muestra = 33,7508

Prueba t
Hipótesis nula: media = 145,11
Alternativa: no igual

Estadístico t = 0,000221732
Valor-p = 0,999817
No se rechaza la hipótesis nula para alfa = 0,05.

Prueba de los signos


Hipótesis nula: mediana = 145,11
Alternativa: no igual

Número de valores menores a la mediana hipotética: 299150


Número de valores mayores a la mediana hipotética: 311915

Estadístico para grandes muestras = 16,3284 (aplicada la corrección por continuidad)


Valor-p = 0
Se rechaza la hipótesis nula para alfa = 0,05.

Prueba de rangos con signo


Hipótesis nula: mediana = 145,11
Alternativa: no igual

Rango medio de valores menores a la mediana hipotética: 309755,


12
Rango medio de valores mayores a la mediana hipotética: 301484,

Estadístico para grandes muestras = (aplicada la corrección por continuidad)


Valor-p = 0
Se rechaza la hipótesis nula para alfa = 0,05.

Prueba chi-cuadrada
Hipótesis nula: sigma = 1,0
Alternativa: no igual

Chi-cuadrado calculado = 6,96072e8


Valor-p = 0
Se rechaza la hipótesis nula para alfa = 0,05.

Se muestra los resultados de las pruebas relativas a la población de la cual procede la muestra de
competencia ciudadana. La prueba-t evalúa la hipótesis de que la media de competencia
ciudadana es igual a 145,11 versus la hipótesis alterna de que la media de competencia
ciudadana es no igual a 145,11. Debido a que el valor-p para esta prueba es mayor o igual a
0,05, no se puede rechazar la hipótesis nula, con un nivel de confianza del 95,0% de confianza.
La prueba de los signos evalúa la hipótesis de que la mediana de competencia ciudadana es igual
a 145,11 versus la hipótesis alterna de que la mediana competencia ciudadana es no igual a
145,11. Se basa en contar el número de valores arriba y abajo de la mediana hipotética. Debido
a que el valor-p para esta prueba es menor que 0,05, se puede rechazar la hipótesis nula con un
95,0% de confianza. La prueba de rangos con signo evalúa la hipótesis nula de que la mediana
de competencia ciudadana es igual a 145,11 versus la hipótesis alterna de que la mediana
competencia ciudadana es no igual a 145,11. Se basa en comparar los rankeos promedio de los
valores arriba y abajo de la mediana hipotética. Debido a que el valor-p para esta prueba es
menor que 0,05, se puede rechazar la hipótesis nula con un 95,0% de confianza. La prueba del
signo y la del signo con rango son menos sensibles a la presencia de valores aberrantes pero son
un tanto menos potentes que la prueba-t si todos los datos provienen de la misma distribución
normal.

La prueba de chi-cuadrada evalúa la hipótesis nula de que la desviación estándar de competencia


ciudadana es igual a 1,0 versus la hipótesis alterna de que la desviación estándar de competencia
ciudadana es no igual a 1,0. Debido a que el valor-p para esta prueba es menor que 0,05, se
puede rechazar la hipótesis nula con un 95,0% de confianza.

13
5. Análisis y resultados
Se clasificarán los datos por: las variables, la descripción, su tipo y la categoría a la cual
pertenece cada una de ellas.

Variable Descripción Tipo Categorías


Tipo de Documento Cualitativa CC= cédula de ciudadanía
documento utilizado
CR= registro civil
CE= cédula extranjería
PC= pasaporte colombiano
PE= permiso especial de
permanencia
TI= tarjeta de identidad
PEP= persona expuesta
políticamente

Método De que modalidad Cualitativa D= distancia


programa hacen parte
Dv= distancia virtual
P= presencial

Género Sexo al que hacen Cualitativa M= Masculino


parte
F= Femenino
Lectura critica Puntaje obtenido en Cuantitativa 0 – 300
el módulo de
lectura critica
Ingles Puntaje obtenido en Cuantitativa 0 – 300
el módulo de ingles

Competencia Puntaje obtenido en Cuantitativa 0 – 300


ciudadana el módulo de
competencia
ciudadana
Tabla 1. Descripción de las variables de estudio

14
Análisis de datos:
Variables cualitativas:
Como se evidencia en la Tabla 1, la investigación maneja 3 variables de tipo cualitativo. A
continuación, se muestran las tablas, gráficas y análisis de estas variables.

Tipo de documento
Tipo documento fa fr Fa Fr

CC 608410 1 608410 1
CR 266 0,00 608676 1

CE 937 0,00 609613 1

PC 66 0,00 609679 1

PE 172 0,00 609851 1

TI 1210 0,00 611061 1

PEP 4 0,00 611061 1

Total 611065 1

Tabla 2. Tabla de frecuencia para tipo de documento

15
Diagrama de Barras de TIPO DOCUMENTO

CC

CE

CR

PC

PE

PEP

TI 0 2 4 6 8
(X 100000,)
frecuencia

Gráfico 1. Diagrama de barras de tipo documento

Diagrama de Sectores de TIPO DOCUMENTO


TIPO DOCUMENTO
CC

0,10254
1
030% CE
CR
PC
PE
PEP
TI

Gráfico 2. Diagrama de sectores de tipo documento

16

99,57%
En esta variable analizamos diferentes tipos de documentos dentro de ellos tenemos cédula de
ciudadanía, registro civil, cédula de extranjería, pasaporte colombiano, permiso especial de
permanencia, tarjeta de identidad y persona expuesta políticamente; podemos concluir que el
documento más utilizado para realizar las pruebas saber pro fue la cedula de ciudadanía con un
fa (frecuencia absoluta) de 608410 y una fr (frecuencia relativa) de 1.

Método programa

Método fa fr Fa Fr
programa

Distancia 98519 0,16 98519 0,08


Distancia 35621 0,06 134140 0,27
virtual

Presencial 476925 0,78 611065 1

Total 611065 1

Tabla 3. Tabla de frecuencia para método de programa

17
Diagrama de Barras de MÉTODO PROGRAMA

DISTANCIA

DISTANCIA VITUAL

PRESENCIAL

0 1 2 3 4 5
(X 100000,)
frecuencia

Gráfico 3. Diagrama de barras de método programa

Diagrama de Sectores de MÉTODO PROGRAMA

16,12% MÉTODO PROGRAMA


DISTANCIA
DISTANCIA VITUAL
PRESENCIAL
5,83%

78,05%

Gráfico 4. Diagrama de sectores de método programa

18
En esta variable analizamos diferentes métodos de programa dentro de ellos tenemos distancia
(D), distancia virtual (DV), presencial (P); podemos concluir que el método de programa al que
más pertenecían los estudiantes que realizaron las pruebas saber pro fue el presencial con un
total de 78,05% y al que menos pertenecían era a el de la distancia virtual con un 5,83%

Género

Género fa fr Fa Fr

M 241696 0,39 241696 0,39


F 361696 0,59 611065 1

Total 611065 1

Tabla 4. Tabla de frecuencia para género

Diagrama de Barras de GÉNERO

0 1 2 3 4
(X 100000,)
frecuencia

Gráfico 5. Diagrama de barras de género

19
Diagrama de Sectores de GÉNERO

GÉNERO
F
M

40,80%

59,20%

Gráfico 6. Diagrama de sectores de género

20
En esta variable analizamos los géneros dentro de ellos tenemos masculino y
femenino, podemos concluir que la mayoría de los estudiantes que presentaron esta
prueba fueron femeninos con un porcentaje de 59,20% y los masculinos de 40,80%

Variables cuantitativas:

Lectura critica:

Intervalo fa fr Fa Fr

0 – 30 578 0,00 578 0,00


30 - 60 73 0,00 651 0,00

60 – 90 13330 0,02 13981 0,02

90 – 120 101725 0,17 115706 0,19

120 – 150 200472 0,33 316178 0,52

150 – 180 193050 0,32 509228 0,83

180 - 210 90000 0,15 599228 0,98

210 – 240 11562 0,02 610790 1

240 – 270 0 0,00 610790 1

270 - 300 275 0,00 611065 1

Total 611065 1

Tabla 5. Tabla de frecuencia para lectura critica

21
Gráfico 7. Histograma de lectura critica

Gráfico 8. Gráfico de comparación de cuantiles de lectura critica

22
Gráfico 9. Gráfico de caja y bigotes de lectura critica

La distribución es normal porque las barras se distribuyen de forma simétrica respecto al


valor medio. Además, el perfil de las barras se adapta a la curva normal. Los datos siguen
una distribución normal, se alinean cerca de la diagonal del gráfico. Cuanto más se alejen,
menos probable será que nuestros datos sigan una distribución normal. Es una distribución
normal, pues tiene una caja simétrica alrededor de la media, con ambos segmentos del
recorrido intercuartílico de longitud similar. La asimetría es normal si da 0, si da un número
positivo no es normal y tiene un sesgo hacia la derecha y si es negativo no es normal y tiene
sesgo hacia la izquierda. La curtosis es normal cuando da 3, si es positiva indica que los
datos muestran más valores atípico extremos que una distribución normal. La curtosis
negativa indica que los datos presentan valores atípicos menos extremados que una
distribución normal.

23
Media 149,15
Mediana 149

Moda 146

Mínimo 0

Máximo 300

Rango 300

Varianza 964,89

Desviación estándar 31,06

Coeficiente de variación 20,83%

Sesgo 33,37

Curtosis 0,10

Cuartil inferir 127

Cuartil superior 171

Tabla 6. Resumen estadístico de lectura critica

En esta variable tenemos una media de 149,15, una mediana de 149, moda de 146,
un número mínimo de 0 y un máximo de 300, un rango de 300, una varianza de
964,89, una desviación estándar 31,06, un coeficiente de variación de 20,83%, un
sesgo de 33,37, una curtosis de 0,10, un cuartil inferior de 127 y uno superior de
171.
Los datos presentados describen una distribución sesgada hacia la derecha, ya que
la media (149,15) es mayor que la mediana (149) y la moda (146), y el coeficiente
de asimetría es positivo (33,37). La curtosis de 0,10 indica que la distribución es
relativamente plana (mesocúrtica) en comparación con una distribución normal.
El rango de 300 indica una gran variabilidad en los datos, pero la desviación
estándar relativamente baja (31,06) y el coeficiente de variación (20,83%) sugieren
que esta variabilidad es relativamente baja en relación con la media.
El cuartil inferior de 127 y el superior de 171 indican que el 50% de los datos se
encuentra en ese rango.

24
En general, estos datos indican que la distribución está sesgada hacia la derecha,
con una alta variabilidad, pero relativamente baja en relación con la media, y una
distribución relativamente plana.

Inglés:

Intervalo fa fr Fa Fr

0 – 30 3225 0,01 3225 0,01


30 - 60 0 0,00 3225 0,01

60 – 90 4285 0,01 7510 0,02

90 – 120 72573 0,12 80083 0,14

120 – 150 228589 0,37 308672 0,51

150 – 180 176819 0,29 485491 0,80

180 - 210 100703 0,16 586194 0,96

210 – 240 21945 0,04 608139 1

240 – 270 0 0,00 608139 1

270 - 300 2926 0,00 611065 1

Total 611065 1

Tabla 7. Tabla de frecuencia para inglés

25
Gráfico 10. Histograma de inglés

Gráfico 11. Gráfico de comparación de cuantiles de inglés

26
Gráfico 12. Gráfico de caja y bigotes de inglés

La distribución es normal porque las barras se distribuyen de forma simétrica respecto al


valor medio. Además, el perfil de las barras se adapta a la curva normal. Los datos siguen
una distribución normal, se alinean cerca de la diagonal del gráfico. Cuanto más se alejen,
menos probable será que nuestros datos sigan una distribución normal. Es una distribución
normal, pues tiene una caja simétrica alrededor de la media, con ambos segmentos del
recorrido intercuartílico de longitud similar. La asimetría es normal si da 0, si da un número
positivo no es normal y tiene un sesgo hacia la derecha y si es negativo no es normal y tiene
sesgo hacia la izquierda. La curtosis es normal cuando da 3, si es positiva indica que los
datos muestran más valores atípico extremos que una distribución normal. La curtosis
negativa indica que los datos presentan valores atípicos menos extremados que una
distribución normal.

27
Media 153,212
Mediana 150

Moda 142

Mínimo 0

Máximo 300

Rango 300

Desviación estándar 33,3731

Coeficiente de variación 21,7823%

Sesgo -106,76

Curtosis 2,71

Cuartil inferir 131

Cuartil superior 174

Tabla 8. Resumen estadístico de inglés

Esta variable tenemos una media de 153,212, mediana de 150, moda de 142, el número
mínimo es de 0 y el número máximo es de 300, rango de 300, una desviación estándar de
33,3731, coeficiente de variación de 21,7823%, un sesgo de -106,76, una curtosis de 2,71,
un cuartil inferior 131 y un cuartil superior de 174
Los datos presentados describen una distribución sesgada hacia la izquierda, ya que la
media (153,212) es mayor que la mediana (150) y la moda (142), y el coeficiente de
asimetría es negativo (-106,76). La curtosis de 2,71 indica que la distribución es bastante
puntiaguda y presenta colas pesadas en comparación con una distribución normal.
El rango de 300 indica una gran variabilidad en los datos, y la desviación estándar
relativamente alta (33,3731) y el coeficiente de variación (21,7823%) sugieren que esta
variabilidad es alta en relación con la media.
El cuartil inferior de 131 y el superior de 174 indican que el 50% de los datos se encuentra
en ese rango.

28
En general, estos datos indican que la distribución está sesgada hacia la izquierda, con una
alta variabilidad en relación con la media, y una distribución bastante puntiaguda con colas
pesadas.

Competencia ciudadana:

Intervalo fa fr Fa Fr

0 – 30 1308 0,00 1308 0,00


30 - 60 121 0,00 1429 0,00

60 – 90 31663 0,05 33092 0,05

90 – 120 116142 0,19 149234 0,24

120 – 150 183849 0,30 333083 0,54

150 – 180 185816 0,30 518899 0,85

180 - 210 82005 0,13 600904 0,98

210 – 240 9598 0,02 610502 1

0,02240 – 270 0 0,00 610502 1

270 - 300 563 0,00 611065 1

Total

Tabla 9. Tabla de frecuencia para competencia ciudadana

29
Gráfico 13. Histograma de competencia ciudadana

Gráfico 14. Gráfico de comparación de cuantiles de competencia ciudadana

30
Gráfico 15. Gráfico de caja y bigotes de competencia ciudadana

La distribución es normal porque las barras se distribuyen de forma simétrica respecto al


valor medio. Además, el perfil de las barras se adapta a la curva normal. Los datos siguen
una distribución normal, se alinean cerca de la diagonal del gráfico. Cuanto más se alejen,
menos probable será que nuestros datos sigan una distribución normal. Es una distribución
normal, pues tiene una caja simétrica alrededor de la media, con ambos segmentos del
recorrido intercuartílico de longitud similar. La asimetría es normal si da 0, si da un número
positivo no es normal y tiene un sesgo hacia la derecha y si es negativo no es normal y tiene
sesgo hacia la izquierda. La curtosis es normal cuando da 3, si es positiva indica que los
datos muestran más valores atípico extremos que una distribución normal. La curtosis
negativa indica que los datos presentan valores atípicos menos extremados que una
distribución normal.

31
Media 145,11

Mediana 146

Moda 157

Mínimo 0

Máximo 300

Rango 300

Varianza 1139,11

Desviación estándar 33,75

Coeficiente de variación 23,26

Sesgo 194,09

Curtosis 0,29

Cuartil inferir 121

Cuartil superior 169

Tabla 10. Resumen estadístico de competencia ciudadana

En esta variable tenemos una media de 145,11, una mediana de 146, una moda de 157, el
número mínimo es de 0 y el máximo es de 300, un rango de 300, varianza de 1139,11, una
desviación estándar de 33,75, un coeficiente de variación de 23,26%, sesgo de 194,09, una
curtosis de 0,29, un cuartil inferior de 121 y uno superior de 169
Los datos presentados describen una distribución sesgada hacia la izquierda, ya que la
media (145,11) es menor que la mediana (146) y la moda (157), y el coeficiente de
asimetría es negativo (-194,09). La curtosis de 0,29 indica que la distribución es
relativamente plana (mesocúrtica) en comparación con una distribución normal.
El rango de 300 indica una gran variabilidad en los datos, pero la desviación estándar
relativamente alta (33,75) y el coeficiente de variación (23,26%) sugieren que esta
variabilidad es alta en relación con la media.

32
El cuartil inferior de 121 y el superior de 169 indican que el 50% de los datos se encuentra
en ese rango.
En general, estos datos indican que la distribución está sesgada hacia la izquierda, con una
alta variabilidad en relación con la media, y una distribución relativamente plana.

Conclusiones: El tipo de documento más utilizado para realizar la prueba Saber Pro es la
cédula de ciudadanía, con una frecuencia de 608.410 y una frecuencia relativa de 1. La
mayoría de los estudiantes que realizaron la prueba Saber Pro fueron mujeres, con un
porcentaje del 59,20%, mientras que los hombres representaron el 40,80%. La modalidad
de programa más común entre los alumnos que realizaron la prueba Saber Pro fue la
presencial, con un total de 78,05%, mientras que la modalidad virtual a distancia fue la
menos representada con un 5,83%. La distribución de los datos para la prueba de inglés está
sesgada hacia la izquierda, con una alta variabilidad en relación con la media y una
distribución bastante puntiaguda con colas gruesas. La puntuación media es 153,212, la
puntuación mediana es 150 y la moda es 142. La puntuación mínima es 0 y la máxima es
300. El rango es 300 y la desviación estándar es 33,3731, mientras que el coeficiente de
variación es 21,7823%. La distribución de los datos para la prueba de competencia
ciudadana está sesgada hacia la izquierda, con una alta variabilidad en relación con la
media y una distribución relativamente plana. La puntuación media es 145,11, la
puntuación mediana es 146 y la moda es 157. La puntuación mínima es 0 y la máxima es
300. El rango es 300 y la desviación estándar es 33,75, mientras que el coeficiente de
variación es 23,26 %. La distribución de los datos para la prueba de lectura crítica está
sesgada a la derecha, con una alta variabilidad en relación con la media y una distribución
relativamente plana. La puntuación media es 149,15, la puntuación mediana es 149 y la
moda es 146. La puntuación mínima es 0 y la máxima es 300. El rango es 300 y la
desviación estándar es 31,06, mientras que el coeficiente de variación es 20,83 %.

Anexos
Base de datos utilizada para el desarrollo de la investigación:

https://www.datos.gov.co/Educaci-n/Resultados-nicos-Saber-Pro/u37r-hjmu

33
Referencias
[1] Monsalve F, J. A. y Ojeda A, A. C. (2022). Propuesta para el mejoramiento de la
comunicación escrita en las pruebas saber Pro, en la Universidad Industrial de Santander
(UIS). Plumilla Educativa, 30 (2), 99-126. DOI: 10.30554/pe.2.4704.2022.
[2] Acautt-Díaz, S, Carreño-González, D y Rey-Cárdenas, L. (2021). Análisis de
Desempeño de Competencias en Pruebas Saber Pro Y Saber 11 de los Estudiantes de
Enfermería de 10 Semestre de la Universidad de Santander Campus Bucaramanga Durante
el año 2020- B. Universidad de Santander.
[3] Vasquez Alvarez, D. (2022). Análisis del desempeño en inglés de las ingenierías en el
eje cafetero a partir de resultados históricos en las pruebas Saber Pro en el marco de la
virtualidad.
[4] Soto Acevedo, Misorly del Carmen (2021). Pronóstico del resultado en las pruebas
Saber Pro a partir de variables socioeconómicas, del puntaje de las pruebas Saber 11.
https://hdl.handle.net/20.500.12585/11821
[5] Recalde Morillo, D. E. (2021). Estrategia para el fortalecimiento de las competencias
ciudadanas de los estudiantes de Ingeniería en Colombia. Propuesta a partir de la revisión
de las Pruebas Saber Pro en tres universidades privadas con vecindad de comparación.
https://ciencia.lasalle.edu.co/doct_educacion_sociedad/49
[6] Ramírez del Río, D., & Guerrero Erazo, J. . (2022). Índice de desempeño relativo
pruebas Saber 11 – Saber Pro. Encuentro Internacional De Educación En Ingeniería.
https://doi.org/10.26507/paper.2197
[7] Arias, L. A. (2021). Análisis de los desempeños de estudiantes de psicología frente a las
competencias de razonamiento cuantitativo y competencias ciudadanas de la prueba
SABER PRO durante el año 2020 a nivel nacional. Recuperado de:
http://hdl.handle.net/11371/4289.
[8] Serna M., Edgar. (2022). Revolución Educativa en la Nueva Era Vol. II.
[9] José Eriberto Cifuentes Medina, José Antonio Chacón Benavides, Luis Ángel Fonseca
Correa. (2019). Análisis del desempeño de los estudiantes de licenciatura en educación
básica en las pruebas Saber Pro. Revista De Orientación Educacional, 32(62), pp. 21-46.
Recuperado a partir de http://200.14.213.175/roe/index.php/roe/article/view/9
[10] Umariana. (2015). Sistema de información para el apoyo en la toma de decisiones, en
relación con los resultados de las pruebas saber pro en la universidad mariana año 2015.
[11] Galindo, P. A. (2022). Desempeño académico de los estudiantes de educación superior
en la prueba Saber Pro durante la pandemia del Covid-19. Recuperado de:
http://hdl.handle.net/10554/62110.
34
[12] Gordon-Hernández, Yimy, Valle-Fuentes, Harold, Vidal-Tovar, Carlos, Maestre-
Pérez, Jehisa, & Rodríguez-Cujia, Jholiannis Yulieth. (2022). Academic Performance and
Saber Pro Test Results in Industrial Engineering Students. Ingeniería Industrial, 43(3), 67-
89. Epub 11 de noviembre de 2022. Recuperado en 28 de marzo de 2023, de
http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S1815-
59362022000300067&lng=es&tlng=en.
[13] Universidad Nacional Abierta y a Distancia. Factores que influyen en los resultados de
la prueba saber de undécimo grado presentadas en la institución educativa agrícola la
Holanda durante el periodo de 2017 a 2019 - 10596/40225 (unad.edu.co)
[14] Burgos Flórez, Marco Antonio (2022) Un análisis del valor agregado generado en las
instituciones de educación superior en relación a las pruebas saber 11 y saber pro 2010-
2014. Editorial Universidad de Nariño, Pasto, Nariño. ISBN 978-628-7509-43-6
[15] Álvarez Lozano, M. C., Plata, Arenas, L. D., Vargas Villamizar, A. J., & Fajardo
Ortiz, E. J. (Julio-diciembre de 2019). Educación superior en Santander, Colombia:
determinantes del rendimiento académico de los estudiantes en las pruebas Saber Pro 2018.
Revista Gestión y Desarrollo Libre, 4(8)
[16] Diseño de estrategias para mejorar los resultados de las Pruebas Saber Pro en los
programas adscritos a la Facultad de Ciencias Administrativas, Económicas y Contables
(FACAEC) (uceva.edu.co)
[17] Lozano, J. C. (2022). Elaboración de una propuesta para el desarrollo de la
competencia estratégica en la presentación de la prueba de comunicación escrita del ICFES
Saber Pro para estudiantes sordos universitarios. Recuperado de:
http://hdl.handle.net/10554/58918.
[18] Rojas, A. d. (2018). Estrategias de aprendizaje para mejorar los resultados de las
pruebas SABER PRO en inglés [Universidad La Gran Colombia]. Recuperado de:
http://hdl.handle.net/11396/4700
[19] Roa - Soler , D. (2021). Estrategia Pedagógica Para el Fortalecimiento de la
Competencia Léxica en Lengua Extranjera (inglés) Mediante el uso de la App Augmented
Class en Estudiantes de Grado Séptimo. Universidad de Santander .
[20] 95047014.pdf (core.ac.uk)

35

Powered by TCPDF (www.tcpdf.org)

También podría gustarte