Está en la página 1de 18

1

Paso 3 Análisis de información

Frank Stivar Escudero Aristizábal

Código: 1088241284

100105- Estadística Descriptiva

Grupo - 35

Tutor:

July Alexandra Hernández

Universidad Nacional Abierta y a Distancia – UNAD

Escuela de ciencias básicas tecnológicas e ingeniería - ECBTI

Ingeniería Electrónica

Dosquebradas

2023
2

Introducción

El desarrollo de esta tarea está enfocada a la aplicación de las medidas estadísticas por medio del

cálculo y la interpretación de datos del software infostat, donde podemos reconocer conceptos

básicos y temas relacionados con la estadística descriptiva.

También realizaremos un mapa mental donde abordaremos las diferentes medidas

univariantes, mediante un archivo anexo base de datos resultados prueba saber 11 del periodo

2020-2 y haciendo uso de herramientas informáticas como Excel o el programa infostat hallamos

los resultados solicitados en la rúbrica de evaluación y mediante tablas de frecuencia, gráficos y

medidas de muestra tendremos una mejor comprensión de los datos obtenidos.


3

Justificación

En el desarrollo de esta tarea buscamos adquirir conocimientos que nos ayuden a entender de una

forma mas precisa sobre la aplicación que tiene la estadística descriptiva en la solución de

interrogantes o simplemente en nuestro diario vivir, tanto en la manipulación de los datos como

en la creación de informes donde se puede plasmar dicha información de forma gráfica, en

porcentajes, tablas u otras formas escritas y de fácil entendimiento.

Para realizar lo anteriormente descrito hacemos uso de la base de datos resultados prueba

saber 11 del 2020-2, donde se hace referencia al sexo, municipio de residencia, puntaje en las

diferentes asignaturas calificadas, ubicación geográfica y características del entorno familiar del

participante de la prueba, con estos datos y el programa infostat realizamos tablas, gráficos y

diagramas que nos facilitaran entender la información plasmada en el anexo.


4

Objetivo

Objetivo General

Aplicar y desarrollar las diferentes medidas univariantes que intervienen en la realización y

análisis de la base de datos, mediante el software infostat.

Objetivos específicos

 Diferenciar las variables propuestas en la base de datos prueba saber 11 del 2020-2, saber
cuales son cuantitativas discretas y continuas.

 Determinar cuales son los datos con los que se va a desarrollar la actividad solicitada
realizando tablas de frecuencia, graficar e interpretando sus resultados.

 Consultar el material de estudio y participar en los cipas para un correcto desarrollo de la


actividad.
5

Actividades

Actividad 1. Mapa mental

Figura 1

Mapa mental medida univariante de tendencia central.


6

Actividad 2. Medidas univariantes - variable discreta

Problemática de estudio

Resultados y datos personales de estudiantes del grado 11 para las pruebas SABER

durante el periodo 2020-2, de forma virtual por el confinamiento de la pandemia de COVID-19.

Tabla 1

Tabla de frecuencias datos no agrupados, variable desempeño de ciencias naturales.

Interpretación: el resultado que nos arroja la tabla de frecuencias es de 8 clases de desempeños,

donde los datos de la primera clase nos dice que tenemos 115 resultados de personas que

presentaron la prueba saber 11 donde tenemos un rango de 1.19 siendo el 30% del total de

personas que presentaron la prueba saber, en la última clase ósea la octava, tenemos solo 7

resultados de las personas que presentaron la prueba saber 11 con un rango de 3.81 siendo estas 7

personas el 2% del total de las personas que presentaron la prueba.


7

Figura 2

Diagrama de barras y líneas para la variable desempeño ciencias naturales.


8

Interpretación: con los resultados que nos muestran estos diagramas podemos decir que de las

380 personas que presentaron la prueba saber 11, 196 personas obtuvieron 2 en desempeño de

ciencias naturales y que solo 7 personas obtuvieron 4 en desempeño de ciencias naturales.

Tabla 2

Medidas de tendencia central para la variable desempeño ciencias naturales

Medida Valor Interpretación

La mayoría de los participantes de la prueba saber 11del periodo


Media 1.89 2020-2 obtuvieron un desempeño de ciencias naturales promedio
de 2.

La mitad de los participantes de la prueba saber 11del periodo


2020-2 obtuvieron un desempeño de ciencias naturales menor a 2
Mediana 2 y la otra mitad obtuvo un desempeño en ciencias naturales mayor
a 2.

El desempeño en ciencias naturales mas frecuente en los


Moda 2
participantes de la prueba saber 11 del 2020-2 fue de 2.

Fuente. Autor
9

Tabla 3

Medidas de posición para la variable desempeño ciencias naturales

Medida Valor Interpretación

Con el resultado obtenido podemos decir que el 25% de los


Q1 1 participantes de la prueba saber 11 del 2020-2 tuvieron un
desempeño en ciencias naturales de 1.

Con el resultado obtenido podemos decir que el 50% de los


participantes de la prueba saber 11 del 2020-2 tuvieron un
Q2 2
desempeño en ciencias naturales de 2.

Con el resultado obtenido podemos decir que el 75% de los


participantes de la prueba saber 11 del 2020-2 tuvieron un
Q3 2
desempeño en ciencias naturales de 2.

Fuente. Autor

Tabla 4

Medidas de dispersión para la variable desempeño ciencias naturales

Medida Valor Interpretación

Este valor hace referencia a la diferencia que hay entre el valor


Rango 3
máximo y el valor mínimo.

Varianza 0.52
Los desempeños de ciencias naturales tienen una variación
10

promedio de 0.52 con respecto a la media que es de 2

Desviación Los desempeños de ciencias naturales tienen una variación


0.72
estándar promedio de 0.72 con respecto a la media que es de 2

Coeficiente
38.26 Este resultado nos indica que hay una variabilidad relativa de
de variación
38.26% con respecto a su media.

Fuente. Autor

Tabla 5

Medidas de asimetría y apuntamiento para la variable desempeño de ciencias naturales

Medida Valor Interpretación

Este resultado nos indica que la distribución del desempeño de


ciencias naturales esta mas concentrada en los valores medios
Asimetría 0.46
haciendo que la distribución se extienda un poco a la derecha con
un valor más bajo.

Este valor nos indica que la distribución del desempeño de


ciencias naturales es un poco dispersa tratando de concentrarse al
Curtosis -0.09
medio de lo que sería una dispersión normal, lo que nos indica
que es curtosis mesocúrtica.
Fuente. Autor

Actividad 3. Medidas univariantes - variable continua


11

Rango

R=valor maximo −valor minimo

R=100−1=99

Rango = 99

Numero de intervalos

K=1+ 3 ,22∗log ⁡(n)

K=1+ 3,22∗log ⁡(380)

K=1+ 3 ,22 ∙2.57

K=9 ,2 8 ≈ 9

Intervalos = 9

Amplitud

Rango
Amplitud=
intervalos

99
Amplitud= =11
9

Amplitud = 11
12

Tabla 6

Tabla de frecuencias datos agrupados, variable percentil ciencias sociales

Interpretación: el resultado que nos arroja la tabla de frecuencias es de 9 clases de percentil de

ciencias sociales, donde los resultados de la prueba saber 11 del 2020-2 nos dice que tenemos 22

estudiantes que obtuvieron un percentil de ciencias sociales entre 67 y 72, siendo este el 6% de

los estudiantes que presentaron la prueba, también tenemos 51 estudiantes obtuvieron un

percentil de ciencias sociales entre 1 y 12, siendo este el 13% de los estudiantes que presentaron

la prueba.

Figura 3
13

Histograma y polígono para la variable percentil ciencias sociales

Interpretación: de acuerdo con la figura número 3 se puede apreciar que tenemos una misma

frecuencia absoluta que es de 48 para dos percentiles en ciencias sociales como lo son los valores

de 40 y 51, donde podemos ubicar a los estudiantes con resultados medios en la prueba saber 11.

Tabla 7
14

Medidas de tendencia central para la variable percentil ciencias sociales

Medida Valor Interpretación

Para los intervalos en punto medio podemos decir que, los


estudiantes de la prueba saber 11del periodo 2020-2 obtuvieron
Media 45.08
un percentil de ciencias naturales sociales en promedio de 45.

Este valor nos indica que, la mitad de los estudiantes de la prueba


saber 11del periodo 2020-2 obtuvieron un percentil de ciencias
Mediana 41.50 naturales sociales menor de 41 y la otra mitad obtuvieron un
percentil de ciencias naturales sociales mayor de 41.

Por medio de la fórmula para calcular la moda y usando el límite


inicial de la clase con la frecuencia absoluta más alta, la
frecuencia absoluta por encima y por debajo de la frecuencia
Moda 29.54
absoluta de mayor valor se determina la moda para el percentil de
ciencias sociales con 29.54

Fuente. Autor

Proceso matemático para obtener la moda

M o=Li +¿

Li=23 ; f i=63 ; f i−1=41 ; f i+1=48 ; A=11

M o=23+
( (63−41)+(
63−41
63−48) )
∗11

M o=29.54

La moda percentil de ciencias sociales es de 29.54


15

Tabla 8

Medidas de posición para la variable percentil de ciencias sociales

Medida Valor Interpretación

Con el resultado obtenido podemos decir que el 25% de los


Q1 24 participantes de la prueba saber 11 del 2020-2 obtuvieron un
percentil en ciencias sociales menor o igual a 24.

Con el resultado obtenido podemos decir que el 50% de los


participantes de la prueba saber 11 del 2020-2 obtuvieron un
Q2 41
percentil en ciencias sociales menor a 41 y superior a 24.

Con el resultado obtenido podemos decir que el 75% de los


participantes de la prueba saber 11 del 2020-2 obtuvieron un
Q3 66 percentil en ciencias sociales menor a 66 y mayor a 41, donde el
25% restante obtuvieron un percentil mayor a 66.

Fuente. Autor

Tabla 9

Medidas de dispersión para la variable percentil ciencias sociales

Medida Valor Interpretación

Rango 99
16

El rango de la variable percentil ciencias sociales en la Base de


datos de la prueba Icfes Saber 11 del periodo 2020-2 es de 99,
con un límite inferior de 1 un límite superior de 100.

Como los datos están alejados en promedio 766.70 puntos de la


media y como la media es de 45.08, esta medida de dispersión
Varianza 766.70 nos muestra que los datos presentan una gran variabilidad en
torno a la media en cuanto a su puntaje en el percentil de ciencias
sociales.

En cuanto a los puntajes individuales se evidencia un desvió


promedio de 27.73 puntos de la media 45.08, con estos datos
Desviación podemos afirmar que hay una amplia variabilidad en los puntajes
27.73
estándar percentiles de ciencias sociales en la base de datos de la prueba
icfes Saber 11 2020-2.

Este dato nos indica que la dispersión de los datos es alta con un
Coeficiente
61.51 61.51% con respecto a la media de los datos de la prueba Icfes
de variación
Saber 11 2020-2, en el puntaje percentil de ciencias sociales.

Fuente. Autor

Tabla 10

Medidas de asimetría y apuntamiento para la variable percentil ciencias sociales

Medida Valor Interpretación


17

Este resultado nos indica que la distribución del percentil de


Asimetría 0.27 ciencias sociales es demasiado dispersa en la gráfica, donde los
valores distribuidos en toda la gráfica la hacen parecer simétrica.

Como el valor de curtosis es menor a 0 cuenta con un grado de


achatamiento significativo con respecto a lo normal,
Curtosis -0.98
denominando esta como una curtosis platicúrtica.

Fuente. Autor

Análisis e interpretación de la información

De acuerdo con la variable desempeño ciencias naturales en los resultados obtenidos por los 380

estudiantes tenemos una particularidad, donde la media, la mediana y la moda comparten el

mismo valor el cual es 2 y donde el 75% de los estudiantes que presentaron la prueba obtuvieron

un desempeño de 2, esto nos demuestra que solo al 25% de los estudiantes les fue bien

obteniendo un desempeño por encima de 2.

En cuanto a la variable percentil ciencias sociales podemos concluir que la media, la mediana

tuvieron valores muy similares y la moda tuvo un valor muy por debajo en comparación a la

media y la mediana, otro dato muy interesante de la variable percentil ciencias sociales es que la

varianza tuvo un valor supremamente alto y esto se pudo evidenciar la gran dispersión de sus

puntos.

Conclusiones
18

 En el primer punto se realizo un mapa mental sobre las medidas univariantes donde se

profundizo en las medidas de tendencia central.

 En el segundo punto se realizo tabla de frecuencia, diagrama de barras, líneas y se dieron

valores e interpretación a medidas de tendencia central, posición, dispersión, asimetría y

apuntamiento para la variable desempeño de ciencias naturales.

 En el segundo punto se realizaron las mismas actividades del segundo punto con la

diferencia que en éste graficamos histograma, polígono y aplicamos formulas para hallar

el numero de intervalos y la moda.

Referencias

Montero, J. M. (2007). Conceptos Generales Estadística descriptiva. Paraninfo. (pp 3 – 16).

https://link.gale.com/apps/doc/CX4052100007/GVRL?u=unad&sid=GVRL&xid=24d3aa51

Montero, J. M. (2007). Características de Una Distribución de Frecuencias. Statistical

Descriptive. Cengage Learning Paraninfo, S.A. (pp 17 –

60).https://link.gale.com/apps/doc/CX4052100008/GVRL?u=unad&sid=GVRL&xid=d49ed557

Monroy, S.S.(2005). Estadística descriptiva.MX: Instituto Politécnico Nacional. (pp 55 -

79).https://elibro-net.bibliotecavirtual.unad.edu.co/es/ereader/unad/74722

Ortegon Pava, M. (2018). OVI. Tablas de Frecuencia. http://hdl.handle.net/10596/20458

También podría gustarte