Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PRESENTADO POR:
PRESENTADO A:
Riaño Campo
INTRODUCCION
La estadistica es una ciencia que se utiliza en los conjuntos da datos nùmericos para poder
ibtener, a partir de ellos, inferencias, basada en el calculo de probabilidades con el fin de
recopilar, organizar, procesar, analizar e interpretar los datos con el fin de deducir las
caracteristicas de una poblaciòn objetivo.
En el siguiente trabajo se toma como referencia la base de datos que se nos ah ofrecido durante
todo el curso llamado “Resultados pruebas saber de 220 estudiantes del Grado 11- Noviembre
(2019), en algunos departamentos de Colombia”, para con ello realizar diagramas de dispersiòn
de las variables cuantitativas determinando el tipo de relaciòn que hay entre cada una de las
variables, tambien realizando sus medidas, como saberlas clasificar, y asì poder hacer un analisis
de correlaciòn, que tambien nos ayudara a realiar el histograma, y asì en la actividad se podra
determinar cada variable en el cual utilizamos distintas herramientas como diagramas de
dispersiòn, tablas de frecuencias entre otras y poder facilitar la compresiòn de los datos
permitiendonos identificar las variaciones.
JUSTIFICACION
El trabajo se realiza con e fin de poder adquirir nuevos conocimientos y entender la importante
que es la estadistica en la vida laboral y como futuros profesionales, siendo practica y necesaria,
ya que mediante graficas podremos entender y explicarla con màs facilidad una base de datos de
una poblaciòn que se busca en las variables elegidas, y asì a los receptores poderles dar una
explicaciòn mas entendible.
Con la actividad pudimos entender que la estadistica nos puede hacer mas fàcil un analisis de
datos, ya que nos brinda una informaciòn clara y sencilla, donde podemos organizarla,
direccionarla y realizar soluciones en base de los analisis obtenidos para mejora de los datos
arrojados.
OBJETIVOS
Objetivos General
Conocer y analizar las variables tomadas de la base de datos “Resultados pruebas saber de 220
estudiantes Grado 11- Noviembre (2019), de algunos departamentos de Colombia”, aplicando
conceptos estadisticos y las diferentes manejos de agrupar la informaciòn con los 50 datos de las
5 variables elegidas, en un orden; haciendo un analisis con los diagramas y datos obtenidos.
Objetivos especificos
ACTIVIDAD A DESRROLLAR
Para dar inicio a su trabajo, el grupo deberá ajustar la base de datos: Pruebas SABER
11 - 220 estudiantes 2020 (16-1) trabajada en el periodo, la cual se encuentra en el entorno de
aprendizaje colaborativo, en la carpeta: guía de actividades y rúbrica de evaluación - Paso 2–
organización y presentación, el grupo dejará sólo los primeros 50 datos en cada una de las
variables y procederá a procesarlos como una muestra de la base original.
En la gráfica podemos concluir que más de la mitad de los estudiantes es decir el 57%
residen en el municipio de Palmira y solo el 4% viven en el municipio Pereira, la mayoria
reside en municipios aledaños.
TABLA DE CONTINGENCIA:
De acuerdo en los datos de la tabla de contingencia se puede concluir que:
VARIABLE DISCRETA
Mediana: El 50% de los estudiantes tienen entre 3 cuartos en el hogar y el otro 50%
de los estudiantes tienen entre 9 cuartos.
Max: 9
Min: 3
Q1=7: El 25% de los estudiantes tienen entre 3 cuartos en el hogar y el 75% tienen
entre 3 y 9 cuartos en el hogar.
Q3. 13: El 75% de los estudiantes consultan tiene entre 3 y 9 cuartos en el hogar y el
25% tiene entre 3 y 4 cuartos.
Moda: La moda es 3 ya que es la cantidad de cuartos que más ahí entre los 50
estudiantes.
Percentil 50: El 50% de los estudiantes tienen entre 3 cuartos en el hogar y el otro
50% de los estudiantes tienen entre 9 cuartos.
Curtosis: En este caso la curtosis da un valor de -0,16 por lo cual es platicúrtica lo que
indica una baja concentración de valores sobre le promedio es decir menor que 3 cuartos en le
hogar.
Desviación estándar o típica: en este caso se tiene una desviación de 1,98 lo cual
indica que los cuartos en el hogar de los estudiantes es heterogénea ya que los que tienen solo
3 cuartos y los que llegan a tener 9 cuartos.
VARIABLE CONTINUA:
MEDIDAS DE RESUMEN.
Media: En promedio los 50 estudiantes decían 2 horas a internet.
Mediana: El 50% de los estudiantes dedican entre 2 horas a internet y el otro 50% de
los estudiantes dedican entre 3 horas y media a internet.
Max: 3 1/2
Min: 1
Q1=7: El 25% de los estudiantes dedican entre 1 hora a internet y el 75% entre 2 y ½
y 3 ½ horas.
Percentil 50: El 50% de los estudiantes dedican entre 2 horas a internet y el otro 50%
de los estudiantes dedican entre 3 horas y media a internet.
Asimetría: De acuerdo a la tabla se puede concluir que en este caso la asimetría es
negativa ya que da un valor de -0,7, lo cual indica que la mayor cantidad de horas dedicadas al
internet se aglomeran en los valores menores al promedio.
Desviación estándar o típica: en este caso se tiene una desviación de 0,91 lo cual
indica que las horas dedicadas a internet de los estudiantes es uniforme ya que están los que
dedican máximo 3 horas y los que dedican solo 1 hora.
2.5
0.5
0
30 35 40 45 50 55 60 65 70 75 80
PUNTAJE DE LECTURA
El modelo matemático que permite predecir el efecto de una variable sobre la otra es:
y = 0,0346x - 0,9567.
El modelo no es muy confinable porque el coeficiente de determinación R2 esta muy
lejos de 1..
La asociación de las variables es débil ya que una no depende de la otra, en este caso
el las horas dedicadas a la lectura no depende del porcentaje de la temperatura, esto se observa
en el coeficiente de determinación R2 que es 90,5%
√ 0,1916
0,4377
El grado de relación de las de variables es de 0,44% lo cual indica que hay una
correlación moderada.
Los resultados estadísticos obtenidos indica que no hay relación entre las variables, las
horas dedicadas a la lectura y el porcentaje de lectura crítica, esto lo podemos comprobar e
identificar mediante el modelo matemático y = 0,0346x - 0,9567a lo cual solo podemos
obtener un 0,19.16.% de confiabilidad, teniendo en cuenta que le intervalo de correlación no
tiene correlación alguna. Por consiguiente es claro que el porcentaje de lectura crítica no
dependió de las horas dedicadas a lectura de los estudiantes.
Del diagrama estadistico de los resultados de pruebas saber de 50 estudiantes del grado
11 , de la tabla de contigencia entre los municipios de residencia y el tipo de colegio en que
asisten los estudiantes de la variable cualitativa, se desprende que los estudiantes que donde
estudian mas alumnos de colegios no oficlaes es en palmira y de colegios oficlaes es el paujil
de donde los encuestados mas alumnos estudian en colegios no oficiales, y esto puede influir
en los resultados de sus pruebas ya que puede ser que la educaciòn de colegios no oficiales
puede ser un poco mas profundizada para la presentaciòn de la pruebas saber 11, y de este
analisis podemos ver que en la tabla de frecuencia se desprende que la mayoria vive en
palmira de los 50, 28 estudiantes es su zona de residencia, siendo la moda el municipio de
Palmira. En las variables cuantitativas los diagramas estadisticos que se obtuvieròn, se pudo
desprende que para ver la moda de cuantos cuartos en el hogar habian, tienen un promedio de
4 cuartos en el hogar siendo la media, y en la mediana se pudo notar que hubo un 50% de
estudiantes que tienen 3 cuartos y otro 50% unos 9 cuartos siendo el maximo de 9 y el
minimo de 3, pero la moda es que hay entre 3 cuartos por los estudiantes encuestados. En la
variable continuia los diagramas estadisticos nos dieron una media de que dedican 2 horas al
internet solo el 50% y la otra mita unas 3 horas, demostrando quela moda es de 2 ½ de esas
horas pueden estarse ayudando para el promedio de sus pruebas saber 11, con una maximos
de 3 ½ y un minimo de una hora de dedicaciòn a intenret, en las horas que dedican los
alumnos a la lecturas en diagrama estadiscito su modelo no es muy confinable porque el
coeficiente de determinación R2 esta muy lejos de 1, ya que al asociarse las dos variables es
debil por que niguna depende de la otra, y según la grafica de dispersion puede haber una
relaciòn directa, por que a medida que aument<an las horas dedicadas de lectura, aumenta su
puntaje, asì demostrando que entre halla mas lectura en los alumonos va a ver mejor
puntuaciòn y mejoramiento en conocimientos.
RECOMENDACIONES
- Cada resultado estadistico nos da una ifnormaciòn especifica, ya que nos permite
interpretar los resultados como podemos ver que no hay asociacion de las vraibles ya que
no existe, entonces es recomendable analizar mejor estos datos en que se esta fallando los
alumnos en las horas de lectura y su puntaje en lectura critica, ver que se puede mejorar
para que su modelo sea confiable, por que en los resultados vemos que no es muy
confiable el coeficiente, y la asociacion de las varibales son debiles por que no dependen
entre ellos, pero pudiendo ver que la relacion de la vraibles hay una correlaciòn
moderada, entonces es mejor ver en que se esta fallando para mejor el porcentaje de la
lectura critica.
REFERENCIAS BIBLIOGRAFICAS
García, J. E (2005). Análisis de Datos Unidimensionales.et al. Madrid: Paraninfo. (pp 26 -42).
Recuperado de http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4052300007&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=03f8699ec7ccf1
0e8745c0ceb7b85bf1