Está en la página 1de 16

ESTADISTICA DESCRIPTIVA:

Paso 5 - Presentación de resultados

PRESENTADO POR:

Leydy Yiseth Velasco Guerrero Còd. 1.072.191.313

Ellen Daniela Alarcòn Mejia. Còd. 1.026.290.997

PRESENTADO A:

Riaño Campo

UNIVERSIDAD NACIAONAL ABIERTA Y A DISTANCIA

Bogotá mayo 2020

INTRODUCCION

La estadistica es una ciencia que se utiliza en los conjuntos da datos nùmericos para poder
ibtener, a partir de ellos, inferencias, basada en el calculo de probabilidades con el fin de
recopilar, organizar, procesar, analizar e interpretar los datos con el fin de deducir las
caracteristicas de una poblaciòn objetivo.

En el siguiente trabajo se toma como referencia la base de datos que se nos ah ofrecido durante
todo el curso llamado “Resultados pruebas saber de 220 estudiantes del Grado 11- Noviembre
(2019), en algunos departamentos de Colombia”, para con ello realizar diagramas de dispersiòn
de las variables cuantitativas determinando el tipo de relaciòn que hay entre cada una de las
variables, tambien realizando sus medidas, como saberlas clasificar, y asì poder hacer un analisis
de correlaciòn, que tambien nos ayudara a realiar el histograma, y asì en la actividad se podra
determinar cada variable en el cual utilizamos distintas herramientas como diagramas de
dispersiòn, tablas de frecuencias entre otras y poder facilitar la compresiòn de los datos
permitiendonos identificar las variaciones.

JUSTIFICACION

El trabajo se realiza con e fin de poder adquirir nuevos conocimientos y entender la importante
que es la estadistica en la vida laboral y como futuros profesionales, siendo practica y necesaria,
ya que mediante graficas podremos entender y explicarla con màs facilidad una base de datos de
una poblaciòn que se busca en las variables elegidas, y asì a los receptores poderles dar una
explicaciòn mas entendible.
Con la actividad pudimos entender que la estadistica nos puede hacer mas fàcil un analisis de
datos, ya que nos brinda una informaciòn clara y sencilla, donde podemos organizarla,
direccionarla y realizar soluciones en base de los analisis obtenidos para mejora de los datos
arrojados.

En el ejercicio se facilita la interpretaciòn analitica y grafica de la situaciòn utilizando la


herramienta y disponer de la mayor cantidad a una reducciòn d ela base de datos elegida, y ya
realizada el ejercicio podemos ver que aprender a realizar estos pasos son fundamentales en
cualquir carrera o un trabajo de campo ya que se realizan analisis y una presentaciòn de los
resultados.

OBJETIVOS

Objetivos General

Conocer y analizar las variables tomadas de la base de datos “Resultados pruebas saber de 220
estudiantes Grado 11- Noviembre (2019), de algunos departamentos de Colombia”, aplicando
conceptos estadisticos y las diferentes manejos de agrupar la informaciòn con los 50 datos de las
5 variables elegidas, en un orden; haciendo un analisis con los diagramas y datos obtenidos.

Objetivos especificos

- Identificar las 5 variables, tanto cualitativas como cuantitativas discretas y continuas.


- Aplicar las medidas univariantes y bivariantes en funciòn y soluciòn de la problemática
del estudio.
- Realizar tablas de frecuencia, graficos y diagramas de dispersiòn.
- Hacer un analisis de la problemática, dandole una soluciòn apartir de los resultados
estadisticos.

ACTIVIDAD A DESRROLLAR

Actividad 1. Ajuste de datos.

Descripción de la actividad colaborativa.

Para dar inicio a su trabajo, el grupo deberá ajustar la base de datos: Pruebas SABER
11 - 220 estudiantes 2020 (16-1) trabajada en el periodo, la cual se encuentra en el entorno de
aprendizaje colaborativo, en la carpeta: guía de actividades y rúbrica de evaluación - Paso 2–
organización y presentación, el grupo dejará sólo los primeros 50 datos en cada una de las
variables y procederá a procesarlos como una muestra de la base original.

Actividad 2. Procesamiento de variables


Una vez ajustada la base de datos, el grupo deberá tomar mínimo cinco variables (al
menos dos cualitativas, una cuantitativa discreta y una cuantitativa continua) y procesará para
cada variable la información solicitada a continuación:

Variable cualitativa: Municipio de residencia y tipo de colegio

Variable cuantitativa discreta: Cuartos en el hoga

Variable cuantitativa continúa: Horas dedicada a internet y Horas de dedicación a la


lectura ESTU_DEDICACION LECTURA DIARIA

Variable cualitativa: Tipo de documento y Municipio de residencia.

Caracterizar la variable cualitativa presentando: tabla de frecuencias, diagrama


de barras o circular, moda, tabla de contingencias y conclusiones.

De acuerdo a la trabla de frecuencias, 5 estudiantes viven en los municipio en El


Paújil, 28 en Palmira, 3 en Pereira y 4 en Tunja.
DIAGRAMA CIRCULAR

MODA: La moda es el municipio de Palmira el cual es el que más se repite.

En la gráfica podemos concluir que más de la mitad de los estudiantes es decir el 57%
residen en el municipio de Palmira y solo el 4% viven en el municipio Pereira, la mayoria
reside en municipios aledaños.

TABLA DE CONTINGENCIA:
De acuerdo en los datos de la tabla de contingencia se puede concluir que:

 28 estudiantes en Palmira estudian en un colegio no oficial


 En el municipio de Paujil 5 estudiantes están en un colegio oficial al igual que en
Pereira donde hay 2 estudiantes en colegio oficial
 La mayoría de estudiantes de los municipios estudian en colegios no oficiales.
Descripción de la actividad colaborativa

Para la variable discreta elegida, se deberán calcular las medidas univariantes de


tendencia central: Media, Mediana, Moda. Todos los cuartiles. Así mismo deberán calcular las
medidas univariantes de dispersión: Rango, Varianza, Desviación típica y Coeficiente de
variación.

Para la variable continúa elegida, se deberán calcular las medidas univariantes de


tendencia central: Media, Mediana, Moda. Todos los cuartiles Así mismo deberán calcular las
medidas univariantes de dispersión: Rango, Varianza, Desviación típica y Coeficiente de
variación

VARIABLE DISCRETA

Media: En promedio los 50 estudiantes tienen 4 cuartos en el hogar.

Mediana: El 50% de los estudiantes tienen entre 3 cuartos en el hogar y el otro 50%
de los estudiantes tienen entre 9 cuartos.

Max: 9

Min: 3

Q1=7: El 25% de los estudiantes tienen entre 3 cuartos en el hogar y el 75% tienen
entre 3 y 9 cuartos en el hogar.
Q3. 13: El 75% de los estudiantes consultan tiene entre 3 y 9 cuartos en el hogar y el
25% tiene entre 3 y 4 cuartos.

Moda: La moda es 3 ya que es la cantidad de cuartos que más ahí entre los 50
estudiantes.

Percentil 50: El 50% de los estudiantes tienen entre 3 cuartos en el hogar y el otro
50% de los estudiantes tienen entre 9 cuartos.

Asimetría: De acuerdo a la tabla se puede concluir que en este caso la asimetría es


negativa ya que da un valor de 0,82, lo cual indica que la mayor cantidad de los cuartos se
aglomeran en los valores menores al promedio.

Curtosis: En este caso la curtosis da un valor de -0,16 por lo cual es platicúrtica lo que
indica una baja concentración de valores sobre le promedio es decir menor que 3 cuartos en le
hogar.

Rango: El rango de los cuartos en el hogar de los 50 estudiantes se encuentra entre 7.

Desviación estándar o típica: en este caso se tiene una desviación de 1,98 lo cual
indica que los cuartos en el hogar de los estudiantes es heterogénea ya que los que tienen solo
3 cuartos y los que llegan a tener 9 cuartos.

Coeficiente de variación: Teniéndose en cuenta que en este caso la CV es de 52,85%


tenemos una dispersión homogénea lo cual no afectaría a los estudiantes en ningún aspecto
educativo ni social

VARIABLE CONTINUA:

MEDIDAS DE RESUMEN.
Media: En promedio los 50 estudiantes decían 2 horas a internet.

Mediana: El 50% de los estudiantes dedican entre 2 horas a internet y el otro 50% de
los estudiantes dedican entre 3 horas y media a internet.

Max: 3 1/2

Min: 1

Q1=7: El 25% de los estudiantes dedican entre 1 hora a internet y el 75% entre 2 y ½
y 3 ½ horas.

Q3. 13: El 75% de los estudiantes dedican entre 2 y ½ y 3 ½ horas en internet y el


25% tiene entre 1 a 2 horas. .

Moda: La moda es de 2 ½ ya que es la cantidad de horas dedicadas a internet que más


se repite entre los 50 estudiantes.

Percentil 50: El 50% de los estudiantes dedican entre 2 horas a internet y el otro 50%
de los estudiantes dedican entre 3 horas y media a internet.
Asimetría: De acuerdo a la tabla se puede concluir que en este caso la asimetría es
negativa ya que da un valor de -0,7, lo cual indica que la mayor cantidad de horas dedicadas al
internet se aglomeran en los valores menores al promedio.

Curtosis: En este caso la curtosis da un valor de -1,30 por lo cual es platicúrtica lo


que indica una baja concentración de valores sobre el promedio es decir menor que 2horas
dedicadas al internet.

Rango: El rango de horas dedicadas a internet de los 50 estudiantes se encuentra entre


2 1/5.

Desviación estándar o típica: en este caso se tiene una desviación de 0,91 lo cual
indica que las horas dedicadas a internet de los estudiantes es uniforme ya que están los que
dedican máximo 3 horas y los que dedican solo 1 hora.

Coeficiente de variación: Teniéndose en cuenta que en este caso la CV es de 42,28


% tenemos una dispersión homogénea lo cual no afectaría a los estudiantes en el rendimiento
académico o perdido de clases por estar dedicados al internet.

Regresión y correlación entre variables cuantitativas

Identificar dos variables cuantitativas de la situación estudiada que puedan estar


relacionadas y.

a. Realizar el diagrama de dispersión de dichas variables y determinar el tipo de


asociación entre las variables.
Horas de lectura y punta en lectura critica
3
HORAS DEDICADAS A LA LECTURA

2.5

1.5 f(x) = 0.03 x − 0.96


R² = 0.19
1

0.5

0
30 35 40 45 50 55 60 65 70 75 80
PUNTAJE DE LECTURA

b. La asociación de las variables no existe, como se puede observar en el coeficiente


de determinación R2 que es de 19.16%.
c. Encontrar el modelo matemático que permite predecir el efecto de una variable
sobre la otra. ¿Es confiable?

El modelo matemático que permite predecir el efecto de una variable sobre la otra es:

y = 0,0346x - 0,9567.
El modelo no es muy confinable porque el coeficiente de determinación R2 esta muy
lejos de 1..

La asociación de las variables es débil ya que una no depende de la otra, en este caso
el las horas dedicadas a la lectura no depende del porcentaje de la temperatura, esto se observa
en el coeficiente de determinación R2 que es 90,5%

d. Determinar el grado de relación de las dos variables.

√ 0,1916
0,4377

El grado de relación de las de variables es de 0,44% lo cual indica que hay una
correlación moderada.

e. Relacionar la información obtenida con el problema.

Los resultados estadísticos obtenidos indica que no hay relación entre las variables, las
horas dedicadas a la lectura y el porcentaje de lectura crítica, esto lo podemos comprobar e
identificar mediante el modelo matemático y = 0,0346x - 0,9567a lo cual solo podemos
obtener un 0,19.16.% de confiabilidad, teniendo en cuenta que le intervalo de correlación no
tiene correlación alguna. Por consiguiente es claro que el porcentaje de lectura crítica no
dependió de las horas dedicadas a lectura de los estudiantes.

Actividad 3. Propuesta de solución a la problemática

Finalmente, el grupo deberá responder a la pregunta: ¿Qué alternativa de solución


plantea para la problemática estudiada?, dicha respuesta deberá estar justificada
descriptivamente, es decir para ello (utilizará tablas, gráficos, medidas, diagramas, entre otros)
a partir de los resultados estadísticos descriptivos realizados en la actividad anterior (50
primeros datos) y la información obtenida de la problemática planteada.

Del diagrama estadistico de los resultados de pruebas saber de 50 estudiantes del grado
11 , de la tabla de contigencia entre los municipios de residencia y el tipo de colegio en que
asisten los estudiantes de la variable cualitativa, se desprende que los estudiantes que donde
estudian mas alumnos de colegios no oficlaes es en palmira y de colegios oficlaes es el paujil
de donde los encuestados mas alumnos estudian en colegios no oficiales, y esto puede influir
en los resultados de sus pruebas ya que puede ser que la educaciòn de colegios no oficiales
puede ser un poco mas profundizada para la presentaciòn de la pruebas saber 11, y de este
analisis podemos ver que en la tabla de frecuencia se desprende que la mayoria vive en
palmira de los 50, 28 estudiantes es su zona de residencia, siendo la moda el municipio de
Palmira. En las variables cuantitativas los diagramas estadisticos que se obtuvieròn, se pudo
desprende que para ver la moda de cuantos cuartos en el hogar habian, tienen un promedio de
4 cuartos en el hogar siendo la media, y en la mediana se pudo notar que hubo un 50% de
estudiantes que tienen 3 cuartos y otro 50% unos 9 cuartos siendo el maximo de 9 y el
minimo de 3, pero la moda es que hay entre 3 cuartos por los estudiantes encuestados. En la
variable continuia los diagramas estadisticos nos dieron una media de que dedican 2 horas al
internet solo el 50% y la otra mita unas 3 horas, demostrando quela moda es de 2 ½ de esas
horas pueden estarse ayudando para el promedio de sus pruebas saber 11, con una maximos
de 3 ½ y un minimo de una hora de dedicaciòn a intenret, en las horas que dedican los
alumnos a la lecturas en diagrama estadiscito su modelo no es muy confinable porque el
coeficiente de determinación R2 esta muy lejos de 1, ya que al asociarse las dos variables es
debil por que niguna depende de la otra, y según la grafica de dispersion puede haber una
relaciòn directa, por que a medida que aument<an las horas dedicadas de lectura, aumenta su
puntaje, asì demostrando que entre halla mas lectura en los alumonos va a ver mejor
puntuaciòn y mejoramiento en conocimientos.

RECOMENDACIONES

- Cada resultado estadistico nos da una ifnormaciòn especifica, ya que nos permite
interpretar los resultados como podemos ver que no hay asociacion de las vraibles ya que
no existe, entonces es recomendable analizar mejor estos datos en que se esta fallando los
alumnos en las horas de lectura y su puntaje en lectura critica, ver que se puede mejorar
para que su modelo sea confiable, por que en los resultados vemos que no es muy
confiable el coeficiente, y la asociacion de las varibales son debiles por que no dependen
entre ellos, pero pudiendo ver que la relacion de la vraibles hay una correlaciòn
moderada, entonces es mejor ver en que se esta fallando para mejor el porcentaje de la
lectura critica.

REFERENCIAS BIBLIOGRAFICAS

Montero, J. M. (2007). Características de Una Distribución de Frecuencias. Statistical


Descriptive.   Cengage Learning Paraninfo, S.A. (pp 41-50). Recuperado
de http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312c
bea60961107ffc27a0
Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City:
Cengage Learning. (pp 675–686). Recuperado de http://go.galegroup.com/ps/i.do?
id=GALE
%7CCX4058900232&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=e558184ed89e5
7d11ede116134cfce41

García, J. E (2005). Análisis de Datos Unidimensionales.et al. Madrid: Paraninfo. (pp 26 -42).
Recuperado de http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4052300007&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=03f8699ec7ccf1
0e8745c0ceb7b85bf1

OVI. Ortegon Pava, M. (27,09,2018). Tablas de Frecuencia. [Archivo de video]. Recuperado


de  http://hdl.handle.net/10596/20458

También podría gustarte