Está en la página 1de 15

Universidad Nacional Abierta y a Distancia

UNAD

Estadística descriptiva

Grupo: 100105_53

Unidad 1 y 2: Paso 3 - Análisis de la Información


Trabajo Individual

Presentado por:
Adonis Hernandez vela

Facultad de ciencias basicas, tecnologia e ingeniería


Programa de ingeniería de sistemas
Regional ccav sur Neiva-Huila

Neiva-Huila
2020
Introducción
Mediante el desarrollo de la siguiente actividad se aplica las medidas estadísticas univariantes,
en la solución de diferentes problemas desarrollando actividades:
Medidas de tendencia central donde se calcula La media, Mediana y moda.
Medidas de posición donde calculamos Cuartiles, Deciles, Percentiles.
Medidas de dispersión absoluta donde se calcula rango, varianza, desviación típica.
Medidas de dispersión relativas donde se calcula coeficiente de variación.
Medidas de dispersión y apuntamiento.
Justificación
Este trabajo ha sido desarrollado con el propósito de entender afondo y aplicar conceptos
básicos de la estadística descriptiva como:
Medidas de tendencia central donde se calcula La media, Mediana y moda.
Medidas de posición donde calculamos Cuartiles, Deciles, Percentiles.
Medidas de dispersión absoluta donde se calcula rango, varianza, desviación típica.
Medidas de dispersión relativas donde se calcula coeficiente de variación.
Medidas de dispersión y apuntamiento.

Se aplicará el uso de los diagramas estadísticos de barras y circulares en la herramienta de Excel


se hallará conclusiones de acuerdo con la temática en base a los gráficos con la base de datos
publicado en la guía.
Objetivos
Identificar los fundamentos básicos de la estadística descriptiva por medio de la caracterización
de variables, a través de la solución de problemas reales y resolverlos por medio de temáticas
como:
Medidas de tendencia central donde se calcula La media, Mediana y moda.
Medidas de posición donde calculamos Cuartiles, Deciles, Percentiles.
Medidas de dispersión absoluta donde se calcula rango, varianza, desviación típica.
Medidas de dispersión relativas donde se calcula coeficiente de variación.
Medidas de dispersión y apuntamiento.

.
Actividad 1. Mapa Mental.

Resumir mediante un mapa mental las medidas estadísticas univariantes


(medidas de tendencia central, medidas de posición, medidas de
dispersión), describiendo ampliamente una de ellas.

Actividad 2. Medidas Univariantes -variable Discreta

A partir de la base de datos: Pruebas SABER 11 - 200 estudiantes


2020 (16-2), encontrada en el entorno de aprendizaje Colaborativo,
cada estudiante deberá elegir una variable cuantitativa discreta distinta
manifestarlo en el foro y resolver los siguientes incisos:

a. Tabla de frecuencia datos no agrupados. Diseñar una tabla de


frecuencia para datos no agrupados de la variable elejida, a partir de ella
elaborar un diagrama de barras y un diagrama de líneas.
Frecuencia Frecuencia Frecuencia
Frecuencia
xi Acumulada Relativa Porcentual
Absoluta(fi)
(Fi) (hi) (Hi)
0 1 1 0,005 0,5
1 40 41 0,2 20
2 24 65 0,12 12
3 41 106 0,205 20,5
4 50 156 0,25 25
5 21 177 0,105 10,5
6 23 200 0,115 11,5
Total: 200
Tabla de Barras:

Tabla de Frecuencia Absoluta


Estrato Familiar
60

50

40
N° Estudiantes

30 50
41
20 40
21 23
24
10
0 3 4 5 6
0 1 1 2
0 1 2 3 4 5 6
Estratos

Tabla Lineal:

Frecuencia absoluta Estrato familiar


60
50
50
40 41
40
N° Estudiantes

30 24
21 23
20

10
1
0
0 1 2 3 4 5 6
Estratos

b. Medidas de tendencias central y de Posición. Para la variable


cuantitativa discreta elegida, cada estudiante deberá calcular las
medidas de tendencia central (media, mediana, moda), medidas de
posición: cuartiles, percentil 25 y 50, determinar el tipo de asimetría y
curtosis e interpretar los resultados y asociarlos con la problemática:
Identificación de los principales factores que influyen en los
resultados de las pruebas SABER 11 en estudiantes de
Instituciones públicas y privadas de Colombia.
Media 3,27
Mediana 3
Moda 4
-La media nos indica el promedio de Estrato familiar
De los estudiantes de la Prueba Saber 11
-Se realiza un cálculo de La Mediana del grupo de
Estudiantes que realizaron las pruebas saber 11
Llegando a la conclusión de su estrato familiar es de 3.
-La moda, la agrupación de datos que más se repite en
el extracto familiar de los estudiantes que realizaron la
prueba saber 11.

Q1 2
Q2 3
Q3 4
Percentil 25 2
Percentil 50 3

Para el cálculo de los cuartiles se tomó de muestra la base de datos de los estudiantes que
realizaron las pruebas saber 11 para dividirlas en 3 partes iguales cada parte con un
equivalente del 25% y nos solicitan calcular los percentiles equivalentes al 25 y 50% de los
datos.
N

Determinamos el tipo curtosis Por la formula


∑ ( xi )−x́ ¿ 4 .∋¿ ni la frecuencia absoluta de xi
i

N S 4x
o de cada intervalo i

3 ( x́−Me)
Asimetría A=
S
0,05215958
Asimetria 2
Curtosis -0,97890499

Determinando la asimetría el grado de simetría que presenta una distribución de probabilidad


de una variable aleatoria, el resultado es Mayor a 0, lo que significa que tiene curva de
asimetría positiva
La curtosis nos muestra la distribución respecto a la mayor frecuencia de los estratos tomados
de los estudiantes que realizaron la prueba saber 11 en este caso el resultado fue negativo que
nos dice que existe una baja concentración de valores (platicúrtica) en torno a la media como
nos muestra la siguiente imagen.

c. Medidas de Dispersión. Para la variable cuantitativa discreta elegida


calcular: Rango, varianza, desviación típica o estandar, coeficiente de
variación, posteriormente interpretar los resultados y asociarlos con la
problemática: Identificación de los principales factores que
influyen en los resultados de las pruebas SABER 11 en
estudiantes de Instituciones públicas y privadas de Colombia.

Rango: 6
Varianza de la
muestra 2,61015075
Desviación estándar 1,6155961
Coeficiente 0,05215958

El rango de los estudiantes se obtiene restando el estrato de mayor valor con el de menor
Valor Max
valor obteniendo un rango de estrato 6. R=
Valor Min
La varianza es la suma de los residuos al cuadrado divididos entre el total estratos

∑ ( xi−x )2
√ n−1
La Desviación estándar de los estratos nos indica qué tan dispersos están los datos con
N

respecto a la media de los datos en total.


σ=
√ ∑ ( xi− x́)2
1

El coeficiente de asiemtria se calcula con la formula As=


N
3 ( x́−Me )
S

Actividad 3. Medidas Univariantes -variable Continua

A partir de la base de datos: Pruebas SABER 11 - 200 estudiantes


2020 (16-2), encontrada en el entorno de aprendizaje Colaborativo,
cada estudiante deberá elegir una variable cuantitativa continua distinta,
manifestarlo en el foro y resolver los siguientes incisos.

a. Tabla de frecuencia datos agrupados. Con la variable cuantitativa


continua elegida, diseñar una tabla de frecuencia para datos agrupados
identificando rango, número de intervalos, amplitud y a partir de ella
elaborar un histograma de frecuencias y un polígono de frecuencias.
Finalmente, interpretar los resultados y asociarlos con la problemática:
Identificación de los principales factores que influyen en los
resultados de las pruebas SABER 11 en estudiantes de
Instituciones públicas y privadas de Colombia.

Frecuencia
Marca de Frecuencia Frecuencia
Intervalos relativa
i clase Absoluta Relativa
(Li-Ls) porcentual
Xi fi hi
pi

1 0,5 0,8 0,666666667 29 0,145 14,5


2 0,8 1,17 1 4 0,02 2
3 1,17 1,5 1,333333333 0 0 0
4 1,5 1,83 1,666666667 71 0,355 35,5
5 1,83 2,17 2 0 0 0
6 2,17 2,5 2,333333333 0 0 0
7 2,5 2,83 2,666666667 54 0,27 27
8 2,83 3,17 3 0 0 0
9 3,17 3,5 3,333333333 42 0,21 21
Total: 200 1,00 100

xiMin 0,5
xiMax 3,5
Rango: 3
El rango de los estudiantes se obtiene restando el estrato de mayor valor con el de menor
Valor Max
valor obteniendo un rango de estrato 6. R=
Valor Min

Intervalos necesarios para la tabla


de frecuencia y aproximamos
 
k: 8,66933298
(aproximación)k: 9
Amplitud de intervalo
c: 0,33333333
Para obtener los intervalos necesarios para realizar la tabla de frecuencia mediante la formula
1+3.333∗log 10(n) donde n:200 que es el total de los estudiantes que realizaron la prueba
para obtener el número de intervalos

Rango
Para obtener la amplitud de intervalo dividiento
k

Histograma de frecuencia
80
70
60
N° Estudiantes

50
40
30
20
10
0
0,5 a 0,8 0,8 a 1,2 1,2 a 1,5 1,5 a 1,8 1,8 a 2,2 2,2 a 2,5 2,5 a 2,8 2,8 a 3,2 3,2 a 3,5
Horas de dedicacion a la lectura diaria
Poligono de frecuencia
80
70
60
N° Estudiantes

50
40
30
20
10
0
0,5 a 0,8 0,8 a 1,2 1,2 a 1,5 1,5 a 1,8 1,8 a 2,2 2,2 a 2,5 2,5 a 2,8 2,8 a 3,2 3,2 a 3,5
Horas de dedicacion a la lectura diaria

Las anteriores graficas nos muestran que la mayoría de los estudiantes dedican de 1.5 a 1.8
horas de dedicación a la lectura diaria y que la mitad de los estudiantes dedican menos de 1.5
a 1.8 horas de lecturas.

b. Medidas de tendencias central y de Posición. Para la variable


cuantitativa continúa elegida, cada estudiante deberá calcular las
medidas de tendencia central (media, mediana, moda), medidas de
posición: cuartiles, percentil 50 y 75, determinar el tipo de asimetría y
curtosis e interpretar los resultados y asociarlos con la problemática:
Identificación de los principales factores que influyen en los
resultados de las pruebas SABER 11 en estudiantes de
Instituciones públicas y privadas de Colombia.

Media 2,035
Mediana 1,5
Moda 1,5
-La media nos indica el promedio de Horas de lectura de los estudiantes de la Prueba Saber 11
-Se realiza un cálculo de La Mediana del grupo de estudiantes que realizaron las pruebas saber
11 Llegando a la conclusión que las horas de lecturas que realizan diariamente es de 1.5.
-La moda, la agrupación de datos que más se repite en horas de lectura de los estudiantes que
realizaron la prueba saber 11.

Q1 1,5
Q2 1,5
Q3 2,5
Percentil
25 1,5
Percentil
50 1,5
Para el cálculo de los cuartiles se tomó de muestra la base de datos de los estudiantes que
realizaron las pruebas saber 11 para dividirlas en 3 partes iguales cada parte con un
equivalente del 25% y nos solicitan calcular los percentiles equivalentes al 25 y 50% de los
datos.
N

Determinamos el tipo curtosis Por la formula


∑ ( xi )−x́ ¿ 4 .∋¿ ni la frecuencia absoluta de xi
i

N S 4x
o de cada intervalo i

3 ( x́−Me)
Asimetría A=
S
Asimetria 0,09065827
Curtosis -1,05918017
Determinando la asimetría el grado de simetría que presenta una distribución de probabilidad
de una variable aleatoria, el resultado es Mayor a 0, lo que significa que tiene curva de
asimetría positiva

La curtosis nos muestra la distribución respecto a la mayor frecuencia de los estratos tomados
de los estudiantes que realizaron la prueba saber 11 en este caso el resultado fue negativo que
nos dice que existe una baja concentración de valores (platicúrtica) en torno a la media como
nos muestra la siguiente imagen.

Esto lo podemos verificar mediante la imagen de gráficos de la actividad 2 Letra b.

c. Medidas de Dispersión. Para la variable cuantitativa continúa


elegida calcular: Rango, varianza, desviación típica, coeficiente de
variación, posteriormente interpretar los resultados y asociarlos con la
problemática: Identificación de los principales factores que
influyen en los resultados de las pruebas SABER 11 en
estudiantes de Instituciones públicas y privadas de Colombia.

xiMin 0,5
xiMax 3,5
Rango: 3
El rango de los estudiantes se obtiene restando las horas que mas dedican los estudiantes para
la lectura menos las horas que menos le dedican a la lectura un rango de estrato 3.
Valor Max
R=
Valor Min
La varianza es la suma de los residuos al cuadrado divididos entre el total estratos

∑ ( xi−x )2
√ n−1
La Desviación estándar de los estratos nos indica qué tan dispersos están los datos con
N

respecto a la media de los datos en total.


σ=
√ ∑ ( xi− x́)2
1

El coeficiente de asimetría se calcula con la formula As=


N
3 ( x́−Me )
S
Conclusiones
Bibliografía

García, J. E (2005). Análisis de Datos Unidimensionales.et al. Madrid:


Paraninfo. Página 26 -42

Montero, J. M. (2007). Características de Una Distribución de


Frecuencias. Statistical Descriptive. Cengage Learning Paraninfo, S.A.
Paginas 41-50

García, J. E (2005). Análisis de Datos Unidimensionales.et al. Madrid:


Paraninfo. Página 26 -42

Montero, J. M. (2007). Características de Una Distribución de


Frecuencias. Statistical Descriptive. Cengage Learning Paraninfo, S.A.
Páginas 41-50

García, J. E (2005). Análisis de Datos Unidimensionales.et al. Madrid:


Paraninfo. Página 26 -42 j

Montero, J. M. (2007). Características de Una Distribución de


Frecuencias. Statistical Descriptive. Cengage Learning Paraninfo, S.A.
Páginas 41-50

También podría gustarte