Está en la página 1de 22

PASO 3- ANALISIS DE LA INFORMACION.

ESTUDIANTE

SERGIO HERNAN CASTRO AGUDELO

MATERIA

ESTADÍSTICA DESCRIPTIVA 100105_761

INSTRUCTOR

JOSE FERNANDO VELANDIA

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

(UNAD)
INTRODUCCION

En el presente actividad se va a contestualizar lo que es la variables continuas y


discretas en el tema estadistica descriptiva.

La investigacion a realizar es compleja se va a estudiar la poblacion estudiantil en el


nivel de estudio academico, descriminando los resultados de la prueba saber de 11 en
instituciones publicas y privadas de colombia, la importancia de conocer el nivel de
educacion de los estudiantes de distintos instituciones educativas a nivel departamental
y nacional, nos permitir conoser como esta el promedio estadistico estudiantil, una de
las partes a investigar del sector de la poblacion que obtuvo un promedio notable, se va
a llevar a tal grado que se va discrinar mediante las medidas estadisticas univariantes
para obtener tal puntuacion.

Una de los temas puntuales de abordar la estadistica descriptiva es aplicanlo a distintas


problematicas que tenemos nos permite descriminar mejor las variables de estudio,
como planificacion y ejecutacion de los colegios privados y publicos que sacaron las
mejores puntuaciones haciendo una compararacion a los colegio que sacaron bajo
rendimiento. de este marco comparativo vamos a ver o a encontrar cuartiles de deciles o
hasta persentiles de colegios de estudiantes que por ejemplo que leen libros.

Al enfoque que voy a realizar por medio de las variables continuas y discretas es
calcular las medidas de tendencia central, de igual forma medidas de posición, aplicada
a la investigacion de estudiar la poblacion estudiantil de el nivel de estudio academico,
descriminando los resultados de la prueba saber de 11 en instituciones publicas y
privadas de colombia.

La estadistica nos va guiar en el entorno de conocer y saber arojandonos los resultados


favorables por estudiante. los que en la pruebas sacaron bajo rendimiento, con que llevo
a analizar discriminada mente, tiempos dedicados al estudio, numeros de libros
consultados, horas que dedica a la lectura entre otras variables. si por esos distintos
temas llevo al bajo rendimiento academico, lo comparamos con el percentil 100 de los
estudiantes en que rango se encuentra.

Este metodo de estadistiva nos vamos aplicar las medidas estadisticas univariantes, en
las soluciones de problemas utilizando medidas de tendencia central, medida de
posicion, medidas dedispersion absoluta, medidas de dispersion relativas, medidas de
dispersion y apuntamiento.

Para el trabajo de estadistica, e ir estendiendo del tema utilizamos lo que el intructor no


brinta como tema de orientacion, en el entorno de comocimiento colaborativo y entorno
conosimiento en la plataforma unad. en otra parte los encuentro formales en distintas
plataforma con el tutor o lider de la materia, tenemos medios digitales en distintas
plataforma para la investigacion.
JUSTIFICACION

El trabajo de estadistica descriptiva con lleva que el estudiante profundice sobre el tema
conocer y indagar, poner en practicas las medidas estadisticas univarianes para la
solucion de diferentes problemas.

Con el conocimiento que a obtenido con los repasos y distintos contenidos buscdos por
los medios las palabras y conceptos claves, se plasmara un mapa mental teniendo en
cuenta cada concepto claro del tema.

Por medio de la base de datos obtenidas de las pruebas saber 11-220 estudiante (16-1),
que se encuentra en el entorno de aprendizaje colaborativo, se elige la variable
cuantitativa discreta y continua que se esta trabajando en este informe.

En el informe las variable discreta se solucinara por medio de datos no agrupados se


representara por medio de diagramas de barra o lineas, en la medida de tendencia
central para la variable que se va atrabajar el numero de libros leydos, se estudia cada
una de las medidas de tendencia central, medidas de posicion, medidas de dispersion
absoluta, medidas de dispersionrelativa y medidas de dispersion y apuntamiento. Se
espone las formulas y se hace una comparacion con infostat se sacara la conclusiones
con la problemática que se esta trabajando .

En el tema de la variable continua son los datos a grupados se da solucion por medio de
la medida de tendencia central para la variable que se va atrabajar, son las horas de
dedicacion a la lectura que el estudiante diariamente, se estudia cada una de las
medidas de tendencia central, medidas de posicion, medidas de dispersion absoluta,
medidas de dispersionrelativa y medidas de dispersion y apuntamiento. Se espone las
formulas y se hace una comparacion con infostat se sacara la conclusiones con la
problemática que se esta trabajando .
OBJETIVOS

En el trabajo de estadistica descriptiva se van a comprender mejor la medidas de


estadisticas univariantes en la solucion de diferentes problemas,

Uno como estudiante identificara, calculara e interpretara las medidas de tendencia central y
dispersion en funcion de la descripcion de la problemática partir del trabajo realizado con
variables cuantitativas continuas con una base de datos prueba de saber 11 -220 estudiantes
2020 (16-1), en las actividades de cada una se va investigar, interpretar, y leer cada una de
las preguntas se comparara con respecto al infostat, los datos que obtengamos se compara
sacando las comcluciones finalizando el trabajo se dominara el tema con los conceptos
claros.
PUNTO 1 MAPA MENTAL

PUNTO 2. Medidas Univariantes -variable Discreta

a. Tabla de frecuencia datos no agrupados. Cada estudiante deberá elegir una


variable cuantitativa discreta y diseñar una tabla de frecuencia para datos no agrupados,
a partir de ella elaborar un diagrama de barras y un diagrama de líneas.

N° de libros de consulta

Diagrama de barras
Diagrama de Línea

COMPARA CUANTOS JOVENES LEEN LIBROS


35
30
CANTIDAD DE ESTUDIANTES

30

25 23
19
20
16
15 13
10 10 11
10 8 8
5 5 5 656 5
3 4 44 3
5 2 2121 2 2
1 1 1 1 1
0
0 10 20 30 40 50 60
ESTUDIANTES QUE LEEN LIBROS

Con respecto a la gráfica de barras y la tabla de frecuencia, podemos observar la cantidad de


estudiantes que leen libros en la casa. Ejemplo hay 4 estudiantes que solo leen 30 libros, esta
problemática puede estar relacionada al bajo rendimiento académico no todos los estudiantes
cuentan con la posibilidad de leer un libro en casa.

b. Medidas de tendencias central y de Posición. Para la variable cuantitativa discreta elegida,


cada estudiante deberá calcular las medidas de tendencia central (media, mediana, moda),
medidas de posición: cuartiles, Decil 5 y percentil 50, determinar el tipo de asimetría y curtosis
e interpretar los resultados y asociarlos con la problemática: Identificación de los principales
factores que influyen en los resultados de las pruebas SABER 11 en estudiantes de Instituciones
públicas y privadas de Colombia. Trabajo realizado en excel
ite dato lim lim. marca fa fr faa fra fa*fr
m s inf Sup de clase
0 0 0 6.2 3.11 8 0.0 8 0.0 0
4 4
1 1 7.2 13.4 10.33 5 0.0 13 0.0 5
2 6
2 2 14.4 20.7 17.56 13 0.0 26 0.1 26
6 2
3 3 21.7 27.9 24.78 10 0.0 36 0.1 30
5 6
4 4 28.9 35.1 32.00 30 0.1 66 0.3 120
4 0
5 5 36.1 42.3 39.22 19 0.0 85 0.3 95
9 9
6 6 43.3 49.6 46.44 16 0.0 10 0.4 96
7 1 6
7 7 50.6 56.8 53.67 23 0.1 12 0.5 161
0 4 6
8 8 57.8 64.0 60.89 5 0.0 12 0.5 40
2 9 9
9 9 65.0 71.2 68.11 10 0.0 13 0.6 90
5 9 3
10 10 72.2 78.4 75.33 8 0.0 14 0.6 80
4 7 7
11 11 79.4 85.7 82.56 5 0.0 15 0.6 55
2 2 9
12 12 86.7 92.9 89.78 11 0.0 16 0.7 132
5 3 4
13 13 93.9 100.1 97.00 6 0.0 16 0.7 78
3 9 7
14 14 101. 107.3 104.22 5 0.0 17 0.7 70
1 2 4 9
15 15 108. 114.6 111.44 6 0.0 18 0.8 90
3 3 0 2
16 16 115. 121.8 118.67 2 0.0 18 0.8 32
6 1 2 3
17 19 122. 129.0 125.89 1 0.0 18 0.8 19
8 0 3 3
18 20 130. 136.2 133.11 3 0.0 18 0.8 60
0 1 6 5
19 23 137. 143.4 140.33 4 0.0 19 0.8 92
2 2 0 6
20 25 144. 150.7 147.56 4 0.0 19 0.8 100
4 2 4 8
21 26 151. 157.9 154.78 4 0.0 19 0.9 104
7 2 8 0
22 30 158. 165.1 162.00 2 0.0 20 0.9 60
9 1 0 1
23 31 166. 172.3 169.22 1 0.0 20 0.9 31
1 0 1 1
24 32 173. 179.6 176.44 2 0.0 20 0.9 64
3 1 3 2
25 33 180. 186.8 183.67 1 0.0 20 0.9 33
6 0 4 3
26 34 187. 194.0 190.89 5 0.0 20 0.9 170
8 2 9 5
27 35 195. 201.2 198.11 3 0.0 21 0.9 105
0 1 2 6
28 36 202. 208.4 205.33 1 0.0 21 0.9 36
2 0 3 7
29 41 209. 215.7 212.56 1 0.0 21 0.9 41
4 0 4 7
30 43 216. 222.9 219.78 2 0.0 21 0.9 86
7 1 6 8
31 45 223. 230.1 227.00 2 0.0 21 0.9 90
9 1 8 9
32 54 231. 237.3 234.22 1 0.0 21 1.0 54
1 0 9 0
33 56 238. 244.6 241.44 1 0.0 22 1.0 56
3 0 0 0
tota 22 2401
l 0

-Media.

Para calcular la media

∑XIfi
x́=
N
2401 ´
X= =¿ 10.91 ¿
220

La media es el promedio aritmético. Para esta problemática se dice que la media o promedio de
los estudiantes constan de 10 libros en promedio de 220 estudiante. El nivel de lectura de los
estudiantes el promedio es crítico, de una manera se puede visualizar el nivel de desempeño
muy bajo que presentan los estudiantes.

Mediana.

Para calcularla

N
M e =Li + (
2
−F i−1
fi
∗ai )
La medina de los estudiantes que leen es 7 libros en representación, eso significa que dé 0 a
50% estudiantes tienes tiene solo la posibilidad solo de leer de 0 a 7 libros, y el otro 50% tiene
de 7 a 56 libros.

Moda
∆1
M o=Li + ( ∆1 +∆ 2)x ai

La moda es el dato que más se repite en este caso. En esta problemática la


moda de los estudiantes que con más frecuencia se encuentra leyendo libro es
de 4 libros.

Medidas de cuartiles Deciles percentiles.

k xN
CUARTILES = M =L + 4
e i
−f i−1
f1
xa( )
Ordenamos los datos de menor a mayor y lo dividimos en 4 partes iguales, de tal
manera que podamos ves el cuartil 1 al 3, cada uno de los segmentos representa una
etapa con ello en la problemática podemos verificar la el primer Q1 donde nos dicen
que hay 4% estudiantes jóvenes que leen libros.

Imagen de interpretación:

k xN
DECILES = M =L + 10
e i
f1 (
−f i−1
xa )
Ordenamos los datos de menor a mayor y lo dividimos en 10partes iguales, con ello
podemos decir, en este caso lo hacemos con el 50 % que es 5 partes igual que la
mediana el 7% de los estudiantes leen libros.

k xN
PERCETIL= M e =Li + 100
(
−f i−1
f1
xa )

Ordenamos los datos de menor a mayor y lo dividimos en 100 partes iguales, con ello
podemos decir, 100% de los estudiantes leen libros.

Interpretación de la gráfica.
Determinar el tipo de asimetría y curtosis e interpretar los resultados y
asociarlos con la problemática: Identificación de los principales factores
que influyen en los resultados de las pruebas SABER 11 en estudiantes
de Instituciones públicas y privadas de Colombia.

Curva positiva porque es mayor a cero

Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor
del punto central (media aritmética). En este caso la media es mayor de la moda y la mediana.

LEPTOCURTICA

La distribución que muestra en la gráfica es una variación baja ya que los valores están
agrupados estrechamente, y también se puede observar mediante su pico es muy agudo

El valor de la desviación estándar nos dio 10.81. Hay diferencia significativa entre los numero
de libros que tienen los estudiantes, lo podemos ver reflejados en la tabla de datos. El mínimo
valor es 0, el dato máximo es 56, pero el promedio es 7. Si hay diferencias significativas entre
el número de libros que tienen los estudiantes en la casa. Esto podría determinar el
rendimiento académico de los estudiantes.

c. Medidas de Dispersión. Para la variable cuantitativa discreta elegida calcular:


Rango, varianza, desviación típica, coeficiente de variación, posteriormente
interpretar los resultados y asociarlos con la problemática: Identificación de los
principales factores que influyen en los resultados de las pruebas SABER 11 en
estudiantes de Instituciones públicas y privadas de Colombia.

Para calcular el rango

Para el cálculo de rango es el Vmax –Vmin.

Rg=56−0=56

Para calcular la varianza formula

s2=∑ ¿ ¿¿ ¿

Para calcular la desviación típica la fórmula:


2
s= √ s2

Los datos están un disperso,

S
Para calcular coeficiente de variación es cv = ∗100 %

es:

desviacion estandar
C . V .= ∗100 %
media
10.81
C.V= ∗100 %
10.91

C . V =0.99083%

desviación típica

que tan alejados están los datos de la media

Actividad 3. Medidas Univariantes -variable Continua

a. Tabla de frecuencia datos agrupados. Cada estudiante deberá elegir una


variable cuantitativa continua y diseñar una tabla de frecuencia para datos
agrupados identificando rango, número de intervalos, amplitud y a partir de ella
elaborar un histograma de frecuencias y un polígono de frecuencias. Finalmente,
interpretar los resultados y asociarlos con la problemática: Identificación de los
principales factores que influyen en los resultados de las pruebas SABER 11
en estudiantes de Instituciones públicas y privadas de Colombia.
Rango:

Rg=lim .. −lim . min .

Rg=1.50−1.17

RG=0.33

Número de intervalos:

Para calcular el número de intervalos utilizamos la regla de STURGES formula.

c=1+3.322∗log N

c=1+3.322∗log 220

C=8.78 aproximado a 9

Amplitud:

Rg
A=
C

0.33
A=
9

A=0.036
Elaborar un histograma de frecuencias y un polígono de frecuencias:

Tenemos una tabla de 220 datos para calcular el número de intervalo se realiza con la
regla de STURGES, calculamos los inérvalos a utilizar y lo asociándolo a la
problemática.

En la frecuencia absoluta miramos la clase 1, la frecuencia que los estudiantes leen, en


este caso hay 38 estudiantes que leen entre un rango comprendido de tiempo, de 50
segundos a 83 segundos.
Revisando en la clase 6 de la frecuencia absoluta acumulada encontramos que 175
estudiantes tienen un promedio de lectura de un tiempo comprendido de 50 segundos a
2 minutos con 50 segundos el 60% de estudiantes se comprende de este rango.

b. Medidas de tendencias central y de Posición. Para la variable cuantitativa continúa


elegida, cada estudiante deberá calcular las medidas de tendencia central (media,
mediana, moda), medidas de posición: cuartiles, Decil 5 y percentil 50, determinar el
tipo de asimetría y curtosis e interpretar los resultados y asociarlos con la problemática:
Identificación de los principales factores que influyen en los resultados de las
pruebas SABER 11 en estudiantes de Instituciones públicas y privadas de
Colombia.

las medidas de tendencia central:


media:

x́=
∑f .x
n

mc fa fa*mc
0.67 38.00 25.46
1.00 4.00 4
1.33 75.00 99.75
1.67 0.00 0
2.00 0.00 0
2.33 58.00 135.14
2.67 0.00 0
3.00 0.00 0
3.33 45.00 149.85
TOTAL 414.2

414.2
x́= =1.9
220
Mediana:
N
−f K−1
2
Me= ∗A K +l K
FK

110−42
Me= ∗0.036+ 1.17
75
Me=1.20264

mediana 1.20264
n/2 110
F K −1 42.00
fk 75.00
Ak 0.036
LK 1.17

moda:

F k−1
mo= ∗A k + Lk
f k−1+ f k +1

4
mo= ∗0.036 +1.17
4+58

mo=1.172

moda 1.172
fk 75.00
f k−1 4.00
f k+1 58.00
LK 1.17
AK 0.036
Cuartiles 1:

Q1∗N 1∗220
= =55
4 4

Cuartiles 2:

Q2∗N 2∗220
= =110
4 4

Cuartiles 3:

Q3∗N 3∗220
= =165
4 4

TBLA DE CUATILES

cuartil posición valor


Q1 55 1.5
Q2 110 1.5
Q3 165 2.5

Decil:

D1∗N 1∗220
= =22
10 10

D5∗N 5∗220
= =110
10 10

D 9∗N 9∗220
= =198
10 10
TABL DE DECILES

Decil Posición valor


D1 22 0.5
D2 44 1.5
D3 66 1.5
D4 88 1.5
D5 110 1.5
D6 132 2.5
D7 154 2.5
D8 176 3.5
D9 198 3.5

Percentil:

P 10∗N 10∗220
= =22
100 100

P 50∗N 50∗220
= =110
100 100

P 90∗N 90∗220
= =198
100 100

TABLA DE PERCENTILES

percentil posición valor


P10 22 0.5
P20 44 1.5
P30 66 1.5
P40 88 1.5
P50 110 1.5
P60 132 2.5
P70 154 2.5
P80 176 3.5
P90 198 3.5
P100 220 3.5

ASIMETRÍA:

CURTOSIS:
c. Medidas de Dispersión. Para la variable cuantitativa continúa
elegida calcular: Rango, varianza, desviación típica, coeficiente de
variación, posteriormente interpretar los resultados y asociarlos con
la problemática: Identificación de los principales factores que
influyen en los resultados de las pruebas SABER 11 en
estudiantes de Instituciones públicas y privadas de Colombia.

Rango:

Rg=lim . super .−lim . inf .

Rg=3.50−0.50

Rg=3.00

Varianza:

desviación típica:

coeficiente de variación:

Referencia bibliográfica
Daniel Chica Medrano 20 /03/2020Medidas de localización: Cuartiles, Deciles,
Percentiles en excel
https://www.youtube.com/watch?v=ydB1DsxQhRs

Milton Fernando Pava Jun/ 2009 Blog Estadística Descriptiva

https://www.blogger.com/profile/08170245791255648434

También podría gustarte