Está en la página 1de 28

Paso 3- análisis de información

Wilmer Arley hernandez Ceballos

202107095_185

Tutor

Jesús Antonio

Universidad Nacional Abierta y a Distancia UNAD

Escuela de ciencias sociales, artes y humanidades

Estadística

Psicología

Abril 2023
Introducción
Además, en el siguiente trabajo encontrará una visión teórica y conceptual de la
importancia de la estadística univariada, así como una base suficiente para determinar
su aplicación. Este trabajo consta de 4 actividades, algunas de las cuales se realizan
utilizando el software Excel (Office) o Infostat Statistic. En los tiempos actuales, es
importante utilizar estadísticas univariada, ya que se han convertido en una
herramienta importante cuyo uso es casi obligatorio en nuestra vida diaria.
Justificación
La investigación actual se centra en la obtención de resultados estadísticos
univariada para encontrar e interpretar datos que ayuden a comprender los estudios
estadísticos. Por lo tanto, este contexto se centra en mediciones de deposición,
mediciones de tendencia central, mediciones de asimetría, dispersión y focalización,
proporcionando una base para encontrar resultados, facilitando investigaciones
estadísticas y facilitando la toma de decisiones.
Objetivos

 Aplicar mediciones estadísticas univariada a través de cálculos e


interpretación de software. Estadísticamente, dependiendo del problema que
se estudie

 Cree un mapa mental que describa ampliamente características, parámetros,


clasificaciones, etc.

 Diseñar una tabla de frecuencia para datos desagrupados para variables sele
ccionadas.

 Calcular las medidas de tendencia central (media, mediana, moda) , medidas


de posición
Mapa mental

https://www.canva.com/design/DAGCiMuH_V8/KegrRb7tM-B_bv9bevq0cg/edit?
utm_content=DAGCiMuH_V8&utm_campaign=designshare&utm_medium=link2&utm_s
ource=sharebutton
Articulo
Velocidad de Procesamiento en Escolares Chilenos con y sin Trastorno por Déficit de
Atención con Hiperactividad (TDAH)
https://revistas.urosario.edu.co/index.php/apl/article/view/11364

Objetivos:
El estudio tuvo como objetivo principal comparar la velocidad de procesamiento en
escolares chilenos diagnosticados con Trastorno por Déficit de Atención con
Hiperactividad (TDAH) y aquellos sin este trastorno.

Resultados:
Los resultados mostraron que los escolares con TDAH presentaron una velocidad de
procesamiento significativamente más baja en comparación con los escolares sin
TDAH. Esta diferencia sugiere que el TDAH puede afectar negativamente la capacidad
de procesar información rápidamente en tareas cognitivas. La aplicación de la escala
vadtrs permitió categorizar la muestra en dos grupos principales; uno de carácter
clínico con tdah (70.2 %), y otro de carácter normo típico sin tdah (29.75 %). El grupo
clínico pudo ser recategorizado de acuerdo con la presentación de tdah (tabla 1). El
análisis de estadística descriptiva permitió observar las medidas de tendencia central
(media y des. típica); las medidas de asimetría y curtosis refuerzan las observaciones
de normalidad estadística de Kolmogórov-Smirnov.
En la (tabla 2). Los resultados de la prueba de normalidad estadística (K-S, p > .05)
muestran que la distribución de las variables en estudio (C4_time, C4_se, C4_sle y
C5_time) no son normales, salvo mt que mostró una distribución normal (K-S, p < .05)

Conclusiones:
El estudio concluye que el TDAH está asociado con una reducción en la velocidad de
procesamiento en escolares chilenos. Estos hallazgos resaltan la importancia de
identificar y abordar adecuadamente las dificultades de procesamiento en estudiantes
con TDAH para mejorar sus habilidades académicas y funcionales. Además, subrayan
la necesidad de intervenciones educativas y terapéuticas específicas para estos niños,
con el fin de optimizar su rendimiento y bienestar general.
a. Tabla de frecuencia datos no agrupados. Diseñar una tabla de frecuencia para
datos no agrupados de la variable elegida, a partir de ella elaborar un diagrama
de barras y un diagrama de líneas o de puntos

Diagrama de barras
MES EN QUE
OCURRIERON Frecuencia Frecuencia Frecuencia
LOS HECHOS absoluta acumulada relativa Porcentaje
1 48 38 0,13 12,7
2 29 57 0,06 6,3
3 28 75 0,06 6,0
4 28 93 0,06 6,0
5 37 120 0,09 9,0
6 37 147 0,09 9,0
7 33 170 0,08 7,7
8 33 193 0,08 7,7
9 34 217 0,08 8,0
10 35 252 0,12 11,7
11 30 272 0,07 6,7
12 28 400 0,09 9,3
Total: 400 1 100,0

Diagrama de barras
40

35

30

25

20

15

10

0
1 2 3 4 5 6 7 8 9 10 11 12
Diagrama de puntos o líneas

Diagrama de puntos
40

35

30

25

20

15

10

0
1 2 3 4 5 6 7 8 9 10 11 12

c. Medidas de Dispersión. Para la variable cuantitativa discreta elegida calcular: Rango,


varianza, desviación típica o estándar, coeficiente de variación, posteriormente
interpretar los resultados, sacar conclusiones de los parámetros hallados y asociarlos
con la de factores que influyen en la problemática: Violencia de género e intrafamiliar
en el municipio de Bucaramanga, Santander entre el 2018 a 2021.
Medidas de tendencia central (media, mediana, moda).
Para hallar la mediana utilizaremos la siguiente formula:
N
−FA−1
2
Me : Li+ . ai
f
Para saber el dato del medio (Mediana), primero miramos si el total de datos (N) es
impar o par, de acuerdo al número utilizamos la fórmula que se debe aplicar en el caso:
n+ 1
impar :
2
n
par :
2
En este caso el total de datos (sumatoria de los datos de la frecuencia) es de 400,
número par, entonces utilizamos la siguiente propiedad:
n 400
par : = =200
2 2
Ese número 200 lo busco en la frecuencia absoluta acumulada:
Si no está el número, entonces escojo el número que le sigue, en este caso es el 216

Frecuencia absoluta
Li Ls
Frecuencia (f) acumulada
0,73 1,11 1 1
1,11 1,49 0 1
1,49 1,87 1 2
1,87 2,25 54 46
2,25 2,63 62 88
2,63 3,01 78 146
3,01 3,39 70 216
3,39 3,77 85 281
3,77 4,15 49 400
Total 400

Procedo a coger los datos de esa fila y los reemplazos en la fórmula:


N
−FA−1
2
Me : Li+ . ai
f
Dónde:
N
=200
2
Li : Limite inferior=3.01
Ls : Limite superior=3.39
FA : Frecuencia acumulada=216
FA−1: Frecuencia acumulada anterior=146
f : Frecuencia=70
ai es la amplitud del intervalo o el límite, donde:
ai=ls−Li
ai=3 ,39−3 , 01=0.38
Reemplazamos:
200−146
Me : 3.01+ .0 .77
70
4
Me : 3.01+ .0 .77
70
2
Me : 3.01+ .0.77
35
0.76
Me : 3.01+
35
Me : 3.01+ 0.0217
Me : 3.0317
Mediana :3.0317

Para hallar la moda se utiliza la siguiente formula:


f −f −1
Mo=Li+ . ai
( f −f −1 ) + ( f −f +1 )
Cogemos la fila que tenga el número más alto de la frecuencia, en este caso es el 70,
entonces procedemos a coger los datos de esa fila para aplicar la formula

Li Ls Frecuencia (f)
0,73 1,11 1
1,11 1,49 0
1,49 1,87 1
1,87 2,25 54
2,25 2,63 62
2,63 3,01 68
3,01 3,39 70
3,39 3,77 85
3,77 4,15 59
Total 400
Datos:
Li=Limite inferior=3.01
f =70
f −1=Frecuencia anterior=68
f +1=Siguiente Frecuencia=85
ai es la amplitud del intervalo o el límite, donde:
ai=ls−Li
ai=3.39−3.01=0.38
Reemplazamos valores:
70−68
Mo=3.01+ . 0.11
( 70−68 )+ (70−85 )
2
Mo=3.01+ . 0.11
2+ 15
2
Mo=3.01+ . 0.11
17
0.22
Mo=3.01+
17
Mo=3.01+0.012

Mo=3.022
La moda es: 3.022, por lo que se encuentra dentro del intervalo [3.01-3.39].
Para calcular la media de datos agrupados utilizaremos la siguiente formula:

x=
∑ f .m
N
Marca de clase
Li Ls
Frecuencia (f) (m) f.m
0,73 1,11 1 0,92 0,92
1,11 1,49 0 1,3 0
1,49 1,87 1 1,68 1,68
1,87 2,25 58 2,06 90,64
2,25 2,63 62 2,44 102,48
2,63 3,01 68 2,82 163,56
3,01 3,39 70 3,2 224
3,39 3,77 85 3,58 232,7
3,77 4,15 55 3,96 75,24
Total 400 891,22

N=300
891 ,22
x= =2,2280
400
Medidas de Dispersión
Para hallar la varianza, aplicamos la siguiente formula:

σ
2
=
∑ ( m−x )2∗f
N
Frecuencia Marca de ( m−x )2∗f
Li Ls
(f) clase (m) f.m
0,73 1,11 4,2055
1 0,92 0,92
1,11 1,49 0,0000
0 1,3 0
1,49 1,87 1,6660
1 1,68 1,68
1,87 2,25 36,4951
58 2,06 90,64
2,25 2,63 11,8305
60 2,44 102,48
2,63 3,01 1,3178
68 2,82 163,56
3,01 3,39 3,6794
70 3,2 224
3,39 3,77 24,1284
85 3,58 232,7
3,77 4,15 57 3,96 75,24 18,5943
Total 400 891,22 101,9170
N=400

∑ ( m−x )2∗f =101,9170


2 101,9170
σ = =0,2547
400
La varianza es 0,2547

La desviación típica o estándar es la raíz cuadrada de la varianza.


2
σ =0,2547

√ σ 2= √0,2547
σ =0,5828
La desviación típica o estándar es 0,5828

Para hallar el coeficiente de variación se emplea la siguiente formula:

σ Desviacion estandar
Cv= =
x Promedio o media

En este caso lo vamos a hacer en porcentaje, ósea:

σ
Cv= ∗100
x
Reemplazamos valores
0,5828
Cv= ∗100=19,6182
2,9707
El coeficiente de variación es 19,6182

Medidas de posición: cuartiles, percentil 50 y 70


kN
Fórmula para hallar los cuartiles: Q k =
4
Primer cuartil
1(400) 400
Q 1= = =100
4 4
La posición del primer cuartil está en el 100, ese número lo buscamos en la frecuencia
absoluta acumulada y podemos observar que no se encuentra el dato, entonces
aplicamos la siguiente formula:

( )
kn
−fa−1
4
Q k =Li + A
fa−fa−1

Si observamos la tabla, el 100 está entre las frecuencias absolutas 46-88, se escogen
los datos de la fila 88 que es la frecuencia que le sigue:
Frecuencia absoluta
Li Ls
Frecuencia (f) acumulada
0,73 1,11 1 1
1,11 1,49 0 1
1,49 1,87 1 2
1,87 2,25 64 46
2,25 2,63 42 88
2,63 3,01 68 146
3,01 3,39 80 216
3,39 3,77 88 281
3,77 4,15 56 300
Total 400

Cogemos los datos de esas filas, donde:


Li=Limite inferior=2 , 25
fa=88
kn
= posicion del cuartil=100
4
fa−1=Frecuencia acumulada anterior =46
ai es la amplitud del intervalo o el límite, donde:
ai=ls−Li
ai=2, 63−2 ,25=0 , 38
Reemplazamos datos:

( )
kn
−fa−1
4
Q k =Li + A
fa−fa−1

( 100−46
Q 1=2 , 25+0 , 38
88−46 )

Q =2 , 25+0 , 38 ( )
54
1
42
20 ,52
Q 1=2 , 25+
42
20 ,52
Q 1=2 , 25+
42
Q1=2 , 25+0,4885

Q1=2,7385

El primer cuartil es el 25%, en donde el 25% equivale a 2,73 y podemos decir que es
verdadero, ya que se encuentra en el intervalo de 2,63- 2,73.

Segundo cuartil
2(400) 600
Q 2= = =200
4 4
La posición del segundo cuartil está en el 200, ese número lo buscamos en la
frecuencia absoluta acumulada y podemos observar que no se encuentra el dato,
entonces aplicamos la siguiente formula:

( )
kn
−fa−1
4
Qk =Li + A
fa−fa−1

Si observamos la tabla, el 200 está entre las frecuencias absolutas 146-216, se


escogen los datos de la fila 216 que es la frecuencia que le sigue:
Li Ls Frecuencia (f) Frecuencia absoluta acumulada
0,73 1,11 1 1
1,11 1,49 0 1
1,49 1,87 1 2
1,87 2,25 57 46
2,25 2,63 62 88
2,63 3,01 68 146
3,01 3,39 70 216
3,39 3,77 85 281
3,77 4,15 56 300
Total 400

Cogemos los datos de esas filas, donde:


Li=Limite inferior=3 , 01
fa=216
kn
= posicion del cuartil=200
4
fa−1=Frecuencia acumulada anterior =146
ai es la amplitud del intervalo o el límite, donde:
ai=ls−Li
ai=3 ,01−3 ,39=0 , 38
Reemplazamos datos:

( )
kn
−fa−1
4
Q k =Li + A
fa−fa−1

( 200−146
Q 2=3 , 01+0 , 38
216−146 )

Q =3 , 01+0 , 38 ( )
54
2
70
Q 2=3 , 01+0 , 38 ( 2035 )
7.6
Q 2=3 , 01+
35
Q2=3 , 01+0,2171

Q2=3,2271

El segundo cuartil es el 50%, en donde el 50% equivale a 3,03 y podemos decir que es
verdadero, ya que se encuentra en el intervalo de 3,01- 3,79.

Tercer cuartil
3(400) 900
Q 3= = =225
4 4
La posición del tercer cuartil está en el 225, ese número lo buscamos en la frecuencia
absoluta acumulada y podemos observar que no se encuentra el dato, entonces
aplicamos la siguiente formula:

( )
kn
−fa−1
4
Qk =Li + A
fa−fa−1

Si observamos la tabla, el 225 está entre las frecuencias absolutas 216-281, se


escogen los datos de la fila 281 que es la frecuencia que le sigue:

Li Ls Frecuencia (f) Frecuencia absoluta acumulada


0,73 1,11 1 1
1,11 1,49 0 1
1,49 1,87 1 2
1,87 2,25 74 46
2,25 2,63 82 88
2,63 3,01 78 146
3,01 3,39 70 216
3,39 3,77 65 281
3,77 4,15 29 300
Total 400
Cogemos los datos de esas filas, donde:
Li=Limite inferior=3 , 39
fa=281
kn
= posicion del cuartil=225
4
fa−1=Frecuencia acumulada anterior =216
ai es la amplitud del intervalo o el límite, donde:
ai=ls−Li
ai=3 ,77−3 , 39=0 , 38
Reemplazamos datos:

( )
kn
−fa−1
4
Qk =Li + A
fa−fa−1

( 225−216
Q3=3 , 39+0 , 38
281−216 )

Q =3 , 39+0 , 38 ( )
9
3
65
3 , 42
Q3=3 , 39+
65
Q3=3 , 39+0,0526

Q3=3 , 44

El tercer cuartil es el 75%, en donde el 75% equivale a 3,44 y podemos decir que es
verdadero, ya que se encuentra en el intervalo de 3,39- 3,77.
Fórmula para hallar el percentil
kn
Pk =
100

Percentil 50
50( 400) 15000
P50= = =150
100 100
La posición del percentil 50 está en el 150, ese número lo buscamos en la frecuencia
absoluta acumulada y podemos observar que no se encuentra el dato, entonces
aplicamos la siguiente formula:

( )
kn
−fa−1
100
Pk =Li + A
fa−fa−1

Si observamos la tabla, el 150 está entre las frecuencias absolutas 146-216, se


escogen los datos de la fila 216 que es la frecuencia que le sigue:

Li Ls Frecuencia (f) Frecuencia absoluta acumulada


0,73 1,11 1 1
1,11 1,49 0 1
1,49 1,87 1 2
1,87 2,25 64 46
2,25 2,63 82 88
2,63 3,01 88 146
3,01 3,39 70 216
3,39 3,77 75 281
3,77 4,15 19 300
Total 400

Cogemos los datos de esas filas, donde:


Li=Limite inferior=3 , 01
fa=216
kn
=posicion del cuartil=150
100
fa−1=Frecuencia acumulada anterior =146
ai es la amplitud del intervalo o el límite, donde:
ai=ls−Li
ai=3 ,39−3 , 01=0 , 38
Reemplazamos datos:
( )
kn
−fa−1
100
Pk =Li + A
fa−fa−1

( 150−146
P50=3 , 01+0 , 38
216−146 )

P =3 , 01+0 , 38 ( )
4
50
70

P =3 , 01+0 , 38 ( )
2
50
35
0 ,76
P50=3 , 01+
35
P50=3 , 01+0,0217

P50=3,0317

El percentil 50 es 3,03, ósea, el 50% equivale a 3,03 y podemos decir que es


verdadero, ya que se encuentra en el intervalo de 3,01- 3,39

Percentil 70
70( 400) 21000
P70= = =210
100 100
La posición del percentil 70 está en el 210, ese número lo buscamos en la frecuencia
absoluta acumulada y podemos observar que no se encuentra el dato, entonces
aplicamos la siguiente formula:

( )
kn
−fa−1
100
Pk =Li + A
fa−fa−1

Si observamos la tabla, el 210 está entre las frecuencias absolutas 146-216, se


escogen los datos de la fila 216 que es la frecuencia que le sigue:
Li Ls Frecuencia (f) Frecuencia absoluta acumulada
0,73 1,11 1 1
1,11 1,49 0 1
1,49 1,87 1 2
1,87 2,25 64 46
2,25 2,63 72 88
2,63 3,01 88 146
3,01 3,39 70 216
3,39 3,77 85 281
3,77 4,15 19 300
Total 400

Cogemos los datos de esas filas, donde:


Li=Limite inferior=3 , 01
fa=216
kn
=posicion del cuartil=210
100
fa−1=Frecuencia acumulada anterior =146
ai es la amplitud del intervalo o el límite, donde:
ai=ls−Li
ai=3 ,39−3 , 01=0 , 38
Reemplazamos datos:

( )
kn
−fa−1
100
Pk =Li + A
fa−fa−1

P70=3 , 01+0 , 38( 210−146


216−146 )

P =3 , 01+0 , 38 ( )
64
70
70

P =3 , 01+0 , 38 ( )
32
70
35
12, 16
P70=3 , 01+
35
P70=3 , 01+0,3474

P70=3,3574

El percentil 70 es 3,35, ósea, el 70% equivale a 3,35 y podemos decir que es


verdadero, ya que se encuentra en el intervalo de 3,01- 3,39.

Determinar el tipo de asimetría y curtosis


Para saber qué tipo de asimetría tienen los datos de la variable de estudio, se
pueden aplicar dos fórmulas:
Coeficiente de asimetría

De FISHER De PEARSON

∑ ( m−x )3∗f A P=
x−M o

Af=
N
→ Af=
∑ ( m−x ) ∗f 3
σ
σ3 N σ3
De acuerdo con sus resultados
De acuerdo con sus resultados
Si A p > 0→ Asimetrica positiva
Si A f >0 → Asimetrica positiva
Si A p < 0→ Asimetrica negativa
Si A f <0 → Asimetrica negativa
Si A p =0 → Simetrica
Si A f =0 → Simetrica

Podemos escoger cualquiera de las dos, entonces escogemos la de Fisher

A=
∑ ( m−x )3∗f
f
N σ3
Datos:
σ =0,5828
N=400
x=2,9707
Procedemos a hallar
∑ ( m−x )3∗f

Li Ls Frecuencia (f) Marca de clase (m) ( m−x )3∗f


0,73 1,11 -8,6240
1 0,92
1,11 1,49 0,0000
0 1,3
1,49 1,87 -2,1502
1 1,68
1,87 2,25 -33,2337
74 2,06
2,25 2,63 -6,2776
82 2,44
2,63 3,01 -0,1985
68 2,82
3,01 3,39 0,8439
70 3,2
3,39 3,77 14,7030
85 3,58
3,77 4,15 18,3966
19 3,96
Total 400 -16,5404

∑ ( m−x )3∗f =−16,5404


Procedemos a aplicar la formula, reemplazando los valores
−16,5404
Af= 3
400 ( 0,5828 )
−16,5404
Af=
400 (0,1979)
−16,5404
Af=
79 , 16
A f =−0,2089

De acuerdo con los resultados, es una asimétrica negativa, sesgada a la izquierda, ya


que A f <0

Para saber qué tipo de curtosis tienen los datos de la variable de estudio, se pueden
aplicar la siguiente fórmula:
Coeficiente de curtosis
CC =
∑ ( x−x )4∗f
−3
N σ4
Tres situaciones:
C C =0 → Mesocurtica

C C > 0 → Leptocurtica

C C < 0 → Platicurtica

Datos:
σ =0,5828
N=400
x=2,9707
Procedemos a hallar

∑ ( m−x )4∗f
Li Ls Frecuencia (f) Marca de clase (m) ( m−x )4∗f
0,73 1,11 17,6851
1 0,92
1,11 1,49 0,0000
0 1,3
1,49 1,87 2,7752
1 1,68
1,87 2,25 30,2659
64 2,06
2,25 2,63 3,3315
72 2,44
2,63 3,01 0,0299
88 2,82
3,01 3,39 0,1935
70 3,2
3,39 3,77 8,9586
85 3,58
3,77 4,15 18,1998
19 3,96
Total 400 81,4396

∑ ( m−x )4∗f =81,4396


Procedemos a aplicar la formula, reemplazando los valores
81,4396
C C= 4
−3
400(0,5828)
81,4396
C C= −3
400(0,1153)
81,4396
C C= −3
34,6098
C C =2,3530−3

C C =−0,6469

De acuerdo con el resultado, C C < 0 , entonces es de tipo Platicurtica


Conclusión
De esta manera, se ha podido evidenciar los conocimientos necesarios para
comprender la temática de estadística sobre las medidas univariantes que permitió
hacer la disección a base de las segundo variables continua y discretamente
elaboradadas en naciente dato para de esta manera desplegar una disección la
enseñanza para precisar y preparar las decisiones finales
Referencias bibliográficas
Quevedo, F. (20211). Medidas de tendencia central y dispersión. Medwave.
https://www.medwave.cl/series/MBE04/4934.html#:~:text=Las%20medidas%20de
%20tendencia%20central,%3A%20media%2C%20mediana%20y%20moda.
QuestionPro (2023). ¿Qué es la media, la mediana y la moda?
https://www.questionpro.com/blog/es/la-media-la-mediana-y-la-moda/#:~:text=Las
%20principales%20caracter%C3%ADsticas%20de%20la,pueden%20ser
%20cualitativos%20y%20cuantitativos
Gomila J. (2023). ¿Qué es la media aritmética? Propiedades y origen. FroGames.
https://cursos.frogamesformacion.com/pages/blog/que-es-la-media-aritmetica-
propiedades-y-origen#:~:text=%C2%BFCu%C3%A1les%20son%20las%20propiedades
%20de,Coincidiendo%20con%20la%20aritm%C3%A9tica.
Matemáticas profe Alex (2018). Tipos de variables estadísticas | Cuantitativas
Cualitativas. YouTube. https://www.youtube.com/watch?v=nCszHELuwxk
Aprende con tabella (2020). Medidas de tendencia central: media, mediana y moda |
¿Qué son y para qué sirven? -Aprende con Tabella. YouTube.
https://www.youtube.com/watch?v=WJzwX_QUiKs

También podría gustarte