Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Indagacion Social de Los Estudiantes PDF
Indagacion Social de Los Estudiantes PDF
2020
2
2020
3
Tabla de contenido
Introducción .................................................................................................................................... 4
1. Análisis de Variable Cualitativa ............................................................................................. 5
2. Análisis Estadístico Descriptivo para datos no agrupados ..................................................... 6
2.1 Tabla de datos no agrupados ................................................................................................. 6
2.2 Medidas de Tendencia Central.............................................................................................. 7
2.2.1 Media Aritmética ........................................................................................................... 8
2.2.2 Media (Me) .................................................................................................................... 8
2.2.3 Moda (Mo) ..................................................................................................................... 9
2.3 Comparación de las medidas de tendencia central para datos no agrupados ........................ 9
2.4 Medidas de Localización para datos no agrupados ........................................................ 10
2.4.1 Cuartiles (Q)................................................................................................................. 11
2.4.2 Deciles (D) ................................................................................................................... 12
2.4.3 Percentiles (P) .............................................................................................................. 12
2.5 Medidas de Dispersión ........................................................................................................ 13
2.5.1 Varianza Muestral (𝑆2)................................................................................................ 13
3.2 Tabla Distribución de Frecuencia para datos agrupados ........................................................ 15
3.3 Medidas de Tendencia Central para datos agrupados ............................................................. 17
3.3.1 Media Aritmética (Promedio) muestral ........................................................................... 17
3.3.2 Mediana (Me)................................................................................................................... 17
3.3.3 Moda (Mo) ....................................................................................................................... 17
3.4 Medias de Localización para Datos Agrupados.................................................................. 18
3.4.2 Deciles (D) ................................................................................................................... 19
3.4.3 Percentiles (P) .............................................................................................................. 19
3.5 Medidas de Dispersión para datos agrupados ......................................................................... 20
4. Conclusiones ......................................................................................................................... 22
Referencias .................................................................................................................................... 24
4
Introducción
descriptiva está relacionada con el arreglo, el resumen y la presentación de datos, de tal manera
que la información sea extraída y extendida con facilidad. Así mismo, se discuten las medidas de
tendencia central como media, mediana y moda. Las medidas de localización como cuartiles,
deciles y percentiles. Las medidas de dispersión como varianza y desviación típica. Igualmente se
aprende a interpretar la variable cualitativa con su diagrama circular. Se interpretan las tablas de
frecuencia de los datos no agrupados y datos agrupados con sus respectivas gráficas (Urias &
Salvador, 2014)
Descriptiva, partiendo de datos primarios que se obtuvieron a través de una encuesta desarrollada
Probabilidad del programa de Ingeniería Civil durante el II semestre del año 2020.
dispersión junto a los gráficos correspondientes que deben ser específicos hacia las variables con
su respectiva interpretación.
5
12; 24%
Femenino
La figura 1 muestra que de los 50 datos obtenidos en la encuesta el 76% de los estudiantes
Ingeniería Industrial y Tecnología en Obras Civiles hay mayoría de estudiantes género masculino.
6
decir, tenemos menos de 20 elementos en la muestra, entonces estos datos son analizados sin
necesidad de formar clases con ellos y a esto es a lo que se le llama tratamiento de datos no
investigador (estadístico) tomó la decisión de sacar una muestra con 𝑛 < 𝑁 con 𝑛 ≤ 50 “𝑚𝑒𝑛𝑜𝑠”,
siendo 𝑛 = 20 estudiantes.
Para ofrecer una mejor presentación a los datos que representan la variable cuantitativa
La tabla 1 nos presenta la cantidad de estudiantes con edades de 18, 19, 20, 21 y 22;
presentando mayor cantidad de estudiantes (8) con edad de 19 años y 3 un estudiante de 22 años.
7
8
7
Número de estudiantes
6
5
4
3
2
1
0
18 19 20 22
Edad
Las medidas de tendencia central, son medidas que nos permiten conocer las características
de un conjunto de datos porque miden, de diferentes formas, hacia qué valor tiende (se acerca) el
Media (Promedio). Se suman todos los datos y se dividen entre el número de datos.
Mediana. Se ORDENAN todos los datos de forma ascendente y se encuentra el dato central, que
Es la medida más utilizada, la más conocida, la más fácil de calcular. Sus fórmulas admiten
tratamiento algebraico (Fernández, Sánchez, Córdoba, & Largo, 2002). Por tal razón es
considerada como la más importante dentro de los promedios, a pesar de ser demasiado sensible a
empleando una rayita sobre la letra que indica la variable o, con minúscula para indicar el
Se obtiene dividiendo la suma de todos los valores que toma la variable, por el número de
observaciones:
∑ 𝑥𝑖
• Poblacional: 𝜇 = = 19,33≈ 19 “Parámetro”
𝑁
∑ 𝑥𝑖
• Muestral 𝑥̅ = = 19,59≈ 19 “Estimador”
𝑛
muestral a valores enteros, garantizando que los resultados sean homogéneos siendo
Santander.
También conocida como media posicional, por ocupar el centro de los datos. Más
formalmente, se puede definir como el lugar del valor central de una sucesión. La divide en un
9
número igual de valores anteriores y sucesores. Los datos deben estar ordenados ya sea de forma
(𝑛+1)
La posición de la mediana se calcula mediante la fórmula: 𝑀𝑒 = =10,5 Como se
2
menos (hasta 17 años) y el otro 50% supera esta edad con una edad máxima de 26 años”
Puede haber más de un dato que corresponda a la moda. Si son dos datos, se considera una
distribución bimodal. Si son más, multimodal. Sirve para un objetivo distinto que las otras dos
medidas, pues para ciertos objetivos puede ser más interesante saber qué dato se repite más que
cuál es el promedio de los datos. Y si la moda es muy diferente a la media, se puede considerar
Para nuestro estudio 𝑀𝑜 = 19 años Esta información se toma de la tabla 1, siendo la mayor
▪ Las distribuciones simétricas tienen el mismo valor para la media, la mediana y la moda.
En una distribución con sesgo positivo, la moda se halla en el punto más alto de la
▪ En una distribución con sesgo negativo, la moda es el punto más alto, la mediana está a la
izquierda de la moda y la media está a la izquierda de la mediana. Es decir, 𝑥̅ < Me < Mo.
▪ Cuando la población tiene una distribución sesgada, con frecuencia la mediana resulta ser
la mejor medida de posición, debido a que está siempre entre la media y la moda. La
Por lo tanto, el análisis de la variable Edad de los estudiantes tiene una distribución
simétrica por ser equivalente Mo = Me = 𝑥̅ y podemos argumentar que los datos están normalmente
distribuidos.
Medida de localización que divide la población o muestra en cuatro partes iguales y su gráfica se
representa por el Diagrama de Cajas (o bigote). Se calcula la posición del cuartil mediante la
𝑘∗𝑛
ecuación 𝑄𝑘 = .
4
años. Esto quiere decir que el 25% de los estudiantes tienen la edad de 19 años o menos (hasta
17).
años. Esto quiere decir, que el 50% de los estudiantes tienen la edad de 19 años o menos (hasta
• Q3= Valor de la variable que deja a la izquierda el 75% de la distribución. 𝑄3 = 20 años. Esto
quiere decir, que el 75% de los estudiantes tienen edad de 20 años o menos (hasta 17) y el otro
representado por cuatro estudiantes de ingeniería; es decir se aleja del valor promedio. Además, se
mucho sentido calcularlas para variables cualitativas discretas. Por lo que lo vamos a ver sólo
para las variables cuantitativa discreta (Edad) o variables cuantitativas continuas. Se calcula
𝑘∗𝑛
mediante la fórmula que ubica la posición de los deciles 𝑄𝑘 = . A modo de ejemplo solo se
10
interpretará el 𝐷2 y 𝐷5 . Luego
Medida de localización que divide la población o muestra en 100 partes iguales. No tiene
mucho sentido calcularlas para variables cualitativas discretas. Por lo que lo vamos a ver sólo para
las variables cuantitativa discreta (Edad) o variables cuantitativas continuas, se calcula posición
𝑘∗𝑛
de los percentiles mediante la fórmula 𝑄𝑘 = 100. A modo de ejemplo se calculará el 𝑃50 y 𝑃70 .
Luego:
• 𝑃70 = 20 𝑎ñ𝑜𝑠. El 70% de los estudiantes tienen 20 años o menos (hasta 17 años)
Representan los conceptos de la varianza y la desviación típica que pueden ser calculadas
Es una medida estadística que mide la dispersión de los valores respecto a un valor central
(promedio o media), es decir, es el cuadrado de las desviaciones. Por lo tanto, este concepto no
tiene interpretación.
∑𝑛
𝑖=1(𝑥1 −𝑥̅ )
2
Se calcula de la forma: 𝑆 2 = = 1,8947 𝑒𝑑𝑎𝑑𝑒𝑠 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑎𝑠. Este resultado es
𝑛−1
∑ 𝑥𝑖
obtenido al usar el promedio como variable cuantitativa discreta 𝑥̅ = = 19,50≈ 19 años.
𝑛
promedio muestral de los datos. Entre más grande se obtenga este resultado, quiere decir que los
datos están más dispersos o alejados del promedio. Entre más pequeño sea la desviación muestral,
quiere decir que los datos están distribuidos normalmente o no están dispersos. Se calcula:
∑𝑛
𝑖=1(𝑥1 −𝑥̅ )
2
𝑠=√ = 1,376
𝑛−1
Esto quiere decir: −𝑠 ≤ 𝑥̅ ≤ 𝑠 para nuestra variable edad se define como: [−1,376 −
19; 1.376 + 19] = [17,6 ; 20,4] El rango de dispersión se encuentre dentro de las edades mínima
(17 años) y máxima (22 años) se evidencia que los datos no están dispersos; sino normalmente
distribuidos.
14
Los datos agrupados son aquellos que se han clasificado en categorías o clases, tomando
como criterio su frecuencia. Esto se hace con la finalidad de simplificar el manejo de grandes
variables toman un número grande de valores o la variable es continua. Se agrupan los valores en
intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna
PARÁMETROS Valor
El número de intervalos se calcula con
n 30 La regla de Sturges y debe ser valor entero
Vmax 4,22 k= 1+ 3,322log(n)
Vmin 2,91 logaritmo base 10
Rango 1,31
m=# Intervalos 6
Amplitud de clase 0,22
de Ingeniería Civil de la Universidad Francisco de Paula Santander en el segundo semestre del año
2020 y solo dos estudiantes alcanzan el promedio más alto que es de 4,14. El 23% es la
probabilidad de que siete estudiantes tomados al azar de una muestra de 30 obtengan un promedio
académico de 3,47.
16
9 120,00%
8
100,00%
7
6 80,00%
5
60,00%
4
3 40,00%
2
20,00%
1
0 0,00%
2,91 3,13 3,35 3,57 3,78 4,00 4,22
Frecuencia % acumulado
representan la mayor cantidad con un valor promedio académico de 3,78 y la gráfica de ojiva nos
permite analizar que el 80% de los estudiantes tiene notas de promedio ponderado igual o inferior
a 4,0.
10
0
2,70 - 2,91 2,91 - 3,13 3,13 - 3,35 3,35 - 3,57 3,57 - 3,78 3,78 - 4,00 4,00 - 4,22 4,22 - 4,22
se encuentran en la parte central; por lo tanto, se podría afirmar que se comportan los datos como
normalmente distribuidos. El pico más alto del Polígono se representa por los promedios
Las medidas de tendencia central son la Media (promedio), Mediana y Moda de datos
agrupados tienen la misma interpretación que se obtuvo para datos no agrupados pero cambia la
forma de calcularlas.
durante el Segundo Semestre del 2020 tienen un promedio académico igual o inferior a 3,56 y el
otro 50% de los estudiantes supera este promedio hasta el promedio académico más alto obtenido
2
𝑀𝑜 = 3,57 + ∗ 0,22 = 3,63
2+5
18
Interpretación: 3,63 es el promedio académico que más se repite y está representado por
ocho estudiantes matriculados en Probabilidad y Estadística durante el Segundo Semestre del 2020
Las medidas de posición son valores que permiten dividir el conjunto de datos en partes
porcentuales iguales y se usan para clasificar una observación dentro de una población o muestra.
Las medidas de posición más usuales son los cuartiles, los deciles y los percentiles.
del 2020 presentan un promedio académico igual o inferior a 3,3 y el otro 85% de los
de 3,75 igual o inferior y el otro 25% de los estudiantes supera este promedio con un
Santander.
𝑥𝑖 = 𝑒𝑙 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑎𝑐𝑎𝑑é𝑚𝑖𝑐𝑜 𝑝𝑜𝑛𝑑𝑒𝑟𝑎𝑑𝑜 de los estudiantes del segundo semestre del 2020
𝑘𝑛
− 𝐹𝑖−1
𝐷𝑘 = 𝑥𝑖−1 + 10 ∗𝐴
𝑓𝑖
asignatura de Probabilidad y Estadística tienen de promedio académico 3,2 igual o menos y el otro
continua 𝑥𝑖 = 𝑒𝑙 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑎𝑐𝑎𝑑é𝑚𝑖𝑐𝑜 𝑝𝑜𝑛𝑑𝑒𝑟𝑎𝑑𝑜 de los estudiantes del segundo semestre del
𝑘𝑛
− 𝐹𝑖−1
𝑃𝑘 = 𝑥𝑖−1 + 100 ∗𝐴
𝑛𝑖
𝑃15 = 3,4. El 15% de los estudiantes matriculados en el segundo semestre del 2020 en la
asignatura de Probabilidad y Estadística tienen de promedio académico 3,4 igual o menos y el otro
𝑃35 = 3,6. El 35% de los estudiantes matriculados en el segundo semestre del 2020 en la
Las medidas de dispersión, variabilidad o variación nos indican si esos datos están
próximos entre sí o sí están dispersos, es decir, nos indican cuán esparcidos se encuentran.
Las formulas para calcular las medidas de dispersión para datos agrupados son:
21
calcular la raíz de la varianza, se obtiene la desviación estándar muestral que es 𝑠 = 0,30 promedio
[3,24; 3,84]. El intervalo se encuentra dentro de los promedios centrales de los datos agrupados;
esto demuestra que no existe dispersión o sesgo. Por lo tanto, los datos están normalmente
distribuidos.
22
4. Conclusiones
Las estadísticas según lo definido por la Asociación Americana de Estadística (ASA), sigla
en inglés, “es la ciencia de aprender de los datos de medir, controlar y comunicar la incertidumbre
(Wild, Utts, & Horton, 2018), convirtiéndose en una de las asignaturas de estudio más centrales
educación estadística incluyendo estudios de cómo las personas piensan sobre los datos al azar.
2008). Los modos de pensamiento utilizados en las investigaciones estadísticas, difieren de los
utilizados para trabajar con derivaciones matemáticas, que a su vez difieren de los utilizados para
siendo equivalente con los programas de Ingeniería de Sistemas, Ingeniería Industrial, Ingeniería
de Minas, Ingeniería Electrónica y Tecnología en Obras Civiles. Se tomó una muestra de 50 datos
para analizar el género de los estudiantes con un 76% de género masculino representando la mayor
proporción.
Para la variable cuantitativa discreta Edad, se tomó una muestra de 20 estudiantes para
normalmente distribuidos.
23
Distribución de Frecuencia para datos agrupado y poder obtener las medidas de tendencia central
con 𝑥̅ = 3,54; 𝑀𝑒 = 3,56 y la 𝑀𝑜 = 3,63 como la Moda es “mayor” que el promedio y la mediana
se evidencia un pequeño sesgo positivo con leve asimetría a la izquierda como lo muestra el gráfico
comprobar que el intervalo [3,24; 3,84] se encuentra dentro de los promedios centrales de los datos
agrupados; esto demuestra que no existe dispersión o sesgo. Por lo tanto, los datos están
normalmente distribuidos.
24
Referencias
Fernández, S., Sánchez, J., Córdoba, A., & Largo, A. (2002). Estadística Descriptiva. España:
Esic.
Pérez, M. (2013). EStadística Descriptiva. Madrid: Udima.
Urias, H., & Salvador, B. (2014). Estadística para ingeniería y ciencias. México: Grupo Editorial
Patria.
Wild, C., Utts, J., & Horton, N. (2018). What is statistics? En D. M. Ben-Zvi, In International
Handbook of Research in Statistics Education (págs. 5-36). Cham, Zwitzerland: Springer.
Zieffler, A., Gafield, J., Alt, S., Dupuis, D., Holleque, K., & Chang, B. (2008). What does research
suggest about the teaching and learning of introductory statistics at the college level? A
review of the literature. Journal of Statistics Education, 16(2).