Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INFORME ESTADÍSTICO - Variable Valor Matrìcula
INFORME ESTADÍSTICO - Variable Valor Matrìcula
Profesor
Universidad Surcolombiana
Especialización en Estadística
Neiva, Huila
Septiembre, 2023
2
Introducción
matrícula de los estudiantes del programa de medicina”, a partir del análisis exploratorio de
datos. En este sentido, se busca usar los métodos de la estadística descriptiva, como: las
elaboración de un box-plot.
1. Metodología
Teniendo en cuenta la base de datos en Excel suministrada por el profesor del curso de
Para seleccionar los elementos de la muestra, Excel dispone de una gran variedad de
métodos que permite garantizar la aleatoriedad de este proceso. Para el caso puntual de este
Editor, en el cual se realizó una organización de la base de datos suministrada, se filtró según los
fin de asignar un valor aleatorio único entre 0 y 1 a cada elemento de la población seleccionada.
Según la base de datos, el programa de Medicina, sede Neiva, jornada Diurna en el año
2021 registró un total de 737 estudiantes matriculados. A cada registro se le asignó un número
Excel K.ESIMO.MENOR(matriz;k).
seleccionó la columna de números aleatorios únicos asignados a cada registro, y para el valor de
k, se creó una columna con la serie de números enteros entre 1 y 80. De esta manera, la función
llama en su orden al registro cuyo número aleatorio sea el más pequeño, seguido del registro
cuyo número aleatorio sea el segundo más pequeño y así sucesivamente hasta encontrar el
4
registro cuyo número aleatorio sea el ochentavo más pequeño. A continuación, en la Tabla 1 se
Tabla 1.
Selección de la muestra
n=80
1 2785 $ 384.930
2 5000 $ 891.146
3 7982 $ 433.023
4 1083 $ 427.656
5 11545 $ 394.992
6 5958 $ 310.013
7 11166 $ 1.069.022
8 8330 $ 287.764
9 2913 $ 1.261.124
10 2943 $ 921.052
11 6736 $ 376.824
12 12540 $ 903.977
13 4155 $ 1.417.674
14 1375 $ 1.263.972
15 11670 $ 1.093.254
16 6336 $ 1.477.221
17 12008 $ 1.356.768
5
18 505 $ 398.783
19 12022 $ 492.970
20 12915 $ 1.107.558
21 7331 $ 522.055
22 12266 $ 374.718
23 3558 $ 402.407
24 605 $ 1.799.560
25 11228 $ 379.493
26 10781 $ 313.233
27 756 $ 393.076
28 8705 $ 1.294.118
29 9682 $ 321.731
30 10793 $ 427.656
31 12063 $ 400.158
32 3828 $ 1.247.979
33 292 $ 375.081
34 3717 $ 1.356.768
35 13414 $ 750.901
36 9486 $ 307.909
37 13165 $ 645.343
38 2655 $ 2.171.150
39 3159 $ 310.013
6
40 1316 $ 394.374
41 1999 $ 635.149
42 2786 $ 398.783
43 11620 $ 868.600
44 8969 $ 419.675
45 2894 $ 400.703
46 11447 $ 376.126
47 606 $ 1.799.560
48 9944 $ 1.272.609
49 12914 $ 1.107.558
50 8384 $ 426.979
51 4713 $ 402.407
52 8719 $ 1.650.490
53 4105 $ 2.193.702
54 1469 $ 575.994
55 1397 $ 625.232
56 4956 $ 398.783
57 5999 $ 1.233.292
58 11121 $ 586.792
59 9712 $ 868.600
60 6565 $ 1.759.115
61 991 $ 393.457
7
62 942 $ 420.386
63 4434 $ 488.314
64 8859 $ 393.075
65 1398 $ 625.232
66 1673 $ 1.055.349
67 5924 $ 536.219
68 2445 $ 522.055
69 1954 $ 1.337.428
70 4390 $ 516.688
71 9750 $ 1.091.772
72 13200 $ 623.284
73 2180 $ 1.417.674
74 7693 $ 656.501
75 13004 $ 1.799.560
76 9973 $ 1.472.328
77 12256 $ 2.527.594
78 3406 $ 396.938
79 9070 $ 2.269.639
80 10618 $ 1.867.583
Surcolombiana.
8
método los datos que componen una serie se clasifican y ordenan siendo el número de veces que
cuantitativa continua:
Tabla 2.
Variable continua
Fuente: Elaboración propia a partir de los datos suministrados por la usco (2023)
de los datos, donde de manera preliminar se identifica que el mayor número de estudiantes se
Tabla 3.
Frec
In L inf L sup Promedio % Rango
abs
Totales 80 100%
Fuente: Elaboración propia a partir de los datos suministrados por la usco (2023)
Figura 1.
60.00%
50.00% 48.75%
Porcentaje estudiantes (%)
40.00%
30.00%
20.00% 16.25%
12.50%
10.00%
10.00% 6.25%
3.75%
1.25% 1.25%
0.00%
$ 287.764 - $ 595.425 - $ 903.086 - $ 1.210.747 $ 1.518.408 $ 1.826.069 $ 2.133.730 $ 2.441.391
$ 595.425 $ 903.086 $ 1.210.747 -$ -$ -$ -$ -$
1.518.408 1.826.069 2.133.730 2.441.391 2.749.052
Rango valor matricula en pesos colombianos ($)
valor respecto a un conjunto de datos, el cual se considera representativo del total de las
observaciones. Estas medidas aplicadas a las características de las unidades en una muestra, se
cuenta que casi el 50% de los datos de la muestra estaba alojada en esa primera banda. Sin
embargo, la muestra seleccionada es bimodal (ver tabla 4). Indicando así que hay dos grupos de
estudiantes con valores de matrícula muy diferentes. Este resultado de la moda se validó de
manera manual con la función “CONTAR.SI()” en Excel y de manera automática con la función
tradicional “MODA()” de Excel, no hubiera sido posible detectar esta dualidad, es por esto que
11
la naturaleza de la estimación.
y la mediana, siendo la primera una medida muy sensible a valores extremos y que pierde
simétrica, sino que está sesgada hacia la derecha. Para este escenario de análisis en el cual se
obtuvo un coeficiente de variación alto que confirma la heterogeneidad de los datos, se infiere
que la media no es representativa. Por otra parte, la mediana al estar enfocada en los valores
centrales de los datos, no se ve tan impactada como la media por los valores extremos y coincide
Tabla 4
Estadísticas de tendencia
tener puntos de referencia en la muestra de estudio, por ejemplo, con el percentil 50 que
corresponde a la media, se puede rápidamente saber que la mitad de los estudiantes de medicina
pagaron una matrícula menor a $624,258 COP y que la otra mitad pagó una matrícula superior a
este valor.
12
Otro aspecto que se pudo considerar, es que indirectamente con la estimación de estos
percentiles se calcularon también los cuartiles, por ejemplo, el percentil 75, corresponde al tercer
cuartil, el cual expone que el 75% de los estudiantes de medicina en el semestre 2021-1 pagaron
menos $1,261,836 COP por concepto de matrícula y que el otro 25% de los estudiantes pagaron
Tabla 5.
Estadísticas de posición
Tabla 6.
Estadígrafos de dispersión
Desviación
$ 563.461 =DESVESTA(número1…)
estándar
Coeficiente de
65% DesviaciónEstandar/Media
variación
13
media aritmética del conjunto de datos es de $860.858, indicando así que, en teoría, los valores
de matrícula deben tender a estar alrededor de ese número. Ahora, para contrastar la valides de
el cual es alto y da indicios que los datos están distribuidos de manera más amplia alrededor de la
65%, lo que efectivamente prueba que la muestra seleccionada es heterogénea y que existen
valores extremos o atípicos en el conjunto de datos. Realizando una inspección a los datos, se
encuentran valores de la escala de $287.764 y $2.527.594, los cuales están bastante alejados de
la media.
La variabilidad de los datos hace que el promedio no sea una medida representativa de la
población. Esto se debe a que el conjunto de datos es heterogéneo y está bastante disperso, con
Tabla 7.
Estadígrafos de forma
k>0, dist.
Curtosis 0,2423942 =CURTOSIS(rango)
leptocúrtica
=COEFICIENTE.AS
Asimetría 1,0552126 as > 0, positiva
IMETRIA(rango)
14
de la distribución e indicando con esto que los valores de la media, la mediana y la moda de
los datos son diferentes: la primera moda es igual a $1.799.560 mayor que la media cuyo valor
es $ 860.858 la cual es mayor que la mediana con un valor de $ 624.25 y este valor a su vez es
distribución es leptocúrtica, es decir, que los datos tienden a elevarse y que los valores de la
Es un diagrama de caja y bigotes que se usa como método estandarizado para representar
En la figura 2 se puede apreciar de manera global la descripción de los datos a partir del
box plot. La caja, cuyo limite inferior es de $398.783 y límite superior es $1.263.260, ilustra el
rango Intercuartil. Esto es, la diferencia entre el tercer cuartil y el primer cuartil. En el centro de
la caja, se ilustra la mediana con una línea vertical y cuyo valor es $624.258 y con una equis, se
indica en la caja el valor de la media aritmética del conjunto de datos, el cual es $860.858.
En el box plot, la caja es ancha, con un rango intercuartil de $863.053. La mediana está a
la izquierda de la media, lo que indica que los datos están más concentrados hacia la izquierda y
15
dispersos a partir del valor central. Demostrando gráficamente la asimetría positiva obtenida para
significativamente más corto que el bigote derecho, soportando la asimetría positiva y que los
Esto es respaldado por el valor obtenido para la curtosis, demostrándose así una distribución
leptocúrtica de los datos, lo cual permite interpretar que gran parte de los estudiantes de la
muestra pagan valores de matrícula bajos. Por su parte, el bigote derecho es significativamente
más largo, indicando que los valores están más ampliamente distribuidos a partir de la mediana
de los datos.
de frecuencias muestra que el 10% de los estudiantes pagaron más de $1.261.836 COP, que es el
límite superior del rango intercuartil. Estos datos podrían considerarse valores atípicos, ya que
Figura 2.
3. Conclusiones
valores de matrícula bajos. El 60% de los estudiantes pagaron menos de $903.085 COP
● Hay un grupo de estudiantes que paga valores de matrícula significativamente más altos
que la mayoría. El 10% de los estudiantes pagaron más de $1.261.836 COP, que es el
● La distribución de los datos no es simétrica, sino que está sesgada hacia la derecha. Esto
● La media aritmética ($860.858 COP) es mayor que la mediana ($624.258 COP). Esto
sugiere que la distribución de los datos no es simétrica, sino que está sesgada hacia la
derecha.
leptocúrtica. Esto significa que la distribución tiene una cola más pesada que una
distribución normal.
● Al analizar la muestra se infiere la distribución de los datos puede ser más compleja de lo
que parece. Es posible que existan otros factores que influyan en los valores de matrícula,
académica.
dispersión en la distribución de los datos, aspecto que sugiere que sea analizada en
● Se observa que tanto las tablas como los gráficos estadísticos y los estadígrafos
4.Recomendación
Para tener un mayor contexto sobre el costo de matrícula para estudiantes de medicina,
sería pertinente analizar otras muestras de universidades públicas que ofrecen el mismo
19
matrícula. Adicionalmente, se podrían considerar las tasas de deserción del programa y la tasa de
empleabilidad de los egresados para entender el impacto del precio de la matrícula en la tasa de
deserción y la relación costo-beneficio para los estudiantes que deciden estudiar medicina.
Referencias
%C3%B3n-coeficiente-asimetria-bdf49d86-b1ef-4804-a046-28eaea69c9fa
20
https://support.microsoft.com/es-es/office/funci%C3%B3n-curtosis-bc3a265c-5da4-
4dcb-b7fd-c237789095ab