Está en la página 1de 3

Análisis Cluster

Tito Melo
September 2023

1 Introducción
En el presente informe se muestra el análisis clúster para una muestra aleatoria de 15 estudiantes en un espacio muestral
de 45 educandos. El análisis pretende clasificar algunas categorı́as establecidas para clasificar y evaluar la solución a un
problema solicitado por el profesor de estadı́stica y probabilidad.
El problema que deja el profesor para solucionar es: ¿De cuantas formas es posible que entren 5 personas a una
sala de cine? Es posible determinar el género; además solicita realizar el espacio muestral completo y realizar el gráfico
e probabilidad. Ahora bien para calificar cada una de las soluciones entregadas por los estudiantes de Didáctica y
Problemas de la probabilidad y estadı́stica, se tienen en cuenta las siguientes tres categorı́as: Espacio muestral, Diagrama
y Resultados. Se consideran también subcategorı́as y/o criterios de evaluación para el espacio muestral como: Organización
y Completitud, para el diagrama se consideran subcategorı́as como la Explicación, Titulo del gráfico, Titulo de los ejes,
Numeración de los ejes y la proporción en la Escala. Las ultimas subcategorı́as respectivas a los resultados, corresponden
a la Veracidad del Espacio muestral y el Diagrama, el Número de hojas, las Diferentes representaciones solicitadas y si
tiene en cuenta el Orden de entrada (Combinatoria o Permutación). La escala de valoración se determina con un valor
numérico de 0 a 5, siendo 0 No entregó, 1 Insuficiente, 2.

2 Coeficiente de Cronbach
 " Pk 2
#   
k i=1 Si 17 196.7071
α= 1− = 1− = 0.7293603 (1)
k−1 Sr2 17 − 1 61.67619
Gracias a Rstudio es posible obtener el valor de 0.7293603 para el coeficiente de Cronbach sugiere una buena consistencia
interna en el conjunto de categorı̀as. En general, se considera que valores superiores a 0.7 son aceptables para la mayorı́a
de las aplicaciones, lo que indica una buena confiabilidad de la escala. Esto también significa que las preguntas en el
cuestionario están relacionadas y miden de manera consistente los criterios de evaluación.

3 Análisis Cluster por método de Ward


3.1 Matriz de Distancias Euclideas
p
d10,12 = (5 − 5)2 + (0 − 4)2 + · · · + (0 − 5)2 = 7.28 (2)
p
d10,5 = (5 − 5)2 + (0 − 1)2 + · · · + (0 − 0)2 = 5.84 (3)
··· =··· = ··· (4)
p
d13,19 = (5 − 5)2 + (3 − 0)2 + · · · + (2 − 0)2 = 6.47 (5)

1
10 12 5 8 15 20 17 14 24 2 4 9 7 13 19
10 0.007.285.845.534.677.065.702.668.566.125.924.493.423.964.95
12 7.280.006.645.415.222.115.686.156.595.847.216.247.196.056.24
5 5.846.640.004.053.316.265.076.157.203.475.746.664.966.144.12
8 5.535.414.050.003.275.253.005.367.284.866.155.816.165.613.50
15 4.675.223.313.270.004.904.035.167.023.635.675.954.444.913.47
20 7.062.116.265.254.900.005.806.076.584.817.256.026.965.585.92
17 5.705.685.073.004.035.800.005.077.665.595.956.996.685.723.40
14 2.666.156.155.365.166.075.070.008.586.505.963.504.353.425.04
24 8.566.597.207.287.026.587.668.580.006.147.999.338.168.746.87
2 6.125.843.474.863.634.815.596.506.140.006.067.195.326.004.29
4 5.927.215.746.155.677.255.955.967.996.060.007.255.886.335.87
9 4.496.246.665.815.956.026.993.509.337.197.250.005.244.526.56
7 3.427.194.966.164.446.966.684.358.165.325.885.240.004.085.77
13 3.966.056.145.614.915.585.723.428.746.006.334.524.080.006.47
19 4.956.244.123.503.475.923.405.046.874.295.876.565.776.470.00

Table 1: Matriz de Distancias 15x15

3.2 Dendograma

4 Análisis Cluster por método de K-means


En un inicio, luego de estandarizar los datos; se seleccionan 5 clusters ya que es en esta cantidad en que se desean agrupar
a los 15 estudiantes.

Semilla 10 Semilla 12 Semilla 5 Semilla 8 Semilla 15

E14 E20 E2 E17 E4

E9 E24 E19

E7

E13
Se calcula la distancia euclidea entre el estudiante 6 y las 5 semillas.

2
3

También podría gustarte