Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PRESENTADO POR:
PRESENTADO A:
1. Los siguientes datos indican el número de minutos que ocuparon sus asientos 50 clientes
en una entidad financiera:
73 65 82 70 45 50 70 54 32 75
75 67 65 60 75 87 83 40 72 64
58 75 89 70 73 55 61 78 89 93
43 51 59 38 65 71 75 85 65 85
49 47 55 60 76 75 69 35 45 63
(a) Construya una tabla de distribución de frecuencias con 5 intervalos de clase e interprete
sus resultados
Luego para que el programa nos muestre la tabla de frecuencias con 5 intervalos de confianza,
para este caso tenemos que dar en la opción de “Analizar” y luego estadística descriptiva con el
fin de que nos pueda proporcionar la siguiente tabla.
Tabla I, Agrupación del conjunto de números
Para lograr este objetivo, utilizamos las opciones de “Analizar” y luego “Estadísticos
descriptivos” para luego seleccionar la opción de frecuencias, dentro de esta opción nos muestra
este recuadro, seleccionamos en la opción de “Estadísticos” para luego darle click a los
recuadros que necesitamos, es decir el promedio o media, la desviación estándar, mediana, moda,
coeficiente de variación para este tipo de datos como se muestra en la figura II.
● La moda, que corresponde al dato más frecuente entre los clientes, es de 75 minutos.
● El valor esperado o promedio de tiempo que los clientes se demoran es de 65,12 minutos.
● Tener una variabilidad y una desviación estándar alta en un conjunto de datos indica que
los valores individuales tienden a estar muy dispersos alrededor de la media. Esto
significa que hay una gran diferencia entre los valores individuales y la media del
conjunto de datos. Los valores tienden a estar ampliamente distribuidos en lugar de
agrupados cerca de la media. Una desviación estándar alta sugiere que la distribución de
los datos es amplia y que los valores individuales pueden estar bastante alejados de la
media. Esto puede implicar que hay una gran variabilidad en los datos y que no hay un
patrón claro en la distribución.
Para realizar este procedimiento se puede destacar que es muy parecido al anterior, pero con el
conjunto de números en los cuales agrupamos por medio de SPSS, para esto seleccionamos,
nuestro conjunto de números antes organizados durante el problema A, seleccionamos la opción
“Analizar” , luego en “ Estadísticos descriptivos” y en “Frecuencias”, seleccionamos el conjunto
de datos agrupados, dándonos los siguientes recuadros evidenciando en la figura III:
Figura III, procedimiento para estadísticos en datos agrupados
Luego pedimos al programa estadístico que nos proporcione los valores de la media, mediana,
moda, desviación estándar, varianza, coeficiente de asimetría y curtosis, clickeando en los
recuadros que aparecen cada una de los estadísticos solicitados.
● Analizando con el punto anterior, los valores estadísticos como son la media, mediana,
moda, varianza y desviación estándar, cambian ligeramente con respecto a los valores
estadísticos en datos no agrupados, igual que el punto anterior, se proporciona la gráfica
de frecuencias con el fin de poder visualizar las siguientes interpretaciones.
● Siendo la media 65,67 se puede mencionar que en promedio los clientes se demoran un
total de 65,67 minutos
● Aunque la media y la mediana tienen una ligera diferencia se da como conclusión que
tienen una ligera asimetría que luego con el coeficiente de asimetría nos da el valor
exacto y en qué sentido esta asimétrico
● Para la desviación y varianza, podemos identificar que es bastantes dispersos los datos
con respecto a la media por ende, podemos ver que la distribución de frecuencias es
ancha, en el siguiente valor de curtosis nos proporcionará en qué división está de curtosis
pudiendo verificar una característica más de esta distribución.
● Un coeficiente de asimetría de -0,315 en una muestra estadística señala una distribución
con una marcada inclinación hacia la izquierda. Esta asimetría negativa indica que la
mayoría de los valores están concentrados en el lado izquierdo de la distribución,
mientras que los valores más altos son menos frecuentes y están más próximos a la
media. Esta distribución sugiere una cola más larga extendiéndose hacia la izquierda, lo
que significa que hay una mayor presencia de valores extremadamente bajos en
comparación con los valores extremadamente altos.
● Un coeficiente de curtosis del -0,829 sugiere una distribución platicúrtica, caracterizada
por ser menos puntiaguda y más aplanada que una distribución normal. Esto implica una
dispersión de los datos más uniforme, con una menor concentración de valores alrededor
de la media y un menor riesgo de valores extremos en comparación con una distribución
leptocúrtica.
(a) Calcular los primeros cuatro momentos con respecto a la media para la distribución de
la tabla.
En la primera etapa del procedimiento, comenzamos ingresando los datos en SPSS, una vez que
los datos estuvieron cargados, nos dirigimos a la pestaña de “Vista de variables” y allí definimos
la medida de las variables de la distribución presentada anteriormente.
Antes de empezar a calcular los cuatro momentos, nos disponemos a realizar una exploración
detallada de los momentos respecto a la media de una distribución de datos:
Los momentos son medidas de dispersión sobre un determinado valor. En general, se define el
momento de orden r respecto del valor c como:
(1)
Teniendo en cuenta la Ecuación (1), si C=𝑋, entonces los momentos de orden r se denominan
momentos centrales o respecto de la media y se denotan por:
(2)
Ahora, es pertinente dar una breve explicación de la funcionalidad e importancia de cada uno de
los momentos mencionados anteriormente:
El tercer momento respecto a la media, conocido como asimetría, desvela información crucial
sobre la simetría o sesgo de una distribución de datos, su cálculo implica considerar las
desviaciones cúbicas normalizadas de cada valor respecto a la media, la asimetría proporciona
una medida cuantitativa de la inclinación de la distribución hacia un lado, indicando si las colas
de la misma son más pronunciadas a la derecha o a la izquierda de la media. Un valor de
asimetría igual a cero sugiere simetría perfecta, mientras que valores positivos indican una
inclinación hacia la derecha y valores negativos señalan una inclinación hacia la izquierda.
Este momento permite discernir no sólo la forma general de la distribución, sino también la
dirección en la que se desvía de la simetría perfecta, proporcionando una percepción detallada de
la distribución de los datos en relación con su tendencia central.
En cuanto al primer momento, representado por la media, podemos evidenciar que tiene un valor
cercano a cero, en este caso 1,76, lo cual nos indica que la distribución de datos está centrada
alrededor de la media, la proximidad a cero nos indica que la variabilidad de los datos respecto a
la media es mínima, lo que concuerda con una distribución simétrica y bien equilibrada.
El segundo momento, que representa la varianza, tiene un valor de 6,179. Como mencionamos
anteriormente, la varianza mide y cuantifica la dispersión de los datos respecto a la media y un
valor superior a cero (6,179 en este caso) nos indica que los datos se extienden en relación con la
media, en este caso, el valor de 6.179 sugiere que los datos en la distribución están relativamente
dispersos, pero no de manera excesiva. La magnitud de la varianza proporciona información
sobre la amplitud de los valores en la distribución y cómo se alejan de la media.
El tercer momento, que refleja la asimetría de la distribución, la cual tiene un valor de -0,289,
este valor negativo indica una ligera inclinación significativa hacia la izquierda en la
distribución.
El valor negativo de la asimetría sugiere que la mayoría de los datos están distribuidos en el
extremo inferior de la escala, con algunos valores extremadamente bajos que tiran la cola
izquierda hacia abajo, esta asimetría hacia la izquierda indica que la distribución está sesgada,
con una mayor concentración de valores por encima de la media y algunos valores atípicos o
extremos en el extremo inferior.
Finalmente, el cuarto momento, representado por la curtosis, tiene un valor de -0,383, este valor
positivo nos señala colas más pesadas en la distribución en comparación con una distribución
normal, en este caso, la curtosis alta nos muestra que hay una mayor concentración de datos en
las colas de la distribución, lo que puede indicar la presencia de valores atípicos o extremos en
los datos, tal como se mencionó anteriormente.
(b) Verificar las relaciones entre momentos con respecto a la media (𝑚𝑟 ) y los momentos
con respecto a un punto cualquiera (𝑚𝑟 ´ ).
(3)
● Xi ^2 x ni : Momento 2
● Xi ^3 x ni : Momento 3
● Xi ^4 x ni : Momento 4
Xi ni Xi ni Xi ^2 x Xi ^3 x Xi ^4 x (Xi-medi (Xi-medi
ni ni ni a)^3 x ni a)^4 x ni
RESPECTO A LA MEDIA x̅
a3: Σ x̅ / 30 -0,289
a4: Σ x̅ / 30 -0,383
Tabla V, Momentos respecto al origen y a la media
Comprobación de Charlier
En SPSS
Prueba de Chi Cuadrado
Se usa esta prueba para verificar si proviene de una distribución normal
● Comparación de la distribución de la muestra con la distribución normal teórica
● Medidas de comparación: la asimetría y la curtosis.
● Asimetría: g1
● Curtosis: g2
Imagen 1, chi cuadrado
La tabla titulada “Frecuencias” presenta las diferencias entre las frecuencias observadas y
esperadas para diferentes valores. En la parte inferior de la tabla, se mencionan los detalles de la
prueba, incluyendo el valor del chi-cuadrado, los grados de libertad y la significancia estadística.
Además, se destaca que ninguna celda tiene una frecuencia esperada menor a 5.
Es importante tener en cuenta que esta interpretación es una aproximación lúdica y no una
medida científicamente precisa.
(d) Aplicar las correcciones Sheppard para los cálculos de la parte (a).
(e) Hallar el coeficiente de sesgo (𝑎3) para la distribución anterior: (a) sin y (b) con las
correcciones Sheppard.
● Con un coeficiente de asimetría (𝑎3) de -0,286, se evidencia una leve inclinación hacia la
izquierda en la distribución, este sesgo nos indica que hay una concentración ligeramente
mayor de valores en el extremo inferior de la escala, haciendo que la cola izquierda de la
distribución sea más larga que la cola derecha.
● La magnitud moderada del sesgo sugiere que, aunque existe una tendencia clara hacia la
izquierda, no es tan pronunciada como para considerarse una asimetría extrema.
(f) Hallar el coeficiente de curtosis (𝑎4) para la distribución anterior: (a) sin y (b) con las
correcciones Sheppard.
En el análisis de datos estadísticos, la curtosis y el momento cuarto con respecto a la media son
medidas cruciales que nos permiten comprender la forma y la dispersión de una distribución.
Para calcular estos parámetros, seguimos un procedimiento sistemático que nos ayuda a obtener
información significativa sobre nuestros datos para este tipo de casos se sigue en SPSS de la
siguiente manera:
Luego de colocar todos los datos necesarios al sistema se requiere de poder analizar de manera
descriptiva los datos proporcionados logrando asi visualizar el valor esperado del coeficiente de
curtosis en las siguientes figuras.
El coeficiente de curtosis está relacionado con el momento cuarto con respecto a la media debido
a cómo se define y calcula la curtosis en estadísticas. La curtosis es una medida de la forma de la
distribución de los datos, específicamente cuán puntiaguda o aplanada es en comparación con
una distribución normal. Se calcula considerando las desviaciones al cuarto poder de los datos
respecto a su media.El momento cuarto con respecto a la media, por otro lado, es precisamente
eso: el cuarto momento central de una distribución de probabilidad, donde "central" significa que
se mide en relación con la media de la distribución.
x f
12 1 desviación estándar 3.346640106
14 4 sumatoria de x*f 528
16 6 promedio 17.6
18 10 sumatoria de f(xi-media) 2676.736
20 7
22 2
30
𝐶𝑠 = 0, 763652
El coeficiente de curtosis corregido de Sheppard en una tabla discreta sirve para ajustar el sesgo
en el cálculo de la curtosis cuando se trabaja con datos discretos. La curtosis es una medida de la
forma de la distribución de los datos, específicamente cuán puntiaguda o aplanada es en
comparación con una distribución normal. Sin embargo, en el caso de datos discretos, la fórmula
estándar para calcular la curtosis puede introducir sesgos.
La corrección de Sheppard se utiliza para mitigar este sesgo y proporcionar una estimación más
precisa de la curtosis en distribuciones discretas. Al aplicar esta corrección, se ajusta el cálculo
de la curtosis para tener en cuenta la naturaleza discreta de los datos y el tamaño de la muestra, lo
que resulta en una medida más precisa de la forma de la distribución, este resultado se puede
visualizar en la gráfica de frecuencias.
Conclusiones
Se exploraron los primeros cuatro momentos con respecto a la media, revelando información
crucial sobre la simetría, forma y concentración de la distribución. La relación entre los
momentos respecto a la media (𝑚𝑟) y los momentos respecto a un punto cualquiera (𝑚𝑟´) fue
verificada, permitiendo una evaluación más profunda de la distribución.
El coeficiente de sesgo (𝑎3) y el coeficiente de curtosis (𝑎4) se calcularon tanto sin correcciones
como con las correcciones de Sheppard. Estos coeficientes permitieron evaluar el sesgo y la
forma de la distribución, proporcionando información valiosa sobre la asimetría y la
concentración de datos en las colas de la distribución.
En conjunto, este análisis exhaustivo de la distribución de datos nos ofrece una visión integral
que respalda la toma de decisiones informada y la comprensión profunda de los fenómenos
representados por los datos analizados.
Bibliografía
1. Guía del usuario de IBM SPSS Statistics 26 Core System IBM. (n.d.). Retrieved from
https://www.ibm.com/docs/en/SSLVMB_26.0.0/pdf/es/IBM_SPSS_Statistics_Core_Syst
em_User_Guide.pdf
2. Méndez Valencia, S., Ana, D., Romo, C., Roberto, R., & Sampieri, H. (n.d.). Manual
https://www.fibao.es/media/uploads/manual_de_spss_universidad_de_celaya.pdf
https://wpd.ugr.es/~bioestad/guia-spss/practica-1/