Parte 1: Selección del Tema y Construcción de la Base de
Datos
a) Selección del Tema de Interés:
El tema elegido para este estudio de mercado es el consumo de crispetas entre los
compradores de la Universidad Pontificia Bolivariana (UPB) y Genius Sport. El objetivo
fue obtener información sobre los hábitos de compra, opiniones sobre el precio, y
preferencias de sabor, con el fin de entender mejor el perfil de los consumidores de
crispetas.
b) Elección de Variables:
En esta base de datos se incluyeron seis variables, tres de ellas cuantitativas y tres
cualitativas. Las variables seleccionadas son:
Cuantitativas:
1. Edad: Variable discreta que mide la cantidad de años enteros cumplidos de
los encuestados.
2. Altura: Variable continua que mide la estatura en centímetros de cada
encuestado.
3. Peso Estimado: Variable continua que estima el peso en kilogramos de cada
encuestado.
4. Cantidad de veces que me has comprado crispetas: Esta es una variable
cuantitativa discreta, ya que cuenta la cantidad de veces que se han comprado
crispetas, lo que implica números enteros (1, 2, 3, etc.).
Cualitativas:
1. Género (Masculino o Femenino): Variable nominal que clasifica a los
encuestados según su identidad de género.
2. Ocupación (Estudia, Trabaja o Ambas): Variable nominal que clasifica si
los encuestados estudian, trabajan o realizan ambas actividades.
3. Sabor Preferido (Dulces, Saladas o Mixtas): Variable nominal que
identifica las preferencias de sabor de crispetas de los encuestados.
4. Frecuencia de Consumo(Diariamente, semanalmente , mensualmente
ocasionalmente): Esta es una variable cualitativa ordinal, ya que representa
categorías con un orden claro (de mayor a menor frecuencia de consumo).
5. Opinion frente a precio (4000) de las Crispetas (Elevado- Medio-Bajo):
Esta es una variable cualitativa ordinal, ya que las opiniones sobre el precio están
organizadas en un orden de valor (de mayor a menor percepción de precio).
c) Recolección de Datos:
Los datos fueron recolectados a través de una encuesta digital distribuida en dos
ubicaciones clave: la Universidad Pontificia Bolivariana (UPB) y el lugar de trabajo del
encuestador, Genius Sport. Para incentivar la participación, se ofreció un descuento de 500
pesos en la compra de crispetas a aquellos que completaran la encuesta. El formulario
contenía preguntas cerradas que permitían recopilar tanto variables cuantitativas como
cualitativas.
Metodología de Recolección de Datos:
i) Fuentes de Datos:
1. Encuestas: Se utilizaron encuestas digitales diseñadas específicamente para
recolectar datos de los consumidores de crispetas. Estas encuestas fueron enviadas y
contestadas en línea, permitiendo una rápida recolección de datos.
ii) Diseño del Instrumento de Recolección de Datos:
1. Diseño de Encuestas o Cuestionarios:
El cuestionario contenía preguntas cerradas que cubrían tanto las variables
cuantitativas (edad, altura, peso estimado) como cualitativas (género, ocupación,
sabor preferido).
iii) Muestreo:
1. Tamaño de la Muestra:
La muestra recolectada incluyó información de más de 50 individuos, cumpliendo
con el requisito mínimo de 30 participantes por variable, para asegurar la validez
estadística del análisis.
2. Método de Muestreo:
Se utilizó un muestreo por conveniencia, ya que los participantes fueron
seleccionados en función de su disponibilidad en dos ubicaciones específicas. Este
método fue elegido para facilitar el acceso a los participantes, aunque es consciente
de los posibles sesgos que esto puede generar en el análisis final.
iv) Ética en la Recolección de Datos:
Se garantizó la confidencialidad y el anonimato de los encuestados. Los datos personales
no se asociaron directamente con las respuestas y se manejaron de manera segura para
proteger la privacidad de los participantes.
v) Registro y Almacenamiento de Datos:
Los datos recolectados fueron organizados y almacenados en una hoja de cálculo
estructurada, lo que permitió su fácil acceso y codificación para el posterior análisis
estadístico.
Recomendaciones para Asegurar la Calidad del Muestreo:
Diversidad de Participantes: La encuesta incluyó personas de diferentes edades,
géneros y ocupaciones para obtener una visión diversa del perfil de los compradores
de crispetas.
Documentación del Proceso de Muestreo: Se mantuvo un registro claro del
proceso de selección de los participantes, documentando las ubicaciones específicas
y los criterios aplicados.
Consideraciones de Sesgo: Se reconoció la posibilidad de sesgo inherente en el
muestreo por conveniencia, dado que los participantes provenían de dos ubicaciones
particulares. Este aspecto será considerado en el análisis final y en la interpretación
de los resultados.Igual menciono en este apartado que va haber un sesgo en todo el
estudio debido a uno de los individuos del muestreo que respondio la encuesta con
información irracional dentro de su variable, (ej: Edad de 3 años).
Análisis de Medidas de Tendencia Central y Dispersión
Edad
Media: 25.34 años
El promedio de edad es de 25.34 años, lo que sugiere que la mayoría de los
participantes son relativamente jóvenes.
Mediana: 20.5 años
La mediana es menor que la media, lo que indica que la distribución de las edades
está sesgada hacia la derecha, con algunos valores mayores que aumentan la
media.
Moda: 19 años
La edad más frecuente es 19 años, lo que indica que muchos participantes están en
la adolescencia tardía o comienzos de la adultez.
Rango: 60 años
La diferencia entre la edad más baja (3 años) y la más alta (63 años) es amplia, lo
que indica una diversidad considerable en las edades.
Desviación Estándar: 12.47 años
La dispersión es relativamente alta, lo que sugiere que las edades están bastante
distribuidas alrededor de la media.
Coeficiente de Variación: 0.49
La variabilidad relativa es moderada, lo que indica una dispersión significativa en
relación con la media.
Interpretación:
La variable de edad muestra una alta variabilidad con una tendencia hacia edades
más jóvenes. La dispersión es notable, lo que refleja que hay una mezcla de
personas de diferentes edades, pero la mayoría se encuentra en el rango juvenil. Acá
se refleja como el muestreo se recopilo en dos espacios diferentes.
Peso Estimado:
Media: 66.05
o El promedio de peso en la muestra es de 66.05 kg.
Mediana: 65.5
o La mediana es muy cercana a la media, lo que indica una distribución
relativamente simétrica.
Moda: Trimodal (valores de 70, 72, y 58)
o Hay tres valores que se repiten con mayor frecuencia (70, 72, y 58), lo que
sugiere que los pesos no están muy concentrados en un único valor.
Rango: 70
o El valor mínimo y máximo están separados por 70 unidades, lo que indica
una gran dispersión en los pesos.
Desviación Estándar: 10.60
o Los datos de peso se distribuyen ±10.60 kg respecto de la media.
Coeficiente de Variación: 0.16
o La variación relativa respecto a la media es del 16%, lo que indica una
dispersión moderada en relación al valor promedio.
Interpretación:
o La distribución del peso es bastante amplia, con tres valores que son los
más comunes, pero en general los datos se concentran alrededor de la
media. El bajo coeficiente de variación indica que la dispersión no es
extremadamente alta.
Altura:
Media: 168.46 cm
o El promedio de altura es de aproximadamente 168.46 cm.
Mediana: 168 cm
o La mediana coincide prácticamente con la media, lo que implica simetría en
la distribución de las alturas.
Moda: 175 cm
o La altura de 175 cm es la más frecuente en la muestra.
Rango: 85 cm
o La diferencia entre el valor mínimo y máximo es amplia, lo que indica que
las alturas varían bastante.
Desviación Estándar: 11.79 cm
o Las alturas se distribuyen ±11.79 cm respecto de la media, lo que refleja una
variación considerable.
Coeficiente de Variación: 0.07
o La variabilidad relativa es baja (7%), lo que indica que las alturas son
bastante consistentes en relación con la media.
Interpretación:
o Aunque el rango es amplio, la dispersión en relación con la media es baja,
sugiriendo que la mayoría de las alturas están cerca del promedio, con 175
cm como el valor más común.
Veces que han comprado crispetas:
Media: 5.59 veces
o En promedio, los participantes han comprado crispetas unas 5.59 veces.
Mediana: 4 veces
o La mediana es significativamente menor que la media, lo que indica una
distribución sesgada a la derecha (más personas han comprado crispetas
menos veces, pero hay algunos que las han comprado muchas veces).
Moda: 4 veces
o El valor más común es haber comprado crispetas 4 veces.
Rango: 35 veces
o Existe una gran diferencia entre los participantes que han comprado
crispetas el mayor número de veces y los que menos lo han hecho.
Desviación Estándar: 6.23 veces
o La dispersión en torno a la media es relativamente alta.
Coeficiente de Variación: 1.12
o Este coeficiente indica que la variabilidad es muy alta en relación con la
media, lo que sugiere que el comportamiento de compra es muy irregular
entre los participantes.
Interpretación:
o La distribución muestra que mientras algunos compran crispetas con
bastante regularidad, la mayoría lo hace con menos frecuencia. Esto se
refleja en la alta desviación estándar y en el coeficiente de variación mayor
a 1, lo que sugiere una alta variabilidad en el comportamiento de compra.
Consistencia en Peso y Altura:
Tanto el peso como la altura muestran distribuciones bastante consistentes en
relación con sus medias. Aunque tienen rangos amplios, el coeficiente de variación
es bajo, lo que significa que la mayoría de los participantes tienen pesos y alturas
cercanos a sus respectivos promedios.
Alta Variabilidad en Edad y Frecuencia de Compra de Crispetas:
Las variables de edad y veces que han comprado crispetas presentan una mayor
dispersión. La edad tiene una distribución sesgada hacia la juventud, mientras que el
comportamiento de compra de crispetas es altamente irregular, como lo muestra el
coeficiente de variación elevado en ambas variables.
Comparación entre Medidas de Tendencia Central y Dispersión:
Mientras que peso y altura son más estables en relación con la media, las variables
de edad y frecuencia de compra de crispetas presentan mayor variabilidad. Esto
implica que hay más uniformidad en los datos de características físicas, pero una
mayor diversidad en términos de edad y comportamiento de compra.
Relación entre Edad y Frecuencia de Compra de Crispetas:
Dado que la edad promedio es baja, es posible que la variabilidad en la frecuencia
de compra de crispetas esté relacionada con la edad, con los más jóvenes
comprando con mayor frecuencia o mostrando comportamientos más variables en
sus hábitos de compra.
Medidas de Posición, Distribución y Gráfico de Frecuencia
1. Edad:
Decil 3 (D3): 19 años
o El 30% de los participantes tienen 19 años o menos.
Decil 7 (D7): 24 años
o El 70% de los participantes tienen 24 años o menos.
Percentil 44 (P44): 20 años
o El 44% de los participantes tienen 20 años o menos.
Percentil 83 (P83): 32.3 años
o El 83% de los participantes tienen 32.3 años o menos.
Rango Intercuartílico (RI):
Q1 = 18.75 años
Q3 = 25.5 años
RI = Q3 - Q1 = 25.5 - 18.75 = 6.75 años
o El 50% de los participantes tienen edades que varían en un rango de 6.75 años
alrededor de la mediana.
Medidas de distribución:
Curtosis: 2.38 (Mesocúrtica)
o La curtosis cercana a 3 indica una distribución mesocúrtica, lo que significa que la
concentración de valores alrededor de la media es similar a la de una distribución
normal.
Coeficiente de asimetría: 1.70 (Asimetría positiva)
o Este valor positivo indica que la distribución está sesgada a la derecha, con una
cola hacia los valores más altos (personas mayores).
2. Peso estimado:
Decil 3 (D3): 61 kg
o El 30% de los participantes pesan 61 kg o menos.
Decil 7 (D7): 72 kg
o El 70% de los participantes pesan 72 kg o menos.
Percentil 44 (P44): 64.2 kg
o El 44% de los participantes pesan 64.2 kg o menos.
Percentil 83 (P83): 75.65 kg
o El 83% de los participantes pesan 75.65 kg o menos.
Rango Intercuartílico (RI):
Q1 = 60 kg
Q3 = 72.25 kg
RI = Q3 - Q1 = 72.25 - 60 = 12.25 kg
o El 50% de los participantes tienen un peso en un rango de 12.25 kg alrededor de la
mediana.
Medidas de distribución:
Curtosis: 8.63 (Leptocúrtica)
o Esta curtosis es mucho mayor que 3, lo que indica una distribución leptocúrtica, es
decir, una mayor concentración de valores cerca de la media y colas más largas.
Coeficiente de asimetría: -1.85 (Asimetría negativa)
o Este valor negativo indica que la distribución está sesgada a la izquierda, con una
cola hacia los valores más bajos (personas más livianas).
3. Altura:
Decil 3 (D3): 166 cm
o El 30% de los participantes miden 166 cm o menos.
Decil 7 (D7): 175 cm
o El 70% de los participantes miden 175 cm o menos.
Percentil 44 (P44): 168 cm
o El 44% de los participantes miden 168 cm o menos.
Percentil 83 (P83): 176.65 cm
o El 83% de los participantes miden 176.65 cm o menos.
Rango Intercuartílico (RI):
Q1 = 165 cm
Q3 = 175.25 cm
RI = Q3 - Q1 = 175.25 - 165 = 10.25 cm
o El 50% de los participantes tienen alturas que varían en un rango de 10.25 cm
alrededor de la mediana.
Medidas de distribución:
Curtosis: 27.55 (Leptocúrtica)
o Esta curtosis extremadamente alta indica una distribución muy leptocúrtica, con
gran concentración de valores alrededor de la media y colas muy largas.
Coeficiente de asimetría: -4.48 (Asimetría negativa)
o Este valor indica un fuerte sesgo a la izquierda, lo que significa que hay una cola
hacia las personas más bajas.
4. Frecuencia de compra de crispetas:
Decil 3 (D3): 2.5 compras
o El 30% de los participantes han comprado crispetas 2.5 veces o menos.
Decil 7 (D7): 5.5 compras
o El 70% de los participantes han comprado crispetas 5.5 veces o menos.
Percentil 44 (P44): 4 compras
o El 44% de los participantes han comprado crispetas 4 veces o menos.
Percentil 83 (P83): 7 compras
o El 83% de los participantes han comprado crispetas 7 veces o menos.
Rango Intercuartílico (RI):
Q1 = 2 compras
Q3 = 6 compras
RI = Q3 - Q1 = 6 - 2 = 4 compras
o El 50% de los participantes han comprado crispetas un número de veces en un
rango de 4 compras alrededor de la mediana.
Medidas de distribución:
Curtosis: 10.64 (Leptocúrtica)
o Esta curtosis alta indica una distribución leptocúrtica, es decir, una mayor
concentración de valores cerca de la media con colas más largas.
Coeficiente de asimetría: 2.96 (Asimetría positiva)
o Este valor positivo indica un fuerte sesgo a la derecha, con una cola hacia los
valores más altos (personas que han comprado crispetas muchas veces).
Conclusión general:
Edad: Distribución mesocúrtica y sesgada a la derecha, con dispersión moderada.
Peso estimado: Distribución leptocúrtica y sesgada a la izquierda.
Altura: Distribución altamente leptocúrtica con fuerte sesgo a la izquierda.
Frecuencia de compra: Distribución leptocúrtica con asimetría positiva muy marcada.
Análisis Comparativo
En este estudio sobre el consumo de crispetas entre compradores de la Universidad
Pontificia Bolivariana (UPB) y Genius Sport, se han examinado diversas medidas de
tendencia central, dispersión, posición y distribución de las variables seleccionadas.
Relación entre Medidas de Tendencia Central y Dispersión: Las medidas de tendencia
central (media, mediana y moda) ofrecen un panorama sobre el comportamiento general de
las variables. Por ejemplo, la edad promedio es de 25.34 años, lo que indica una población
predominantemente joven. Sin embargo, la media es mayor que la mediana, sugiriendo un
sesgo hacia edades mayores. En contraste, el peso estimado muestra una media de 66.05 kg
y una mediana cercana, lo que sugiere una distribución más simétrica.
La dispersión, medida a través de la desviación estándar y el rango, revela una alta
variabilidad en la edad (desviación estándar de 12.47 años) en comparación con el peso
(10.60 kg). Esto implica que, mientras las edades están más distribuidas, los pesos se
agrupan más alrededor de la media.
Análisis de Frecuencia: La frecuencia de compra de crispetas es notablemente irregular,
con un promedio de 5.59 compras, pero una mediana de 4. Esto, junto con un alto
coeficiente de variación (1.12), sugiere que la mayoría de los participantes compran
crispetas con poca regularidad, mientras que algunos lo hacen frecuentemente.
Conclusiones Integrales: Al combinar todas las medidas calculadas, se puede concluir que
existe una diversidad considerable entre los consumidores de crispetas. La alta variabilidad
en edad y frecuencia de compra sugiere que los patrones de consumo son muy diferentes
entre los participantes, posiblemente influenciados por factores como la edad y la
ocupación. Mientras tanto, las medidas de peso y altura indican una mayor consistencia
entre los encuestados.
La relación entre la edad y la frecuencia de compra puede indicar que los consumidores
más jóvenes son más propensos a comprar crispetas con mayor regularidad. Esto se alinea
con las tendencias observadas en el comportamiento de consumo juvenil, que tiende a ser
más exploratorio y frecuente.
Interpretación de las Analisis
1. Medidas de Tendencia Central y Dispersión:
Edad Promedio (25.34 años): Esto indica que la mayoría de los encuestados son jóvenes,
lo cual es relevante en un contexto universitario. La media mayor que la mediana sugiere
que hay algunos participantes significativamente mayores que están inflando la media, lo
que puede reflejar un grupo diverso que incluye estudiantes de diferentes etapas de su
educación o profesionales que también están estudiando.
Peso Estimado (Media: 66.05 kg): La cercanía entre la media y la mediana sugiere que los
pesos de los encuestados están más agrupados, indicando un perfil físico más homogéneo
en comparación con la edad.
2. Dispersión:
Alta Variabilidad en Edad: Una desviación estándar de 12.47 años significa que hay un
rango amplio de edades entre los participantes, lo que puede influir en sus hábitos de
consumo. Esto podría indicar que los jóvenes tienden a consumir más crispetas por su
estilo de vida más social y dinámico.
Menor Variabilidad en Peso: Con una desviación estándar de 10.60 kg, los pesos son más
consistentes entre los encuestados, sugiriendo que no hay un gran rango en los hábitos
alimenticios o estilos de vida en términos de salud entre ellos.
3. Análisis de Frecuencia de Compra:
Frecuencia Irregular (Promedio: 5.59 y Mediana: 4): La diferencia entre el promedio y la
mediana indica que mientras algunos compran crispetas con frecuencia, muchos otros lo
hacen rara vez. El alto coeficiente de variación (1.12) resalta esta irregularidad, sugiriendo
que hay un grupo significativo que consume crispetas ocasionalmente o esporádicamente.
Esto podría implicar que la compra de crispetas no es un hábito diario para la mayoría, lo
que podría relacionarse con el tipo de eventos en los que suelen ser consumidas (por
ejemplo, en películas o eventos deportivos).
4. Diversidad entre Consumidores:
Variabilidad en Edad y Frecuencia de Compra: Esto sugiere que los hábitos de consumo
son influenciados por factores demográficos. La diversidad de edad y patrones de compra
indica que el marketing y las estrategias de venta deben ser adaptadas para atraer a
diferentes segmentos del mercado.
Consumo de Jóvenes: La observación de que los consumidores más jóvenes compran
crispetas con más frecuencia se alinea con las tendencias de consumo donde los jóvenes
suelen ser más propensos a participar en actividades sociales y de entretenimiento, lo que
explica su mayor consumo de productos como las crispetas.