Está en la página 1de 6

UNIVERSIDAD NACIONAL AUTÓNOMA DE HONDURAS

FACULTAD DE CIENCIAS ECONÓMICAS ADMINISTRATIVAS Y


CONTABLES
ADMINISTRACIÓN DE EMPRESAS

Lic. Carmen Belinda Martínez


Asignatura: Investigación de Mercados
Tarea: Resumen cap. 15
Alumno:
Kevin Alberto Briceño
Cuenta:
20131003893
Sección:
1100

Ciudad universitaria jueves 20 de agosto de 2020


Capitulo 15
Distribución de frecuencias, tabulación cruzada y prueba de hipótesis

Distribución de frecuencias

En la distribución de frecuencias se considera una variable a la vez. El objetivo es


obtener un conteo del número de respuestas asociadas con distintos valores de la
variable. La ocurrencia relativa o frecuencia de los diferentes valores de la variable se
expresa en porcentajes. Una distribución de frecuencias de una variable produce una
tabla de conteo de frecuencias, porcentajes y porcentajes acumulativos de todos los
valores asociados con esa variable.

Estadísticos asociados con la distribución de frecuencias

Como vimos en la sección anterior, una distribución de frecuencias es una manera


conveniente de examinar los distintos valores de una variable. Una tabla de frecuencias
es fácil de leer y proporciona información básica, aunque en ocasiones esta
información suele ser demasiado detallada y el investigador debe resumirla mediante
estadísticos descriptivos. Los estadísticos más utilizados que se asocian con las
frecuencias son las medidas de localización (media, moda y mediana), las medidas de
variación (rango, rango intercuartílico, desviación estándar y coeficiente de variación), y
las medidas de la forma (asimetría y curtosis).

Medidas de localización

Las medidas de localización que estudiaremos son medidas de tendencia central


porque tienden a describir el centro de la distribución. Si se modifica toda la muestra al
añadir una constante fija a cada observación, entonces, la media, la moda y la mediana
cambian en la misma cantidad fija.

Media. La media, o valor promedio, es la medida de tendencia central más utilizada.


Sirve para estimar el promedio cuando los datos se recolectaron utilizando una escala
de intervalo o de razón. Los datos deberían mostrar cierta tendencia central, ya que la
mayoría de las respuestas se distribuyen alrededor de la media

Moda. La moda es el valor que ocurre con mayor frecuencia y representa el pico más
alto de la distribución. La moda es una buena medida de localización cuando la variable
es categórica o se ha agrupado en categorías.

Mediana. La mediana de una muestra es el valor intermedio cuando los datos están
acomodados en orden ascendente o descendente. Cuando el número de datos es par,
la mediana se calcula como el punto medio entre los dos valores intermedios: al sumar
los dos valores intermedios y dividir la suma entre 2. La mediana es el percentil 50, y es
una medida de tendencia central adecuada para datos ordinales.
Medidas de variación

Las medidas de variación, que se calculan con datos de intervalo o de razón, incluyen
el rango, el rango intercuartílico, la varianza o la desviación estándar y el coeficiente de
variación.

Rango. El rango mide la dispersión de los datos, y se define simplemente como la


diferencia entre el valor más grande y el valor más pequeño en la muestra. Debido a
esto, el rango se ve directamente afectado por los valores extremos.

Rango intercuartílico. El rango intercuartílico es la diferencia entre el percentil 75 y


el percentil 25. Para un conjunto de datos presentados en orden de magnitud, el
percentil p-ésimo es el valor que deja por debajo al porcentaje p de los datos y al
porcentaje (100 - p) por arriba de él. Si todos los datos se multiplican por una
constante, el rango intercuartílico se multiplica por la misma constante.

Varianza y desviación estándar. La diferencia entre la media y un valor observado se


conoce como la desviación a partir de la media. La varianza es la desviación promedio
al cuadrado a partir de la media. La varianza nunca puede ser negativa. Cuando los
datos se agrupan alrededor de la media, la varianza es pequeña. Cuando los datos
están dispersos, la varianza es grande. Si todos los datos se multiplican por una
constante, la varianza se multiplica por el cuadrado de la constante. La desviación
estándar es la raíz cuadrada de la varianza. Así, la desviación estándar se expresa en
las mismas unidades que los datos, y no en unidades al cuadrado.

Coeficiente de variación. El coeficiente de variación es el cociente de la desviación


estándar con respecto a la media, expresado en porcentaje, y es una medida de
variación relativa sin unidades.

Medidas de forma

Además de las medidas de variación, las medidas de la forma también son útiles para
entender la naturaleza de la distribución. La forma de una distribución se determina al
examinar la asimetría y la curtosis.

Asimetría. Las distribuciones pueden ser simétricas o asimétricas. En una distribución


simétrica, los valores que se ubican a ambos lados del centro de la distribución son
iguales, y la media, la moda y la mediana tienen el mismo valor.

Curtosis. La curtosis es una medida del pico o aplanamiento relativo de la curva,


definido por la distribución de frecuencias. La curtosis de una distribución normal es
cero. Si la curtosis es positiva, entonces la distribución es más puntiaguda que una
distribución normal, y un valor negativo indica que la distribución es más plana que una
distribución normal.
Introducción a la prueba de hipótesis

Un análisis básico siempre implica alguna prueba de hipótesis. Existen muchos


ejemplos de hipótesis generadas en la investigación de mercados:
 La tienda departamental está siendo visitada por más del 10 por ciento de las
familias.
 Los usuarios frecuentes y esporádicos de una marca difieren en términos de sus
características psicográficos.
 Un hotel tiene una imagen de mayor lujo que su competidor más cercano.
 La familiaridad con un restaurante produce una mayor preferencia por éste.

Procedimiento general para la prueba de hipótesis

La prueba de hipótesis incluye los siguientes pasos:

1. Formular la hipótesis nula H0 y la hipótesis alternativa H1.


2. Elegir una técnica estadística adecuada y su estadístico de prueba
correspondiente.
3. Seleccionar el nivel de significancia, _.
4. Determinar el tamaño de la muestra y reunir los datos. Calcular el valor del
estadístico de prueba.
5. Determinar la probabilidad asociada con el estadístico de prueba con respecto a
la hipótesis nula, utilizando la distribución de la muestra del estadístico de
prueba. Como alternativa, determinar los valores críticos asociados con el
estadístico de prueba, que dividen las regiones de rechazo y no rechazo.
6. Comparar la probabilidad asociada con el estadístico de prueba, al nivel de
significancia especificado. Como alternativa, determinar si el estadístico de
prueba cae en la región de rechazo o de no rechazo.
7. Tomar la decisión estadística de rechazar o no rechazar la hipótesis nula.
8. Expresar la decisión estadística en términos del problema de investigación de
mercados.

Una hipótesis nula es un enunciado sobre el status quo sin diferencia o con ningún
efecto. Si la hipótesis nula no se rechaza, entonces no se realizan cambios. En una
hipótesis alternativa se plantea la expectativa de cierta diferencia o efecto. La
aceptación de la hipótesis alternativa llevará a cambios en las opiniones o acciones. De
esta manera, la hipótesis alternativa es opuesta a la hipótesis nula.

Tabulaciones cruzadas
Aunque las respuestas a preguntas relacionadas con una sola variable son
interesantes, a menudo suscitan otras preguntas sobre la relación entre esa variable y
otras. Al introducir la distribución de frecuencias planteamos varias preguntas de
investigación de mercados.

Una tabulación cruzada describe dos o más variables de forma simultánea. Una
tabulación cruzada es la combinación de la distribución de frecuencias de dos o más
variables en una sola tabla, y nos ayuda a entender la manera en que una variable,
como la lealtad hacia la marca, se relaciona con otra variable, como el sexo. La
tabulación cruzada produce tablas que reflejan la distribución conjunta de dos o más
variables con un número limitado de categorías o valores distintos.

A las tablas de tabulación cruzada también se les conoce como tablas de


contingencia. Se considera que los datos incluidos son cualitativos o categóricos, ya
que se asume que cada variable sólo tiene una escala nominal.

Estadísticos asociados con la tabulación cruzada

Ahora analizaremos los estadísticos más utilizados para evaluar la significancia y


fuerza estadística de la asociación de variables en tabulaciones cruzadas. La
significancia estadística de la asociación observada generalmente se mide usando el
estadístico chi cuadrada. La fuerza de la asociación o el grado de relación es
importante desde una perspectiva práctica o sustantiva. Por lo general, la fuerza de la
asociación sólo nos interesa si ésta es estadísticamente significativa. La fuerza de la
asociación se puede medir mediante el coeficiente de correlación fi, el coeficiente de
contingencia, la V de Cramer y el coeficiente lambda.

La tabulación cruzada en la práctica

Al llevar a cabo un análisis de tabulación cruzada, es útil seguir estos pasos.


1. Poner a prueba la hipótesis nula de que no existe una asociación entre las
variables por medio del estadístico chi cuadrada. Si no se rechaza la hipótesis
nula, entonces no existe relación alguna.
2. Si se rechaza H0, entonces se debe determinar la fuerza de la asociación
utilizando un estadístico apropiado (coeficiente fi, coeficiente de contingencia, V
de Cramer, coeficiente lambda u otro estadístico).
3. Si se rechaza H0, se debe interpretar el patrón de la relación calculando los
porcentajes en la dirección de la variable independiente, por la variable
dependiente.
4. Si se trata a las variables como ordinales más que como nominales, se utiliza
tau b, tau c o gamma como estadístico de prueba. Si se rechaza H0, entonces
se determina la fuerza de la asociación utilizando la magnitud y la dirección de la
relación con el signo del estadístico de prueba.
5. Traducir los resultados de la prueba de hipótesis, la fuerza de la asociación y el
patrón de la asociación, a implicaciones y recomendaciones para la gerencia
cuando sea conveniente.

Pruebas paramétricas

Las pruebas paramétricas dan inferencias para hacer afirmaciones sobre las medias
de poblaciones originales. La prueba t generalmente se utiliza para este propósito, y se
basa en el estadístico t de Student. El estadístico t supone que la variable se
distribuye normalmente y que se conoce la media (o asume que se conoce), y la
varianza de la población se estima a partir de la muestra. La distribución t tiene una
apariencia similar a la distribución normal, ya que ambas son simétricas y tienen forma
de campana.

Pruebas no paramétricas

Las pruebas no paramétricas se utilizan cuando las variables independientes no son


métricas. Al igual que las pruebas paramétricas, existen pruebas no paramétricas para
probar variables de una muestra, dos muestras independientes o de dos muestras
relacionadas.

También podría gustarte