1. Describa el procedimiento para el cálculo de frecuencias.
2. ¿Qué medidas de localización se calculan generalmente?
Los estadísticos más utilizados que se asocian con las frecuencias son las medidas de localización (media, moda y mediana). Media: El promedio; valor que se obtiene al sumar todos los elementos de un conjunto y dividirlos entre el número de elementos. Moda: Medida de tendencia central dada por el valor que ocurre con mayor frecuencia en una distribución muestral. Mediana: Medida de tendencia central definida como el valor que deja por arriba a la mitad de los datos y por debajo a la otra mitad. 3. Defina el rango intercuartílico. ¿Qué mide? El rango intercuartílico es la diferencia entre el percentil 75 y el percentil 25. Para un conjunto de datos presentados en orden de magnitud, el percentil p-ésimo es el valor que deja por debajo al porcentaje p de los datos y al porcentaje (100 - p) por arriba de él. Si todos los datos se multiplican por una constante, el rango intercuartílico se multiplica por la misma constante. 4. ¿A qué se refiere el coeficiente de variación? El coeficiente de variación es el cociente de la desviación estándar con respecto a la media, expresado en porcentaje, y es una medida de variación relativa sin unidades. 5. ¿Cómo se mide el aplanamiento o pico relativo de una distribución? La curtosis es una medida del pico o aplanamiento relativo de la curva, definido por la distribución de frecuencias. La curtosis de una distribución normal es cero. Si la curtosis es positiva, entonces la distribución es más puntiaguda que una distribución normal, y un valor negativo indica que la distribución es más plana que una distribución normal. 6. ¿Qué es una distribución asimétrica? ¿Qué significa? En una distribución asimétrica, las desviaciones positivas y negativas a partir de la media son diferentes. La asimetría es la tendencia de las desviaciones de la media a ser mayores tanto en una dirección como en la otra. Se podría definir como la tendencia de una de las colas de la distribución a ser más grande que la otra. 7. ¿Cuál es la principal diferencia entre la tabulación cruzada y la distribución de frecuencias? La tabulación cruzada es una técnica estadística que describe dos o más variables de manera simultánea, y que produce tablas que reflejan la distribución conjunta de dos o más variables con un número limitado de categorías o valores distintivos y la distribución de frecuencias es una distribución matemática cuyo objetivo es obtener un conteo del número de respuestas asociadas con distintos valores de una variable, y expresar esos conteos en términos de porcentajes. 8. ¿Cuál es la regla general para el cálculo de porcentajes en las tabulaciones cruzadas? La regla general consiste en calcular los porcentajes en dirección de la variable independiente por la variable dependiente. Como regla general, debe haber por lo menos cinco observaciones esperadas en cada celda para calcular los estadísticos. De esta manera, la tabulación cruzada es una forma ineficiente de examinar relaciones en las que existen muchas variables 9. Defina una correlación espuria. Situación en donde dos o más variables de medidas se creen estadísticamente relacionadas, pero no tienen relación de causalidad entre ellas en realidad. En otras palabras, relación matemática entre acontecimientos que no tienen ninguna conexión lógica. También es llamada relación espuria. 10. ¿A qué se refiere una asociación oculta? ¿De qué manera se revela? Con frecuencia la introducción de una tercera variable aclara la asociación inicial (a la falta de ella) observada entre dos variables. Tres variables pueden revelar alguna asociación entre las dos variables, aunque al inicio no se haya observado ninguna. En este caso, la tercera variable revela una asociación oculta entre las primeras dos variables: un efecto supresor. Cuando el efecto se controla, la asociación oculta entre el deseo de viajar al extranjero y la edad se revela en las categorías separadas de hombres y mujeres. 11. Analice las razones del uso frecuente de las tabulaciones cruzadas. ¿Cuáles son algunas de sus limitaciones? La tabulación cruzada se utiliza ampliamente en la investigación de mercados comercial, ya que 1. el análisis y los resultados de una tabulación cruzada pueden interpretarse y comprenderse fácilmente por parte de gerentes sin conocimientos de estadística; 2. la claridad de la interpretación ofrece un vínculo más fuerte entre los resultados de la investigación y las acciones gerenciales; 3. una serie de tabulaciones cruzadas puede dar más información sobre un fenómeno complejo, que un solo análisis multivariado; 4. la tabulación cruzada puede resolver el problema de celdas escasas, el cual sería grave en los análisis multivariados discretos; y 5. el análisis de una tabulación cruzada es sencillo de hacer y atractivo para los investigadores menos expertos 12. Presente una clasificación de procedimientos de prueba de hipótesis. 1. Formular la hipótesis nula H0 y la hipótesis alternativa H1. 2. Elegir una técnica estadística adecuada y su estadístico de prueba correspondiente. 3. Seleccionar el nivel de significancia. 4. Determinar el tamaño de la muestra y reunir los datos. Calcular el valor del estadístico de prueba. 5. Determinar la probabilidad asociada con el estadístico de prueba con respecto a la hipótesis nula, utilizando la distribución de la muestra del estadístico de prueba. Como alternativa, determinar los valores críticos asociados con el estadístico de prueba, que dividen las regiones de rechazo y no rechazo. 6. Comparar la probabilidad asociada con el estadístico de prueba, al nivel de significancia especificado. Como alternativa, determinar si el estadístico de prueba cae en la región de rechazo o de no rechazo. 7. Tomar la decisión estadística de rechazar o no rechazar la hipótesis nula. 8. Expresar la decisión estadística en términos del problema de investigación de mercados. 13. Describa el procedimiento general para realizar una prueba t. La prueba paramétrica más popular es la prueba t, que se utiliza para examinar hipótesis sobre medias. La prueba t se puede aplicar a la media de una muestra o de dos muestras de observaciones. En el caso de dos muestras, éstas pueden ser independientes o pareadas. Las pruebas paramétricas dan inferencias para hacer afirmaciones sobre las medias de poblaciones originales. La prueba t generalmente se utiliza para este propósito, y se basa en el estadístico t de Student. 1. Formular las hipótesis nula (H0) y alternativa (H1). 2. Elegir la fórmula apropiada para el estadístico t. 3. Elegir un nivel de significancia, , para poner a prueba H0. Generalmente se selecciona un nivel de 0.05.13 4. Tomar una o dos muestras, y calcular la media y la desviación estándar de cada una. 5. Calcular el estadístico t asumiendo que H0 es verdadera. 6. Calcular los grados de libertad y estimar la probabilidad de obtener un valor más extremo del estadístico en la tabla 4 (de manera alternativa, calcular el valor crítico del estadístico t). 7. Si la probabilidad calculada en el paso 6 es menor que el nivel de significancia elegido en el paso 3, se rechaza H0. Si la probabilidad es mayor, no se rechaza H0. (De manera alternativa, si el valor del estadístico t calculado en el paso 5 es mayor que el valor crítico determinado en el paso 6, se rechaza H0. Si el valor calculado es menor que el valor crítico, no se rechaza H0). El no rechazo de H0 no necesariamente implica que H0 sea verdadera; únicamente significa que la aseveración de verdad no difiere de manera significativa de la que se asume por medio de H0. 8. Expresar la conclusión a la que se llegó por medio de la prueba t, en términos del problema de investigación de mercados.
14. ¿Cuál es la principal diferencia entre las pruebas paramétricas y las no
paramétricas? Las pruebas paramétricas son procedimientos de prueba de hipótesis que asumen que las variables de interés se miden por lo menos a una escala de intervalo y las no paramétricas son procedimientos de prueba de hipótesis que asumen que las variables se miden en una escala nominal u ordinal. 15. ¿Cuáles pruebas no paramétricas son la contraparte de la prueba t para dos muestras independientes en el caso de datos paramétricos? Las pruebas no paramétricas basadas en observaciones obtenidas de una muestra abarcan la prueba Kolmogorov-Smirnov, la prueba chi cuadrada, la prueba de rachas y la prueba binomial. En el caso de dos muestras independientes, la prueba U de Mann-Whitney, la prueba de la mediana y la prueba Kolmogorov-Smirnov de dos muestras se utilizan para probar hipótesis sobre localización. Estas pruebas son las contrapartes no paramétricas de la prueba t de dos grupos. 16. ¿Cuáles pruebas no paramétricas son la contraparte de la prueba t para muestras pareadas en el caso de datos paramétricos? Las pruebas no paramétricas para muestras pareadas incluyen la prueba de rangos con signo de Wilcoxon para muestras pareadas y la prueba del signo. Estas pruebas son la contraparte de la prueba t para muestras pareadas.