Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Una prueba de hipótesis es una regla que especifica cuando se puede aceptar o rechazar
una afirmación sobre una población dependiendo de la evidencia proporcionada por una
muestra de datos.
Una prueba de hipótesis examina dos hipótesis opuestas sobre una población: la
hipótesis nula y la hipótesis alternativa. La hipótesis nula es la afirmación que se está
comprobando. Normalmente la hipótesis nula es una afirmación de "sin efecto" o "sin
diferencia". La hipótesis alternativa es la afirmación que se desea ser capaz de concluir
que es verdadera basándose en la evidencia proporcionada por los datos de la muestra.
Un error común suele ser que las pruebas de hipótesis estadísticas están diseñadas para
seleccionar la más probable de dos hipótesis. Sin embargo, al diseñar una prueba de
hipótesis, se configura la hipótesis nula como la que se quiere rechazar. Dado que se fija
que el nivel de significación sea pequeño antes del análisis (normalmente, un valor de
0.05 funciona correctamente), Cuando se rechaza la hipótesis nula, se tiene una prueba
estadística de que la alternativa es cierta. Por el contrario, si no se rechaza la hipótesis
nula, no se tiene prueba estadística de que la hipótesis nula sea cierta. Esto es debido a
que no se ha fijado la probabilidad de que se acepte falsamente que la hipótesis nula sea
pequeña.
EJEMPLO:
Jane acaba de incorporarse al equipo de ventas de una compañía muy competitiva. En
una muestra de 16 llamadas de ventas se comprobó que cerró el contrato por un valor
promedio de 108 dólares con una desviación típica de 12 dólares. Pruebe al 5 % de
significación que la media de la población es de al menos 100 dólares contra la alternativa
de que es menor de 100 dólares. La política de la compañía exige que los nuevos
integrantes del equipo de ventas superen un promedio de 100 dólares por contrato
durante el periodo de prueba del empleo. ¿Podemos concluir que Jane ha cumplido este
requisito con un nivel de significación del 95 %?
Solución 1
H0: µ ≤ 100
Ha: µ > 100
Las hipótesis nula y alternativa son para el parámetro µ porque el número de dólares de
los contratos es una variable aleatoria continua. Además, se trata de una prueba de una
cola porque a la compañía solo le interesa si el número de dólares por contacto está por
debajo de una cifra determinada, no de una cifra "demasiado alta". Esto se considera una
afirmación de que el requisito se cumple; por ende, está en la hipótesis alternativa.
Estadístico de prueba: tc=x¯–µ0sn√=108–100(1216√)=2,67tc=x¯–µ0sn=108–
100(1216)=2,67
Valor crítico: ta=1,753ta=1,753 con n-1 grados de libertad = 15
El estadístico de prueba es una t de Student porque el tamaño de la muestra es inferior a
30; por ende, no podemos utilizar la distribución normal. Al comparar el valor calculado del
estadístico de prueba y el valor crítico de tt (ta) (ta) a un nivel de significación del 5 %,
vemos que el valor calculado está en la cola de la distribución. Así, concluimos que 108
dólares por contrato es significativamente mayor que el valor hipotético de 100; por ende,
no podemos aceptar la hipótesis nula. Hay pruebas que apoyan que el desempeño de
Jane cumple con los estándares de la compañía.
REGRESIÓN LINEAL
La regresión lineal es una técnica de análisis de datos que predice el valor de datos
desconocidos mediante el uso de otro valor de datos relacionado y conocido. Modela
matemáticamente la variable desconocida o dependiente y la variable conocida o
independiente como una ecuación lineal. Por ejemplo, supongamos que tiene datos sobre
sus gastos e ingresos del año pasado. Las técnicas de regresión lineal analizan estos
datos y determinan que tus gastos son la mitad de tus ingresos. Luego calculan un gasto
futuro desconocido al reducir a la mitad un ingreso conocido futuro.
En esencia, una técnica de regresión lineal simple intenta trazar un gráfico lineal entre dos
variables de datos, x e y. Como variable independiente, x se traza a lo largo del eje
horizontal. Las variables independientes también se denominan variables explicativas o
variables predictivas. La variable dependiente, y, se traza en el eje vertical. También
puede hacer referencia a los valores y como variables de respuesta o variables
pronosticadas.
Para esta visión general, tenga en cuenta la forma más simple de la ecuación de gráfico
de líneas entre y y x; y=c*x+m, donde c y m son constantes para todos los valores
posibles de x e y. Así, por ejemplo, supongamos que los datos de entrada para (x, y) era
(1,5), (2,8) y (3,11). Para identificar el método de regresión lineal, debe seguir los
siguientes pasos:
Veamos el gráfico:
Observemos el gráfico:
Vemos que la recta corta al eje y en 11,48 y en el eje x en 13,57. Por lo tanto, si
queremos saber dónde corta en el eje x igualamos la ecuación y = 0:
Despejamos x:
Supuestos del modelo de regresión lineal
Como todo modelo estadístico, existen supuestos del modelo de regresión lineal, cuyo
cumplimiento son necesarios para validar su confiabilidad.
Esto supuestos o condiciones, constituyen la base teórica del análisis, por lo que su
incumplimiento, impide su ejecución de forma tácita.
Esto quiere decir que antes de intentar aplicar el modelo de regresión lineal, a nuestros
datos, es necesario examinar los supuestos que lo condicionan.
Independencia.
Los residuos son independientes entre sí, es decir, los residuos constituyen una variable
aleatoria.
Cuando se trabaja con series temporales, podemos hallar residuos auto correlacionados
entre sí.
Linealidad.
La ecuación de regresión, posee una forma particular que responde a una recta. A partir
de ello, se dan como característica que la variable dependiente constituye la suma de un
conjunto de elementos que son: el origen de la recta, una combinación lineal de variables
independientes o predictores y los residuos.
Este supuesto puede incumplirse por varias causas, como por ejemplo la no linealidad (la
relación entre las variables independientes y la dependiente no es lineal), la no aditividad
(el efecto de alguna variable independiente es sensible a los niveles de alguna otra
variable independiente), la omisión de variables independientes que son importantes para
el estudio, la inclusión de variables independientes irrelevantes, parámetros cambiantes
(los parámetros no permanecen constantes durante el tiempo que dura la recogida de
datos), entre otros.
También el uso de gráficos parciales, ayudará a observar la linealidad entre las variables,
al ser herramientas que ofrecen una representación espacial, de la relación neta entre dos
variables.
Homocedasticidad.
Normalidad.
Para cada valor de la variable independiente (o combinación de sus valores), los residuos
se distribuyen normalmente con media cero.
No-colinealidad.
Son pruebas no paramétricas las pruebas de hipótesis que no especifican condiciones sobre los
parámetros de la población de la que proviene la muestra.