Documentos de Académico
Documentos de Profesional
Documentos de Cultura
inferencial
El error muestral se refiere a la variación natural existente entre muestras tomadas de la
misma población.
Parámetros de estimación
• Media
• Desviación estándar
Desviación Estándar mide cuánto se separan los datos.Su símbolo es σ. Es la raíz cuadrada
de la Varianza.
Prueba de hipótesis para la media
Una hipótesis es una declaración relativa a una población sujeta a verificación , es una
afirmación de algo que se puede o no probar.
Por el contrario, la hipótesis alterna sostiene que sí hay diferencias entre los grupos de trabajo del
hospital,
Hi: M ≠ E ≠ A ≠ I.
EJEMPLO 2:Se desea contrastar con un nivel de significancia del 5 % la hipotesis de que la talla
media de los hombres de 18 o mas años de un pa´ıs es igual a 180. Suponiendo que la desviacion
tipica de las tallas en la poblaci´on vale 4, contraste dicha hipotesis frente a la alternativa de que es
distinta.
Planteamiento de hipótesis
Error tipo I y II
Cualquiera sea la decisión tomada a partir de una prueba de hipótesis, ya sea de aceptación de la Ho o
de la Ha, puede incurrirse en error:
Un error tipo I se presenta si la hipótesis nula Ho es rechazada cuando es verdadera y debía ser
aceptada. La probabilidad de cometer un error tipo I se denomina con la letra alfa α.
Un error tipo II, se denota con la letra griega β se presenta si la hipótesis nula es aceptada cuando de
hecho es falsa y debía ser rechazada.En cualquiera de los dos casos se comete un error al tomar una
decisión equivocada.En la siguiente tabla se muestran las decisiones que pueden tomar el investigador y
las consecuencias posibles.
NIVEL DE SIGNIFICANCIA
Probabilidad de rechazar la hipótesis nula cuando es verdadera. Se le denota mediante la
letra griega α, tambiιn es denominada como nivel de riesgo, este termino es mas adecuado
ya que se corre el riesgo de rechazar la hipótesis nula, cuando en realidad es verdadera.
Este nivel esta bajo el control de la persona que realiza la prueba.Si suponemos que la
hipótesis planteada es verdadera, entonces, el nivel de significación indicará la probabilidad
de no aceptarla, es decir, estén fuera de área de aceptación. El nivel de confianza (1-α),
indica la probabilidad de aceptar la hipótesis planteada, cuando es verdadera en la
población.
Ejemplo:Como parte de un estudio de tiempos y movimientos conducido en un centro de
Salud psicológica, una muestra de 100 pacientes pasó en promedio 23 min en la sala de
espera entre su registro y su atención por un miembro del grupo psicológico. La desviación
estándar muestral fue de 10 min. ¿Proporcionan estos datos evidencia suficiente como para
indicar que el tiempo de permanencia en la sala de espera es mayor a 20 min? Sea 𝛼𝛼 = 0,05
Paso 5: Conclusión.
Existe suficiente evidencia
estadística para afirmar con un
nivel de confianza del 95% que
el tiempo de permanencia en la
sala de espera es mayor a 20
min.
Pruebas Paramétricas
• Se busca estimar los parámetros de una población en base a una muestra.
• Se conoce el modelo de distribución de la población, presenta variables cuantitativas continuas
medibles).
• Mientras más grande sea la muestra más exacta será la estimación, mientras más pequeña, más
distorsionada será la media de las muestras.
La prueba chi-cuadrado es una de las más conocidas y utilizadas para analizar variables nominales o
cualitativas, es decir, para determinar la existencia o no de independencia entre dos variables. Con el
estudio de la independencia, se origina también un método para verificar si las frecuencias observadas en
cada categoría son compatibles con la independencia entre ambas variables.
Para evaluar la independencia entre las variables, se calculan los valores que indicarían la independencia
absoluta, lo que se denomina “frecuencias esperadas”, comparándolos con las frecuencias de la muestra.
las pruebas de la familia de pruebas t comparan diferencias en las puntuaciones medias de los datos
distribuidos normalmente de nivel continuo (intervalo o relación).
La prueba t de una muestra funciona con una sola puntuación media. La prueba t de una muestra
compara la media de una sola muestra con un valor predeterminado para determinar si la media de la
muestra es significativamente mayor o menor que ese valor.
Grupo entrenado: 12 16 19 8 10 13 9 15 14
Grupo no entrenado: 15 5 11 8 9 5 6 11 10
𝑯𝟎 : µ1 = µ2 o sea 𝑯𝟎 : µ1 - µ2 = 0
la hipótesis nula afirma que la cantidad media problemas resueltos por los adolescentes entrenados es igual a
la de los adolescentes no entrenados, o sea sostiene que el entrenamiento no es eficaz.
El estadístico de prueba para las hipótesis y las condiciones dadas (igual varianza de las dos poblaciones
independientes normalmente distribuidas), se distribuye t de Student con n1+n2-2= 9+9-2=16 grados de
libertad.
La hipótesis nula: Es que la media de la variable estudiada es la misma en los diferentes grupos.
La hipótesis alternativa: Al menos dos medias difieren de forma significativa.
ANOVA permite comparar múltiples medias, pero lo hace mediante el estudio de las varianzas
El estadístico estudiado en el ANOVA, conocido como F-ratio, es el razon entre la varianza de las medias de
los grupos y el promedio de la varianza dentro de los grupos. Este estadístico sigue una distribución
conocida como “F de Fisher-Snedecor”. Si se cumple la hipótesis nula, el estadístico F adquiere el valor de 1
ya que la intervarianza será igual a la intravarianza.
Se puede demostrar que si la hipótesis nula es cierta y no existen diferencias entre las (desconocidas)
medias poblacionales, MSB y MSW serán muy similares. Por otro lado, si los medios (desconocidos) son
diferentes, MS B será mayor que MS W (esto tiene sentido intuitivode manera directa: si las medias de la
población son muy diferentes, esperaríamos que las medias de la muestra fueran bastante separados y,
por lo tanto, la variabilidad entre grupos será grande).
Interpretación. “Existen diferencias significativas entre los medios aritméticos de los tres grupos
experimentales y podemos atribuirlas a las distintas eficacias de los métodos de enseñanza empleados”.
Variable independiente (dos niveles)
Utilizaríamos una prueba t para estos diseños, porque solo tienen dos niveles.
Hora del día (mañana versus tarde): ¿Los estudiantes obtienen mejores resultados en los exámenes
cuando los toman por la mañana que por la tarde?
Cafeína (algo de cafeína versus nada de cafeína): ¿Los estudiantes obtienen mejores resultados en las
pruebas cuando beben cafeína en comparación con no beben cafeína?
ANOVA factorial
Hora del día: mañana o tarde
Cafeína: algo de cafeína frente a no cafeína
¿Cómo influye la hora del día y el consumo de cafeína en las calificaciones de los estudiantes?
Hicimos que los estudiantes tomaran exámenes por la mañana o por la tarde, con o sin cafeína.
Los diseños factoriales permiten a los investigadores manipular más de una cosa a la vez.