Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. N
2. Media
La media describe cada grupo con un valor simple que identifique el centro de los
datos. Es la suma de todas las observaciones con un grupo dividida entre el número de
observaciones en ese grupo.
Debido a que cada diferencia en las medias de los grupos se basa en los datos de una
muestra y no de toda la población, no se puede estar seguro de que sea igual a la
diferencia en las poblaciones. Para obtener un mejor sentido de la diferencia
poblacional, puede utilizar el intervalo de confianza.
Utilice S para evaluar qué tan bien el modelo describe la respuesta. S se mide en las
unidades de la variable de respuesta y representa la distancia que separa a los valores
de los datos de los valores ajustados. Mientras más bajo sea el valor de S, mejor será
descrita la respuesta por el modelo. Sin embargo, un valor de S bajo no indica por sí
solo que el modelo cumple con los supuestos del modelo. Debe examinar las gráficas
de residuos para verificar los supuestos.
La desviación estándar es la medida de dispersión más común, que indica qué tan
dispersos están los datos con respecto a la media. El símbolo σ (sigma) suele utilizarse
para representar la desviación estándar de una población. El símbolo s se utiliza para
representar la desviación estándar de una muestra.
Estos intervalos de confianza (IC) son rangos de valores que probablemente contienen
la media real de cada población. Los intervalos de confianza se calculan usando la
desviación estándar agrupada.
Puesto que las muestras son aleatorias, es poco probable que dos muestras de una
población produzcan intervalos de confianza idénticos. Sin embargo, si se repite la
muestra muchas veces, un determinado porcentaje de los intervalos de confianza
resultantes incluirá el parámetro de población desconocido. El porcentaje de estos
intervalos de confianza que contiene el parámetro es el nivel de confianza del
intervalo.
a) Estimación de punto
b) Margen de error
Por ejemplo, con un nivel de confianza de 95%, usted puede estar 95% seguro de que
el intervalo de confianza contiene la media del grupo. El intervalo de confianza ayuda a
evaluar la significancia práctica de los resultados. Utilice su conocimiento especializado
para determinar si el intervalo de confianza incluye valores que tienen significancia
práctica para su situación. Si el intervalo es demasiado amplio para ser útil, considere
aumentar el tamaño de la muestra.
Un valor de desviación estándar más alto indica una mayor dispersión de los datos. Un
valor más alto produce intervalos de confianza menos precisos (más amplios) y baja
potencia estadística.
Supongamos que su estudio tiene los cuatro grupos, tal como se muestra en la tabla
siguiente:
6. Grados de libertad
Los grados de libertad (GL) son la cantidad de información suministrada por los datos
que usted puede "gastar" para estimar los valores de parámetros de población
desconocidos y calcular la variabilidad de esas estimaciones. Este valor se determina
según el número de observaciones de la muestra y el número de parámetros del
modelo.
Los grados de libertad también se utilizan para caracterizar una distribución específica.
Muchas familias de distribuciones, como t, F o chi-cuadrada, utilizan los grados de
libertad para especificar cuál distribución t, F o chi-cuadrada específica es apropiada
para diferentes tamaños de muestra y diferentes números de parámetros del modelo.
Por ejemplo, la siguiente figura muestra las diferencias entre distribuciones de chi-
cuadrada con diferentes grados de libertad.
7. Contribución
Interpretación
Interpretación
Utilice el R2 para determinar qué tan bien se ajusta el modelo a los datos Mientras
mayor sea el valor de R2, mejor se ajustará el modelo a los datos. El R2 siempre está
entre 0% y 100%.
El R2 es solo una medida de qué tan bien el modelo se ajusta a los datos. Incluso
cuando un modelo tenga un R2 alto, usted deberá revisar las gráficas de residuos para
verificar que el modelo cumpla con los supuestos del modelo.
R-cuad.(ajustado)
Utilice el R2 ajustado cuando desee comparar modelos que tengan diferentes números
de predictores. El R2 siempre aumenta cuando se agrega un predictor al modelo,
incluso cuando no haya una mejora real en el modelo. El valor de R2 ajustado
incorpora el número de predictores del modelo para ayudar a elegir el modelo correcto.
10.Valor F
Interpretación
Si desea usar el valor F para determinar si puede rechazar la hipótesis nula, compare
el valor F con su valor crítico.
11.Valor p
El valor p es una probabilidad que mide la evidencia en contra de la hipótesis nula. Las
probabilidades más bajas proporcionan una evidencia más fuerte en contra de la
hipótesis nula.
Interpretación
Utilice el valor p indicado en la salida del ANOVA para determinar si las diferencias
entre algunas de las medias son estadísticamente significativas.
El valor p ajustado indica cuales pares dentro de una familia de comparaciones son
significativamente diferentes. El ajuste limita la tasa de error por familia al nivel de
significancia que usted especifique. Si usted utiliza un valor p regular para
comparaciones múltiples, la tasa de error por familia aumenta con cada comparación
adicional.
Interpretación
Si el valor p ajustado es menor que alfa, rechace la hipótesis nula y concluya que la
diferencia entre las medias de un par de grupo es estadísticamente significativa. El
valor p ajustado también representa la menor tasa de error por familia en la cual se
rechaza una hipótesis nula en particular.
13.R-cuad.(pred)
Interpretación
Utilice el R2 pronosticado para determinar qué tan bien el modelo predice la respuesta
para nuevas observaciones. Los modelos que tienen valores más grandes de R2
pronosticado tienen mejor capacidad de predicción.
El R2 pronosticado también puede ser más útil que el R2 ajustado para comparar
modelos, porque se calcula con observaciones que no se incluyen en el cálculo del
modelo.
Estimación de punto
La estimación de punto es la diferencia entre un par de medias y se calcula a
partir de los datos de la muestra. El intervalo de confianza se centra en este
valor.
Margen de error
El margen de error define la amplitud del intervalo de confianza y es
determinado por la variabilidad observada en la muestra y el nivel de confianza.
Para calcular el límite superior del intervalo de confianza, el margen de error se
suma a la estimación de punto. Para calcular el límite inferior del intervalo de
confianza, el margen de error se resta de la estimación de punto.
Interpretación
Use los intervalos de confianza para evaluar las diferencias entre medias de
grupo.
ANOVA de un solo factor es una prueba de hipótesis que evalúa dos enunciados
exclusivos acerca de dos o más medias de población. Estos dos enunciados se
denominan hipótesis nula e hipótesis alternativa. Una prueba de hipótesis utiliza los
datos de la muestra para determinar si se puede rechazar la hipótesis nula.
Para ANOVA de un solo factor, las hipótesis de la prueba son las siguientes:
La hipótesis nula (H0) es que no todas las medias grupales son iguales.
La hipótesis alternativa (HA) es que no todas las medias grupales son iguales.
16.Nivel de significancia
Interpretación
En cuanto a ANOVA de un solo factor, usted rechaza la hipótesis nula cuando hay
suficiente evidencia para concluir que no todas las medias son iguales.
17.Valor t
Interpretación
Usted puede utilizar el valor t para determinar si puede rechazar la hipótesis nula, que
indica que la diferencia en las medias es 0. Sin embargo, la mayoría de las personas
utiliza el valor p, porque es más fácil de interpretar.
Este coeficiente es una medida que indica la situación relativa de los sucesos respecto
a las dos variables, es decir, representa la expresión numérica que indica el grado de
correspondencia o relación que existe entre las 2 variables. Estos números varían entre
límites de +1 y -1.
¿Cómo se calcula?
Para ello se hace uso del coeficiente de correlación de Pearson, definido como la
covarianza que se da entre dos variables tipificadas y se calcula con la siguiente
expresión:
Cuando es menor a cero (r < 0) Se dice que hay correlación negativa: Las
variables se correlacionan en un sentido inverso.
Cuando es mayor a cero (r > 0) Se dice que hay correlación positiva: Ambas
variables se correlacionan en un sentido directo.
No existe relación lineal, pero esto no implica necesariamente que las variables
sean independientes, pudiendo existir relaciones no lineales entre las variables.
Para concluir se puede decir que se ve más difícil de lo que resulta ser, sobre
todo si se cuenta con tecnología avanzada, pues hoy día existen múltiples
programas que facilitan esta labor de cálculo e interpretación del coeficiente de
Pearson.
Utilice este análisis para probar qué tan bien una muestra de datos categóricos
se ajusta a una distribución teórica.
Los cálculos para estas pruebas son iguales, pero la pregunta que se está
tratando de contestar puede ser diferente.
19.ANOVA
Un análisis de varianza (ANOVA) prueba la hipótesis de que las medias de dos o más
poblaciones son iguales. Los ANOVA evalúan la importancia de uno o más factores al
comparar las medias de la variable de respuesta en los diferentes niveles de los
factores. La hipótesis nula establece que todas las medias de la población (medias de
los niveles de los factores) son iguales mientras que la hipótesis alternativa establece
que al menos una es diferente.
Para ejecutar un ANOVA, debe tener una variable de respuesta continua y al menos un
factor categórico con dos o más niveles. Los análisis ANOVA requieren datos de
poblaciones que sigan una distribución aproximadamente normal con varianzas iguales
entre los niveles de factores. Sin embargo, los procedimientos de ANOVA funcionan
bastante bien incluso cuando se viola el supuesto de normalidad, a menos que una o
más de las distribuciones sean muy asimétricas o si las varianzas son bastante
diferentes. Las transformaciones del conjunto de datos original pueden corregir estas
violaciones.
para determinar si las medias de dos o más grupos son diferentes. Puede incluir
factores aleatorios, covariables o una combinación de factores cruzados y anidados.
También puede usar la regresión escalonada como ayuda para determinar el modelo.
Luego podrá usar el modelo para predecir los valores de nuevas observaciones,
identificar la combinación de valores predictores que en conjunto optimicen uno o más
valores ajustados y crear gráficas de superficie, gráficas de contorno y gráficas
factoriales.
NOTA
Puesto que los valores p son menores que cualquier nivel de significancia razonable,
existe evidencia de que los dos predictores y su interacción ejercen un efecto
significativo sobre la resistencia. Además, el modelo explica el 99.73% de la varianza.
El coeficiente de la covariable, temperatura, indica que la resistencia media aumenta
en 83.87 unidades por cada incremento de un grado en la temperatura cuando todos
los demás predictores se mantienen constantes. Para el factor aditivo, la media del
nivel 1 se encuentra 24.40 unidades por debajo de la media general, mientras que el
nivel 2 se encuentra 27.87 unidades por debajo de la media general. El nivel 3 es el
valor de referencia, y por ello no se muestra. Usted puede calcular la media de los
niveles de los factores de referencia sumando todos los coeficientes de los niveles de
un factor (excluyendo la intersección) y multiplicando por - 1. En este caso, está 52.27
((-24.40-27.87) * -1) unidades por encima de la media general.