Documentos de Académico
Documentos de Profesional
Documentos de Cultura
SnapStat-Comparación de Muestras Pareadas
SnapStat-Comparación de Muestras Pareadas
4/25/2007
Resumen
La SnapStat Comparación de Muestras Pareadas crea un resumen en una hoja para comparar
dos columnas de datos numéricos. Calcula estadísticas de resumen e intervalos de confianza para
las diferencias pareadas y presenta un histograma, un gráfico de caja y bigotes, un gráfico de
secuencia en el tiempo, y un gráfico de probabilidad normal. Los cálculos son un subconjunto de
los que realiza el procedimiento Comparación de Muestras Pareadas. Sin embargo, la salida
tiene un formato previo para que se ajuste a una sola hoja.
Datos de Ejemplo:
El archivo 93cars.sf3 contiene información de 26 variables para n = 93 marcas (Make) y modelos
(Model) de automóviles, tomada de Lock (1993). La tabla a continuación muestra una lista
parcial de 4 columnas de ese archivo:
Ingreso de Datos
Los datos a analizar consisten de dos columnas numéricas de observaciones pareadas.
• Muestra 1: columna numérica que contiene el primer valor para cada unidad experimental.
• Muestra 2: columna numérica que contiene el segundo valor para cada unidad experimental.
Salida
La salida de SnapStat es una sola página de gráficos y estadísticas numéricas.
frecuencia
Mínimo = 2.0
Máximo = 11.0
Rango = 9.0 9
Rango Intercuartílico = 3.0
Sesgo Estandarizado = -0.686851 6
Curtosis Estandarizada = -1.33445
3
0
0 2 4 6 8 10 12
MPG Highway-MPG City
Comparación de Medias
Hipótesis Nula: diferencia = 0
estadístico t = 34.9291
Valor-P Bilateral = 0.0000
Diagnósticos
Valor-P de Shapiro-Wilks = 0.0028
Autocorrelación en Retraso 1 = 0.172553 +/- 0.203239
0 2 4 6 8 10 12
MPG Highway-MPG City
12 99.9
MPG Highway-MPG City
99
10
95
8
porcentaje
80
6 50
20
4
5
2
1
0 0.1
0 20 40 60 80 100 0 2 4 6 8 10 12
Fila MPG Highway-MPG City
Para los datos de los automóviles, la diferencia promedio entre las millas por galón en el manejo
en carretera versus manejo en ciudad d = 6.72 y la desviación estándar muestral s = 1.86. La
razón de la desviación estándar y la media es el coeficiente de variación CV = 27.61%. Las
diferencias varían entre 2 y 11 en un rango R = 9. La distancia cubierta por mitad central de los
datos (el rango intercuartílico) RIC = 3. El sesgo y la curtosis estandarizados están ambos entre -
2 +2, indicando que las diferencias bien pueden haber provenido de una distribución normal.
• Se dibuja una caja que se extienda desde el cuartil inferior de la muestra hasta el
cuartil superior. Este es el intervalo cubierto por el 50% central de los valores de los
datos cuando se ordenan de menor a mayor.
También incluye una prueba t de la hipótesis de que la diferencia media es igual a 0. Un Valor de
P pequeño, como en el ejemplo anterior (menor de 0.05 si se trabaja al nivel de significancia del
5%), lleva a la conclusión de que la diferencia media es significativamente diferente de cero.
Cálculos
Las fórmulas usadas en este procedimiento, junto con descripciones más detalladas para cada
técnica, se encuentran en los siguientes documentos: