Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Introduccin
En este tema vamos a utilizar procedimientos para trabajar con Estadstica Descriptiva
unidimensional as como para generar grficos.
Con variables categricas, las medidas de tendencia central y de dispersin carecen de
sentido comparadas con una tabla de frecuencias o un grfico sobre la forma de la
distribucin. Por el contrario, con variables continuas, una tabla de frecuencias pierde
importancia comparada con la capacidad informativa de las medidas de tendencia central
y de dispersin. Por otro lado los grficos que informan sobre la forma de una distribucin
son diferentes dependiendo de que la variable estudiada sea categrica o continua.
El men: Analizar
Estadsticos descriptivos
Figura 1: Analizar
1.- Frecuencias
El procedimiento Frecuencias proporciona estadsticos y representaciones grficas que
resultan tiles para describir muchos tipos de variables. Este procedimiento es un
comienzo para empezar a consultar los datos.
Para los informes de frecuencias y los grficos de barras, puede organizar los diferentes
valores en orden ascendente o descendente u ordenar las categoras por sus frecuencias.
Es posible suprimir el informe de frecuencias cuando una variable posee muchos valores
diferentes. Puede etiquetar los grficos con las frecuencias (la opcin por defecto) o con
los porcentajes.
Supuestos. Las tabulaciones y los porcentajes proporcionan una descripcin til para los
datos de cualquier distribucin, especialmente para las variables con categoras ordenadas
o desordenadas. Muchos de los estadsticos de resumen optativos, tales como la media y
la desviacin tpica, se basan en la teora normal y son apropiados para las variables
cuantitativas con distribuciones simtricas. Los estadsticos robustos, tales como la
mediana, los cuartiles y los percentiles son apropiados para las variables cuantitativas que
pueden o no cumplir el supuesto de normalidad.
El procedimiento Frecuencias permite obtener distribuciones de frecuencias, pero
adems contiene opciones para: (1) calcular algunos de los estadsticos descriptivos ms
utilizados (tendencia central, posicin, dispersin, asimetra y curtosis); (2) obtener
algunos grficos bsicos (de barras, de sectores e histogramas); (3) controlar el formato
de presentacin de las tablas de frecuencias. Se accede mediante:
Analizar
Estadsticos descriptivos
Frecuencias
Figura 2: Frecuencias
Mostrar tablas de frecuencias: Esta opcin est activa por defecto y muestra
tablas de frecuencias para las variables seleccionadas. Nos ofrece las frecuencias
absolutas, los porcentajes sobre el total, los porcentajes sobre los casos vlidos y
los porcentajes acumulados de los vlidos. Si se desactiva, no se muestra ninguna
tabla de frecuencias, pero se mostrarn en los resultados cualesquiera estadsticos
y grficos que se soliciten.
Estadsticos
Con el botn de Estadsticos accedemos al cuadro de dilogo de la Figura 3 que nos
permite elegir los estadsticos descriptivos ms habituales.
Figura 3: Estadsticos
Valores percentiles. Este recuadro contiene varias opciones para solicitar algunos
ndices de posicin.
Cuartiles: Muestra los valores correspondientes a los percentiles 25, 50 y 75.
- Puntos de corte par k grupos iguales: Calcula los (k-1) valores que dividen los
casos en un nmero k de grupos del mismo tamao. Por defecto son 10 pero puede
elegirse entre 2 y 100.
- Percentiles: Para cada percentil especificado, muestra el valor por debajo del cual
se encuentra ese porcentaje de casos. Se pueden elegir los que se quieran
aadiendo, cambiando o borrando en su cuadro de dilogo.
Tendencia Central. Este cuadro nos permite seleccionar uno o ms de los siguientes
estadsticos:
-
Dispersin. Este cuadro nos permite seleccionar uno o ms de los siguientes estadsticos:
-
Amplitud: Diferencia entre los valores mayor y menor de una variable numrica;
el mximo menos el mnimo. Tambin se denomina recorrido o rango de la
variable.
Mnimo: Valor ms pequeo.
Mximo: valor ms grande.
E.T. media: Error tpico de la media, o sea la desviacin tpica de la distribucin
muestral de la media. Se obtiene dividiendo la desviacin tpica por la raz
cuadrada del nmero de casos. Es una medida de cunto puede variar el valor de
la media de una muestra a otra, extradas stas de la misma distribucin.
Los valores son puntos medios de los grupos. Calcula los estadsticos del valor percentil
y la mediana bajo el supuesto de que sus datos han sido agrupados y que los valores
presentes en los datos son puntos medios de los grupos originales. Esta opcin afecta a
todas las variables por lo que no debe utilizarse si hay una o ms variables del archivo
que no estn agrupadas en intervalos.
Grficos
Con el botn de Grficos accedemos al cuadro de dilogo de la Figura 4 que nos
permite elegir grficos bsicos, tanto para variables cualitativas como cuantitativas,
discretas y continuas.
Figura 4: Grficos
Valores del grfico. En los grficos de barras y en los de sectores se puede elegir el tpo
de frecuencia que se desea representar:
-
Formato
Las opciones de formato permiten controlar algunos aspectos relacionados con la forma
en que aparecern en el visor de resultados las tablas de frecuencias y los estadsticos
seleccionados. Con el botn de Formato aparece el cuadro de dilogo que muestra la
Figura 5.
Figura 5: Formato
Ordenar por. Las opciones de este recuadro sirven para establecer el orden en el que
aparecern los valores o categoras de la variable en la distribucin de frecuencias.
-
2.- Descriptivos
El procedimiento Descriptivos muestra estadsticos de resumen univariados para varias
variables en una nica tabla y calcula valores tipificados (puntuaciones z). Las variables
se pueden ordenar por el tamao de sus medias (en orden ascendente o descendente),
alfabticamente o por el orden en el que se seleccionen las variables (el valor por defecto).
Cuando se guardan las puntuaciones z, stas se aaden a los datos del Editor de datos y
quedan disponibles para los grficos, el listado de los datos y los anlisis. Cuando las
variables se registran en unidades diferentes (por ejemplo, producto interior bruto per
cpita y porcentaje de alfabetizacin), una transformacin de puntuacin z pondr las
variables en una escala comn para poder compararlas visualmente con ms facilidad.
Como datos utilice variables numricas despus de haberlas inspeccionado grficamente
para registrar errores, valores atpicos y anomalas de distribucin. El procedimiento
Descriptivos es muy eficaz para archivos grandes (de miles de casos).
Supuestos. La mayora de los estadsticos disponibles (incluyendo las puntuaciones z) se
basan en la teora normal y son adecuados para variables cuantitativas (medidas a nivel
de razn o de intervalo) con distribuciones simtricas. Se deben evitar las variables con
categoras no ordenadas o distribuciones asimtricas. La distribucin de puntuaciones z
tiene la misma forma que la de los datos originales; por tanto, el clculo de puntuaciones
z no es una solucin para los datos con problemas.
Los estadsticos que muestra significan lo mismo que los mostrados por el procedimiento
Frecuencias.
Orden de presentacin. Esta opcin permite establecer el orden en el que sern listadas
las variables en la tabla de descriptivo que ofrece el Visor de resultados.
- Lista de variables: Las variables aparecen en el mismo orden que aparecen en el
listado de Variables de la Figura 5. Es la opcin por defecto.
Procedimientos relacionados
Utilice el procedimiento Frecuencias para obtener la mediana, la moda, los cuartiles, los
percentiles y un histograma.
Para calcular estadsticos de resumen para cada uno de los distintos grupos de casos (por
ejemplo, si quiere separar los estadsticos para hombres y mujeres o personas que viven
en cuatro regiones diferentes de un pas), utilice el procedimiento Explorar o Medias.
Tambin puede utilizar Segmentar archivo en el men Datos.
Estilo
El dilogo Estilo de tabla especifica las condiciones para cambiar automticamente las
propiedades de las tablas pivote basndose en condiciones especficas.
3.- Explorar
La exploracin de los datos puede ayudar a determinar si son adecuadas las tcnicas
estadsticas que est teniendo en consideracin para el anlisis de los datos. La
exploracin puede indicar que necesita transformar los datos si la tcnica necesita una
distribucin normal. O bien, el usuario puede decidir que necesita utilizar pruebas no
paramtricas.
Este procedimiento, adems de incluir gran parte de los estadsticos ya estudiados en los
procedimientos Frecuencias y Descriptivos, permite obtener nuevos estadsticos
descriptivos, identificar casos atpicos y estudiar con mayor precisin la forma y otras
caractersticas de una distribucin. Tambin permite contrastar dos de los supuestos en
que se basan muchas de las tcnicas de anlisis: normalidad y homogeneidad de
varianzas.
En el procedimiento Explorar se pueden utilizar como datos variables cuantitativas
(nivel de medida de razn o de intervalo). Una variable de factor (utilizada para dividir
los datos en grupos de casos) debe tener un nmero razonable de valores distintivos
(categoras). Estos valores pueden ser numricos o de cadena corta. La variable de
etiquetas de caso, utilizada para etiquetar valores atpicos en los diagramas de caja, puede
ser de cadena corta, de cadena larga (los 15 primeros bytes) o numrica.
Supuestos. La distribucin de los datos no tiene que ser simtrica ni normal.
Para acceder al procedimiento, elegir
Analizar
Estadsticos descriptivos
Explorar
Figura 8: Explorar
Grficos
La opcin Grficos (Figura 10) ofrece la posibilidad de obtener varios tipos de grficos y
algunos estadsticos relacionados con pruebas de normalidad y de homogeneidad de
varianzas.
Figura10: Grficos
Niveles de los dos factores juntos: Para cada variable dependiente, se muestran
juntos los diagramas de caja de cada grupo. Puede as comparar fcilmente cmo
los valores de la variable dependiente varan a travs de los grupos. Si no se
selecciona ninguna variable de factor, slo se muestra un diagrama de caja para la
muestra total.
Dependientes juntas: Para un grupo dado, muestra juntos los diagramas de caja
de cada variable. Podr as comparar fcilmente los valores de las variables
dependientes para un grupo particular. Esta disposicin es especialmente til
cuando las diferentes variables representan una caracterstica nica medida en
diferentes momentos.
Ninguno: Suprime los diagramas de caja.
Tallo y hojas: (opcin por defecto) y nos muestra la distribucin de los valores
para una variable. Cada valor observado se divide en dos componentes: los dgitos
precedentes (el tallo) y el dgito final (la hoja).
Histogramas: Representacin de la distribucin de una variable cuantitativa que
muestra la concentracin relativa de los datos a lo largo de diferentes intervalos o
secciones de la escala en la que estn medidos dichos datos.
Opciones
Esta opcin (Figura 11) nos permite decidir qu tipo de tratamiento se desea dar a los
valores perdidos.
Figura 11: Opciones
Excluir caso segn lista: Excluye los casos que tienen valores perdidos en
cualquiera de las variables utilizadas en cualquiera de los anlisis.
Excluir caso segn pareja: Excluye del anlisis los casos que tengan valores
perdidos en cualquiera (o en ambas) de las variables de una pareja implicada en
el clculo de un estadstico especfico.
Mostrar valores: Trata los valores perdidos en las variables de factor como una
categora separada. Se generan todos los resultados para esta categora adicional.
Las tablas de frecuencias incluyen categoras para los valores perdidos.
Procedimientos relacionados
Si desea obtener unos pocos estadsticos de resumen simples para grupos de casos, utilice
el procedimiento de medias. Para obtener recuentos, porcentajes de casos o percentiles
especficos, utilice el procedimiento Frecuencias. Para calcular puntuaciones z, utilice el
procedimiento Descriptivos.
GRFICOS
El procedimiento Grficos (Figura 12) proporciona un Generador de grficos, un
Selector de plantillas, nos permite compara grupos, hace grficos de regresin y nos
permite utilizar Cuadros de dilogo antiguos.
Figura 12: Grficos
Generador de grficos
Permite crear grficos a partir de los grficos predefinidos de la galera o a partir de los
elementos individuales (por ejemplo, ejes y barras). Puede crear un grfico arrastrando y
colocando los grficos de la galera o los elementos bsicos en el lienzo, que es la zona
grande situada a la derecha de la lista Variables del cuadro de dilogo Generador de
grficos. (Figura 13)
A medida que genere el grfico, el lienzo mostrar una presentacin preliminar del
grfico. Aunque la presentacin preliminar utiliza etiquetas de variable definidas y
niveles de medida, no muestra los datos reales. En su lugar, utiliza datos generados
aleatoriamente para proporcionar un esbozo aproximado de la apariencia del grfico.
Figura 13: Generador de grficos
Comparar subgrupos
Este procedimiento crea grficos pequeos para las variables seleccionadas en los
subgrupos de datos. Cada grfico muestra la distribucin de la muestra completa con la
distribucin del subgrupo. Esto puede ser especialmente til para comprender los
resultados de agrupacin. Adems, se puede utilizar cualquier variable categrica para
definir los grupos.
Figura 15: Comparar subgrupos