Está en la página 1de 56

Instituto Na ciona l de Esta dística e Informá tica

SPSS BÁSICO
Instituto Na ciona l de Esta dística e Informá tica

Estimado alumno, buen


día. Cualquier consulta
no dudes en
comentarme o
avisarme.

Este curso es
netamente práctico y se
que lograremos
objetivos importantes.

2
Instituto Na ciona l de Esta dística e Informá tica

Contactos:
enei@inei.gob.pe
campusvirtual@inei.gob.pe
Instituto Na ciona l de Esta dística e Informá tica

CONCEPTOS.
Instituto Na ciona l de Esta dística e Informá tica

TERMINOS
• La media aritmética de n valores, es igual a la suma de todos ellos dividida
entre n.

• La mediana es el punto central de una serie de datos.


Hallar la mediana en los siguientes datos.

25,30,28,26,32

SOLUCION:

Se ordenan en forma creciente o decreciente y se toma el valor central.

25,26,28,30,32

mediana = 28

Moda :Es aquel valor de mayor frecuencia, la moda puede ser no


única e inclusive no existir.
5
Instituto Na ciona l de Esta dística e Informá tica

TERMINOS
• Tendencia central: Una de las características más sobresalientes de la
distribución de datos es su tendencia a acumularse hacia el centro de la
misma. Esta característica se denomina Tendencia central.

• Las medidas de tendencia central más usuales son:


a) media aritmética (x), el valor medio.

b) mediana, el valor central.

c) moda, el valor más frecuente

6
Instituto Na ciona l de Esta dística e Informá tica

TERMINOS
MEDIDAS DE DISPERSION

• Existe otro tipo de medidas que indican la tendencia de los datos a dispersarse
respecto al valor central.

• Algunas de las medidas de dispersión más usuales son:

• Rango, amplitud o recorrido (R)

• Desviación estándar (S , muestral; s , poblacional ).

• Varianza (S² , s² )

• Desviación media (DM).

• Coeficiente de Variación (C. V.)

7
Instituto Na ciona l de Esta dística e Informá tica

TERMINOS
• Cuartiles. Son valores que dividen a la población en cuatro partes iguales. Los vamos
a representar por C1, C2 y C3. Entre cada dos de ellos estará el 25 % de los datos.
Lógicamente el segundo cuartil coincidirá con la mediana.

• Deciles. Son valores que dividen a la población en diez partes iguales. Los
representaremos por Dn. El quinto decil coincide también con la mediana.

• Percentiles. Son valores que dividen a la población en cien partes iguales. Los
representamos por Pn. Evidentemente los percentiles 25, 50 y 75 coinciden con los
cuartiles. Y los percentiles 10, 20 , ... , 90 coinciden con los deciles.

8
Instituto Na ciona l de Esta dística e Informá tica

TERMINOS
• Coeficiente de variación. Si hemos realizado un estudio
estadístico en dos poblaciones diferentes, y queremos
comparar resultados, no podemos acudir a la desviación típica
para ver la mayor o menor homogeneidad de los datos, sino a
otro parámetro nuevo, llamado coeficiente de variación y que
se define como el cociente entre la desviación típica y la media.

9
Instituto Na ciona l de Esta dística e Informá tica

TERMINOS

• RANGO. Es la diferencia entre el dato mayor y el dato menor. (R= X


máx.- Xmín.

• DESVIACION ESTANDAR. La desviación estándar o desviación tipo se


define como la raíz cuadrada de los cuadrados de las desviaciones de los
valores de la variable respecto a su media

10
Instituto Na ciona l de Esta dística e Informá tica

TERMINOS

• VARIANZA. Es el cuadrado de la desviación estándar

• Desviación media. Se conoce también como promedio de desviación.

• Medidas de curtosis. Miden la mayor o menos concentración de datos


alrededor de la media. Se suele medir con el coeficiente de curtosis.

11
Instituto Na ciona l de Esta dística e Informá tica

TERMINOS
• Estadística descriptiva. Realiza el estudio sobre la población
completa, observando una característica de la misma y
calculando unos parámetros que den información global de
toda la población.

• Estadística inferencial. Realiza el estudio descriptivo sobre un


subconjunto de la población llamado muestra y,
posteriormente, extiende los resultados obtenidos a toda la
población.

12
Instituto Na ciona l de Esta dística e Informá tica

TERMINOS – Variables estadísticas


• Variable cualitativa. Es aquella característica que no podemos expresar con números y
hay que expresarla con palabras. Por ejemplo, el lugar de residencia.

• Variable cuantitativa. Es cualquier característica que se puede expresar con números.


Por ejemplo, el número de hermanos o la estatura. Dentro de esta variable podemos
distinguir dos tipos:
– Variable cuantitativa discreta. Es aquella variable que puede tomar únicamente un número
finito de valores. Por ejemplo, el número de hermanos.
– Variable cuantitativa continua. Es aquella variable que puede tomar cualquier valor dentro
de un intervalo real. Por ejemplo, la estatura.

13
Instituto Na ciona l de Esta dística e Informá tica

Análisis Exploratorio de Datos


• El análisis exploratorio de datos persigue los
mismos objetivos que la clásica estadística
descriptiva univariante.
• Suplementariamente concede una importancia
crucial a la detección de anomalías y errores en la
distribución de la variable que se trate.

14
Instituto Na ciona l de Esta dística e Informá tica

Análisis Exploratorio de Datos


• Todo ello se basa en técnicas gráficas y en estadísticos
resistentes y robustos, relacionados sobre toso con el
orden y la mediana. Los aspectos fundamentales
consisten en sus representaciones gráficas, el análisis de
residuos y la transformación de los datos con objeto de
encontrar la escala que mejor simplifique y clarifique el
análisis.

15
Instituto Na ciona l de Esta dística e Informá tica

Análisis Exploratorio de Datos


• Dependent List: en este recuadro se especifican las
variables cuantitativas y si se hace clic en OK se
obtienen para cada variable, por defecto, el diagrama
de tallo y hojas, el de cajas, así como los estadísticos
de tendencia central, de dispersión, asimetría, etc., la
media recortada al 5%.

16
Instituto Na ciona l de Esta dística e Informá tica

Análisis Exploratorio de Datos


• Factor List: en este recuadro se especifican las
variables que jugarán el papel de factores
(análogos a los del análisis de la varianza); cada
combinación entre variables dependientes y
factores se trata como un problema
diferenciado.

17
Instituto Na ciona l de Esta dística e Informá tica

Análisis Exploratorio de Datos


• Label Cases by: en este recuadro se selecciona la
variable que servirá para etiquetar a los casos
anómalos e inusuales; es decir, en lugar de que tales
casos se vean identificados, por defecto, por su
número de secuencia, lo serán por las etiquetas de los
valores de la variable que se haya especificado.

18
Instituto Na ciona l de Esta dística e Informá tica

Análisis Exploratorio de Datos


• En Display se presentan tres alternativas:

– Both (ambos), por defecto, se presentan gráficos y


estadísticos
– Statistics (estadísticos), sólo se presentan los estadísticos
– Plots (gráficos), sólo se presentan los gráficos.

19
Instituto Na ciona l de Esta dística e Informá tica

Análisis Exploratorio de Datos - Estadísticos

• En función de lo que se haya seleccionado en


Display, se obtendrán o no los estadísticos.
Suponiendo que allí se haya seleccionado Both
(ambos) se hace clic en Statistics... y se entre en
el cuadro de diálogo siguiente:

20
Instituto Na ciona l de Esta dística e Informá tica

Análisis Exploratorio de Datos - Estadísticos

21
Instituto Na ciona l de Esta dística e Informá tica

Análisis Exploratorio de Datos - Estadísticos

• Descriptives (descriptivos), esta opción es por defecto, se


obtienen los estadísticos habituales, así como la media
recortada al 5%, recorrido intercuartílico y los índices de
asimetría y apuntamiento acompañados de sus respectivos
errores estándar.
• En el recuadro de texto adjunto se especifica el nivel de
confianza para la estimación por intervalo de la media en
Intervalo confidencial de la media.

22
Instituto Na ciona l de Esta dística e Informá tica

Análisis Exploratorio de Datos - Estadísticos

• M-estimators (estimadores robustos centrales), estimadores


robustos de máxima verosimilitud de tendencia central, se
presentan los de Huber, Andrews, Hampel y Tukey.

• Outliers (valores atípicos), los casos etiquetados como


“extremos” son los correspondientes a los 5 de mayor valor y a
los 5 de menor.

• Percentiles, muestra los percentiles 5, 10, 25, 50, 75, 90 y 95.

23
Instituto Na ciona l de Esta dística e Informá tica

Análisis Exploratorio de Datos - Gráficos

• En función de lo que se haya seleccionado en


Display, se obtendrán o no los gráficos.
Suponiendo que allí se haya seleccionado Both
(ambos) se hace clic en Plots... y se entra en el
cuadro de diálogo siguiente:

24
Instituto Na ciona l de Esta dística e Informá tica

Análisis Exploratorio de Datos - Gráficos

25
Instituto Na ciona l de Esta dística e Informá tica

Análisis Exploratorio de Datos - Gráficos

Boxplots (diagramas de caja)

• Factor levels together (factor de niveles


juntos), por defecto, en la misma gráfica se
presentan las cajas de los distintos grupos
correspondientes al factor, hay una gráfica por
cada combinación entre factores y variables.

26
Instituto Na ciona l de Esta dística e Informá tica

Análisis Exploratorio de Datos - Gráficos

• Dependents together (dependientes juntas),


para cada nivel del factor se presentan las cajas
de las distintas variables dependientes,
incluyéndose todos los niveles en una misma
gráfica; si el factor tiene bastantes niveles, la
gráfica es prácticamente inelegible..

27
Instituto Na ciona l de Esta dística e Informá tica

Análisis Exploratorio de Datos - Gráficos


• Stem-and-leaf (tallo y hojas): Por defecto, se presenta
para cada variable dependiente este tipo de gráfico.

• Histogram (histograma): Histograma obtenido


agrupando los valores de la variable dependiente en
intervalos de igual amplitud.

28
Instituto Na ciona l de Esta dística e Informá tica

Análisis Exploratorio de Datos - Gráficos


• Normality plots with levene test (gráficos con pruebas
de normalidad)

• Se obtienen las gráficas Q-Q de probabilidad normal y


las de probabilidad normal eliminada la tendencia, así
como los valores de los estadísticos de Shapiro-Wilks,
Kolmogorov-Smitnov y la corrección del nivel de
significación de Lilliefors.

29
Instituto Na ciona l de Esta dística e Informá tica

Análisis Exploratorio de Datos - Gráficos


• Con el fin de examinar si hay
homocedasticidad, se dispone de Spread vs.
Level with Levene Test (dispersión por nivel con
prueba de Levence), para lo que
evidentemente ha habido que declarar con
anterioridad algún factor.

30
Instituto Na ciona l de Esta dística e Informá tica

Análisis Exploratorio de Datos - Gráficos


• None (ninguno), por defecto, se suprimen las gráficas
de dispersión por nivel, así como la prueba de Levene.

• Power estimation, se presenta para nivel o grupo la


gráfica de los logaritmos neperianos de la mediana
contra el logaritmo neperiano del recorrido
intercuartílico; muestra también la potencia estimada
a que hay que elevar la variable dependiente parta
lograr hocedasticidad.

31
Instituto Na ciona l de Esta dística e Informá tica

Análisis Exploratorio de Datos - Gráficos


• Transformed (transformados), el usuario especifica
alguna de las transformaciones de la lista desplegable,
que por defecto es el logaritmo natural o neperiano.

• Untransformed (no transformados), no se procede a


ninguna transformación de los datos.

32
Instituto Na ciona l de Esta dística e Informá tica

Análisis Exploratorio de Datos - Gráficos


Ejercicio
• Seleccionar Analyze/Descriptive Statistics / Explore
• Especificar como variables dependiente a la edad.
• Especificar como variable factor a la variable sexo.
• Dar clik en OK y ver el resultado en la ventana de
Output, ¿Comente los resultados?.

33
Instituto Na ciona l de Esta dística e Informá tica

Análisis Exploratorio de Datos - Gráficos

34
Instituto Na ciona l de Esta dística e Informá tica

Análisis Exploratorio de Datos - Gráficos


Ejercicio
• Seleccionar Analyze/Descriptive Statistics / Explore
• Especificar como variables dependiente a la edad.
• Especificar como variable factor a la variable est_civil.
• Dar clik en OK y ver el resultado en la ventana de
Output, ¿Comente los resultados?.

35
Instituto Na ciona l de Esta dística e Informá tica

Análisis Exploratorio de Datos - Gráficos

36
Instituto Na ciona l de Esta dística e Informá tica

Análisis Exploratorio de Datos - Gráficos

37
Instituto Na ciona l de Esta dística e Informá tica

Análisis Exploratorio de Datos - Gráficos


Ejercicio
• Seleccionar Analyze/Descriptive Statistics / Explore
• Especificar como variables dependiente a la edad y
gashog2d.
• No especificar variable factor
• Dar clik en OK y ver el resultado en la ventana de
Output, ¿Comente los resultados?.

38
Instituto Na ciona l de Esta dística e Informá tica

Análisis Exploratorio de Datos - Gráficos

39
Instituto Na ciona l de Esta dística e Informá tica

Análisis Exploratorio de Datos - Gráficos

40
Instituto Na ciona l de Esta dística e Informá tica

GRAFICAS
• La utilización de gráficos es necesaria en Estadística.
Se pretende resumir la información de la muestra de
forma gráfica con fines clarificadores o para enfatizar y
descubrir determinadas características que de otra
forma sería muy difícil apreciar.
• Por otro lado, un gráfico siempre es más inmediato de
comprender que un conjunto de estadísticos. Por
ejemplo, podemos dar una matriz de distancias entre
un conjunto de ciudades pero aún teniendo esa
información será difícil que nos imaginemos su
distribución geográfica si no se adjunta un gráfico.

41
Instituto Na ciona l de Esta dística e Informá tica

GRAFICAS

• Los gráficos adecuados para


representar variables discretas o
categóricas son diferentes de los de
las continuas por lo que separaremos
su estudio.

42
Instituto Na ciona l de Esta dística e Informá tica

GRAFICAS

1. Gráficos de variables discretas y


categóricas
• Los gráficos más utilizados en estadística para
representar variables discretas o categóricas
son los gráficos de sectores y los diagramas de
barras.

43
Instituto Na ciona l de Esta dística e Informá tica

GRAFICAS
Gráficos de sectores

• Un gráfico de sectores consiste en un círculo dividido en


sectores de tamaño proporcional a la frecuencia de cada valor
de la variable. Se utilizan cuando hay pocos valores que
representar (máximo 7).

• Para obtener un gráfico de sectores con SPSS usaremos el menú


Graphs\Pie... y aparecerá el cuadro de diálogo siguiente:

44
Instituto Na ciona l de Esta dística e Informá tica

GRAFICAS

Summaries for groups of cases (Resúmenes para grupos de casos)

Genera un gráfico en el que cada sector corresponde a un valor de la variable


seleccionada. El tamaño del sector se determina por la opción Slices represent
(Los sectores representan), esta opción aparece en el cuadro de diálogo que
surge después de apretar el botón Definir del cuadro anterior.
45
Instituto Na ciona l de Esta dística e Informá tica

GRAFICAS
Por ejemplo, suponer que deseamos representar los valores de la variable
est_civi (estado civil) en un diagrama de sectores donde cada sector represente
el número de casos de cada estado civil o conyugal. El gráfico de sectores
podría ser así:
Soltero
Separado

Divorciado
Viudo

Conviviente

Casado
46
Instituto Na ciona l de Esta dística e Informá tica

GRAFICAS
También es posible que los sectores
representen otra cosa, como la media de los
valores de otra variable, el máximo, etc., esto
se consigue con la opción Other summary
function (otra función resúmen). Se puede
también editar el gráfico haciendo doble clic
sobre él, con posibilidad de cambiar los colores,
tramas, desgajar sectores, etc.

47
Instituto Na ciona l de Esta dística e Informá tica

GRAFICAS
Summaries of separate variables (Resúmenes para distintas variables)
•Permite que los sectores representen variables en lugar de casos. Cada sector
representa una función de una determinada variable (por ejemplo, la suma de los
valores de sus casos)

48
Instituto Na ciona l de Esta dística e Informá tica

GRAFICAS
Por ejemplo, las puntuaciones de 10 alumnos a tres profesores de SPSS.

PROF3
71.00 / 36.1%

Prof1 Prof2 Prof3

PROF1

69.20 / 35.2%

PROF2
49
56.30 / 28.7%
Instituto Na ciona l de Esta dística e Informá tica

GRAFICAS

Values of individual cases (Valores individuales de los casos)

• Se resume una única variable, los casos ya son valores


agrupados de la variable. Cada sector representa el valor de un
caso individual.

50
Instituto Na ciona l de Esta dística e Informá tica

GRAFICAS

Soltero Conviviente

40.20 / 13.2% 39.30 / 12.9%

Separado Casado
48.86 / 16.1% 49.95 / 16.4%

Divorciado Viudo
61.13 / 20.1% 64.84 / 21.3%

51
Instituto Na ciona l de Esta dística e Informá tica

GRAFICAS DE DIAGRAMA DE BARRA


• Sobre un eje horizontal se representan los distintos
valores de una variable discreta o categórica.

• Sobre cada valor se levanta un rectángulo vertical cuya


base está separada de las contiguas. En un eje de
escala vertical se representa una característica
numérica de la variable como el número de casos, o
bien otra función resumen que puede estar asociada a
otra variable, etc..

52
Instituto Na ciona l de Esta dística e Informá tica

GRAFICAS DE DIAGRAMA DE BARRA


• Los diagramas de barras permiten utilizar mayor
número de valores que los gráficos de sectores. Son
más versátiles que los gráficos de sectores y al igual
que con éstos también se pueden conseguir efectos
especiales como 3D, giros e iluminaciones.

53
Instituto Na ciona l de Esta dística e Informá tica

GRAFICAS DE DIAGRAMA DE BARRA


• Para generar un diagrama de barras con SPSS se utiliza
el menú Graphs\Bar... con lo que aparecerá el
siguiente cuadro de diálogo

54
Instituto Na ciona l de Esta dística e Informá tica

GRAFICAS DE DIAGRAMA DE BARRA

55
Instituto Na ciona l de Esta dística e Informá tica

GRAFICAS DE DIAGRAMA DE BARRA


• Para agregar valores a la grafica, o modificar las
propiedades de ellas, realizar los pasos siguientes:

• Doble clic a la gráfica. Se abre la ventana de edición de


gráficos.

• Clic al menú edit / opcion: properties.

• Adicionar propiedades.

56

También podría gustarte