Está en la página 1de 15

Análisis de datos de la investigación social

Mtra. Diana Gutiérrez Cervantes

¿Qué significa describir


una variable?

1
¿Qué significa describir una variable?

El término describir una variable se deriva de la rama


descriptiva de la estadística:
Estadística descriptiva: Parte de la estadística que se
encarga de la recopilación, presentación y descripción de
datos (Góngora y Hernández, 1999), mediante:
• Tablas de distribución de frecuencias
• Gráficas
• Medidas descriptivas, como
• Promedios
• Moda
• Desviación estándar

2
ENTONCES…

Describir una variable es:

• Presentar y describir los datos obtenidos de su


medición mediante:

Tablas de distribución de Gráficas Medidas descriptivas


frecuencias

3
Tablas de distribución de frecuencias

Muestran las veces que se repite un dato de forma:


• Absoluta
• Porcentual
• Relativa

4
Gráficas

• Muestran la distribución de los datos en una


imagen, lo cual facilita la interpretación.

5
Medidas descriptivas

Estas medidas nos permiten conocer las principales


características de nuestra variable, que en el
procedimiento revisado esta semana son:

Media
Suma
Dispersión
Caracterizar distribución posterior

6
Media y suma

• Media: Media aritmética: suma de todas las


puntuaciones dividida por el número de
puntuaciones.
• Suma: Suma de todos los datos de la variable.

7
Dispersión (Universidad de Granada, s. f.)

• Desviación estándar: Raíz cuadrada de la varianza.


Mide el grado en que las puntuaciones de la variable se
alejan de la media.
• Varianza: Suma de los cuadrados de las diferencias
entre cada puntuación y la media.
• Rango: Diferencia entre el valor más grande (máximo) y
el más pequeño (mínimo).
• Mínimo: Valor más pequeño.
• Máximo: Valor más grande.
• Error estándar media: Desviación típica de la
distribución muestral de la media.

8
Caracterizar distribución posterior
(Universidad de Granada, s. f.)

• Asimetría: La asimetría positiva indica que los valores


más extremos se encuentran por encima de la media; la
negativa indica que los valores más extremos se
encuentran por debajo de la media.
• Curtosis. Expresa el grado en que una distribución
acumula casos en sus extremos en comparación con los
caos acumulados en los extremos de una distribución
normal con la misma varianza. La curtosis positiva
indica que en los extremos de la distribución hay más
casos acumulados que en la distribución normal.

9
En esta semana también vimos
procedimientos para:

• Transformar datos
• Seleccionar casos
• Hacer un listado de casos
• Ordenar casos

10
Entre los procedimientos para transformar datos,
vimos opciones para:
• Crear serie temporal.
• Reemplazar valores perdidos.

A continuación, se explican con más detalle las


opciones que aparecen para la ejecución de cada
uno.

11
OPCIONES PARA CREAR SERIE TEMPORAL
(IBM Knowledge Center, s. f.)
• Diferencia: Diferencia no estacional entre valores sucesivos de la serie. El
orden es el número de valores previos utilizados para calcular la diferencia.
Dado que se pierde una observación para cada orden de diferencia,
aparecerán valores perdidos del sistema al comienzo de la serie.
• Diferencia estacional: Diferencia los valores de la serie respecto a los valores
de la propia serie distanciados un orden (un lapso) de valores constante. El
orden se basa en la periodicidad definida actualmente. El orden es el número
de períodos estacionales utilizados para calcular la diferencia. El número de
casos con el valor perdido del sistema al comienzo de la serie es igual a la
periodicidad multiplicada por el orden de la diferencia estacional.
• Media móvil centrada: Se utiliza el promedio de un rango de los valores de la
serie, que rodean e incluyen al valor actual. La amplitud es el número de
valores de la serie utilizados para calcular el promedio. Si la amplitud es par, la
media móvil se calcula con el promedio de cada par de medias no centradas.
Número de casos con el valor perdido del sistema al comienzo y al final de la
serie para una amplitud de n es igual a n/2 para los valores de la amplitud par y
(n-1)/2 para los valores de la amplitud impar.
• Media móvil anterior: Se utiliza el promedio de un rango de las observaciones
precedentes. La amplitud es el número de valores precedentes de la serie
utilizados para calcular el promedio. El número de casos con el valor perdido
del sistema al comienzo de la serie es igual al valor de la amplitud.

12
OPCIONES PARA CREAR SERIE TEMPORAL
(IBM Knowledge Center, s. f.)
• Medianas móviles: Se utiliza la mediana de un rango de los valores de la serie, que rodean e
incluyen al valor actual. La amplitud es el número de valores de la serie utilizados para calcular la
mediana. Si la amplitud es par, la mediana se calcula con el promedio de cada par de medianas no
centradas. Número de casos con el valor perdido del sistema al comienzo y al final de la serie para
una amplitud de n es igual a n/2 para los valores de la amplitud par y (n-1)/2 para los valores de la
amplitud impar.
• Suma acumulada: Cada valor de la serie se sustituye por la suma acumulada de los valores
precedentes, incluyendo el valor actual.
• Retardo: Cada valor de la serie se sustituye por el valor del caso precedente, en el orden
especificado. El orden especifica a qué distancia se encuentra el caso precedente. El número de
casos con el valor perdido del sistema al comienzo de la serie es igual al valor del orden.
• Adelanto: Cada valor de la serie se sustituye por el valor de un caso posterior, en el orden
especificado. El orden especifica a qué distancia se encuentra el caso posterior. El número de casos
con el valor perdido del sistema al final de la serie es igual al valor del orden.
• Suavizado: Los nuevos valores de la serie se basan en un suavizador de datos compuesto. El
suavizador comienza con una mediana móvil de 4, que se centra por una mediana móvil de 2. A
continuación, se vuelven a suavizar estos valores aplicando una mediana móvil de 5, una mediana
móvil de 3 y los promedios ponderados móviles (hanning). Los residuos se calculan sustrayendo la
serie suavizada de la serie original. Después se repite todo el proceso sobre los residuos
calculados. Por último, los residuos suavizados se calculan sustrayendo los valores suavizados
obtenidos la primera vez que se realizó el proceso. A esto se le denomina a veces suavizado
T4253H.

13
Métodos de estimación para reemplazar los
valores perdidos (IBM Knowledge Center, s. f.)

• Media de la serie. Sustituye los valores perdidos con la media de la


serie completa.
• Media de puntos adyacentes. Sustituye los valores perdidos por la
media de los valores válidos circundantes. La amplitud de los puntos
adyacentes es el número de valores válidos, por encima y por debajo
del valor perdido, utilizados para calcular la media.
• Mediana de puntos adyacentes. Sustituye los valores perdidos por la
mediana de los valores válidos circundantes. La amplitud de los
puntos adyacentes es el número de valores válidos, por encima y por
debajo del valor perdido, utilizados para calcular la mediana.
• Interpolación lineal. Sustituye los valores perdidos utilizando una
interpolación lineal. Se utilizan para la interpolación el último valor
válido antes del valor perdido y el primer valor válido después del
valor perdido. Si el primer o el último caso de la serie tiene un valor
perdido, el valor perdido no se sustituye.
• Tendencia lineal en el punto. Reemplaza los valores perdidos de la
serie por la tendencia lineal en ese punto. Se hace una regresión de la
serie existente sobre una variable índice escalada de 1 a n. Los valores
perdidos se sustituyen por sus valores pronosticados.
14
• Góngora Cortés, J. J. y Hernández Ramírez, R. (1999). Estadística descriptiva.
Trillas.
• IBM Knowledge Center. (s. f.). Funciones de Transformación de series
temporales.
https://www.ibm.com/support/knowledgecenter/es/SSLVMB_subs/statistics_m
ainhelp_ddita/spss/base/time_series_functions.html
• IBM Knowledge Center. (s. f.). Métodos de estimación para reemplazar los
valores perdidos
https://www.ibm.com/support/knowledgecenter/es/SSLVMB_sub/statistics_ma
inhelp_ddita/spss/base/replace_missing_values_estimation_methods.html
• Universidad de Granada (s. f.).Capítulo 10. Los procedimientos Frecuencias y
estadísticos.
https://www.ugr.es/~fmocan/MATERIALES%20DOCTORADO/Descriptiva.pdf

15

También podría gustarte