Está en la página 1de 32

SEMINARIO DE POSGRADO

METODOLOGÍA DE
INVESTIGACIÓN

Titular: Agustín Salvia

MÓDULO 2: MÉTODOS DE
INVESTIGACIÓN BASADOS EN EL
ANÁLISIS DE VARIABLES.
TÉCNICAS DE ANÁLISIS ESTADÍSTICO

ESTADÍSTICA DESCRIPTIVA
(Medidas de tendencia central y dispersión)

TABLA DE CONTINGENCIA Y ANÁLISIS PORCENTUALES


(Diferencias porcentuales, perfiles y segmentos)

ANALISIS DE ASOCIACIÓN
(Correlación y coeficientes de asociación)

TECNICAS DE ANALISIS MULTIVARIADO


(Modelos Lazarsfeld, regresiones, factoriales,
clusters)
MEDIDAS ESTADÍSTICAS
• LA ESTADÍSTICA DESCRIPTIVA TIENE COMO FUNCIÓN BRINDAR
UN CONJUNTO DE MEDIDAS QUE SINTETICEN LA INFORMACIÓN
RELEVADA POR LOS DATOS. ESTUDIA CARACTERES O ASPECTOS
REFERIDOS A UN COLECTIVO DE PERSONAS, OBJETO O
ELEMENTOS DE NATURALEZA ESPECÍFICA.
• LA ESTADÍSTICA DESCRIPTIVA DISPONE DE UNA SERIE VARIADA
DE HERRAMIENTAS PARA RESUMIR INFORMACIÓN QUE CONTIENE
UNA MUESTRA O POBLACIÓN: TABLAS, GRÁFICOS, MEDIDAS DE
TENDENCIA CENTRAL, DE DISPERSIÓN, ETC.
• LA EXTRAPOLACIÓN DE LOS RESULTADOS DE UNA MUESTRA A
LA POBLACIÓN Y LA ESTIMACIÓN DE EFECTOS CAUSALES ES EL
CONTENIDO DE LA ESTADÍSTICA INFERENCIAL, CUYA FUNCIÓN ES
INFERIR CONCLUSIONES Y BRINDAR MEDIDAS QUE PERMITAN
CUANTIFICAR LA CONFIANZA DE TALES CONCLUSIONES.

EL EMPLEO DE UN DETERMINADO TIPO Y/O


HERRAMIENTA ESTADÍSTICA DEPENDE DEL TIPO DE
PROBLEMA/OBJETO DE ESTUDIO Y DEL NIVEL DE MEDIÓN
DE LOS VALORES DE LA VARIABLE A CONSIDERAR.
LA BASE DE DATOS COMO PUNTO
DE LLEGADA
DADO UN DISEÑO DE INVESTIGACIÓN
BASADO EN ENCUESTAS

FORMULACIÓN DE HIPÓTESIS, ELABORACIÓN DE LA


MUESTRA Y EL INSTRUMENTO

APLICACIÓN CONTROLADA DE CUESTIONARIO

CODIFICACIÓN, PROCESAMIENTO Y CARGA DE INFORMACIÓN

BASE DE DATOS
LOS TRES COMPONENTES DE UNA
BASE DE DATOS

Registro (casos) Atributo


(variables)
N° V1 V2 V3 V4 V5 V.n
1 20
2
3
¿A qué se
4 Valor
denomina
Unidad de 5 (categoría
Análisis?
6 s)
DE LOS CONCEPTOS A LOS
INDICADORES

El proceso de operacionalización
 Determinar las preguntas de
investigación e hipótesis de trabajo
(proposiciones conceptuales)

 Establecer las relaciones esperables


entre dimensiones y variables
(proposiciones empíricas)

 Creación / selección de indicadores e


REGISTROS: UNIDADES DE
OBSERVACIÓN

UNIDAD DE ANÁLISIS / OBSERVACIÓN


(los registros pueden ser de diversa naturaleza, dependiendo de los
objetivos del estudio)

Ej: personas, familias, empresas,


huelgas, palabras, avisos, muertes,
 Eletc.
número de registros está dado por el tamaño de la muestra de
la población objeto de estudio. Según las leyes de la estadística,
cuanto mayor sea el número de casos de una muestra probabilística,
más confianza y generalizables podrán ser nuestras estimaciones
¿Por qué…? ¿Y si la muestra no es probabilística?
VARIABLES: ATRIBUTOS DE LA
POBLACIÓN

Propiedades o atributos observables de


la población o dimensión objeto de
estudio.
Ej: edad, nivel socio-económico,
preferencias, hábitos de consumo, nivel
educativo alcanzado, situación
ocupacional, condición de pobreza, etc.
 Las variables estadísticas pueden ser:
causales o independientes, contextuales o
intervinientes y descriptivas o dependientes.
Los valores de una variable deben ser
excluyentes y exhaustivos.
VALORES DE LAS VARIABLES

Representación conceptual cualitativa o


cuantitativa que una propiedad o atributo
objeto de medición.
Ej: 54 años, joven, varón, ocupado, católico,
150$ per cápita, 12 años de instrucción, feliz,
etc.
 MEDIR implica poner en correspondencia una teoría o
concepto explicativo y los atributos observables de un objeto a
través de un lenguaje estándar cuyas reglas de sintaxis
permiten realizar operaciones lógico-matemáticas entre sus
valores o categorías. Ej. Masa-Peso / Nivel de Vida-Ingreso.
LAS VARIABLES ESTADÍSTICAS

NIVEL DE MEDICIÓN DE LAS VARIABLES


VARIABLES VARIABLES MÉTRICAS
CATEGÓRICAS

División en clases Discretas Continuas

Operaciones básicas: moda, Medidas de tendencia central y


porcentajes, tasas, razones. de posición, varianza, etc.
LAS VARIABLES ESTADÍSTICAS

Escalas de medida
NOMINAL O DE DE ORDEN INTERVALOS
CLASIFICACIÓN JERÁRQUICO RAZÓN
IGUALES
Clase social, nivel Fecha del Nº de hijos,
Sexo, ciudad,
educativo, escalas calendario, ingresos,
situación laboral,
de actitud, etc. factoriales, antigüedad,
religión, etc. edad, etc.
test, etc.
HERRAMIENTAS BÁSICAS EN LA ESTADÍSTICA DESCRIPTIVA

INFORMACIÓN RESUMEN DE
VARIABLES ALEATORIAS
TENDENCIA CENTRAL
HETEROGENEIDAD O DESVÍO
FORMA DE LA DISTRIBUCIÓN
HERRAMIENTAS BÁSICAS EN LA
ESTADÍSTICA DESCRIPTIVA

VARIABLES D

Cualitativas en V
escala nominal m
Estadística
TablaDescriptiva
de distribución de
frecuencias
Una de los primeros pasos que se realizan en cualquier
estudio estadístico es la tabulación de resultados, es
decir, recoger la información de la muestra resumida en
una tabla, que denominaremos DISTRIBUCIÓN DE
FRECUENCIAS, en la que cada valor de la variable o
clase se le asocian el número de veces que ha
aparecido, su proporción con respecto a otros valores
de la variable, etc.

FRECUENCIAS: ABSOLUTAS O PORCENTUALES

En caso de que las variables estén al menos en escala


ordinal aparecen opcionalmente las frecuencias
acumuladas absolutas y acumuladas porcentuales.
Tabla de distribución de
frecuencias
Definiremos como frecuencia de un dato el número de veces que este
aparece en el colectivo. Siendo N la suma de las respectivas frecuencias
de cada dato (N=ΣXi). Este N será denominado como frecuencia total. A
efectos prácticos, asumiremos las siguientes definiciones de frecuencias:

a) frecuencias absolutas : es el número de veces que aparece dicho valor


de la variable y se representa por fi.

b) frecuencias relativas: es el cociente entre la frecuencia absoluta y el


tamaño de la muestra. La denotaremos por fri

c) frecuencias absoluta acumulada: es el número de veces que ha


aparecido en la muestra un valor menor o igual que el de la variable, se
puede acumular, en la tabla estadística) en orden ascendente (fa↑) o
descendente (fa↓)

d) frecuencia relativa acumulada: al igual que en el caso anterior se


calcula como el cociente entre la frecuencia absoluta acumulada dividido por
el tamaño de la muestra (N).
GRÁFICOS ESTADÍSTICOS
Diagrama de barras:   Se utilizan rectángulos separados, que tienen
como base a cada uno de los datos y como altura la frecuencia de ese
dato.

  Ejemplo: En la siguiente tabla se muestra el total de vacunas aplicadas


durante el verano de l991 en un estado de la República Mexicana.  
GRÁFICOS ESTADÍSTICOS
Gráfica de Torta:   Se forma al dividir un círculo en sectores circulares de
manera que: a) cada sector circular equivale al porcentaje
correspondiente al dato o grupo que representa; y b) la unión de los
sectores circulares forma el círculo y la suma de sus porcentajes es 100.
Estadística
Descriptiva

• Variable nominal
PEA PEA
5000000

Valid Cumulativ
Frequency Percent Percent e Percent
Valid Activo 4699861 79,6 79,6 79,6 4000000

Inactivo 1207374 20,4 20,4 100,0


Total 5907235 100,0 100,0 3000000

2000000

1000000

Frequency
Statistics 0
Activo Inactivo
PEA
N Valid 5907235 PEA
Missing 0 Cases weighted by PONDERA
Mode 1,00 TEMPORARY .
SELECT IF (h12>25 AND
h12<45) .
FREQUENCIES
VARIABLES=cdea
/STATISTICS=MODE
/BARCHART FREQ
GRÁFICOS ESTADÍSTICOS
Ojiva de Frecuencias Acumuladas: Una gráfica de distribución de
frecuencias absolutas o relativas acumuladas es llamada una ojiva. Se
trazan los límites reales superiores contra las frecuencias acumuladas.
ESTADÍSTICA DESCRIPTIVA
Statistics

Grupos de edad
VARIABLE CUALITATIVA N Valid 24266752
Missing 0
EN ESCALA ORDINAL Median 2,0000
Range 6,00
Minimum ,00
Grupos de edad Maximum 6,00
Percentiles 20 1,0000
Valid Cumulativ 25 1,0000
Frequency Percent Percent e Percent
50 2,0000
Valid 0.- 9 años y menos 4077127 16,8 16,8 16,8
75 4,0000
1.- de 10 a 19 años 4506457 18,6 18,6 35,4 80 5,0000
2.- de 20 a 29 años 4023557 16,6 16,6 52,0
3.- de 30 a 39 años 3053744 12,6 12,6 64,5
Grupos de edad
4.- de 40 a 49 años 2917893 12,0 12,0 76,6 5000000

5.- de 50 a 59 años 2326358 9,6 9,6 86,1


6.- 60 años y más 3361616 13,9 13,9 100,0 4000000

Total 24266752 100,0 100,0


3000000

FREQUENCIES 2000000
VARIABLES=xgedad
/NTILES= 4 1000000

/PERCENTILES= 20 80
Frequency

Std. Dev = 2,02


Mean = 2,7
/STATISTICS=RANGE MINIMUM MAXIMUM 0 N = 24266752,0

MEDIAN 0,0 1,0 2,0 3,0 4,0 5,0 6,0

/BARCHART FREQ Grupos de edad

/ORDER ANALYSIS . Cases weighted by PONDERA


HERRAMIENTAS BÁSICAS EN LA
ESTADÍSTICA DESCRIPTIVA
VARIABLES CUANTITATIVAS

VARIABLES DE

Cuantitativa en Cu
escala de 
GRÁFICOS ESTADÍSTICOS
Histograma: Se utiliza en datos cuantitativos en distribuciones de
frecuencia. Son rectángulos verticales unidos entre sí, en donde sus lados
son los límites reales inferior y superior de clase y cuya altura es igual ala
frecuencia de clase.
ESTADÍSTICA DESCRIPTIVA

• Variable cuantitativa
Edad
Statistics 3000000

Edad
N Valid 24.266.752
Missing 0 2000000
Mean 32,15
Std. Error of Mean ,00
Median 28
1000000
Mode 21
Std. Deviation 22,03

Frequency
Std. Dev = 22,03
Variance 485,49 Mean = 32,1
Skewness ,53 0 N = 24266756,0

Std. Error of Skewness ,00

0,

10

20

30

40

50

60

70

80

90

10
0

,0

,0

,0

,0

,0

,0

,0

,0

,0

0,
0
Kurtosis -,64
Std. Error of Kurtosis Edad
,00
Range 99 Cases weighted by PONDERA

Minimum 0
Maximum 99 FREQUENCIES
Sum 780.121.228 VARIABLES=xh12 /FORMAT=NOTABLE
Percentiles 10 6
/NTILES= 4
/PERCENTILES= 10 90
25 14
/STATISTICS=STDDEV VARIANCE RANGE MINIMUM MAXIMUM
50 28
SEMEAN MEAN MEDIAN MODE
75 48 SUM SKEWNESS SESKEW KURTOSIS SEKURT
90 65 /HISTOGRAM NORMAL
/ORDER ANALYSIS .
ESTADÍSTICA DESCRIPTIVA – MEDIA
ARITMÉTICA
La MEDIA ARITMÉTICA O PROMEDIO es una medida
estadística de tendencia central. De una cantidad finita de
números, es igual a la suma de todos ellos dividida entre el
número de sumandos.

También la media aritmética puede ser denominada como


centro de gravedad de una distribución, el cual no es
necesariamente la mitad.
ESTADÍSTICA DESCRIPTIVA - DESVÍO
ESTÁNDAR
La desviación estándar (o desviación típica) es
una medida de dispersión para variables de razón
(ratio o cociente) y de intervalo. Es una medida
(cuadrática) que informa de la media de distancias
que tienen los datos respecto de su media aritmética,
expresada en las mismas unidades que la variable.
Para tal fin nos valemos la varianza y la desviación
estándar. Ambas medidas están estrechamente
relacionadas ya que se define una a partir de la otra.

Expresión de la varianza: Expresión de la desviación estándar:


HERRAMIENTAS BÁSICAS EN LA ESTADÍSTICA DESCRIPTIVA

UN TIPO PARTICULAR DE
DISTRIBUCIÓN PARA VARIABLES
ALEATORIAS MÉTRICAS

LA CURVA NORMAL
SUS PROPIEDADES
SUS ESTADÍSTICOS
ESTADÍSTICA DESCRIPTIVA – LA
DISTRIBUCIÓN NORMAL
Muchas variables aleatorias presentan una función de densidad que
es simétrica y cuya gráfica tiene forma de campana.

Esta distribución es utilizada en aplicaciones estadísticas como


modelo o parámetro de comparación dada la frecuencia o normalidad
con la que ciertos fenómenos tienden a parecerse a esta distribución.

La distribución normal queda definida por dos parámetros:

LA MEDIA Y EL DESVIACIÓN ESTÁNDAR


ESTADÍSTICA DESCRIPTIVA - DISTRIBUCIÓN
NORMAL
Para conocer con detalle un conjunto de datos, no basta con conocer las medidas
de tendencia central, sino que necesitamos conocer también la desviación que
representan los datos en su distribución respecto de la media aritmética de dicha
distribución, con objeto de tener una visión de los mismos más acorde con la
realidad a la hora de describirlos e interpretarlos para la toma de decisiones.

La media indica la posición de la campana, de modo que para


diferentes valores de la gráfica es desplazada a lo largo del eje
horizontal. La desviación estándar determina el grado de
apuntamiento de la curva. Cuanto mayor sea su valor más se
dispersarán los datos. Un valor pequeño indica una gran probabilidad
de obtener datos cercanos al valor medio de la distribución.
ESTADÍSTICA DESCRIPTIVA – LA CURVA
NORMAL
La curva de distribución normal presenta una única moda, que coincide con
la media y la mediana. La curva normal es asintótica al eje de abscisas. El
área total bajo la curva es igual a 1. El área bajo la curva comprendido entre
los valores situados a dos desviaciones estándar de la media es
aproximadamente igual a 0.95. Es decir, existe un 95% de posibilidades de
observar un valor comprendido en el intervalo -1,96 desvío estándar y +1,96
desvío estándar de la media.
ESTADÍSTICA DESCRIPTIVA - DISTRIBUCIÓN
NORMAL
• El uso extendido de la distribución normal en las aplicaciones
estadísticas puede explicarse, además, por otras razones. Muchos
de los procedimientos estadísticos habitualmente utilizados asumen
la normalidad de los datos observados (p. e. el muestreo).

• Resulta recomendable contrastar siempre si se puede asumir o no


una distribución normal. Para ello, la simple exploración visual de
los datos puede sugerir la forma de su distribución.

• No obstante, existen medidas (simestría y kurtosis), gráficos de


normalidad y contrastes de hipótesis que pueden ayudarnos a
decidir, de un modo más riguroso, si la muestra de la que se dispone
procede o no de una distribución normal.

• Cuando los datos no sean normales, podremos o bien


transformarlos o emplear otros métodos estadísticos que no exijan
este tipo de restricciones (los llamados métodos no paramétricos).
GRÁFICOS ESTADÍSTICOS
En los gráficos PROBABILIDAD NORMAL P-P se confrontan las
proporciones acumuladas de una variable con las de una distribución
normal. Los gráficos permiten conocer la causa de esa desviación. Una
curva en forma de "U“ significa que la distribución es asimétrica,
mientras que un gráfico en forma de "S" significará que la distribución
tiene colas mayores o menores que la normal, esto es, que existen pocas
o demasiadas observaciones en las colas.
TRABAJO PRÁCTICO N° 1

• A partir de un tema propuesto formule un problema de investigación que


requiera de datos estadísticos. Elabore una conjetura o hipótesis general y otra
operativa.

• Identifique el dominio empírico al que remite el problema a investigar y elabore


un diseño de investigación a partir del cual identificar la población, las variables
y los atributos que deben ser estudiados.

• Sugiera el tipo de análisis estadístico descriptivo que deberá aplicar para


explorar o testear su hipótesis con la información obtenida.

También podría gustarte