Está en la página 1de 201

ESTADSTICA APLICADA A LA

GESTIN PBLICA Y GOBIERNO


MSc. Miguel Oswaldo Prez Pulido

Maestra en Gestin Pblica y gobierno
Universidad de Santander
Mayo de 2013
JORNADA TEMAS





Generalidades de las Estadsticas oficiales

-Instrumentos para el fortalecimiento del sistema estadstico
Nacional

- Credibilidad estadstica

- Principios y buenas prcticas

-Planificacin estadstica estratgica

-Indicadores de gestin: construccin e interpretacin





Estadstica descriptiva

- Forma grafica de presentar resultados
- Medidas de tendencia central
- Medidas de dispersin
- Medidas de forma
PROGRAMA CURSO
JORNADA TEMAS





Marco conceptual de las tcnicas muestrales:

Poblacin
Muestras, Marcos muestrales
Diseos muestrales
Estimacin puntual
Estimacin por intervalos.

La encuesta y el cuestionario.

Distribuciones de muestreo





Anlisis de regresin lineal y correlacin entre variables.
Variables dependientes, independientes
Supuestos del modelo
Pronsticos

MDULO 1



IMPORTANTE LA ESTADSTICA PARA LA GESTIN
PBLICA?



PRESIDENTE DEL BID DESTACA IMPORTANCIA DE LA ESTADSTICA EN EL
DESEMPEO DEL SECTOR PBLICO



El presidente del Banco Interamericano de Desarrollo, Luis Alberto Moreno, resalt hoy la
importancia de la estadstica para medir el desempeo de los gobiernos durante la
conferencia Utilizando la estadstica para promover un desarrollo incluyente: retos para
Amrica Latina y el Caribe.


La conferencia, que se lleva a cabo en la sede del BID en Washington del 28 al 29 de
septiembre, es auspiciada por el BID y Pars 21, el consorcio para la colaboracin en las
estadsticas para el desarrollo en el siglo XXI. El evento busca identificar los principales retos
de la regin para mejorar el uso de la informacin estadstica para apoyar un desarrollo
incluyente y alcanzar los Objetivos de Desarrollo del Milenio (ODM) en el 2015.
"El BID ha sido y seguir siendo una entidad activa en el apoyo al desarrollo
estadstico de la regin, habiendo canalizado ms de US $150 millones para la
generacin de mejores estadsticas, particularmente en el rea social, en 12
pases de la regin", afirm Moreno al iniciar la conferencia.

Destac la relevancia de la estadstica en el proceso de toma de decisiones
gubernamentales, en asuntos relativos al desarrollo econmico y social y a la
superacin de la pobreza y la equidad.


"Contar con informacin oportuna, creble y relevante es esencial para mejorar
el desempeo del sector pblico y la legitimidad de los gobiernos", dijo Moreno.
"La generacin de datos de alta calidad, producidos a tiempo, ampliamente
accesibles y tiles para la gestin pblica es una prioridad en la agenda de los
gobiernos y de los institutos de estadstica de toda la regin.


Tomado de Internet el 10 de julio de 2012 en www.iadb.org/dominicana/noticias/28.09.06A.htm
El presidente del BID agreg que la estadstica como herramienta para medir el
impacto de polticas y programas es an mayor ahora que se han trazado metas
sobre el cumplimiento de objetivos concretos para el desarrollo en la regin, como
es el caso de los ODM (Objetivos del Desarrollo del Milenio) y las metas de
Oportunidades para la Mayora (OPM), la iniciativa lanzada por el BID en junio.

Adems, subray la importancia de trabajar en el contexto de coordinacin en
materia estadstica representado en la regin por la Conferencia Estadstica de las
Amricas.

Pars 21 fue fundada en 1999 por la Organizacin para Cooperacin y Desarrollo
Econmico (OECD), el Banco Mundial, la Comisin Europea, el Fondo Monetario
Internacional (FMI) y las Naciones Unidas

No se puede gestionar lo que no se mide. Las mediciones son la clave. Si usted no
puede medirlo, no puede controlarlo. Si no puede controlarlo, no puede gestionarlo. Si no
puede gestionarlo, no puede mejorarlo. La falta sistemtica o ausencia estructural de
estadsticas en las organizaciones impide una administracin cientfica de las
mismas. Dirigir slo en base a datos financieros del pasado, realizar predicciones
basadas ms en la intuicin o en simples extrapolaciones, y tomar decisiones
desconociendo las probabilidades de xito u ocurrencia, son slo algunos de los
problemas o inconvenientes ms comunes hallados en las empresas.


Carecer de datos estadsticos en cuanto a lo que acontece tanto interna como
externamente, impide decidir sobre bases racionales, y adoptar las medidas
preventivas y correctivas con el suficiente tiempo para evitar daos, en muchos
casos irreparables, para la organizacin.

Por Mauricio Len Lefcovich

Tomado el 10 de julio de 2012 en manuelgross.bligoo.com/.../La-estadistica-es-fundamental-par...
Espaa
ESTADSTICAS OFICIALES?
LA ESTADSTICA PBLICA (u oficiales)
Es un instrumento estratgico para el diseo de polticas pblicas
apropiadas, la adopcin de decisiones oportunas y el ejercicio de
gestiones eficientes, transparentes y responsables.

Uno de los principales problemas que encuentran los usuarios de la
estadstica pblica es le disponer de informacin estadstica que sea
homognea y comparable.

La estadstica est definida como La ciencia especializada en contar
sucesos, personas o cosas y ordenar la informacin obtenida en tablas,
bases de datos y grficas, a fin de facilitar su anlisis

La estadstica pblica son todos aquellos datos y estadsticas
definidas, generadas, elaboradas y publicadas por las diferentes
dependencias y organismos que componen la administracin pblica,
(INEGI, 2006)
LA NECESIDAD DE UNA CULTURA ESTADSTICA ENTRE
LOS FUNCIONARIOS DE LA ADMINISTRACIN PBLICA
En la organizacin y gestin de los organismos de la administracin pblica, ha
surgido un nuevo modelo de produccin resultante del impulso hacia la
descentralizacin, el desarrollo autnomo de cada organismo y la introduccin de
responsabilidades de los directivos por los resultados obtenidos.

Todo ello requiere el desarrollo de las funciones de planeamiento, control
administrativo y evaluacin en los distintos planos en que se formulan los
procesos de decisin.

Resulta fcil demostrar que para esto hacen falta sistemas de informacin
estadstica adecuados y que cada etapa del proceso requiere informacin e
indicadores estadsticos apropiados, as como la utilizacin de procedimientos
estadsticos idneos para realizar los anlisis necesarios. (mediaciones de
costos, eficiencia y efectividad, anlisis de simulacin e impacto, anlisis de
satisfaccin de los usuarios


La estadstica comienza por la nocin de que utilizamos datos para responder
preguntas, es importante recordar que los datos no son solo conjuntos de nmeros
sino que consisten en conjuntos de mediciones .

El pensamiento de Moore (1997), es que la educacin estadstica debera
centrarse en los datos y en el razonamiento estadstico antes que en la
presentacin de tantos mtodos como sea posible o en la teora matemtica de la
inferencia.

La comprensin del razonamiento estadstico debera constituir el objetivo ms
importante de la difusin de la cultura estadstica: tenemos que hacer mas hincapi
en los datos y los conceptos, a expensas de menos teora y menos recetas.

Por consiguiente, los conocimientos numricos y estadsticos bsicos
comprenden: la facilidad para manejar cifras y problemas cuantitativos, la
comprensin de nociones y conceptos matemticos bsicos, el razonamiento
estadstico, la cuantificacin ey explicacin de la variabilidad, la produccin y
presentacin de los datos.
Las estadsticas pblicas son una de las piedras angulares del buen
gobierno y de la confianza del pblico en el buen gobierno., (Consejo
Econmico y Social, 2004)


Grado en el cual la informacin
estadstica y su proceso de
produccin satisfacen las
expectativas de sus diferentes
interesados. (Tarazona, 2006)
Calidad de
informacin
estadstica
Capacidad para interpretar y evaluar
crticamente la informacin
estadstica
Capacidad para discutir o comunicar
sus opiniones respecto a tales
informaciones estadsticas cuando
sea relevante (Batanero, 2002)
Cultura
estadstica
Elaboracin de informes estndar de calidad con indicadores cualitativos y
cuantitativos de los dominios de calidad definidos y medicin de sus mejoras
Utilizacin de modelos de medicin de calidad en los instrumentos
Mejoramiento en las relaciones con las unidades informantes (Facilitando la
forma de proporcionar los datos y reduciendo la carga de respuesta)
Realizacin de encuestas de satisfaccin de los usuarios
Realizacin de foros de dilogo productores-usuarios
Elaboracin de manuales que permitan al personal conocer temas Buenas
practicas en la elaboracin de encuestas oficiales
Elaboracin de una listas e verificacin genrica para programas sencillos de
autoevaluacin de los responsables de las encuestas
Realizacin de auditorias internas
Elaboracin y distribucin de documentos sobre la misin y polticas de
difusin
Ejecucin de programas de formacin en materia de calidad para el personal
ACCIONES O INSTRUMENTOS PARA EL MEJORAMIENTO DE CALIDAD DE
LAS ESTADISTICAS OFICIALES (presentada por el INE en la CEPAL, 2003)
CREDIBILIDAD EN LA ESTADSTICA PBLICA
Las buenas estadsticas son esenciales para generar una pintura objetiva de la
condicin econmica y social del pas
Un ciudadano informado es un mejor ciudadano. Las estadsticas posibiliten a las
personas a tomar mejores decisiones sobre su vida diaria
Las buenas estadsticas permiten a los gobiernos informar a la sociedades sobre el
avance de sus polticas y darles poder a los ciudadanos a evaluar su xito
Las estadsticas publicas crebles proporcionan valiosos antecedentes a los
ciudadanos para evaluar la calidad de las polticas pblicas
La credibilidad se deriva del respeto y confianza que los usuarios tengan por la
organizacin productora y los datos que emanen de ella
PORTALES ESTADSTICOS
http://biblioteca.unimagdalena.edu.co/index.php?option=com_content&task=view&id
=144
EL SISTEMA ESTADSTICO NACIONAL Y LA INFORMACIN
ESTADSTICA ESTRATGICA (SEN)
El sistema Estadstico Nacional (SEN) es segn el DANE:















El SEN forma parte de un universo que contiene tanto informacin
estadstica como no estadstica. Dentro de la informacin estadstica
existe informacin estadstica estratgica (IEE).









Se considera de carcter estratgico aquella informacin estadstica que
primordialmente apoya y sirve de insumo directo al Sistema de Cuentas
Nacionales, o se constituye como base para la toma de decisiones, el
diseo, formulacin, seguimiento y evaluacin de polticas pblicas a
nivel nacional, sectorial y territorial (DANE, 2008)
Registros
administrativos
Censos
Estadsticas
derivadas
Encuestas
Instrumentos para el fortalecimiento del
Sistema Estadstico Nacional (SEN)
http://190.25.231.249/aplicativos/sen/aym_document/aym_sen/El%20papel%20de%20los%20usuarios%20especializados
%20en%20el%20fortalecimiento%20del%20SEN%20COLOMBIA.pdf

La informacin estadstica estratgica en el Sistema
Estadstico Nacional Colombiano
Fuente: DIRPEN (2008). Documento de trabajo. El sistema Estadstico Nacional y la informacin
estadstica estratgica: articulacin de instrumentos.
ENDE
Busca garantizar la consolidacin del SEN para brindar al pas una informacin
estadstica estratgica en condiciones optimas soportada en informacin
estadstica y conocimiento
PENDES
Identifica a los usuarios de informacin estadstica estratgica, define
sus perfiles y determina las prioridades e produccin de informacin
estadstica
PAD
Es un sistema de informacin que permite la ejecucin de las mejores prcticas
y las normas internacionales en la documentacin y difusin de microdatos y
metadatos, aprovechando as la labor realizada por la red internacional para
encuesta de hogares
MIS
Son instrumentos que permiten representar grficamente, la distribucin de la
informacin estadstica sectorial, las cuales hacen referencia a tres aspectos
fundamentales: estructura del sector, normativa vigente, inventario de
operaciones estadstica del sector
SIEAT
Es un sistema de informacin creado para disponer de informacin territorial
relevante y estratgica que sirva para el diseo, monitoreo y evaluacin de
programas y polticas pblicas que sean implementadas en un espacio
geogrfico determinado
Plan estratgico nacional de estadstica y su dinmica
ESTANDARIZACIN DE CONCEPTOS
Los productos que se obtienen son:
Distribucin temtica de conceptos estandarizados
ESTANDARIZACIN DE METODOLOGIAS
Segn la ONU, los institutos nacionales
de estadstica deben contar con un
conjunto de valores y principios
fundamentales.

+ Persistencia

+ Imparcialidad

+ Acceso equitativo

+ Rendicin de cuentas

+Transparencia
BUENAS PRCTICAS PARA EL DESARROLLO ESTADSTICO
1. Pertinencia,
imparcialidad y
acceso
equitativo
2. Normas y
tica
profesionales
3. Rendicin de
cuentas y
transparencia
4. Prevencin de
la utilizacin
indebida
5. Fuentes de las
estadsticas
oficiales
6. Confidencialidad
7. Legislacin
8. Coordinacin
nacional
9. Utilizacin de
normas
internacionales
10. Cooperacin
internacional
P
R
I
N
C
I
P
I
O
S

D
E

B
U
E
N
A
S

P
R

C
T
I
C
A
S

D
E

O
N
U

B
A
N
C
O
S

D
E

B
U
E
N
A
S

P
R
A
C
T
I
C
A
S


ASEGURAMIENTO DE CALIDAD DE LA INFORMACIN
ESTADSTICA ESTRATGICA
Es un conjunto de procesos que busca garantizar que un producto o servicio
cumpla los estndares de calidad, estos estndares son parmetros que se
definen por la entidad certificadora y los estndares internacionales existentes.

Su objetivo es revisar y analizar, diagnosticar y evaluar el proceso de produccin
de la informacin estadstica estratgica del pas, analizando las principales
variables que garanticen su calidad.
PLANIFICACIN ESTADSTICA ESTRATEGICA
La planificacin estadstica tiene como objetivo organizar los procesos
de produccin y de gestin de la informacin estadstica institucional,
sectorial y territorial, de modo que esta se constituya en un soporte
eficiente para la formulacin de polticas pblicas, la planeacin, la
toma de decisiones, el seguimiento y evaluacin a los planes de
desarrollo y programas de gobierno
METODOLOGIA ESTADSTICA
1-METODOLOGIA ESTADSTICA
2-DATOS ESTADSTICOS
1.1-CONCEPTO Y NATURALEZA.
1.2-CLASIFICACION: TEMPORALES, ATEMPORALES
1.3-ESCALAS DE MEDIDA: NOMINAL, ORDINAL, INTERVALOS
3-VARIABLES ESTADSTICAS
2.1-VARIABLES CATEGRICAS O CUALITATIVAS
2.2-VARIABLES CUANTITATIVAS: DISCRETAS, CONTINUAS
4-ANLISIS DECRIPTIVO DE LOS DATOS ESTADSTICOS
3.1-GRAFICOS: HISTOGRAMAS, CAJAS, TENDENCIA, DISPERSIN 3.1-
DISTRIBUCIN DE FRECUENCIAS. ABSOLUTA. RELATIVA.
3.2-MEDIDAS DESCRIPTIVAS:
1-TENDENCIA CENTRAL
2-POSICIN
3-DISPERSIN
4-FORMA
5-ASOCIACIN
Los Datos son unidades de informacin que incluyen
percepciones, nmeros, observaciones, hechos y cifras, pero que
al estar desligada de un contexto particular, carecen de sentido
informativo.

La informacin, es un conjunto organizado de datos procesados,
que constituyen un mensaje sobre un determinado fenmeno y
proporciona significado o sentido a una situacin en particular.

Los datos se convierten en informacin cuando aportan
significado, relevancia y entendimiento, en un tiempo y lugar
especifico.

El principal desafo de la evaluacin y planificacin es separar los
datos que tienen sentido y aportan informacin, para asegurarse
de que el anlisis se realice basado en la mejor informacin
disponible.
http://www.transparenciacolombia.org.co/LACORRUPCION/EnColombia/tabid/101/language/
es-ES/Default.aspx

http://www.vanguardia.com/opinion/editorial/103670-corrupcion-de-las-estadisticas-al-drama-humano

http://suamox03.dane.gov.co:7778/pls/enh/enh_web_continua.definicion_e
nh1

http://chartsbin.com/view/2186

http://www.dnp.gov.co/EstudiosEconomicos/Estad%C3%ADsticashist%C3%B3ri
casdeColombia.aspx

CARACTERISTICAS POBLACIONALES
(PARAMETROS)
Valores desconocidos de la Poblacin
Se estiman con base en muestras
METODOLOGIA ESTADISTICA
IDENTIFICACION DEL PROBLEMA
D
E
S
OBTENCION DE DATOS
PROCESAMIENTO Y SINTESIS DE DATOS
C
R
I
P
T
I
V
DATOS de la POBLACION
Conjunto total de mediciones de
la caracterstica del proceso
DATOS de la MUESTRA
Subconjunto representativo de
la poblacin (grupo de
mediciones)
CARACTERISTICAS MUESTRALES
(ESTIMADORES) A


Funcin de la muestra
Se infieren a la poblacin
LA ESTADSTICA:
Estudia Fenmenos Aleatorios:
variabilidad inherente.
Fenmenos parcialmente predecibles debido a su
Identifica y Analiza la Variabilidad Inherente de los Fenmenos Aleatorios.
Proporciona mtodos para recolectar, organizar, resumir y analizar informacin
con fines descriptivos e inferenciales.
A) Esquema General del Proceso de Obtencin, Elaboracin y Anlisis
de Resultados.
Esquema General (Vicens 2005)
Universo Poblacional.
Mtodos de Muestreo.
Tamaos y Errores de
Muestro.
Tabulacin de la
Informacin.
Fuentes Secundarias
DETERMINACIN
DEL OBJETIVO
OBTENCIN DE
INFORMACIN
ANLISIS
TCNICO
INFORME DE
RESULTADOS
Fuentes Primarias
Internacionales.
Nacionales.
Tablas y Grficos.
Estadstica Descriptiva.
Anlisis de Correlacin
Simple
Anlisis de
Dependencia. (MBRL, ANOVA,
Anlisis Discriminante, LOGIT, PROBIT, TOBIT,
REGRESIN COX)
Anlisis de
Interdependencia. (Anlisis
Factorial, Anlisis Cluster,)
Multivariante


DATOS ESTADISTICOS
PROBLEMAS, INFORMACION Y DATOS ESTADISTICOS
REALIDAD
INDISPENSABLE:
Planificar la recoleccin de datos dentro del
UNIDADES EXPERIMENTALES
marco de las preguntas que deben contestarse.
Datos correctos y exactos, recopilados mediante
elaborados diseos muestrales o experimentales,
son intiles si no permiten resolver las preguntas
MEDIDAS RELEVANTES
de inters.
INFORMACION UTIL
PROCESO GENERADOR DE INFORMACION UTIL PARA LA SOLUCION DE PROBLEMAS:
1. FORMULACION DEL PROBLEMA O PREGUNTAS QUE DEBEN RESOLVERSE
2.
3.
RECOPILAR DATOS RELATIVOS A LAS CUESTIONES PLANTEADAS DISEO EXPERIMENTAL

ORGANIZAR Y ANALIZAR LOS DATOS EN FORMA ADECUADA:
1. ANALISIS GRAFICO
2. ANALISIS NUMERICO
DATOS ESTADISTICOS
RESULTADO NUMERICO DE MEDIDAS SOBRE UNIDADES EXPERIMENTALES
OBSERVACIONES DISPONIBLES PARA EL ANALISIS ESTADISTICO

INFORMACION: ESTA BASADA EN DATOS. PERMITE RESOLVER PROBLEMAS
CLASIFICACION DE LOS DATOS:
1. DATOS TEMPORALES: SERIES CRONOLOGICAS (Ver ejemplo)
DATOS DE UN MISMO ELEMENTO EN DISTINTOS PERIODOS DE TIEMPO

2. DATOS ATEMPORALES: MATRICES DE DATOS
DATOS DE DIFERENTES

EJEMPLO: Carros.sf6
ELEMENTOS EN UN MISMO PERIODO DE TIEMPO
X1 X2 ... Xj ......... Xp
ESCALAS DE MEDIDA
1.
2.
3.
4.
NOMINAL
ORDINAL
INTERVALO
RELACION
MATRIZ
de DATOS
Xij
Tipos de Informacin Estadstica en Tiempo y Espacio.
La informacin estadstica pueden adoptar tres tipos de dimensiones: la temporal, la espacial o
ambas a la vez. As, y definiendo, existen tres tipos de datos:
Series
Temporales
Los datos se refieren a la
evolucin de una o ms variables
a lo largo de un determinado
tiempo.
PIB per cpita (ppp) de Mxico
10.101,2
13.406,7
8000
9000
10000
11000
12000
13000
14000
1
9
9
0
1
9
9
1
1
9
9
2
1
9
9
3
1
9
9
4
1
9
9
5
1
9
9
6
1
9
9
7
1
9
9
8
1
9
9
9
2
0
0
0
2
0
0
1
2
0
0
2
2
0
0
3
2
0
0
4
2
0
0
5
2
0
0
6
2
0
0
7
2
0
0
8
Fuente: World Bank
Corte
Transversal
Los datos se refieren al
comportamiento de una
variable para diferentes
individuos.
0,594
0,584
0,412
0,000
0,100
0,200
0,300
0,400
0,500
0,600
0,700
A
r
B
o
B
r
C
l
C
o
C
r
E
c
M
x
N
i
P
a
P
e
R
.
D
o
m
U
y
V
e
ndice de Concentracin de Gini (2008)
Fuente: Comisin Econmica para Amrica Latina y el Caribe (CEPAL)
POOL (PANEL DATA)
Combinan la variabilidad temporal y
transversal de una variable.

ESCALA

CARACTERISTICAS

EJEMPLOS

MEDIDAS ESTADISTICAS
1.IDENTIFICACION Y CLASIFICACION DE
UNIDADES

2.LOS NUMEROS INDICAN LA CLASE O
CATEGORIA. NO INDICAN CANTIDAD DE
LA CARACTERISTICA DE LAS UNIDADES
1.CLASIFICACION POR SEXO
2.CLASIFICACION POZOS
PETROLEROS

(PRODUCTIVO, SECO)

1.PORCENTAJES
2.MODA


NOMINAL


ORDINAL

1.ORDENAMIENTO Y POSICION RELATIVA DE
LAS UNIDADES

2.INDICA SI UNA UNIDAD TIENE MAS O
MENOS CANTIDAD DE LA
CARACTERISITICA QUE OTRA UNIDAD

3.NO INDICA LA MAGNITUD DE LAS
DIFERENCIAS ENTRE LAS UNIDADES

4.PERMITE MEDIR OPINIONES, ACTITUDES,
PREFERENCIAS


1.CLASE ECONOMICA SOCIAL
2.CALIDAD DEL CRUDO:

(PESADO, LIVIANO)

1.FRACTILES
2.MEDIANA


INTERVALOS

1.LAS DIFERENCIAS ENTRE UNIDADES
PUEDEN COMPARARSE.

2.LAS DISTANCIAS IGUALES EN LA ESCALA
REPRESENTAN VALORES IGUALES EN LA
CARACTERISTICA QUE SE MIDE

3.EL PUNTO CERO ES ARBITRARIO

1.TEMPERATURA (F, C)
2.OPINIONES 3.INDICES

1.MEDIA
2.RANGO
3.VARIANZA
4.DESVIACION ESTANDAR
5.COEFICIENTE CORRELACION


RELACION
1.EL PUNTO CERO ES FIJO

2.LA RELACION ENTRE LOS VALORES DE
LA ESCALA SE PUEDE CALCULAR

1.EDAD 2.INGRESO 3.COSTOS

1.MEDIA GEOMETRICA
2.COEFICIENTE VARIACION
ESCALAS DE MEDIDA
VARIABLES

CUALITATIVAS
ESTADISTICAS

CUANTITATIVAS
Vernier
No PASA
PASA
Tiempo
ON OFF
TEMPERATURA
Circuito Elctrico
Termmetro
7
VARIABLES DISCRETAS
DIAGRAMA de BARRAS. GRAFICO DE SECTORES
Frecuencia Frec. Acumulada
Class CIL Absoluta Relativa Absoluta Relativa
1 4 104 0.689 104 0.689
2 6 30 0.199 134 0.887
3 8 17 0.113 151 1.000
Diagrama de barras: Se utilizan rectngulos separados, que tienen como
base a cada uno de los datos y como altura la frecuencia de ese dato.

Ejemplo: En la siguiente tabla se muestra el total de vacunas aplicadas
durante el verano de 1991 en un estado de la Repblica Mexicana.
Ojiva de Frecuencias Acumuladas: Una grfica de distribucin de
frecuencias absolutas o relativas acumuladas es llamada una ojiva. Se
trazan los lmites reales superiores contra las frecuencias acumuladas.
GRFICOS ESTADSTICOS
0
1
f
r
e
c
u
e
n
c
i
a
Miles galones de agua
25
30
35
0
2
4
6
8
10
12
14
5 10 15 20 25 30 35 40
#

d
e

f
a
m
i
l
i
a
s
CONSUMO DE AGUA (MILES DE GALONES)
POLIGONO DE FRECUENCIAS
GRFICOS ESTADSTICOS
Polgono de frecuencias: Se puede construir dibujando primero un
histograma y luego conectando por medio de lneas rectas los puntos
medios de la parte superior de cada una de las barras o rectngulos
Ejemplo:
Se pregunt si estamos gastando Muy poco, ms o menos o demasiado
en programas sociales.
GRFICOS ESTADSTICOS
Diagrama de torta: Consiste en representar las frecuencias absolutas o
relativas a travs de un circulo que representa el 100% de las frecuencias,
y subdividiendo el circulo en parte proporcional
Cartograma es un mapa o diagrama que muestra datos de cantidad
asociados a respectivas reas, mediante la modificacin de los tamaos de
las unidades de enumeracin.
Limite Limite Punto Frecuencia Frecuencia Acumulada
Clase Inferior Superior Medio Absoluta Relativa Absoluta Relativa
1 13.0 15.6 14.3 1 0.0067 1 0.0067
2 15.6 18.1 16.9 11 0.0733 12 0.0800
3 18.1 20.7 19.4 19 0.1267 31 0.2067
4 20.7 23.3 22.0 10 0.0667 41 0.2733
5 23.3 25.9 24.6 12 0.0800 53 0.3533
6 25.9 28.4 27.1 20 0.1333 73 0.4867
7 28.4 31.0 29.7 14 0.0933 87 0.5800
8 31.0 33.6 32.3 18 0.1200 105 0.7000
9 33.6 36.1 34.9 22 0.1467 127 0.8467
10 36.1 38.7 37.4 11 0.0733 138 0.9200
11 38.7 41.3 40.0 5 0.0333 143 0.9533
12 41.3 43.9 42.6 3 0.0200 146 0.9733
13 43.9 46.4 45.1 3 0.0200 149 0.9933
14 46.4 49.0 47.7 1 0.0067 150 1.0000
Total 150
VARIABLES CONTINUAS
HISTOGRAMA de FRECUENCIAS. DIAGRAMA de CAJA.
DISTRIBUCION de FRECUENCIAS (Carros.sf6)
22
El Histograma indica la mezcla de tres poblaciones (origen)
El anlisis debe hacerse por grupo de origen

PROCEDIMIENTO STATGRAF:
20
19
ANALYZE VARIABLE DATA
ONE VARIABLE ANALYSIS
DISTRIBUCION DE FRECUENCIAS
GRFICOS DE TENDENCIA
Anlisis de patrones y tendencias
Visualiza el comportamiento de los datos en el tiempo
Tendencia creciente Tendencia decreciente Corrida de proceso
Valores anormales Ciclos Variabilidad creciente
65
PARMETROS Y ESTADSTICOS
Parmetro: Es una cantidad numrica
calculada sobre una poblacin.
La altura media de los individuos de un
pas.
La idea es resumir toda la informacin
que hay en la poblacin en unos pocos
nmeros (parmetros).
Estadstico: (cambiar poblacin por muestra).
La altura media de los que estamos en este aula.
Somos una muestra (representativa?) de la poblacin.
Si un estadstico se usa para aproximar un parmetro tambin se le suele
llamar estimador.
66
Estadsticos de forma intuitiva
SINTESIS DESCRIPTIVA DE
LOS DATOS ESTADISTICOS
1-TENDENCIA CENTRAL
2-POSICION
3-DISPERSION
4-FORMA
5-ASOCIACION


A-GRAFICOS Y TABLAS
GRAFICOS UNIVARIANTES. MULTIVARIANTES

TABLAS
TABLAS DE FRECUENCIAS
TABLAS CRUZADAS
B-MEDIDAS DESCRIPTIVAS


1.TENDENCIA CENTRAL

MEDIA ARITMETICA

MEDIANA

MODA
2.POSICION (ORDEN)

MAXIMO

MINIMO

CUANTILES (CUARTILES, PERCENTILES)
3.DISPERSION (VARIABILIDAD)

RANGO, RANGO INTERCUARTILICO

VARIANZA, DESVIACION ESTNDAR

COEFICIENTE DE VARIACION


4.FORMA

ASIMETRIA (SESGO)

CURTOSIS (ACHATAMIENTO)


5.ASOCIACION

COVARIANZA

CORRELACION

1-MEDIDAS DE TENDENCIA CENTRAL
Se elimina un porcentaje (5-10%) de los
Media Acotada Conjunto Total Datos
valores ms altos y bajos del conjunto de datos
(datos outliers)
(Media Recortada)
(%Menor + %Mayor)
Media Geomtrica G= (X1*X2**Xn)
1/n
Escala de Medida No Lineal.
(G)
Log(G) =E(log(Xi))/n
2-MEDIDAS DE POSICION (MEDIDAS DE ORDEN)
3-MEDIDAS DE DISPERSION (VARIABILIDAD)
UNIDAD Media Desv Est CV (%)
1-Comparacin de muestras con distintas unidades de medida y diferentes promedios
Tiempo Espera Minutos 78.7 12.14 12.05
Salario Bs F 1000.0 215.35 21.53


2-Comparacin de muestras con las mismas unidades de medida, y diferentes promedios
Temperatura A C 1100 225 20.45
Temperatura B C 800 200
25.00
19
DESVIACION ESTANDAR (S)
Raz cuadrada positiva de la Varianza. Medida de dispersin ms comn
Se expresa en las mismas unidades que la Variable Estadstica.
Estandariza los valores de la VE (VE con media cero y desviacin estndar unitaria)
Z = (X ) / ~ (0;1)
Permite calcular la proporcin de datos contenido en cierto intervalo alrededor de la
media: El Intervalo ( K) contiene al menos (1-1/K
2
), K>1
COEFICIENTE DE VARIACIN: Medida de Dispersin Relativa
4-MEDIDAS DE FORMA
HISTOGRAMAS y FORMAS
NORMAL BIMODAL
INTERVALO VACIO
ASIMETRIA POSITIVA ASIMETRIA NEGATIVA
UNIFORME
DATOS OUTLIERS
Universo
Poblacin
Muestra
Individuos
Conceptos
bsicos
Etapas
Preparacin
Muestra
Procedimiento
Probabilsticos
No probabilsticos
M
U
E
S
T
R
E
O

Significatividad
Representatividad
Tamao de la muestra
Simple
Sistemtico
Estratificado
Conglomerados
Multietpico
Deliberado
Accidental
Bola de nieve
Por voluntarios
CARACTERISTICAS VENTAJAS INCONVENIENTES
Aleatorio simple
Se selecciona una muestra
de tamao n de una
poblacin de N unidades,
cada elemento tiene una
probabilidad de inclusin
igual y conocida de n/N.
Sencillo y de fcil
comprensin.

Clculo rpido de medias y
varianzas.

Se basa en la teora
estadstica, y por tanto
existen paquetes
informticos para analizar
los datos
Requiere que se posea de
antemano un listado
completo de toda la
poblacin. Cuando se
trabaja con muestras
pequeas es posible que
no represente a la
poblacin
adecuadamente.
Sistemtico
Conseguir un listado de los N
elementos de la poblacin
Determinar tamao muestral
n.
Definir un intervalo k= N/n.
Elegir un nmero aleatorio, r,
entre 1 y k (r= arranque
aleatorio).
Seleccionar los elementos de
la lista.
Fcil de aplicar.
No siempre es necesario
tener un listado de toda la
poblacin.
Cuando la poblacin est
ordenada siguiendo una
tendencia conocida,
asegura una cobertura de
unidades de todos los
tipos.
Si la constante de
muestreo est asociada
con el fenmeno de
inters, las estimaciones
obtenidas a partir de la
muestra pueden contener
sesgo de seleccin
Ventajas e inconvenientes de los distintos tipos de muestreo
probabilstico
Estratificado
En ciertas ocasiones
resultar conveniente
estratificar la muestra
segn ciertas variables
de inters. Para ello
debemos conocer la
composicin
estratificada de la
poblacin objetivo a
hacer un muestreo. Una
vez calculado el tamao
muestral apropiado,
este se reparte de
manera proporcional
entre los distintos
estratos definidos en la
poblacin usando una
simple regla de tres.

Tiende a asegurar que la muestra
represente adecuadamente a la
poblacin en funcin de unas
variables seleccionadas.

Se obtienen estimaciones ms
precisa

Su objetivo es conseguir una
muestra lo ms semejante posible a
la poblacin en lo que a las
variables estratificadoras se refiere.
Se ha de
conocer la
distribucin en
la poblacin de
las variables
utilizadas para
la
estratificacin.
Conglomerados
Se realizan varias
fases de muestreo
sucesivas
(Polietpico)

La necesidad de
listados de las
unidades de una
etapa se limita a
aquellas unidades
de muestreo
seleccionadas en
la etapa anterior.
Es muy eficiente
cuando la poblacin es
muy grande y dispersa.

No es preciso tener un
listado de toda la
poblacin, slo de las
unidades primarias de
muestreo.
El error estndar es mayor
que en el muestreo
aleatorio simple o
estratificado.

El clculo del error
estndar es complejo.



Conceptos bsicos del muestreo
CARACTERSTICAS DE LA INFORMACIN
Calidad
Suficiente
1. Confiable
2. Oportuna
Confiable
3. Bajo costo
Mtodo de bsqueda de
informacin
Censo
Muestreo
MUESTREO:
Es una tcnica inductiva que permite determinar tanto el tamao de
muestra como seleccionar una o ms de una poblacin de acuerdo al tipo
de modelo de muestreo a utilizar: as como obtener estimaciones de
totales, promedios, proporciones, etc. La estimacin puede ser tan exacta
como queramos al incrementar el tamao de muestra
Costo reducido (Gastos son menores que los que se
realizan si se lleva a cabo un censo)
Mayor rapidez (el muestreo emplea menos tiempo en
recopilar y procesar los datos que el censo)
Mayor exactitud (Se espera que una encuesta bien
empleada produzca resultados ms exactos que el censo.
En el censo, ms errores de complejidad. El muestreo
emplea personas de mayor calibre
Estimar vlidamente el margen de error y decidir si los
resultados son suficientemente exactos. El censo no revela
el margen de incertidumbre al cual est sometido. En
poblaciones pequeas, mejor el censo
VENTAJAS MUESTREO vs. CENSO
1
Disear instrumentos o cuestionarios de la encuesta
2
Economa de adquirir una cantidad especfica de informacin
3
Seleccionar el tipo de muestreo adecuado de acuerdo al
objetivo
4
Determinacin de tamaos de muestra con error especificado. El
muestreo abarca tres grandes reas:a
Diseo de la muestra
Determinacin de la muestra
Inferencias
OBJETIVOS DEL CURSO
ETAPAS PRINCIPALES DE LA INVESTIGACIN
POR MUESTREO
Se realiza segn el plan
de tabulacin diseado
y las tcnicas
estadsticas propuestas
para cumplir con los
objetivos previstos en la
investigacin

Se redacta el informe de
resultados de la
investigacin por muestreo y
se ejecuta el plan de
publicacin de los mismos
Objetivos de la
encuesta
Poblacin bajo
muestreo
El marco
Unidad de muestreo
Seleccin de la
muestra
Informacin que se
recopilar
Grado de precisin
deseado
Mtodo de obtener
informacin
Referencia de tiempo y
periodo de referencia
Cuestionario u hoja de
encuesta
Capacitacin de los
entrevistados y
supervisin
Inspeccin de la
informacin entregada
1.
Planeacin
y ejecucin
de una
encuesta
(Fase I)
3. Informe
y
publicacin
de
resultados
2.
Presentaci
n y anlisis
de datos
Planeacin
y ejecucin
de una
encuesta
(Fase II)

INCONVENIENTES DEL MUESTREO
Al seleccionar una muestra podemos hacerlo de tal forma que sta
no sea representativa de la poblacin que queremos estudiar o
que al hacerlo cometamos errores.

Errores en la seleccin de la muestra. Porque el listado base de los
individuos de la poblacin sea incompleto, contenga errores o sus datos
sean insuficientes, o bien porque se haya recurrido a un mtodo
incorrecto de muestreo (por Ej. Estudiar las caractersticas de una
enfermedad en voluntarios que acudan al hospital).

Errores debidos a las no respuestas. La imposibilidad de localizar
a algunos individuos seleccionados o la negativa de stos a responder al
cuestionario o a acudir a un examen puede no ser debida al azar, por lo
que a menudo puede actuar como fuente de error en la estimacin de un
parmetro.

Errores de medida o de observacin. Son los debidos a la impericia
del observador o a defectos del aparato de medida.
Errores de transcripcin. Son los que se producen cuando, por
ejemplo, se anota la cifra del pulso en la casilla correspondiente a la
tensin arterial diastlica o cuando se anota 2.300 g. como peso de un
recin nacido que en realidad pesa 3.200 g.

Errores en el tratamiento de la informacin. Son los que se
comenten al codificar, tabular o, en general, procesar la informacin
inicial.

Error propio de la estimacin muestral.
Estrategias para aumentar la exactitud
Estandarizacin de los mtodos de medicin
Entrenamiento y acreditacin de los observadores
Refinamiento de los instrumentos
Automatizacin de los instrumentos
Cegamiento o enmascaramiento
Calibracin del instrumento con un estndar de oro.

Estrategias para aumentar la precisin
Estandarizacin de los mtodos de medicin
Entrenamiento y acreditacin de los observadores
Refinamiento de los instrumentos
Automatizacin de los instrumentos
Repeticin
Error de medida
SISTEMATICO ALEATORIO
OBSERVADOR
SUJETO
INSTRUMENTO
VARIABILIDAD DEL
ESTIMADOR EN EL
MUESTREO.

ERROR NO DE MUESTREO ERROR DE MUESTREO
SESGO DE INFORMACION
ERROR ESTANDAR
DISEO y EJECUCION
TEORIA DEL MUESTREO
MUESTRA
POBLACION
PARAMETROS
ESTIMADORES

x
P
p
Error de medida
SISTEMATICO ALEATORIO
ERROR NO DE MUESTREO
ERROR DE MUESTREO
ERROR ESTANDAR
MARCO CONCEPTUAL
* Poblacin de Referencia: Conjunto de elementos o sujetos
acerca de los cuales queremos conocer una o varias
caractersticas (Consideraremos solo el caso de Poblaciones
finitas pero relativamente grandes).

Se describen generalmente de manera conceptual:
Nios en edad escolar del municipio X
Municipios de Colombia
Estudiantes universitarios de pregrado.
Manzanas del Municipio de Bucaramanga

Tipos de poblacin objetivo

1. Hogares y personas

2. Clientes empleados o miembros de organizaciones

3. Organizaciones

4. Eventos

5. Poblaciones poco frecuentes


Unidades de Anlisis, unidad elemental, unidad de
observacin o elemento: Nombre genrico que reciben los
elementos o sujetos que constituyen una poblacin y que podran
ser objeto de interrogatorio o medicin.


Unidades de muestreo: Son colecciones no traslapadas de
elementos de la poblacin que cubran la poblacin completa. Otra
definicin: colecciones o grupos no solapados de unidades
elementales. Tambin es la unidad donde realizamos la muestra.

Ejemplos:

Encuestas de vivienda-Unidad de muestreo: manzanas definidas de tal forma que
cada vivienda no pueda ser muestreada ms de una vez y que cada vivienda tenga
una oportunidad de ser seleccionada en la muestra

Encuesta sobre ingreso familiar-Unidad de muestreo: vivienda

Proporcin de votantes que favorecieron la emisin de bonos-Unidad de
muestreo: hogares. Unidad elemental: votantes
En cualquier caso las Unidades de Muestreo deben cubrir
por entero la Poblacin sin interceptarse.
Unidades de Primera Etapa (UPE): En una primera etapa
del muestreo pueden ser seleccionados directamente los
individuos que sern interrogados o sobre los que se har la
medicin.

Unidades de Segunda Etapa (USE): En una primera etapa
se seleccionen conglomerados (UPE), y en una segunda
etapa, se seleccionan las Unidades que sern interrogadas
o medidas. Y as sucesivamente
Despus de tener definido el cuestionario, para completar la elaboracin de datos primarios es
necesario cumplir las siguiente etapas:
Procedimiento Estadstico para la
Elaboracin de Datos Primarios
Determinacin del
Universo Poblacional
Determinacin
del Tamao de la
Muestra
Eleccin del
Mtodo de
Muestreo
Clculo de
los Errores de
Muestreo
Trabajo de Campo
(Aplicacin de la
Encuesta)
1 5 2 3 4
Marco Muestral: Conjunto de listas de todas las
unidades de muestreo necesarias para llevar adelante
el proceso.

Por ejemplo: Para interrogar u observar caractersticas
de jefes de hogar en una ciudad puede se necesario
contar con:

Listado de Manzanas de la ciudad.
Listado de Hogares de cada Manzana.
No se puede hablar de muestreo probabilstico e
inferencia estadstica sin contar con Marcos
Muestrales.

Tipos de marco de muestreo

1. De lista

2. De reas


El marco de muestreo es defectuoso si presenta:

1. Sobrecoberturas

2. Subcoberturas

3. Duplicacin
Muestra: Coleccin de unidades mustrales de un
marco o de varios marcos. Puede decirse tambin que
muestra es una proporcin representativa de la
poblacin. Son requisitos deseables de una buena
muestra:


Representatividad
(que se garantiza con la
seleccin adecuada del tipo
de muestreo)
Confiabilidad
(est relacionada con el
tamao de la muestra)
El anlisis estadstico puede extenderse o no, a todo el conjunto de elementos que
participan en nuestra investigacin. En este sentido, todo el conjunto de individuos
o elementos que tienen caractersticas comunes recibe el nombre de poblacin.
Por razones obvias de coste, slo podemos analizar una parte de esta poblacin
que se denomina muestra. Por tanto, una muestra ser todo subconjunto
representativo del total de la poblacin.
En el caso de que nuestra investigacin se dirija a toda la poblacin se dice que se
realiza un censo, mientras que la recogida muestral recibe el nombre de encuesta.
Poblacin y Muestra.
Una muestra
debe cumplir:
Perfecta Acotacin del Universo
Conocimiento preciso de las unidades que lo componen
Obtencin de un Censo



Tipos
de
muestreo
Muestreo probabilstico






Muestreo no probabilstico
Muestreo irrestricto aleatorio
Muestreo estratificado
Muestreo sistemtico
Muestreo por conglomerados
por reas
Muestreo Bietpico
Muestreo Polietpico
Intencional u opintico
Sin norma circunstancial
errtico
A capricho o comodidad
Por cuotas: a conveniencia
administrativa o econmica
Juicio
Bola de nieve







Probabilidad de Seleccin y Diseos Probabilisticos:
Supongamos que tenemos una poblacin:
{ }
N
e e e P ,... ,
2 1
=
El mtodo de seleccin es estadsticamente riguroso si se
cumple:

Que se ha otorgado a cada elemento de la poblacin una
probabilidad conocida i (diferente de cero) de integrar la
muestra

Ejemplo 2: Se escriben los 12 nmeros en igual nmero de tarjetas
que se colocan en una urna y se toma al azar 6 nmeros; la teora
combinatoria permite probar que en este caso cada individuo tiene igual
probabilidad tambin de ser elegido.

Sin embargo, los dos mtodos de eleccin son diferentes.
Diseos Equiprobablsticos:
Todos los elementos de la Poblacin tienen la misma probabilidad de
ser seleccionados. Es decir i es constante para todo i.
Ejemplo 1: Tenemos 12 individuos numerados del 1 al 12 y los
separamos en dos grupos. Grupo 1, los numerado del 1 al 6, Grupo 2 los
numerados del 7 al 12. Se lanza una moneda, si cae cara se elige el
Grupo 1 y si sello el Grupo 2. La probabilidad de elegir cualquier
individuo es igual a .
En que se diferencian los dos mtodos?
Diseos No Equiprobablisticos:

Ejemplo: Ahora los 12 individuos estn separados en dos
grupos: En el Grupo 1 hay 4 individuos y en el Grupo 2 hay 8
individuos. Los 6 individuos se seleccionan as: Se
seleccionan al azar 3 individuos del Grupo 1: la probabilidad
de elegir cualquier individuo de este grupo es , y se eligen
al azar 3 individuos del Grupo 2: la probabilidad de elegir a
cualquier individuo de este grupo es 3/8.
El diseo es probabilstico, pero no equiprobabilistico
Muestras No Probabilsticas:
Seleccin realizada sin ningn mtodo.

No se recomienda en ningn caso.
Muestreo semiprobabilstico.

Se mantiene el rigor probabilstico hasta cierto punto y
de all en adelante se abandona. Solo se recomienda
cuando no hay nada ms que hacer y tomando muchas
precauciones para no generar sesgos.
Muestreo por cuotas.
Forzar que la muestra contenga el mismo porcentaje de individuos con
ciertas caractersticas prefijadas que la poblacin entera.

Por ejemplo: Se le asigna a cada encuestador una manzana en la cual
debe hacer 10 entrevistas: As:

5 hombres y 5 mujeres.
Uno profesional.
Dos mayores de 50 aos 6 deben estar entre los 25 y los 49
aos y el resto entre 15 y 24 aos.

Puede conducir a importantes sesgos debido a que la seleccin final del
encuestado se deja al juicio subjetivo del entrevistador.
Seleccin segn criterio de autoridad.
En ocasiones, con poblaciones y muestras pequeas se prefieren a
los estrictamente probabilsticos.
Representatividad:
La muestra exhibe internamente el mismo grado de
diversidad que la poblacin
Azar: (Definicin) Suceso imprevisible por ser fruto de
una coincidencia fortuita de series causales diversas.
Segn algunas escuelas, llamamos azar slo a
nuestra ignorancia de todos los factores causales que
inciden en un fenmeno.
Porque recurrimos al azar para escoger las muestra
con las cuales trabajar en el muestreo probabilstico?
Para establecer criterios que nos permitan medir el
grado de precisin con el cual se hacen las
estimaciones.
Para eliminar toda subjetividad en la eleccin de las
unidades de anlisis.
Garantiza el azar la representatividad?
MARCO Y LUCY (Librera en R TeachingSampling)
Base de datos de una investigacin gubernamental que
quiere responder al objetivo de medir el crecimiento
econmico en el sector industrial. (Tomado de Gutirrez, 2009)

Supongamos que para completar el objetivo se ha propuesto
desarrollar una encuesta a las empresas que hacen parte del
sector industrial para conocer el comportamiento en trminos
de constructores financieros, sociales y fiscales.

Cuando termine el proceso de medicin, se pueden calcular
estimaciones y construir indicadores que permitan inferir
sobre el crecimiento del sector en le periodo de inters.
Poblacin objetivo: empresas con actividades comerciales
en el sector industrial.

Proceso de medicin: se har con base a las
caractersticas de inters (ingresos del ltimo ao, impuestos
declarados en el ltimo ao, nmero de empleados)

Preguntas de inters:

1. En el ltimo ao fiscal, a cuanto ascendieron los ingresos en
esta empresa?
2. En el ltimo ao fiscal, a cunto ascendieron los impuestos
declarados por esta empresa?
3. Actualmente, cuntos empleados laboran para esta empresa?
4. Esta empresa acostumbra a enviar peridicamente material
publicitario por correo electrnico a sus clientes o potenciales
clientes?
Big Medium Small
0
5
0
0
1
0
0
0
1
5
0
0
2
0
0
0
2
5
0
0
Boxplot de Ingreso
Big Medium Small
0
5
0
1
0
0
1
5
0
2
0
0
2
5
0
Boxplot de empleados
Histograma de Ingreso
Income
F
r
e
q
u
e
n
c
y
0 500 1000 1500 2000 2500
0
2
0
0
4
0
0
6
0
0
Big
Medium
Small
Pie de Nivel
Income
0 50 100 200
0
5
0
0
1
5
0
0
2
5
0
0
0
5
0
1
0
0
2
0
0
Employees
0 500 1500 2500 0 50 150 250
0
5
0
1
5
0
2
5
0
Taxes



Parmetros Poblacionales
y
Estimacin Puntual






Parmetro Poblacional Estimador Puntual
Si N es el tamao de la poblacin
constituida por las observaciones

La Media Poblacional es:


Si n es el tamao de la muestra
constituida por las observaciones

La Media Muestral es:


El Total Poblacional El Total Poblacional Estimado es:

Si individuos de la poblacin
tienen una caracterstica de inters A,
la Proporcin Poblacional con la
Caracterstica A es:


Si en la muestra resultan individuos
con dicha caracterstica la Proporcin
Muestral es:

N
X X X ,... ,
2 1

=
=
N
i
i
X
N
X
1
1
n
x x x ,... ,
2 1

=
=
n
i
i
x
n
x
1
1
X N X
N
N X T
N
i
i
N
i
i
= = =

= = 1 1
1
x N T =

A
N
N
N
P
A
=
A
n
n
n
p
A
=
Estimacin por Intervalos

e

interpretacin

Pob


Error de
Muestreo


Media
Estimada
Intervalo de Confianza
del 95 %
Limite
Inferior
Limite
Superior
X 0.9 149.68 148.78 150.58
Y 3.8 155.88 152.08 159.69
Lmite Inferior = Estimacin Puntual - Error de Muestreo

Lmite Superior = Estimacin Puntual + Error de Muestreo
Ejemplo:
Tamao de Muestra: 100
Por ejemplo un Intervalo de Confianza del 95 % quiere
decir que si el investigador repitiera el experimento 100
veces en aproximadamente 95 ocasiones el Intervalo
incluir el verdadero valor del parmetro.

Confiabilidad
Es el grado de confianza con el cual el investigador
puede asegurar que el verdadero valor del parmetro
se encuentra en el intervalo calculado. Se da en
porcentaje generalmente del 90, 95, 98 por ciento.
Para la determinacin del Tamao de la Muestra debemos considerar que
intervienen las siguientes variables:
Tamao de la Muestra y Errores de Muestreo.
1 Error de Muestreo ( )
2 Tamao de la Poblacin ( )
3 Varianza Poblacional ( )
N
S
Adicionalmente habr que tener en cuenta para decidir el tamao muestral lo
siguiente:
1 Tipo de Muestreo utilizado
2 El nivel de confianza
El nivel de confianza ptimo
es de 95%. Esto es que
podramos equivocarnos un 5%
k
Para el clculo de errores de muestro es necesario diferenciar entre estimaciones
medias y totales o de proporciones.
1 Error de Muestreo para Medias y Totales
2 Error de Muestreo para Proporciones
n
q p
1 N
n N
2 k

=
N
= Tamao de la poblacin
= Tamao de la muestra
= Proporcin muestral
= (1- p )
n
p
q
n
S
N
n N
k

= 2
= Tamao de la poblacin
= Tamao de la muestra
= Cuasi varianza muestral
n
S
N
Un buen estimador debe se insesgado, eficiente
y consistente.
La media de la muestra es un buen estimador
para pequeas muestras.
Para muestras grandes y en virtud del teorema
del lmite central, la distribucin de las muestras
distintas seguir una distribucin normal.
Sigue los mismos criterios de estimacin que en
el caso de medias y totales.
Si el cuestionario contiene en su globalidad
variables de escala nominal la frmula ms
adecuada para el clculo de los errores de
muestreo es mediante proporciones. ste es el
mtodo que utiliz la UAM para estimar los
errores de muestreo de la Encuesta de
Inmigracin.
Validez
Es el grado en que un instrumento de medida
mide aquello que realmente pretende medir o
sirve para el propsito para el que ha sido
construido. (Hernndez Sampieri)

Grado en que un instrumento realmente mide
los que el investigador pretende. (Thorndike)
Prueba piloto

Es una muestra que antecede a la definitiva, cuya seleccin
se hace de acuerdo a los lineamientos que marca el diseo
de muestreo que se utilizar en el estudio definitivamente.

* Se tiene una primera aproximacin del tiempo y costos

* Estimar parmetros involucrados en la determinacin de la
muestra (media-varianza)

* Probar factibilidad (mtodos de seleccin de unidades
muestrales, medicin de variables, entre otros

* Probar factibilidad del cuestionario
Tamao del Error de Muestreo
Para comprender la importancia de este concepto
miremos el siguiente raciocinio:
Supngase que un Candidato cree contar con el 70 %
de opinin favorable.
En un Sondeo de opinin obtuvo que 75 % de los
encuestados estn por dicho candidato.

Se puede afirmar que se supera la creencia original?
Si el Error Muestral es del 8 % esto significa
que el verdadero valor promedio de favorabilidad
esta entre el 67 % y el 83 %.
Es decir, la favorabilidad en el momento del
nuevo sondeo podra ser incluso inferior a la
primera medicin.

En este caso el intervalo de confianza para la
favorabilidad promedio en el momento del sondeo, estara
entre el 71% y el 79 %, intervalo que esta por encima del
70 % (creencia original).
En otras palabras el sondeo solo mostrara superacin
de la creencia original, para una estimacin puntual del
75 %, si el error muestral fuera inferior al 5 % (digamos,
por ejemplo, 4 %).
El nuevo sondeo, para ser concluyentemente
favorable, debera tener un error muestral aun ms
pequeo digamos del 2 %. As, el nuevo intervalo del
73 % al 77 % al no interceptar al anterior apoyara la
conclusin de que la favorabilidad actual es mayor que
la original.
Pero hay algo ms:
Si la creencia original se estableci tambin por un
procedimiento de muestreo y lo que obtuvo fue un
Intervalo de Confianza de 68 % al 72 %.
Distribuciones

de

muestreo
Cada una de las muestras proporcionan un valor estimado del parmetro el cul
vara de muestra a muestra. Esta variabilidad proviene de un ERROR DE MUESTREO,
debido al azar, es decir, hay diferencias entre cada muestra y la poblacin y entre
diversas muestras, debido nicamente a caractersticas de los individuos
seleccionados para formar las muestras
DISTRIBUCIONES MUESTRALES DE X A PARTIR DE
POBLACIONES QUE SIGUEN UNA DISTRIBUCIN
NORMAL
Si se obtiene una muestra aleatoria n observaciones de una
poblacin que sigue aprox una distribucin normal con media
mu y desviacin estndar sigma, la distribucin de muestreo
de x barra ser normal y tendr:



DISTRIBUCIONES MUESTRALES DE X A PARTIR DE
POBLACIONES QUE NO SIGUEN UNA DISTRIBUCIN
NORMAL
RELACIN ENTRE EL TAMAO DE LA MUESTRA Y EL
ERROR ESTANDAR


Cuestionario
y
la
encuesta
LA ENCUESTA Y EL CUESTIONARIO
TAREAS BSICAS PARA ORGANIZAR UNA
ENCUESTA

1. Redactar un cuestionario
2. Confeccionar un plan de tabulacin y anlisis
3. Construir un marco muestral adecuado
4. Disear la muestra
5. Aplicar el cuestionario a las unidades elegidas
6. Procesar la informacin
7. Realizar inferencias
Diagrama de organizacin y desarrollo de una
encuesta por muestreo
Errores ajenos al muestreo
Pueden producirse por:


1. Deficiencias en aspectos como el diseo del cuestionario
2. La estructura o redaccin de las preguntas
3. En el registro de la informacin


Varios experimentos ponen en evidencia que el error
inducido por preguntas deficientemente formuladas pueden
superar los 20 30 puntos de porcentaje
El cuestionario
1. Instrumento bsico de recoleccin de informacin:

Preguntas (subjetividad: opiniones, Objetividad)

Mediciones
2 Formas de Aplicacin
A travs de un encuestador.

Cuestionario auto administrados

Por telfono

Procurando respuestas por correo

Encuesta asistida por computador usando el
Internet.
3. Ubicacin de las preguntas
El orden de las preguntas afectar la calidad de
informacin de la encuesta?

Si se est tratando un tema delicados, cul debe ser
la estrategia para ubicar las preguntas?

Lo que se recomienda es que no deben ubicarse al
principio del cuestionario. Todas las preguntas
conflictivas deberan dejarse para el final.


Las opciones presentadas deben ser exhaustivas

Cuando las opciones son valorativas, el nmero de
opciones que se presente al encuestado influye en
las respuestas.
Abiertas
Al dejar en libertad al encuestado para que
redacte un prrafo como respuesta, se debe prever
el tratamiento que se le dar.

Son tiles en estudios exploratorios
4. Tipos de Preguntas
Cerradas
4.1 Abiertas, cerradas


Cmo considera usted que es su estado de salud actualmente?

Bueno________ Malo__________
Cmo considera usted que es su estado de salud actualmente?

Bueno________ Aceptable ___________ Malo__________


Cmo considera usted que es su estado de salud actualmente?

ptimo______ Muy bueno ______ Bueno ______ Regular _______ Malo______


Ejemplos: (Preguntas cerradas)
Ejemplos: (Preguntas abiertas)
Cul es su opinin acerca del grado de eficiencia de la gestin gubernamental en
materia de sanidad ambiental?

________________________________________________________________________


Indique los mtodos con los cules usted practica el sexo seguro:
________________________________________________________________________


Cuantitativas
La respuesta es un nmero que puede ser el resultado de
una pregunta sobre aspectos objetivos o subjetivos.

O el resultado de una medicin.
Cualitativas
La respuesta es una categora.
En la mayora de los casos las categoras posibles (una de
las cuales debe ser escogida por el encuestado) son
aportadas en forma de pregunta cerrada
4.2 Cuantitativas, cualitativas
4.3 De ordenacin
Responden a preguntas que se enuncian como : Ponga en orden de
importancia dando una lista de opciones

En orden de importancia, de ms a menos, escriba los nombres de los tres
profesores que ms influyeron, positivamente, en su formacin durante la
carrera.
Ponga en orden de importancia para su vida numerndolos del ms importante (1) al
menos importante (5):

_______trabajo _______ relaciones de amistad
_______ relaciones de pareja _______ salud
_______dinero
En qu orden cronolgico deben a su juicio introducirse los alimentos
siguientes a los nios durante su primer ao de vida.
______ zumo de frutas _______ cereales
______ pescados
______ carne de res
4.4 De escala
Escala de analoga visual
Nada
Mucho
Segmento de recta de 10 cm aprox. El encuestado debe poner
una marca sobre la recta donde considere ms adecuado su
situacin
Cun fuerte han sido los ataques asmticos que ha sufrido en la ltima semana?

No tuve ataques De extrema
intensidad
Escala de Likert
Se usa para valorar el grado en que un individuo comparte
cierta lnea de pensamiento o teora.
Se aplica a una secuencia de afirmaciones (alrededor de 15)
acerca de un determinado punto de vista.
Para cada afirmacin la persona encuestada debe elegir
una de entre varias alternativas (usualmente entre 5 y 9) que
expresan diversos grados de adhesin a dicha posicin.
Para evitar que el encuestado responda sin pensar, en un
cierto sentido, se construyen unas preguntas en forma
positiva y otras en forma negativa.
Qu tan de acuerdo est con las siguientes afirmaciones
N TEMS completo
acuerdo
acuerdo Mediano
acuerdo
Desa-
cuerdo
Completo
desacuerdo
1 Su esposo puede cambiar y dejar de
maltratarla
1 2 3 4 5
2 Cuando su esposo la maltrata lo hace sin
querer hacerlo
1 2 3 4 5
3 Siente que su deber es conservar su familia
unida a pesar del maltrato
1 2 3 4 5
4 Para usted es motivo de orgullo mantener
el matrimonio a pesar del maltrato que
recibe
1 2 3 4 5
5 Tiene la esperanza de que su esposo
cambie y deje de maltratarla
1 2 3 4 5
6 Piensa que es indispensable que su esposo
permanezca en casa para criar bien a sus
hijos
1 2 3 4 5
ESCALA PARA IDENTIFICAR LA ETAPA DEL PROCESO DE CAMBIO EN QUE
SE ENCUENTRAN LAS MUJERES EN UNA RELACIN CONYUGAL VIOLENTA
ndice de consistencia interna
Si su valor es cercano a la unidad se trata de un instrumento
fiable que hace mediciones estables y consistentes.

Si su valor est por debajo de 0.8 el instrumento que se est
evaluando presenta una variabilidad heterognea en sus items y
por tanto llevar a conclusiones equivocadas.

Existen dos formas de calcularlo:
Requisitos para poder calcular la fiabilidad de un test:

1. Estar formado por un conjunto de items que se combinan aditivamente para
hallar una puntuacin global (esto es, las puntuaciones se suman y dan un
total que es el que se interpreta.

2. Todos los items miden la caracterstica deseada en la misma direccin. Es
decir, los items de cada una de las escalas tienen el mismo sentido de
respuesta. Este ltimo no es necesario para el mtodo de la varianza de los
items
Algunos comentarios sobre:
1. Recoleccin de la informacin.
Necesidad de establecer controles para garantizar que la
informacin que se recoge sea correcta.
2. Registro y captura de datos
Uso de Hojas de Excel, Access, o los mdulos especficos con
que cuentan los distintos paquetes estadsticos.

Conocer, o aprender a lidiar con los problemas de importacin
y exportacin de datos.
3. Procesamiento y anlisis de datos
Uso de hojas de Excel (clculos manuales)
Paquetes estadsticos:

Epi info, Modulo Complex Sample

SPSS , Modulo Complex Sample (versin 13 en adelante)

SAS, Procedimientos SurveyMeans, SurveyFreq, etc.

R-project, por la librera TeachingSampling
Encuesta sobre Hbitos de Consumo de los Inmigrantes en la
Comunidad de Madrid
Datos Tcnicos de la Encuesta

Tabulacin y Anlisis Primario de Datos con
SPSS
Ficha Tcnica de la Encuesta sobre Hbitos de Consumo de los Inmigrantes en la
Comunidad de Madrid
Entidades que
Participan
Consejera de Inmigracin de la Comunidad de Madrid e Instituto de
Prediccin Econmica L.R. Klein de la UAM
mbito
Universo
Personas mayores de 18 aos con nacionalidad ecuatoriana, colombiana,
peruana, boliviana, rumana, marroqu y resto (inmigracin econmica).
Muestra 1545 encuestas. (46 encuestadores)
Amplia variedad de zonas de trabajo de campo: calle, parques, locutorios,
metro, asociaciones, tren de cercanas.
Distribucin de
la Muestra
12 municipios de la Comunidad y 19 distrititos del municipio de Madrid con
mayor concentracin de inmigrantes.
Aplicacin de la
Encuesta
15 29 Octubre de 2007.
Error de
Muestro
Error de muestreo del 2,55% para el conjunto y de entre el10% para los
resultados por nacionalidad.
Datos Primarios
179 variables creadas y analizadas.
Esquema General de Trabajo de la Encuesta sobre Hbitos de Consumo de los
Inmigrantes en la Comunidad de Madrid
DE TERMINACIN
OBJETIVOS:
Consumo e Inversin de los
Inmigrantes

Anlisis de la Poblacin y
del Entorno
Economa de la Comunidad
de Madrid
Inmigracin y Economa en
la Comunidad de Madrid
Importancia del Consumo y
de la Inversin de la
Inmigracin
Determinacin de los
Mtodos y Errores de
Muestreo

Diseo del Cuestionario

Cuestionario Definitivo

Trabajo de Campo
ANLISIS DE RESULTADOS
1 Hbitos de consumo
2 Expectativas de futuro
3 Renta, Ahorro y Remesas
4 Inversin
Recomendaciones generales para la
construccin de un cuestionario (Segn Silva, 2000)



1. Comprobar que las preguntas que se realizan se deriven
exclusivamente de las que se haya formulado el
investigador.

Es necesario que haya consistencia entre los propsitos del estudio y el
contenido del cuestionario


2. Conformar cuestionarios tan breves como sea posible.

Los cuestionarios muy largos producen fatiga y desestimulo en el sujeto
interrogado.
3. Conseguir que las preguntas sean autoexplicativas.

Que no se requiera de instructivos para los encuestadores, y con mayor
razn para los entrevistados para explicaciones de preguntas.


4. Reducir al mximo las preguntas que exijan remomeracin
a largo plazo.

Cuando se pide informacin sobre acontecimientos muy lejanos, el sesgo
aumenta, pues el interrogado puede no recordar lo que se pide y
responder, si llega a hacerlo, de modo tentativo y ajeno a todo rigor.


5. Evitar preguntas abiertas salvo situaciones excepcionales

En ocasiones es necesario cuando se quiere una descripcin personal
que obliga a dar la palabra al encuestado. Por ejemplo, cuando se
pregunta sobre la comida favorita, es imposible anticipar todas las
posibles respuestas.

Segn Shuman y Presser (1981), han demostrado que las preguntas
abiertas pueden generar problemas de fiabilidad y validez.

Uno de los mtodos sugeridos para cerrar la pregunta es aplicar una
prueba con preguntas abiertas similares y utilizar las respuestas que se
presenten con ms frecuencias como opciones de respuesta para
conformar definitivamente la pregunta cerrada (Scheafer y Mendehall,
1996)

Se deberan cerrar las preguntas?
Por ejemplo:

Cuntos cigarrillos fuma como promedio diariamente?

_______________

Cuntos cigarrillos fuma como promedio diariamente?

_______ Ninguno
_______ de 1 a 20
_______ de 21 a 40
_______ ms de 40
6. Emplear la tcnica de retro traduccin siempre que la
encuesta original haya sido redactada en otro idioma

Retro traduccin significa traducir nuevamente al idioma original el
texto que se obtuvo como resultado de la primera traduccin. Se
espera que no difiera significativamente del texto original.


7. Tener en cuenta que el interrogado suele no adoptar una
posicin crtica ante la redaccin o la forma de la
pregunta.


Pregunta formulada a 189 estudiantes de la carrera de medicina de la
Habana (Silva y Macas, 2000).

En su opinin, es la informtica una tecnologa completamente
inteligente respecto del futuro?

Si______ No _______

8. Reparar en que el interrogado tiende a preocuparse ms
por la imagen que da por la exactitud de la informacin
que comunica


Comparte usted los argumentos existentes para fundamentar que se
otorgue el premio Nobel al creador de la vacuna antimeningocccica?

Si_______ No ________ No conozco el tema _____











Reaccin de los encuestados Nmero Porcentaje
Comparten los argumentos 68 36,0
No comparten los argumentos 15 7,9
Reconocen desconocimiento 106 56,1
Total 189 100,0
Dependiendo del tema (cuando son delicados), es conveniente
contextualizar con el fin de suavizar la situacin:

Su consumo de bebidas alcohlicas por lo general es:

Nulo_____ Escaso______ Moderado _______ Alto_____ Muy alto ____

Se podran hacer preguntas de este tipo:

a). En general, Ud. Dira que Ud. Ingiere bebidas alcohlicas:

Menos que sus amigos _______
Aproximadamente igual que ellos ______
Ms que sus amigos _______

b). Piense en aquel de sus amigos que ms alcohol consume. Cuntos
tragos Ud. Cree que l consume a diario como promedio?
______

c). Y cuntos consume Ud. Aquellos das en que lo hace?
Aproximadamente cuntos tragos?
_________
9. Valorar la conveniencia de usar una pregunta de filtro
antes que indagar directamente sobre determinada
conducta u opinin


Reciben los nios de este centro de atencin estomatolgica
sistemticamente?

Preventiva _______
Curativa _________
Ambas __________
No la reciben _______

Los nios de este centro reciben atencin estomatolgica sistemtica?
Si_______ No ______

Qu tipo de atencin reciben?
Preventiva Si_____ No____
Curativa Si_____ No____




Experimento en estudiantes universitarios (Silva y Macas, 2000).


Grupo A: Para el estudio independiente, utiliza usted la biblioteca?
Si______ No ________ (pasar a la prxima pregunta)


Cuntas veces hace uso de ella a lo largo de un mes?




Grupo B: Para el estudio independiente, Cuntas veces hace uso de la
biblioteca a lo largo de un mes?

_______ nunca
_______ una
_______ dos o tres
_______ cuatro o cinco
_______ ms de cinco

Nmero de
veces que usa
la biblioteca
Grupo A Grupo B
No % No %
Nunca 51 54,3 15 15,8
Una 5 5,3 13 13,7
Dos o tres 13 13,8 34 35,8
Cuatro o cinco 10 10,6 19 20
Ms de cinco 15 16 14 14,7
Influy notablemente la pregunta de filtro, para que los
encuestados reconocieran que no usaban la biblioteca para el
estudio personal.
10. Tener en cuenta que una pregunta que procure obtener
una opinin, si se proyecta sobre otra persona, puede
conseguir ms veracidad que cuando se reclama de
manera directa












Grupo A: Un compaero suyo se ve involucrado en un fraude acadmico. Cul es su
opinin acerca de la medida que debe tomarse? Estara a favor de:

_____Sancionarlo pero permitirle que contine la carrera
_____Expulsarlo de la carrera
_____ Hacerle slo una advertencia

Grupo B: Si usted se ve involucrado en un fraude acadmico, la medida adecuada
que procede aplicarle en su opinin sera:

_____ Sancionarlo pero permitirle que contine la carrera
_____ Expulsarlo de la carrera
_____ Hacerle slo una advertencia
Opciones Grupo A Grupo B
No % No %
Sancionarlo pero
permitirle que contine
la carerra
65 69,1 58 62,4
Expulsarlo de la carrera 14 14,9 9 9,7
Hacerle slo una
advertencia
15 16,0 26 27,9
Total 94 100 93 100
La opcin de perdonar al alumno se elige casi dos veces ms
para si mismo que para otros (16% frente a 28%)

Ausencia
de
respuesta
La mejor manera de enfrentar la ausencia de
respuesta es prevenirla.

Ante la ausencia de respuesta es posible,
modelar los datos faltantes, pero predecir esos
datos nunca es tan bueno como observarlos de
primera mano. Las personas que no responden
con frecuencia difieren de manera crucial de
las personas que si lo hacen.
Tipos de ausencia de respuesta

No respuesta por unidad (falta toda la unidad de
observacin)

No respuesta por elemento (falta al menos un individuo).

Formas de prevenir la ausencia de respuesta:

Prevencin. Diseo de la encuesta de modo que la
ausencia de respuesta sea pequea.

Extraer una submuestra representativa de quienes no
responden; y utilizarla para establecer inferencias acerca
de quienes no contestaron.

Utilizar modelos para predecir u observar como se
comportan los valores de quienes no responden.
Factores que afectan la ausencia de respuesta
FORMAS DE ENCARAR LA AUSENCIA DE RESPUESTA



Tcnicas de imputacin

De la media
Sustituir cada valor faltante por la media aritmtica

Por regresin
Si el valor a imputarse es un nmero (edad, salario, hemoglobina), usar
regresin mltiple
Si el valor es categrico (grupo religioso, status laboral), usar regresin
logstica

Cold-deck
Tomar un sujeto parecido al que tiene valores perdidos y atriburselo

Mltiple
Cada valor faltante se asigna m(>=2) veces distintas.
QU ES UNA TASA DE RESPUESTA
ACEPTABLE?
Con frecuencia el investigador dir: espero una tasa de
respuesta de 60% en mi encuesta Es esto aceptable? Me
dar la a encuesta resultados validos?

La repuesta a estas preguntas depende de la naturaleza de la
no respuesta: si los que no responden son completamente
aleatorios, entonces podemos ignorar por completo la no
respuesta y utilizar a quienes contestan como muestra
representativa de la poblacin. Si quienes no contestan tienden
a diferir, de quienes si, entonces los sesgos de los resultados al
usar solo a quienes si respondieron har que toda la encuesta
pierda su valor.
Se debe tomar en cuenta que las tasa de respuesta se pueden manipular al
definirlas de otra manera, y se acumulan resultados distintos para las tasa de
respuesta, segn la definicin utilizada:
















Obsrvese que una tasa de respuesta calculada con la ltima formula ser
mucho mayor que la calculada mediante la primer frmula pues el denominador
es menor.
muestra la en unidades de cantidad
concluidas s entrevista de cantidad
rechazos s inelegible unidades s contactada unidades
concluidas s entrevista

s inelegible unidades s contactada unidades
concluidas s entrevista

contactada unidades
s inelegible unidades concluidas s entrevista +
s contactada unidades de cantidad
concluidas s entrevista de cantidad
Por lo anterior se sugiere que se reporten varias tasas de respuesta para una
encuesta:


Tasa fuera de alcance: el cociente del nmero de unidades fuera de alcance
entre la cantidad de unidades al alcance y no respuesta.


Tasa de no contactos: el cociente del nmero de no contactos y las
unidades no resueltas entre las cantidad de unidades al alcance y no
resueltas.


Tasa de rechazo: el cociente del nmero de rechazos entre la cantidad de
unidades al alcance.


Tasa de no respuesta: el cociente del nmero de quienes no responden y
las unidades no resueltas entre la cantidad de unidades al alcance y no
resueltas.
Las distintas medidas de no respuesta pueden ser adecuadas para distintas
encuestas y no intentamos dar una definicin de tasa de respuesta que se ajuste
a todos los casos. Sin embargo, las cantidades utilizadas para calcular la tasa de
respuesta deben quedar definidas en cada encuesta, para lo que se recomienda
lo siguiente:


1. Los equipos de la encuesta deben calcularla de una manera uniforme con
respecto del tiempo y documentar los componentes en cada edicin de una
encuesta.


2. Los componentes de la tasa de respuesta deben publicarse en los informes de
la encuesta; los lectores pueden recibir las definiciones de las tasas utilizadas,
incluyendo las cifras reales, as como comentarios sobre la importancia de la
tasa de respuesta para la calidad de los datos de la encuesta.


3. Un poco de investigacin acerca de la no respuesta debe tener sus
dividendos, se debe de apoyar como una forma de mejorar la eficacia de las
operaciones de recoleccin de datos.


CONSENTIMIENTO INFORMADO
El consentimiento informado es el procedimiento mediante el cual se
garantiza que el sujeto ha expresado voluntariamente su intencin de
participar en la investigacin, despus de haber comprendido la informacin
que se le ha dado, acerca de los objetivos del estudio, los beneficios, las
molestias, los posibles riesgos y las alternativas, sus derechos y
responsabilidades.


El sujeto participante expresar su consentimiento por escrito o, en su
defecto, de forma oral ante un testigo independiente del equipo de
investigadores, que lo declarar por escrito bajo su responsabilidad.


Debe contener el objetivo, los posibles riesgos y beneficios, procedimientos,
alternativas y posibilidades de retiro, adems del nmero de telfono del
investigador y del encuestado para contactarlos.


Los proyectos de investigacin de las Ciencias Sociales relacionados
con la salud, tambin requieren del consentimiento informado oral o
escrito de los participantes. En estos casos, debe informarse al
participante sobre los objetivos del estudio, la metodologa por seguir,
las tcnicas e instrumentos que se utilizarn para registrar la
informacin (grabadora, fotografa, vdeo entre otros), la forma en que la
informacin recolectada ser resguardada, la utilizacin de los datos y
la garanta del anonimato de los participantes, durante y despus del
trabajo de campo.


En algunas investigaciones sociales no se exige el consentimiento
informado, entre otras razones, porque al notificar el propsito del
estudio los participantes podran cambiar su comportamiento.
Igualmente, en algunos estudios epidemiolgicos, podra existir una
voluntad comunal manifiesta de participar en el estudio, por ejemplo,
para el control de brotes o epidemias, sin embargo, siempre debe
respetarse el derecho individual a no participar

UNIVERSIDAD DE SANTANDER
Maestria en Gestin Pblica y Gobierno
Estadistica aplicada a las ciencias sociales
Regresin lineal simple
Correlacin simple (pearson)
Profesor: MSc. Miguel Prez

REGRESIN LINEAL SIMPLE
Es un modelo matemtico para predecir el efecto de
una variable sobre otra, ambas cuantitativas.
Una variable es la dependiente y otra la
independiente
Se grafica con el diagrama de dispersin.
Dice cmo es la relacin entre las dos variables.
El anlisis consiste en encontrar la mejor lnea
recta de esos puntos.

SUPUESTOS
La variable X o independiente o predictora (est bajo el control
del investigador), la variable Y es la variable dependiente o
predicha.

Los valores de X son fijos (seleccionados previamente por el
investigador).

Para cada X, existe un conjunto de valores de Y, que deben
seguir una distribucin normal (es decir, los valores de Y deben
ser normales), para aplicar con validez los procedimientos de
inferencia y/o estimacin.

Todas las varianzas de las subpoblaciones de Y son iguales.
EL MODELO DE REGRESIN LINEAL
La relacin se puede representar grficamente
mediante una lnea recta.
Se supone que el error sigue una distribucin
normal con media cero y varianza sigma
2
.
El modelo de regresin completo es

x y | o + =
Y es el valor de la variable dependiente
A o alfa es el intercepto, donde cruza el eje Y
B o beta es la pendiente o inclinacin
DIAGRAMA DE DISPERSIN
DIAGRAMA DE DISPERSIN Y RECTA
PRUEBA DE HIPTESIS
Prueba de Ho: beta=0, mediante la estadstica
F
Si beta es igual a cero, se concluye que:
La relacin es lineal y de fuerza para justificar
el uso de ecuaciones de regresin simple para
predecir y estimar Y para valores dados de X.

El modelo lineal proporciona un buen ajuste
para los datos, pero un modelo curvilneo
podra proporcionar un mejor ajuste.
ESTUDIO DE LA SIGNIFICANCIA
Tiene dos grandes partes:
El anlisis de varianza, que dice si el modelo es
significativo como un todo
El estudio de los coeficientes individuales por
medio de una prueba t. La prueba t permite probar
hiptesis y construir intervalos de confianza para
los coeficientes del modelo
EJEMPLO: REGRESIN LINEAL SIMPLE
EJEMPLO: REGRESIN LINEAL SIMPLE
EJEMPLO: REGRESIN LINEAL SIMPLE
EJEMPLO: REGRESIN LINEAL SIMPLE
Temperatura media anual y tasa de mortalidad por
100,000 habitantes
y = -0,0592x + 4,6146
R
2
= 0,8395
-0,5
0
0,5
1
1,5
2
2,5
0 20 40 60 80 100
Temperatura
T
a
s
a

d
e

m
o
r
t
a
l
i
d
a
d

p
o
r

1
0
0
,
0
0
0
CORRELACIN SIMPLE
CORRELACIN SIMPLE
Es una extensin de la regresin simple.
Mide la calidad del ajuste de una lnea.
Dice cunto se relacionan las dos
variables
r es el coeficiente de correlacin
r
2
es el coeficiente de determinacin


total iacin
licada in iacin
r
var
exp var
2
=
PRUEBA DE HIPTESIS
Ho: r=0, mediante la estadstica F

Si r es igual a cero, se concluye que no existe
correlacin lineal entre las variables, pero
puede ser no lineal (exponencial, curva, etc.)
COEFICIENTE R DE PEARSON
Puede variar de 1 a +1
-1 correlacin negativa perfecta
-0.9 correlacin negativa muy fuerte
-0.75 correlacin negativa considerable
-0.5 correlacin negativa media
-0.1 correlacin negativa dbil
0.0 no existe correlacin entre las variables
Los programas reportan el valor de p del coeficiente para
evaluar la significancia de la correlacin
ASOCIACIN ENTRE X Y Y
EJEMPLO: REGRESIN LINEAL SIMPLE
Temperatura media anual y tasa de mortalidad por
100,000 habitantes
y = -0,0592x + 4,6146
R
2
= 0,8395
-0,5
0
0,5
1
1,5
2
2,5
0 20 40 60 80 100
Temperatura
T
a
s
a

d
e

m
o
r
t
a
l
i
d
a
d

p
o
r

1
0
0
,
0
0
0