Está en la página 1de 60

Anlisis Cuantitativo

Fundamentos de Investigacin

El ncleo temtico tiene como objetivo el


desarrollar operativamente un problema de
investigacin, sobre el cual se puede efectuar
una indagacin con nfasis en la dimensin
cualitativa o cuantitativa, cada una de las
cules tiene sus mtodos. El mdulo de
anlisis cuantitativo hace nfasis en las
tcnicas bsicas de recoleccin de informacin
y su procesamiento en el software R.
2

CONTENIDO
Etapas de la investigacin estadstica
Poblacin
Muestra
Estadstica descriptiva
Estadstica inferencial
Tipos de variables
Escalas de medicin
Tcnicas de muestreo
Diseos experimentales
Diseo y validacin de cuestionarios
Diseo de bases de datos
2 y 3 de septiembre
3

Representacin grfica
Tablas de frecuencias
Medidas de tendencia central, posicin, variabilidad, forma
Tablas de contingencia
Pruebas de independencia y asociacin
Pruebas de bondad de ajuste
Pruebas de diferencia de medias (bajo normalidad y no normalidad)
Descripcin de algunas tcnicas de interdependencia y de dependencia

16 y 17 septiembre
4

BIBLIOGRAFA
DAZ, Luis Guillermo, MORALES, Mario Alfonso, (2012). Anlisis Estadstico
de datos Multivariantes. Universidad Nacional de Colombia. Primera
edicin.

Daz, L. y Morales, M. (2012). Anlisis estadstico de datos categricos.


PEA, D. (2002): Anlisis de datos multivariantes . McGraww-Hill, 2002
Casella, G. (2008), Statistical Design.

Kuehl, R. O. (2001), Diseo de experimentos. Principios estadsticos de


diseo y anlisis de investigacin.
Lohr, S. (2010) Muestreo: Diseo y Anlisis. Segunda edicin. Brooks cole.

Ramon, P. Garcia,J. Otros, Madrid (2009), Estadstica aplicada a la


educacin, Pearson Educacin.
5

FORMA DE EVALUACIN
Actividad
Ponderacin
Taller de clase #1, sesin uno
20%
Tarea #1: respecto al proyecto de 30%
investigacin aprobado por comit
curricular, se debe definir: poblacin,
tcnica de recoleccin de informacin,
diseo de cuestionario o protocolo del
experimento y diseo de la base de
datos

Fecha de entrega
3 de septiembre
15 de septiembre

Taller de clase #2, sesin dos


20%
Tarea #2: respecto al proyecto de 30%
investigacin aprobado por comit
curricular, se debe definir: plan de
resultados y tcnica estadstica de
anlisis de los datos.

17 de septiembre
30 de septiembre

OTROS ASPECTOS
Para el desarrollo de la tarea uno y dos se puede
hacer uso de las siguientes horas de tutora, ya
sea de manera virtual o presencial: sbado 10 de
septiembre de 8AM 12M y viernes 24 de
septiembre de 2-6PM (Oficina 53 tercer piso del
edificio administrativo o Aula virtual).
La entrega de los talleres de clase y tareas se har
a travs de la plataforma.
7

ELEMENTOS BSICOS DEL


PROYECTO DE INVESTIGACIN
El problema(planteamiento,
objetivos, justificacin)
Marco terico
Marco metodolgico
Aspectos administrativos

formulacin,

MARCO METODOLGICO

Tipo de investigacin y enfoque


Tipo de diseo (bibliogrfico o de campo)
Poblacin y muestra
Tcnicas e instrumentos de recoleccin de datos
Variables de estudio
Tcnicas de procesamiento y anlisis de datos
10

ETAPAS DE LA
INVESTIGACIN ESTADSTICA
Conjunto de mtodos cientficos que facilitan el
anlisis y la interpretacin de la informacin
obtenida de un censo o muestra

11

Realidad
(concreto)

Modelo

Modelo

Teora
(Abstracto)

Problema (Poblacin, variables de estudio)

Recoleccin de los datos (tipo de diseo)


Anlisis de los datos (tcnicas procesamiento y
anlisis datos)
Interpretacin

Sobre el problema de estudio

Tener claro el objetivo del estudio (plan o


proyecto de investigacin a realizar)
Situar el problema en trminos estadsticos
(Poblacin y variables de estudio)

Cmo se obtendrn
los datos?

Sobre la recoleccin de los datos

Diseo Bibliogrfico: Cuando


se utilizan datos secundarios ,
han sido obtenidos por otros
y llegan elaborados y
procesados

Diseo de Campo: Cuando los


datos se recogen
directamente por el
investigador

Bases de datos
Observacionales:
(Probabilsticos y no
probabilsticos)
Experimentales: Diseo de
experimentos, diseo cuasi
experimental, diseo ex post facto)

Sobre el anlisis de los datos


1. Siempre se debe efectuar una descripcin de los
datos
Resumen numrico o resumen grfico para detectar outliers,
errores en la entrada de los datos, sesgo o distribuciones
inusuales en su estructura.

2. Seleccin de la tcnica estadstica

Modelado dirigido por la teora:


habr que utilizar tcnicas
analticas, inferenciales o de
dependencia considerando una
variable dependiente explicada
por unas independientes ,
relacionndolas por una ecuacin

TCNICAS EXPLICATIVAS O DE
DEPENDENCIA

Anlisis de
varianza y
coovarianza
Modelamiento
estadstico

Series de
tiempo

Anlisis discriminante

Tcnicas

Modelado dirigido por los


datos: en estos casos todas
las variables tienen una
importancia equivalente
TCNICAS DESCRIPTIVAS O
INTERDEPENDENCIA

Anlisis
Cluster

Anlisis
factorial

Escalamiento
multidimensional

Escalamiento
ptimo

rboles de
decisin

Redes
neuronales

Sobre la interpretacin
Esta se da de acuerdo al objetivo del estudio y se
refiere a la interpretacin en el marco del
problema (marco conceptual) de las
conclusiones de tipo estadstico obtenidas.

18

RAMAS DE LA ESTADSTICA
Descriptiva

Describir y resumir el
conjunto de datos de
mltiples maneras.
Por lo general, esto
implica el clculo de
medidas descriptivas
y grficas.

Inferencial

Mediante la creacin de un
modelo matemtico infiere
el comportamiento de le
poblacin total partiendo de
los resultados obtenidos en
las observaciones de las
muestras

Estadstica

19

CONCEPTOS BSICOS
POBLACIN: Conjunto de personas, objetos,
ideas o acontecimientos que se someten a
observacin estadstica de una o varias
caractersticas.
ELEMENTO: Cada uno de los componentes de
la poblacin
TAMAO DE LA POBLACIN: nmero de
elementos de una poblacin que puede ser
finito o infinito

VARIABLE: Cualquier caracterstica de los


elementos de la poblacin susceptible de
tomar algn valor (numrico o no numrico)
DATO: manifestacin de una variable

La observacin de una variable implica conocer


para cada elemento el valor que toma cada
variable.

CMO SE PUEDE EFECTUAR LA OBSERVACIN DE


LAS VARIABLES?
Nmero de
elementos
observados

Exhaustiva
Parcial

Transversal
Clasificacin de las
observaciones

En funcin del
tiempo
Longitudinal

Procedimiento de
obtencin de los
datos

Directa
Indirecta

CMO PUEDEN SER LAS VARIABLES?

CUANTITATIVAS : Toma
valores numricos y
pueden ser continuas o
discretas
TIPOS DE VARIABLES

CUALITATIVAS: Toma
valores no numricos

CMO SE PUEDEN MEDIR LOS DATOS?

Hay diferentes tipos de escalas o niveles de


medicin sobre las propiedades o dimensiones
de los objetos o eventos, las cuales varan en
funcin de si tienen uno o ms de los
siguientes aspectos: origen, distancia y orden
(Wolman, 1984)

24

ESCALA DE INTERVALO:
ESCALA NOMINAL: No existe una
relacin de orden o de distancia entre
ellos. Las categoras son mutuamente
excluyentes y exhaustivas

ESCALA ORDINAL : Tan slo


existe una relacin de
orden entre ellos.

Los datos pueden clasificarse en orden


creciente o decreciente y adems es
posible medir la distancia entre ellos .
El cero es relativo no absoluto, no
indica ausencia de la magnitud.

ESCALA DE RAZN:
Implican adems de orden
y que se puedan
determinar las distancias,
que existe un cero
absoluto en la variable.

La relevancia de las escalas de medicin de los datos,


es que indican los clculos y las actividades grficas
que se pueden hacer con ellos para poderlos
explorar, organizar, resumir y presentar. De la misma
forma las diferentes pruebas de inferencia estadstica
aplicables a los datos, exigen diferentes niveles de
medicin. Mientras que la mayora de las pruebas
estadsticas en ingeniera y ciencias exigen
mediciones de intervalo o de razn, hay otras
pruebas que se han diseado para las ciencias de la
conducta que utilizan datos nominales u ordinales.

26

Ejemplos
DIMENSIN

ASPECTO

VARIABLE

SOCIOCULTURAL

Estrato socioeconmico
Lugar de origen (lugar de residencia de los padres)
Origen
Sociocultural Zona de origen
Gnero
Nivel educativo de la madre
Nivel
Educativo Nivel educativo del padre
Presencia de internet en la residencia
Presencia de biblioteca en la residencia
Presencia de computador en la residencia
Presencia de sitio de estudio en la residencia
Presencia de libros de estadstica en la residencia
Clima
Educativo de Opinin de los padres en cuanto a la carrera que el estudiante escogi.
la Familia
Opinin de los padres en cuanto a que hay que estudiar para mejorar.
Opinin de los padres en cuanto a que hay que estudiar una carrera que
de plata
Opinin de los padres en cuanto a que hay que estudiar lo que a uno
ms le gusta
Integracin
Social

Nmero de actividades que desarrolla el estudiante en sus tiempos libres


El tipo de actividad que desarrolla principalmente.

DESCRIPICIN
Variable Cualitativa ordinal
Variable cualitativa nominal
Variable cuantitativa discreta
Variable Cualitativa en escala
ordinal

Variable cualitativa
dicotmica de tipo nominal

Variable cualitativa de tipo


ordinal

Variable cuantitativa discreta


Variable de tipo nominal

27

Nombre de la variable
Ingreso familiar al presentar el examen de estado
Variable Cualitativa
Gnero
Variable Cualitativa
Numero de hermanos
Variable Cuantitativa
Edad al presentar el examen de estado
Variable Cuantitativa
Vivienda propia
Variable Cualitativa
Trabajaba al presentar el examen de estado
Variable Cualitativa
Nivel educativo de la madre
Variable Cualitativa
Puntaje en el examen de estado
Variable Cuantitativa
Materias perdidas
Variable cuantitativa
Estado acadmico del estudiante
Variable Cualitativa
Tiempo hasta la graduacin
Variable cuantitativa
Tiempo hasta la desercin
Variable cuantitativa

Escala de medicin

28

Cuando era estudiante me senta as:

Ahora me siento as
Cuando sea magister me sentir as:

29

SPSS
Statgraphics
Minitab
Statistic
SAS
S-Plus

SOFTWARE ESTADSTICO

R ( Economa Universidad, estudiante, acceso


desde su propio equipo (horarios y vida
profesional), el papel de la universidad en la
Sociedad a la hora de construccin de
conocimiento)

R: LENGUAJE DE PROGRAMACIN PARA EL


ANLISIS ESTADSTICO
R fue inicialmente diseado por Robert
Gentleman y Ross Ihaka, miembros del
Departamento de Estadstica de la Universidad
de Auckland, en Nueva Zelanda. Sin embargo,
una de las grandes ventajas de R es que hoy en
da es, en realidad, fruto del esfuerzo de miles
de personas en todo el mundo que colaboran
en su desarrollo.

INSTALACIN
Instalar R es sumamente simple, solo hay que
dirigirse a la pgina http://www.r-project.org donde
se le da click a la opcin download R, luego se escoge
un CRAN mirror, por ejemplo el de Colombia
http://www.icesi.edu.co/CRAN/ y se descarga la
aplicacin para el sistema operativo que el usuario
tenga en su computadora.
Luego se le da ejecutar, se escoge el idioma y se
instalar en la computadora. Una vez abierto el
programa se presentar una consola.

CONSOLA DE R

Lo primero que nos aparece es una ventana, tambin


llamada consola, donde podemos manejar R mediante
la introduccin de cdigo. Por ejemplo, podemos
escribir 2+2 en ella, pulsando Intro, lo que nos
devolver en la misma consola el valor 4.
SCRIPT: documento de trabajo en blanco. Podemos
incluir comentarios (#), ejecutar una o varias
instrucciones con Control + R o F5 o opciones click
derecho. Se puede guardar para el futuro Guardar
como
Posteriormente podemos abrir el SCRIPT en el mismo
menu

INSTALACIN Rcmdr
R Commander -Rcmdr- es una interfaz tipo ventana que cubre la mayor
parte de los anlisis estadsticos ms habituales en unos mens
desplegables a los que estamos bastante acostumbrados, ya que la
mayora de los programas que utilizamos en cualquier sistema operativo
son de este tipo.
Podemos decir que es una manera de manejar R sin necesidad de
aprender su cdigo o casi nada de l, lo cual lo hace bastante prctico
cuando se est aprendiendo a usarlo.

RECOLECCIN DE LA INFORMACIN

35

Nociones generales sobre muestreo estadstico


en poblaciones finitas
Muestreo aleatorio simple
Muestreo sistemtico
Muestreo estratificado
Muestreo por conglomerados
Muestreo por etapas
Muestreo no probabilstico o emprico
Principios del diseo de experimentos
Algunos diseos experimentales clsicos
36

Recursos limitados
Datos disponibles limitados
Prueba destructiva

Muestreo Probabilstico
Cuando la tcnica de muestreo asigna a
cada unidad de la poblacin alguna
probabilidad (diferente de cero) de ser
seleccionada - Mecanismos aleatorios

Muestreo No probabilstico
Tcnicas que no asignan a cada unidad
de la poblacin una probabilidad
Mecanismos al azar

DEFINICIONES
UNIDAD DE MUESTREO (UM) Y UNIDAD DE LA POBLACIN (UP): La poblacin debe
dividirse en unidades de muestreo que en su conjunto constituyen la poblacin.
Ej 1: Si estamos muestreando personas, podemos escoger al individuo, la familia, o los
ocupantes de alguna vivienda especfica como unidad de muestreo.
Ej 2. Si estamos muestreando un cultivo, se pueden yuxtaponer cuadrculas sobre los
mapas del terreno, los bosques u otras zonas de las cuales se necesite obtener
muestras.
MARCO MUESTRAL: Enumeracin de todas las UM.
Marco muestral de lista: cuando las unidades de muestreo del marco se constituyen en
un listado. Ejemplo: un listado de unidades agropecuarias, listado de empresas, listado
de estudiantes, listado de colegios.
Marco muestral de reas: cuando las unidades de muestreo del marco son reas de
terreno usualmente llamados segmentos (segmentos de rea) y dentro de ella suelen
haber varias unidades de informacin. Las unidades se ubican a travs de un sistema de
coordenadas y se utilizan mapas y listados.
Ejemplo: el marco de parcelas catastradas, marco digital de manzanas de vivienda de
Duitama, etc.

INSTRUMENTO DE MEDICIN: identificacin de qu va a medirse en la UM y


cmo. (DISEO DE CUESTIONARIOS)

DISEO DE MUESTREO: conjunto de mtodos para seleccionar una muestra


probabilstica.

FICHA TCNICA: puntos relevantes del diseo de la muestra que se incluyen en


el informe final del proyecto de investigacin, contiene mnimo: Especificacin de
las unidades de muestreo, consideraciones en la construccin del marco muestral,
de ser el caso utilizacin de la informacin complementaria, tamao de muestra,
margen de error, confiabilidad, diseo muestral, mtodos estadsticos para el
tratamiento de la falta de respuesta, control de otros errores ajenos al muestreo,
instrumento de medicin, mtodo de recoleccin

Seleccin de la muestra?

Se cuenta con el
marco muestral?
Finito

SI, Muestreo
probabilstico

Conclusiones
sobre la
poblacin

No, muestreo no
probabilstico

Conclusiones
sobre la muestra

ALGUNOS DISEOS DE MUESTREO PROBABILSTICO

Muestreo Aleatorio Simple (MAS)


Muestreo Aleatorio Estratificado (MAE)
Muestreo por conglomerados
Muestreo sistemtico

MUESTREO ALEATORIO SIMPLE

Requiere que la unidad de muestreo sea la misma unidad poblacional


y se llama muestreo irrestricto aleatorio si el muestreo se hace sin
reposicin.

El M.A.S. es el diseo en el cual cada muestra posible tiene igual


probabilidad de seleccin.
Una consecuencia es que en MAS cada elemento de la poblacin
tiene la misma probabilidad de ser seleccionado en la muestra.
Estos procedimientos de muestreo se conocen como Mtodos de
seleccin equiprobables .

Cmo se determina el tamao de la muestra?

Para estimar :
Sea e el error mximo permitido (en la unidad original),
entonces el n que garantiza ese error mximo para la
estimacin de al nivel de confianza 1-

en el MAS es:

N(z1- )
n
2
2
2
Ne (z 1- )
2

Problema: ?

Para estimar una proporcin:


2

N(z1- ) p(1 - p)
n
2
2
Ne (z1- ) p (1 p )

MUESTREO SISTEMTICO

Consiste en seleccionar las unidades elementales a intervalos


iguales tomando como punto de partida (seleccin del primer
elemento) aleatorio. Resulta til cuando las poblaciones se
encuentran ordenadas debido a que la seleccin de las unidades
elementales se hace ms fcil y disminuye los costos. Este
procedimiento facilita una distribucin espacial de la muestra que
puede ser til en muchas investigaciones.
Suponga que se numeran las N unidades de la poblacin de 1 a N en
cierto orden (por ejemplo las facturas de una compaa, los
miembros de un sindicato, las actas de nacimiento de una
poblacin, etc.). Para elegir una muestra aleatoria de n unidades,
tomamos una unidad al azar entre las k primeras y luego elegimos
las subsecuentes a intervalos de k unidades. Para determinar k se
toma la parte entera de N/n.
48

MUESTREO POR CONGLOMERADOS

til en el caso de que antes de tener unidades elementales se tienen


grupos de ellas denominadas conglomerados y cada grupo pasa a ser
una unidad de muestreo. Cundo es ms eficiente? Cuando los
conglomerados son muy heterogneos dentro y homogneos entre s.
Ejemplos:
Si se requiere informacin sobre los pasajeros de una flota de
transportes, quienes viajan en un autobs en un viaje determinado de
esa empresa constituyen un conglomerado.
Cuando se requiere informacin sobre los residentes en conjuntos
residenciales, la muestra puede estar constituida por edificios con todos
los hogares que residen en los edificios.
Cuando se requiere informacin sobre estudiantes, la muestra puede
estar constituida por colegios, cursos.
Otros conglomerados muy utilizados son : manzanas de una ciudad,
pginas de un libro, cajones de un archivo, canastas de cerveza o de
gaseosa, etc.

Los conglomerados deben estar bien definidos de modo


que todo elemento de la poblacin pertenezca a uno y slo
un conglomerado.
Debe existir una estimacin razonable acerca del nmero
de elementos de cada conglomerado.

Los conglomerados deben ser suficientemente pequeos


para que sea posible algn ahorro en los costos.
Los conglomerados deben escogerse de manera que se
minimice el incremento en el error de muestreo debido al
agrupamiento.
51

MUESTREO ALEATORIO
ESTRATIFICADO

Definicin: La poblacin de N elementos se


divide en L grupos llamados estratos. Se
toman luego M.A.S. dentro de cada estrato.
Consecuencia: la probabilidad de seleccin de
un elemento de la poblacin ya no es
constante (depende del estrato al cual
pertenece).
Cundo es ms eficiente? Cuando los estratos
son muy homogneos internamente y
heterogneos entre ellos.

ALGUNOS DISEOS DE MUESTREO NO PROBABILSTICO


Los siguientes son algunos tipos de muestreo
frecuentemente empleados (Cochran, 1977):
1. La muestra ha sido restringida a la parte de la poblacin
que es fcilmente accesible.
2. La muestra se selecciona teniendo en cuenta el azar
mas no la aleatoriedad (seleccionar los elementos que
estn ms a mano).
3. Con una poblacin heterognea y pequea, el
muestrista inspeccin la poblacin en general y selecciona
una muestra pequea de unidades tipo (cercanas a la
impresin que pueda tener de la media poblacional).

USO DEL SOFTWARE PARA


LA OBTENCIN DEL
TAMAO DE MUESTRA Y
SELECCIN DE SUS
ELEMENTOS
55

Cmo se selecciona una MAS?


Por definicin, cada elemento (i) de los N de la
poblacin tiene igual probabilidad de ser
seleccionado (pi = n/N).
Una forma prctica es elegir n de a uno y sin
reponer sorteando n nmeros aleatorios distintos
entre 1 y N.
Usando una tabla de nmeros aleatorios o un
programa de cmputo (por ejemplo la funcin
ALEATORIO de Excel
o el paquete
TeachingSampling de R).

En Excel

57

En R

La versin de TeachingSampling cuenta con funciones para la


extraccin de muestras bajo diversos diseos muestrales.
S.WR y S.SI se puede obtener una muestra aleatoria simple con y sin
reemplazamiento, respectivamente.

S.SY para obtener muestras de muestreo sistemtico


S.PPS y S.piPS
muestreo con probabilidades proporcionales al
tamao, ya sea con o sin reposicin a travs de la funciones,
respectivamente
Cada tcnica de muestreo, dispone de una funcin que calcula una
estimacin del total poblacional, su varianza estimada y su
coeficiente de variacin estimado. Por tanto, es muy habitual en la
prctica que las funciones de seleccin de muestras y de estimacin
58
de parmetros se utilicen secuencialmente.

PRCTICA
Para instalar el paquete mientras se est ejecutando una sesin de R,
se puede usar el comando install.packages (TeachingSampling).

Para
cargarlo,
se
emplea
library(TeachingSampling).

este

otro

comando:

Al ejecutar el comando help(package =TeachinSampling), se obtiene


una lista con todas las funciones del paquete.

Si se necesita informacin adicional sobre alguna funcin en particular,


se puede utilizar el comando help(nombre), sustituyendo nombre por
el nombre concreto de la funcin a consultar.
59

60