Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tema Codificación y Tabulación
Tema Codificación y Tabulación
La codificacin consiste en asignar a todos y cada uno de los tipos de respuesta del
cuestionario o del documento de observacin un dgito o nmero que represente a dicha
respuesta en un soporte informtico, un calculo estadstico...
El objeto de la codificacin es representar todas y cada una de las respuestas de los
cuestionarios y de las anotaciones de los documentos de observacin por cdigos
numricos que faciliten su agrupacin.
Las preguntas cerradas se codifican asignando un nmero a cada una de las respuestas
predeterminadas.
Para codificar las preguntas abiertas o semiabiertas se procede del siguiente modo:
Se leen todas las respuestas dadas a la pregunta
Se establecen clases de respuestas
Se asigna un cdigo a cada una de las clases de respuestas establecidas.
( La clasificacin de las preguntas abiertas es laboriosa y est sujeta a errores y
subjetividades por lo que, sin negar la riqueza de matices que puede aportar, es
aconsejable reducirlas al mnimo en los cuestionarios)
Ejercicio: Para la pregunta abierta por qu piensa usted que no va a comprar el
electrodomstico en los dos prximos aos?.Las respuestas han sido:
es demasiado grande para ponerlo en mi cocina
no tengo dinero para comprarlo
tiene un aspecto muy feo
no me gusta el color y cuesta mucho
he odo que es poco fiable
somos slo dos, por ahora no nos hace falta
estoy esperando que bajen el precio
su uso es muy difcil
no lo s realmente.
Establece clases de respuestas, a la vista de las contestaciones dadas, y asgnales un
cdigo
LA TABULACIN
LA TABULACIN de los datos es el recuento del nmero de respuestas que ha
tenido una pregunta y su presentacin en tablas. Consiste en resumir los datos en
una tabla que sustituya la masa de datos difcilmente manejable, por una
representacin ordenada de los mismos, que facilite su uso. La tabulacin no tiene
un fin en s misma, sino que es el medio que permite al investigador tener una visin
de conjunto de la informacin de todos los cuestionarios, al convertir stos en datos
homogneos que posteriormente sern objeto de anlisis.
DEPURACIN DE LOS DATOS: Consiste en detectar aquellos datos que son
errneos, bien por errores en la cumplimentacin del cuestionario, o bien por errores
en inconsistencia de las respuestas. Caben dos opciones ante estos casos: se corrigen
los datos errneos , observando de nuevo el elemento o recogiendo otra vez el
dato, o, directamente,.se desecha ese dato.
LAS TABLAS son la disposicin conjunta y ordenada de las sumas o totales de las
respuestas de una pregunta o de varias relacionadas entre s, obtenidas de la
tabulacin de los datos.
CODIFICACIN
DEPURACIN
TABULACIN
ANLISIS
TABLAS DE TIPO II
Se utiliza en el caso de que la variable x toma pocos valores y , sin embargo, toma
muchos datos.
Ejplo: hemos preguntado a nuestros 50 empleados los das que faltaron al trabajo
durante el mes pasado, las respuestas han sido:
1,0,0,3,4,1,2,9,1,0
1,2,3,3,4,0,0,1,1,1
1,1,2,3,3,4,0,1,0,2
1,0,0,2,3,3,2.1,0,0
0,2,3,4,4,2,1,0,2,0
X= das ausentes
repeticiones
CONCEPTOS IMPORTANTES
Poblacin: Conjunto de personas, animales o cosas sobre las que se va a realizar la
investigacin.
Estadstica: estudio de los colectivos o fenmenos de masa para DESCUBRIR
REGULARIDADES del comportamiento o las relaciones existentes entre ellos.
Elementos de una poblacin: cada una de las unidades o entes componentes de la
poblacin
Tamao de la poblacin: el nmero total de elementos que integra la poblacin
Caracteres de la poblacin: La serie de cualidades, propiedades o rasgos comunes
que poseen los elementos de una poblacin
( rasgos de un individuo: edad, sexo, nivel de estudios...)
Cada uno de los caracteres de los elementos de una poblacin pueden presentar dos
o ms situaciones diferentes posibles, que reciben el nombre de modalidades ( sexo:
mujer, hombre)
Los caracteres pueden ser:
Caracteres cualitativos o ATRIBUTOS: son aquellos que por su propia
naturaleza no se pueden cuantificar
Caracteres cuantitativos o VARIABLES: son aquellos que se pueden describir
mediante nmeros.
EJERCICIOS
DISTRIBUCIONES DE FRECUENCIAS:
Hasta ahora hemos estudiado cmo se recogen los datos y cmo se presentan en
forma de una tabla. Ahora vamos a estudiar las diferentes formas de disponer de los
datos) para su posterior tratamiento estadstico. El nmero de repeticiones de cada
valor de la variable ( el nmero de veces que aparecen los datos) se pueden
presentar como:
Frecuencia absoluta: el nmero de veces que aparecen los datos ( las
repeticiones el recuento) ( ni ) ni = N ( N es el total de la poblacin objeto
de estudio)
Frecuencia relativa: es el cociente entre la frecuencia absoluta y el nmero total
de datos ( fi = niN )
Frecuencia absoluta acumulada ascendente ( Ni ): el nmero de datos que son
menores o iguales que xi
Frecuencia absoluta acumulada descendente ( Ni) : el nmero de datos que son
mayores que xi
REPRESENTACIONES GRFICAS
Tablas de tipo II : Diagramas de barras
Diagramas acumulativos
Tablas de tipo III: Histogramas
Polgonos acumulativos
REPRESENTACIONES GRFICAS DE DISTRIBUCIONES DE FRECUENCIAS
RELATIVAS A ATRIBUTOS:
ANLISIS UNIVARIABLE
Estudio del comportamiento de una SOLA variable estadstica para un conjunto de
elementos o individuos determinados.
MEDIDAS DE POSICIN: Nos miden la posicin en torno a la cual se distribuyen
nuestras observaciones.
Diagrama de sectores
Pictogramas
Cartogramas
ALGUNAS NORMAS A TENER EN ECUENTA SOBRE INTERPRETACIONES
Y REPRESENTACIONES GRFICAS
Se debe tener siempre presente la escala de medida utilizada en el eje de
ordenadas, ya que la misma distribucin de frecuencias puede presentar aspectos
muy diferentes de acuerdo con la escala de medida utilizada.
Si las distribuciones de frecuencias corresponden a tablas de tipo III se debe
tener en cuenta la eleccin de los intervalos en los que se agrupan las variables,
porque diferentes agrupaciones producen representaciones distintas.
CONCEPTOS IMPORTANTES
-
o La Varianza
o La desviacin tpica
o Medidas de deformacin: asimetra y curtosis.
o Relaciones entre las mismas
El anlisis bivariable ( tabulaciones cruzadas):
o Coeficiente epsilon.
o Coeficiente Rho de Spearman
o Coeficiente r de Pearson
o Relacin entre variables cualitativas: test de chi-cuadrado.
o Cuando las variables son dicotmicas, su relacin se estudia con el
coeficiente
o Cuando las variables no son dicotmicas: coeficiente de contingencia C
o Otros
El contraste de hiptesis
o Formular la hiptesis nula.
El anlisis multivariante de la informacin: Los mtodos de interdependencia.
o Los mtodos factoriales
o ACP ( El anlisis de componentes principales)
o AFC ( Anlisis factorial de correspondencias)
o Otros
El anlisis multivariante de la informacin: Los mtodos de dependencia
o La regresin mnimo cuadrtica