Está en la página 1de 7

TEMA 7: CODIFICACIN Y TABULACIN

La codificacin consiste en asignar a todos y cada uno de los tipos de respuesta del
cuestionario o del documento de observacin un dgito o nmero que represente a dicha
respuesta en un soporte informtico, un calculo estadstico...
El objeto de la codificacin es representar todas y cada una de las respuestas de los
cuestionarios y de las anotaciones de los documentos de observacin por cdigos
numricos que faciliten su agrupacin.
Las preguntas cerradas se codifican asignando un nmero a cada una de las respuestas
predeterminadas.
Para codificar las preguntas abiertas o semiabiertas se procede del siguiente modo:
Se leen todas las respuestas dadas a la pregunta
Se establecen clases de respuestas
Se asigna un cdigo a cada una de las clases de respuestas establecidas.
( La clasificacin de las preguntas abiertas es laboriosa y est sujeta a errores y
subjetividades por lo que, sin negar la riqueza de matices que puede aportar, es
aconsejable reducirlas al mnimo en los cuestionarios)
Ejercicio: Para la pregunta abierta por qu piensa usted que no va a comprar el
electrodomstico en los dos prximos aos?.Las respuestas han sido:
es demasiado grande para ponerlo en mi cocina
no tengo dinero para comprarlo
tiene un aspecto muy feo
no me gusta el color y cuesta mucho
he odo que es poco fiable
somos slo dos, por ahora no nos hace falta
estoy esperando que bajen el precio
su uso es muy difcil
no lo s realmente.
Establece clases de respuestas, a la vista de las contestaciones dadas, y asgnales un
cdigo

LA TABULACIN
LA TABULACIN de los datos es el recuento del nmero de respuestas que ha
tenido una pregunta y su presentacin en tablas. Consiste en resumir los datos en
una tabla que sustituya la masa de datos difcilmente manejable, por una
representacin ordenada de los mismos, que facilite su uso. La tabulacin no tiene
un fin en s misma, sino que es el medio que permite al investigador tener una visin
de conjunto de la informacin de todos los cuestionarios, al convertir stos en datos
homogneos que posteriormente sern objeto de anlisis.
DEPURACIN DE LOS DATOS: Consiste en detectar aquellos datos que son
errneos, bien por errores en la cumplimentacin del cuestionario, o bien por errores
en inconsistencia de las respuestas. Caben dos opciones ante estos casos: se corrigen
los datos errneos , observando de nuevo el elemento o recogiendo otra vez el
dato, o, directamente,.se desecha ese dato.
LAS TABLAS son la disposicin conjunta y ordenada de las sumas o totales de las
respuestas de una pregunta o de varias relacionadas entre s, obtenidas de la
tabulacin de los datos.
CODIFICACIN

DEPURACIN

TABULACIN

ANLISIS

Cmo se realiza la tabulacin de los datos?


La tabulacin puede realizarse pregunta por pregunta tabulacin simple: tipo I,
tipo II y tipo III .
La tabulacin puede realizarse de dos en dos preguntas o ms preguntas a la vez.
Tabulacin cruzada.
En la tabulacin simple se calculan la frecuencia absoluta, la frecuencia relativa, las
frecuencias acumuladas ( ascendente o descendente) y los porcentajes con que se
presentaron dichas respuestas en la muestra.
En la tabulacin cruzada se trata de poner en relacin las respuestas a dos o ms
preguntas diferentes para ver en qu medida las respuestas estn ligadas entre s.
Se calculan las frecuencias absolutas y relativas y las frecuencias conjuntas.
TABLAS DE TIPO I
Corresponde a situaciones en la que la variable x toma pocos valores y, adems , se
dispone de pocas observaciones. En este caso basta con presentar la informacin de
manera ordenada.
Por ejemplo, x = nmero de hijos de los 5 trabajadores de mi empresa
Las respuestas han sido: 0,3,0,1,3
Bastara presentar ordenados los datos : 0,0,1,3,3

TABLAS DE TIPO II
Se utiliza en el caso de que la variable x toma pocos valores y , sin embargo, toma
muchos datos.
Ejplo: hemos preguntado a nuestros 50 empleados los das que faltaron al trabajo
durante el mes pasado, las respuestas han sido:
1,0,0,3,4,1,2,9,1,0
1,2,3,3,4,0,0,1,1,1
1,1,2,3,3,4,0,1,0,2
1,0,0,2,3,3,2.1,0,0
0,2,3,4,4,2,1,0,2,0
X= das ausentes

repeticiones

TABLAS DE TIPO III


Se utiliza este tipo de tablas cuando los valores que toma la variable objeto de
estudio es muy grande.
Por ejemplo: Estudiamos el peso de una determinada poblacin y obtenemos 40
datos pero muy diferentes
60- 66-67-70-59-55-78-80-55,50-63
61-58-64,5-56-71-83-62-60,40-49-55-52
70-74,32-80-58-48-52-53-57-67-66
77-74-67-63-58,9-54-65-66-60-50
En estos casos agrupamos los valores en intervalos, con lo que se consigue una
mayor comodidad en el tratamiento de los datos. Siempre teniendo en cuenta que en
esta agrupacin se pierde informacin.
Los intervalos pueden tener la misma amplitud o no, dependiendo de la estructura de
los datos y el estudio que se esta llevando a cabo. Adems pueden contener sus
valores extremos ( intervalos cerrados, 2,10 ) o no ( intervalos abiertos ( 2,10) ) o
incluir uno y no otro ( intervalos semiabiertos , 2,10) )
Si deseamos que los intervalos sean de amplitud constante se puede proceder de dos
formas:

Fijando el nmero de intervalos


Fijando la amplitud
Pasos:
-

1. Se calcula previamente el recorrido o rango de la variable, determinado por


la diferencia entre el mayor y el menor valor
Re= max.dato-min.dato
2. Una vez obtenido el recorrido , est claro que:
Re= nmero de intervalos amplitud
3. Si fijamos la amplitud, el nmero de intervalos se calculara:
Nmero de intervalos= Re Amplitud
4. Si fijamos el nmero de intervalos, la amplitud se calculara:
Amplitud= Re Nmero de intervalos.
En el ejemplo presentar los datos en una tabla:
a) amplitud de los intervalos :5
b) nmero de intervalos : 10

CONCEPTOS IMPORTANTES
Poblacin: Conjunto de personas, animales o cosas sobre las que se va a realizar la
investigacin.
Estadstica: estudio de los colectivos o fenmenos de masa para DESCUBRIR
REGULARIDADES del comportamiento o las relaciones existentes entre ellos.
Elementos de una poblacin: cada una de las unidades o entes componentes de la
poblacin
Tamao de la poblacin: el nmero total de elementos que integra la poblacin
Caracteres de la poblacin: La serie de cualidades, propiedades o rasgos comunes
que poseen los elementos de una poblacin
( rasgos de un individuo: edad, sexo, nivel de estudios...)
Cada uno de los caracteres de los elementos de una poblacin pueden presentar dos
o ms situaciones diferentes posibles, que reciben el nombre de modalidades ( sexo:
mujer, hombre)
Los caracteres pueden ser:
Caracteres cualitativos o ATRIBUTOS: son aquellos que por su propia
naturaleza no se pueden cuantificar
Caracteres cuantitativos o VARIABLES: son aquellos que se pueden describir
mediante nmeros.
EJERCICIOS
DISTRIBUCIONES DE FRECUENCIAS:
Hasta ahora hemos estudiado cmo se recogen los datos y cmo se presentan en
forma de una tabla. Ahora vamos a estudiar las diferentes formas de disponer de los
datos) para su posterior tratamiento estadstico. El nmero de repeticiones de cada
valor de la variable ( el nmero de veces que aparecen los datos) se pueden
presentar como:
Frecuencia absoluta: el nmero de veces que aparecen los datos ( las
repeticiones el recuento) ( ni ) ni = N ( N es el total de la poblacin objeto
de estudio)
Frecuencia relativa: es el cociente entre la frecuencia absoluta y el nmero total
de datos ( fi = niN )
Frecuencia absoluta acumulada ascendente ( Ni ): el nmero de datos que son
menores o iguales que xi
Frecuencia absoluta acumulada descendente ( Ni) : el nmero de datos que son
mayores que xi

REPRESENTACIONES GRFICAS
Tablas de tipo II : Diagramas de barras
Diagramas acumulativos
Tablas de tipo III: Histogramas
Polgonos acumulativos
REPRESENTACIONES GRFICAS DE DISTRIBUCIONES DE FRECUENCIAS
RELATIVAS A ATRIBUTOS:
ANLISIS UNIVARIABLE
Estudio del comportamiento de una SOLA variable estadstica para un conjunto de
elementos o individuos determinados.
MEDIDAS DE POSICIN: Nos miden la posicin en torno a la cual se distribuyen
nuestras observaciones.
Diagrama de sectores
Pictogramas
Cartogramas
ALGUNAS NORMAS A TENER EN ECUENTA SOBRE INTERPRETACIONES
Y REPRESENTACIONES GRFICAS
Se debe tener siempre presente la escala de medida utilizada en el eje de
ordenadas, ya que la misma distribucin de frecuencias puede presentar aspectos
muy diferentes de acuerdo con la escala de medida utilizada.
Si las distribuciones de frecuencias corresponden a tablas de tipo III se debe
tener en cuenta la eleccin de los intervalos en los que se agrupan las variables,
porque diferentes agrupaciones producen representaciones distintas.
CONCEPTOS IMPORTANTES
-

ANLISIS E INTERPRETACIN DE DATOS


Una vez tabulados los datos, sern sometidos a diversas tcnicas de anlisis.
Este anlisis consiste en obtener, de los datos numricos contenidos en las tablas,
medidas estadsticas representativas de las mismas y en determinar la validez de
estas medidas para el conjunto de la poblacin objeto de estudio.
La estadstica va a reducir los datos a una serie de valores ( estadsticos o
medidas descriptivas) que permitan caracterizar el fenmeno estudiado.
Las tcnicas de anlisis que vamos a estudiar en este mdulo son:
-

El anlisis univariable ( tabulaciones simples):


o La media
o La moda
o La Mediana

o La Varianza
o La desviacin tpica
o Medidas de deformacin: asimetra y curtosis.
o Relaciones entre las mismas
El anlisis bivariable ( tabulaciones cruzadas):
o Coeficiente epsilon.
o Coeficiente Rho de Spearman
o Coeficiente r de Pearson
o Relacin entre variables cualitativas: test de chi-cuadrado.
o Cuando las variables son dicotmicas, su relacin se estudia con el
coeficiente
o Cuando las variables no son dicotmicas: coeficiente de contingencia C
o Otros
El contraste de hiptesis
o Formular la hiptesis nula.
El anlisis multivariante de la informacin: Los mtodos de interdependencia.
o Los mtodos factoriales
o ACP ( El anlisis de componentes principales)
o AFC ( Anlisis factorial de correspondencias)
o Otros
El anlisis multivariante de la informacin: Los mtodos de dependencia
o La regresin mnimo cuadrtica

También podría gustarte