Está en la página 1de 6

codificacin y tabulacin Editar 0 1

TEMA 7: CODIFICACIN Y TABULACIN La codificacin consiste en asignar a todos y cada uno de los tipos de respuesta del cuestionario o del documento de observacin un dgito o nmero que represente a dicha respuesta en un soporte informtico, un calculo estadstico... El objeto de la codificacin es representar todas y cada una de las respuestas de los cuestionarios y de las anotaciones de los documentos de observacin por cdigos numricos que faciliten su agrupacin. Las preguntas cerradas se codifican asignando un nmero a cada una de las respuestas predeterminadas. Para codificar las preguntas abiertas o semiabiertas se procede del siguiente modo: - Se leen todas las respuestas dadas a la pregunta - Se establecen clases de respuestas - Se asigna un cdigo a cada una de las clases de respuestas establecidas. ( La clasificacin de las preguntas abiertas es laboriosa y est sujeta a errores y subjetividades por lo que, sin negar la riqueza de matices que puede aportar, es aconsejable reducirlas al mnimo en los cuestionarios) Ejercicio: Para la pregunta abierta por qu piensa usted que no va a comprar el electrodomstico en los dos prximos aos?.Las respuestas han sido: - es demasiado grande para ponerlo en mi cocina - no tengo dinero para comprarlo - tiene un aspecto muy feo - no me gusta el color y cuesta mucho - he odo que es poco fiable - somos slo dos, por ahora no nos hace falta - estoy esperando que bajen el precio - su uso es muy difcil - no lo s realmente. Establece clases de respuestas, a la vista de las contestaciones dadas, y asgnales un cdigo

LA TABULACIN LA TABULACIN de los datos es el recuento del nmero de respuestas que ha tenido una pregunta y su presentacin en tablas. Consiste en resumir los datos en una tabla que sustituya la masa de datos difcilmente

manejable, por una representacin ordenada de los mismos, que facilite su uso. La tabulacin no tiene un fin en s misma, sino que es el medio que permite al investigador tener una visin de conjunto de la informacin de todos los cuestionarios, al convertir stos en datos homogneos que posteriormente sern objeto de anlisis. DEPURACIN DE LOS DATOS: Consiste en detectar aquellos datos que son errneos, bien por errores en la cumplimentacin del cuestionario, o bien por errores en inconsistencia de las respuestas. Caben dos opciones ante estos casos: se corrigen los datos errneos , observando de nuevo el elemento o recogiendo otra vez el dato, o, directamente,.se desecha ese dato. LAS TABLAS son la disposicin conjunta y ordenada de las sumas o totales de las respuestas de una pregunta o de varias relacionadas entre s, obtenidas de la tabulacin de los datos. CODIFICACIN DEPURACIN TABULACIN ANLISIS

Cmo se realiza la tabulacin de los datos? La tabulacin puede realizarse pregunta por pregunta tabulacin simple: tipo I, tipo II y tipo III . La tabulacin puede realizarse de dos en dos preguntas o ms preguntas a la vez. Tabulacin cruzada. En la tabulacin simple se calculan la frecuencia absoluta, la frecuencia relativa, las frecuencias acumuladas ( ascendente o descendente) y los porcentajes con que se presentaron dichas respuestas en la muestra. En la tabulacin cruzada se trata de poner en relacin las respuestas a dos o ms preguntas diferentes para ver en qu medida las respuestas estn ligadas entre s. Se calculan las frecuencias absolutas y relativas y las frecuencias conjuntas. TABLAS DE TIPO I Corresponde a situaciones en la que la variable x toma pocos valores y, adems , se dispone de pocas observaciones. En este caso basta con presentar la informacin de manera ordenada. Por ejemplo, x = nmero de hijos de los 5 trabajadores de mi empresa Las respuestas han sido: 0,3,0,1,3 Bastara presentar ordenados los datos : 0,0,1,3,3

TABLAS DE TIPO II Se utiliza en el caso de que la variable x toma pocos valores y , sin embargo, toma muchos datos. Ejplo: hemos preguntado a nuestros 50 empleados los das que faltaron al trabajo durante el mes pasado, las respuestas han sido: 1,0,0,3,4,1,2,9,1,0 1,2,3,3,4,0,0,1,1,1 1,1,2,3,3,4,0,1,0,2 1,0,0,2,3,3,2.1,0,0 0,2,3,4,4,2,1,0,2,0 X= das ausentes repeticiones

TABLAS DE TIPO III

Se utiliza este tipo de tablas cuando los valores que toma la variable objeto de estudio es muy grande. Por ejemplo: Estudiamos el peso de una determinada poblacin y obtenemos 40 datos pero muy diferentes 60- 66-67-70-59-55-78-80-55,50-63 61-58-64,5-56-71-83-62-60,40-49-55-52 70-74,32-80-58-48-52-53-57-67-66 77-74-67-63-58,9-54-65-66-60-50 En estos casos agrupamos los valores en intervalos, con lo que se consigue una mayor comodidad en el tratamiento de los datos. Siempre teniendo en cuenta que en esta agrupacin se pierde informacin. Los intervalos pueden tener la misma amplitud o no, dependiendo de la estructura de los datos y el estudio que se esta llevando a cabo. Adems pueden contener sus valores extremos ( intervalos cerrados, 2,10 ) o no ( intervalos abiertos ( 2,10) ) o incluir uno y no otro ( intervalos semiabiertos , 2,10) ) Si deseamos que los intervalos sean de amplitud constante se puede proceder de dos formas: - Fijando el nmero de intervalos - Fijando la amplitud Pasos: 1. Se calcula previamente el recorrido o rango de la variable, determinado por la diferencia entre el mayor y el menor valor

Re= max.dato-min.dato 1. Una vez obtenido el recorrido , est claro que:

Re= nmero de intervalos amplitud 1. Si fijamos la amplitud, el nmero de intervalos se calculara:

Nmero de intervalos= Re Amplitud 1. Si fijamos el nmero de intervalos, la amplitud se calculara:

Amplitud= Re Nmero de intervalos.

En el ejemplo presentar los datos en una tabla: a) amplitud de los intervalos :5 b) nmero de intervalos : 10

CONCEPTOS IMPORTANTES Poblacin: Conjunto de personas, animales o cosas sobre las que se va a realizar la investigacin. Estadstica: estudio de los colectivos o fenmenos de masa para DESCUBRIR REGULARIDADES del comportamiento o las relaciones existentes entre ellos. Elementos de una poblacin: cada una de las unidades o entes componentes de la poblacin Tamao de la poblacin: el nmero total de elementos que integra la poblacin Caracteres de la poblacin: La serie de cualidades, propiedades o rasgos comunes que poseen los elementos de una poblacin ( rasgos de un individuo: edad, sexo, nivel de estudios...) Cada uno de los caracteres de los elementos de una poblacin pueden presentar dos o ms situaciones diferentes posibles, que reciben el nombre de modalidades ( sexo: mujer, hombre) Los caracteres pueden ser: - Caracteres cualitativos o ATRIBUTOS: son aquellos que por su propia naturaleza no se pueden cuantificar - Caracteres cuantitativos o VARIABLES: son aquellos que se pueden describir mediante nmeros. EJERCICIOS DISTRIBUCIONES DE FRECUENCIAS: Hasta ahora hemos estudiado cmo se recogen los datos y cmo se presentan en forma de una tabla. Ahora vamos a estudiar las diferentes formas de disponer de los datos) para su posterior tratamiento estadstico. El nmero de repeticiones de cada valor de la variable ( el nmero de veces que aparecen los datos) se pueden presentar como: - Frecuencia absoluta: el nmero de veces que aparecen los datos ( las repeticiones el recuento) ( ni ) ni = N ( N es el total de la poblacin objeto de estudio) - Frecuencia relativa: es el cociente entre la frecuencia absoluta y el nmero total de datos ( fi = ni N ) - Frecuencia absoluta acumulada ascendente ( Ni ): el nmero de datos que son menores o iguales que xi - Frecuencia absoluta acumulada descendente ( Ni) : el nmero de datos que son mayores que xi

REPRESENTACIONES GRFICAS Tablas de tipo II : Diagramas de barras Diagramas acumulativos Tablas de tipo III: Histogramas Polgonos acumulativos REPRESENTACIONES GRFICAS DE DISTRIBUCIONES DE FRECUENCIAS RELATIVAS A ATRIBUTOS: ANLISIS UNIVARIABLE Estudio del comportamiento de una SOLA variable estadstica para un conjunto de elementos o individuos determinados. MEDIDAS DE POSICIN: Nos miden la posicin en torno a la cual se distribuyen nuestras observaciones. Diagrama de sectores Pictogramas Cartogramas ALGUNAS NORMAS A TENER EN ECUENTA SOBRE INTERPRETACIONES Y REPRESENTACIONES GRFICAS - Se debe tener siempre presente la escala de medida utilizada en el eje de ordenadas, ya que la misma distribucin de frecuencias puede presentar aspectos muy diferentes de acuerdo con la escala de medida utilizada. - Si las distribuciones de frecuencias corresponden a tablas de tipo III se debe tener en cuenta la eleccin de los intervalos en los que se agrupan las variables, porque diferentes agrupaciones producen representaciones distintas. CONCEPTOS IMPORTANTES ANLISIS E INTERPRETACIN DE DATOS Una vez tabulados los datos, sern sometidos a diversas tcnicas de anlisis. Este anlisis consiste en obtener, de los datos numricos contenidos en las tablas, medidas estadsticas representativas de las mismas y en determinar la validez de estas medidas para el conjunto de la poblacin objeto de estudio. La estadstica va a reducir los datos a una serie de valores ( estadsticos o medidas descriptivas) que permitan caracterizar el fenmeno estudiado. Las tcnicas de anlisis que vamos a estudiar en este mdulo son: - El anlisis univariable ( tabulaciones simples): o La media o La moda o La Mediana o La Varianza o La desviacin tpica o Medidas de deformacin: asimetra y curtosis. o Relaciones entre las mismas - El anlisis bivariable ( tabulaciones cruzadas):

o Coeficiente epsilon. o Coeficiente Rho de Spearman o Coeficiente r de Pearson o Relacin entre variables cualitativas: test de chi-cuadrado. o Cuando las variables son dicotmicas, su relacin se estudia con el coeficiente o Cuando las variables no son dicotmicas: coeficiente de contingencia C o Otros - El contraste de hiptesis o Formular la hiptesis nula. - El anlisis multivariante de la informacin: Los mtodos de interdependencia. o Los mtodos factoriales o ACP ( El anlisis de componentes principales) o AFC ( Anlisis factorial de correspondencias) o Otros - El anlisis multivariante de la informacin: Los mtodos de dependencia o La regresin mnimo cuadrtica

También podría gustarte