Está en la página 1de 27

SISTEMATIZACIN DE DATOS

Manual de mtodos de investigacin para las ciencias sociales

Expositor: Cristina Gonzlez Prez

I. Formulacin del problema (identificacin y especificacin de un problema de inv.)

II. Diseo del experimento (seleccin de la tcnica de recoleccin de datos (observacin directa, entrevista, encuesta) que le permita obtener informacin a menor costo)

IV. Proceso de datos y su descripcin (se exponen los datos mustrales mediante representaciones tabulares, graficas y medidas estadsticas= descripcin del resultado)

III. Recoleccin de datos (implementacin de las tcnicas de recoleccin, bajo las reglas de stas para datos fiables)

V. Inferencia estadstica y conclusiones (en ella se define el nivel de confianza y significancia del proceso inferencia = anlisis y toma de decisiones)

CLASIFICACIN VARIABLES
cuantitativas
Son aquellas cuya determinacin est asociada a una unidad de medida, Ej, la estatura, el no. De habitantes, el ingreso mensual.

Continuas. Son aquellas que

mtricas.

Discretas o discontinuas. Son aquellas que

pueden tomar cualquier valor numrico, es decir un valor entero o fraccionario en un intervalo previamente especificado. Ej. El tiempo puede medirse en horas, minutos, segundos.

cuantifican las caractersticas por medio de valores enteros y nunca mediante fracciones de los mismos. Ej. El no. de clientes de un banco, el no. de hijos de una familia, el no. de alumnos

Cualitativas o no mtricas. Especifican y miden


cualidades en los individuos, lugares o cosas a partir de su descripcin con palabras. Ej. Gnero (hombre-mujer), religin (catlica, protestante), idioma (espaol, francs), estatus social (media, alta, baja).

Nominales. Son variables no mtricas usadas para describir una caracterstica que no puede ser cuantificada numricamente, Ej. El nombre de una persona, idioma, religin. A estas variables se les asignan nmeros, estos slo se emplean para diferenciar a las distintas categoras. Ej. Genero podra clasificarse en 2 categoras 1 hombres, 2 mujeres

Ordinales. Son

variables no mtricas que permiten describir las caractersticas de una persona, objeto o lugar, a partir de diferenciar en diversas categoras establecidas en orden de supremaca de acuerdo con un criterio jerrquico. Ej. En una evaluacin de un cliente con respecto a un servicio, fue malo, regular, bueno o muy bueno. Como se puede observar, la variable mide diversas categoras que no han sido establecidas de acuerdo a un criterio.

La clasificacin de las variables expuestas, parte del punto de vista estadstico, no es nica, ya que cada disciplina cientfica crea alguna denominacin para las variables que en ella se manejan. As lo que en el momento de la operacionalizacin es una variable nominal, ordinal, intervalar o de razn, en el momento de su representacin grfica puede ser una variable discreta o continua, y al realizar su anlisis puede ser dependiente o independiente. Esta ultima clasificacin se usa en las ciencias sociales muy comn mente.

Escalas de medicin
Una vez que hemos especificado las variables, y su descripcin a nivel conceptual, es conveniente establecer, la escala de medicin, la cual nos permite definir con precisin la forma en la que el investigador medir en la prctica sus variables. 4 tipos: Escala nominal, Escala ordinal, Escala de intervalo y Escala de razn.

Escala nominal
Es el tipo ms limitado de medicin que puede tener una variable. Se emplea para hacer referencia a los datos que slo pueden clasificarse en categoras, es decir, se aplica a aquellas variables que no pueden medirse mediante escalas numricas, sino nicamente a partir de cada una de las caractersticas (se realiza un conteo de datos exhaustivo, todos los datos pueden ser incluidos).
Divisin de Ciencias sociales y Humanidades alumnos por licenciatura Licenciatura Administracin Economa Sociologa Total Alumnos 425 350 370 1145

Escala ordinal
Esta escala presenta diferentes niveles de medida entre sus categoras, una mayor que otra, de tal forma que todas tienen diferente valor subjetivo. Esta medida diferente tiene dos caractersticas importantes: 1. consiste en, como ya se indico, el valor que toma la variable es subjetivo; 2. es aquella que obliga a clasificarla en las categoras establecidas, en un orden especifico. Ej. Un investigador desea medir la calidad del servicio que presta el transporte pblico Metro de la Ciudad de Mxico, y para ello pregunta.

Cmo considera usted la calidad del servicio del Metro?


Buena Mala Regular Muy Buena

La clasificacin de las respuestas seguir el orden del valor que el individuo le asigne

Escala de intervalo
Esta escala de medicin presenta las mismas caractersticas bsicas que tiene la escala ordinal, salvo que en sta es posible establecer valores numricos constantes en las diversas categoras, y por ello establecer medidas o cuantificaciones entre unas y otras.

Ej. Habilidad de los operadores para el armado de un componente electrnico en una empresa del valle de Toluca. Puntuaciones 91-100 81-90 71-80 Menos de 61 Obreros 30 25 15 13

Escala de razn
Es el nivel de medicin ms alto. Esta escala tiene todas las caractersticas que presenta la escala de intervalo, es decir, las categoras se especifican con nmeros. El tamao de stas es conocido y constante; son tambin mutuamente excluyentes y exhaustivas. Su gran diferencia con respecto a la escala de intervalo es, por un lado, que en la escala de razn el punto cero si es significativo, y por otro, el cociente o razn entre dos nmeros de la escala tambin lo es. Ej. Gastos diarios en transporte de alumnos de la universidad Gasto ($) 0-10 11-20 21-30 31-40 Alumnos 30 25 5 3
Puede tener un gasto de $7.50 al da, pero tambin podra suceder que tenga un gasto de $0.00, lo que indica que quiz camine diariamente a la universidad

Sistematizacin de los datos


Codificacin numrica Elaboracin de la matriz de datos

Codificacin numrica
Una vez recolectado los datos para comprobar las hiptesis que responden a t problema de investigacin, debers reflexionar sobre el hecho de que las respuestas recabadas en el instrumento que aplicaste debern reflejar una serie de valores o datos, que al expresarse numricamente o codificarse, te permitan desarrollar tcnicas y/o pruebas estadsticas.

La primer etapa del anlisis de los datos recolectados es la sistematizacin de los mismos, esto implica organizarlos y jerarquizarlos

La sistematizacin incluye 2 pasos bsicamente:


1. Definir las categoras de codificacin considerando los tems, preguntas, contenidos u observaciones y elaborando para ello un libro o catlogo de cdigos.

2.Construir la matriz de los datos en forma ordenada, almacenndolos en un archivo permanente que nos permita su utilizacin en aumenta las que se requiera el momento variables y parmetros de la Codificacin es el proceso por el cual asignamos valores numricos o puntajes sociedad respuestas recolectadas en el instrumento. Est a las civil que pueden formato relacionada con el y deben de respuesta de los instrumentos, ya que les asignaste ser manipulados categoras de respuesta.
Es importante asignar un valor a aquellos casos en que los sujetos omitieron la respuesta a cualquiera de los tems del instrumento, con esto controlamos los valores perdidos (missing values).

El libro o catlogo de cdigos es un documento donde relacionamos las variables, tems o preguntas, o sus categoras, con sus cdigos correspondientes (valores numricos o smbolos asignados), as como la columna que ocupa en nuestra base de datos, o bien la denominacin que le hacemos dado a cada una de las variables o tems que se incluyen. El libro de cdigos cumple 2 funciones;

a) Es la gua para el proceso de codificacin y b) Es la gua para localizar variables e interpretar los datos durante el anlisis.

Ejemplo:
Etiqueta las variables de manera alfa-numrica (con letras y nmeros). Puedes usar el nombre completo si es largo o abreviar si es corto. Debes poner en orden numrico sucesivo las variables que incluiste en el estudio. ** Se cuenta con los datos de edad e inscripcin a una revista especializada de una muestra de 115 sujetos 1. VAR1 Edad (Edad) VAR2 INS REV (Inscripcin a revistas) 2. Asigna un cdigo para las posibles respuestas Variable Cdigo VAR1Edad 18 a 60 VAR2InscRev SI=1, NO=2

ELABORACION DE LA MATRIZ DE DATOS


Consiste en el vaciado de la informacin recolectada con los instrumentos de evaluacin a una matriz, hoja tabular, sbana o archivo, que servir para reflejar los datos de manera directa, referidos por caso y pregunta o variable, de donde habremos de obtener la informacin que emplearemos en las pruebas estadsticas. (el libro de cdigos facilita la labor pues unifica los criterios asignados de valores o smbolos)

La matriz de datos se elabora registrando en los renglones los casos o sujetos, y en las columnas los valores de las variables

Siguiendo el ejemplo anterior, la matriz se presenta como sigue:


Matriz de datos
Caso VAR1Edad VAR2 InscRev

1
2 3 4 5

18
28 35 36 48

1
1 2 1 2

Anlisis Descriptivo
Presentacin de la informacin (tablas o grficas) Medidas descriptivas o deductivas (tendencia central, posicin etc.)
Exploracin de datos (para confirmar la informacin antes de elegir una prueba inferencial)

Los datos que se obtiene en el curso de la investigacin deben organizarse y resumirse con el fin de ser analizados. Un instrumento
til para resumirlos es la distribucin de frecuencias. sta consiste en una representacin de las categoras numricas de la variable junto con el nmero de entidades que se clasifican en cada categora (frecuencia). Las distribuciones pueden presentarse en forma tabular o en forma grafica

Las tablas pueden representar una, dos o ms variables; en el primer caso reciben el nombre de unidimensionales, en las cuales nicamente se anotan los valores de la variable y sus frecuencias. En el caso de que las tablas incluyan dos variables, se les denominan bidimencionales, y para ms de dos variables kdimensionales. Estas tablas se emplean para ver la relacin que existe entre variables.

Ejemplo
Grupos de edad
VAR2 InscRev De 18 a 24 aos De 25 a 31 aos De 32 a 38 aos

Si No

8 7

27 20

8 21

Otra distincin al presentar las tablas es, si se trata de datos agrupados o no agrupados. Los datos no agrupados presentan las observaciones recopiladas en los instrumentos de forma ordenada, ya sea de menor a mayor o en orden inverso, y el nmero de veces que se obtuvo cada valor (frecuencia, f)
Edad 18 19 20 Nmero total de casos Si 3 4 2 2 2 2 VAR2 InscRev No 1 2 1

Los datos agrupados exponen las observaciones en grupos, esto es que se generan intervalos de datos (clases), donde los valores para el anlisis estn considerados en arreglos incluyentes de un valor mnimo o uno mximo, que determinan las clases en que se clasifican los datos obtenidos.
Intervalo de clase De 18 a 24 aos De 25 a 31 aos De 32 a 38 aos Nmero total de casos Si 15 47 29 8 27 8 VAR2 InscRev No 7 20 21

Grficas
Una grafica intenta exponer caractersticas o particularidades de tus variables, se trata de esquemas o dibujos que ayudan a comprender las caractersticas importantes o propias de tu objeto de estudio Los grficos ms comunes en el anlisis descriptivo son los siguientes

Grficas de Sectores (pastel o pay): consiste en una grfica circular cuyos segmentos suman 100%. Permite visualizar las diferencias en cuanto a frecuencias o distribuciones para las categoras de tipo nominal.
bulimia Anorexia Ansiedad Depresin

Grafica de barras. De acuerdo con el tipo de datos que presentan, se considera como de barras o histograma. La grafica de barras representa los datos correspondientes a una escala nominal; para cada categora se traza una barra vertical y la altura de la barra representa la frecuencia o porcentaje de esa categora. Los histogramas las barras estn unidad, ya que representan intervalos de clase. Son tiles para exponer datos en escala intervalar o de razn
70% 60% 50% 40% 30% 20% 10% 0%

Series1

Polgono de frecuencias o de porcentaje. Se obtiene al unir en forma consecutiva los puntos de interseccin entre los puntos medios de cada clase y su frecuencia incluyendo el punto medio anterior a la primera clase y el punto medio posterior a la ltima clase. La altura de cada punto indica la frecuencia. (variables cuantitativas)
Cantidad de nios vacunados contra el sarampin de 1979-1985
8000 6000 4000 2000 0 1 2 3 4 5 6 7 4991 3549 4123 5020 6876 5543 6334 cantidad de nios

Ojiva. Es una versin de polgonos de frecuencia con la diferencia de que en sta se grafican las frecuencias acumuladas de una variable

Medidas descriptivas: Tendencia central


Las tablas o grficas no logran sintetizar suficiente la informacin, de ah que sea necesario obtener un solo valor numrico que concentre la informacin y nos permita describir los datos. Adems de esto, las medidas descriptivas proporcionan bases para el clculo de las caractersticas de la poblacin (parmetros), a partir del conocimiento de las caractersticas de la muestra (estadsticos)

Se describen las caractersticas de la distribucin de los datos

Medidas de tendencia central

Medidas de dispersin o variabilidad

Medidas de posicin

Medidas de forma

De esta manera, es posible afirmar


que se tiene una distribucin normal, bimodal (dos modas), rectangular (distribucin simtrica con una frecuencia constante para todos los valores), asimtrica positiva (las distribuciones se concentra a la izquierda, los valores bajos, y se alarga a la derecha, en los valores altos), asimtrica negativa (la distribucin se alarga a la izquierda al extremo de los valores bajos y se concentra a la derecha, en los valores altos), leptocrtica (curtosis positiva), platicrtica (curtosis negativa), mesocrtica (curva normal) etc.

Medidas de tendencia central: es un valor numrico que intenta captar y comunicar la distribucin de una variable como un todo, generalmente indica dnde se encuentra localizado el centro de la distribucin Debido a que se pueden dar varias interpretaciones de lo que significa valor central de una distribucin se estudian 3 MTC

AP

Moda (Mo)

Mediana (Md)

Media (~X)

MTC

Moda (Mo). Es la observacin que ocurre con ms frecuencia

Mediana (Md). Es el valor medio en un conjunto de valores ordenados

Media X. es el promedio aritmtico de un conjunto de observaciones.

También podría gustarte