SISTEMATIZACIÓN DE DATOS

Manual de métodos de investigación para las ciencias sociales

Expositor: Cristina González Pérez

I. Formulación del problema (identificación y especificación de un problema de inv.)

II. Diseño del experimento (selección de la técnica de recolección de datos (observación directa, entrevista, encuesta) que le permita obtener información a menor costo)

IV. Proceso de datos y su descripción (se exponen los datos muéstrales mediante representaciones tabulares, graficas y medidas estadísticas= descripción del resultado)

III. Recolección de datos (implementación de las técnicas de recolección, bajo las reglas de éstas para datos fiables)

V. Inferencia estadística y conclusiones (en ella se define el nivel de confianza y significancia del proceso inferencia = análisis y toma de decisiones)

Como se puede observar. Ej. estatus social (media. Ej. francés). regular. de clientes de un banco.CLASIFICACIÓN VARIABLES cuantitativas Son aquellas cuya determinación está asociada a una unidad de medida. Son aquellas que pueden tomar cualquier valor numérico. minutos. Son variables no métricas que permiten describir las características de una persona. Son variables no métricas usadas para describir una característica que no puede ser cuantificada numéricamente. lugares o cosas a partir de su descripción con palabras. idioma. baja). Continuas. el no. bueno o muy bueno. De habitantes. segundos. alta. Ej. el ingreso mensual. . Ej. Genero podría clasificarse en 2 categorías 1 hombres. Son aquellas que y métricas. la variable mide diversas categorías que no han sido establecidas de acuerdo a un criterio. el no. En una evaluación de un cliente con respecto a un servicio. es decir un valor entero o fraccionario en un intervalo previamente especificado. objeto o lugar. Género (hombre-mujer). El tiempo puede medirse en horas. la estatura. El nombre de una persona. Ej. Ej. 2 mujeres Ordinales. Nominales. religión. fue malo. estos sólo se emplean para diferenciar a las distintas categorías. Discretas o discontinuas. religión (católica. el no. idioma (español. protestante). cuantifican las características por medio de valores enteros y nunca mediante fracciones de los mismos. a partir de diferenciar en diversas categorías establecidas en orden de supremacía de acuerdo con un criterio jerárquico. El no. de alumnos Cualitativas o no métricas. A estas variables se les asignan números. de hijos de una familia. Ej. Especifican y miden cualidades en los individuos.

no es única. Esta ultima clasificación se usa en las ciencias sociales muy común mente. y al realizar su análisis puede ser dependiente o independiente. Así lo que en el momento de la operacionalización es una variable nominal.La clasificación de las variables expuestas. ordinal. en el momento de su representación gráfica puede ser una variable discreta o continua. ya que cada disciplina científica crea alguna denominación para las variables que en ella se manejan. parte del punto de vista estadístico. intervalar o de razón. .

Escala de intervalo y Escala de razón. es conveniente establecer. . la escala de medición. • 4 tipos: Escala nominal.Escalas de medición • Una vez que hemos especificado las variables. Escala ordinal. y su descripción a nivel conceptual. la cual nos permite definir con precisión la forma en la que el investigador medirá en la práctica sus variables.

Escala nominal • Es el tipo más limitado de medición que puede tener una variable. Se emplea para hacer referencia a los datos que sólo pueden clasificarse en categorías. es decir. División de Ciencias sociales y Humanidades alumnos por licenciatura Licenciatura Administración Economía Sociología Total Alumnos 425 350 370 1145 . todos los datos pueden ser incluidos). se aplica a aquellas variables que no pueden medirse mediante escalas numéricas. sino únicamente a partir de cada una de las características (se realiza un conteo de datos exhaustivo.

en un orden especifico. 2. y para ello pregunta. Esta medida diferente tiene dos características importantes: 1. el valor que toma la variable es subjetivo. una mayor que otra. de tal forma que todas tienen diferente valor subjetivo. Un investigador desea medir la calidad del servicio que presta el transporte público Metro de la Ciudad de México.Escala ordinal • Esta escala presenta diferentes niveles de medida entre sus categorías. Ej. es aquella que obliga a clasificarla en las categorías establecidas. ¿Cómo considera usted la calidad del servicio del Metro? Buena Mala Regular Muy Buena La clasificación de las respuestas seguirá el orden del valor que el individuo le asigne . consiste en. como ya se indico.

Puntuaciones 91-100 81-90 71-80 Menos de 61 Obreros 30 25 15 13 .Escala de intervalo • Esta escala de medición presenta las mismas características básicas que tiene la escala ordinal. Habilidad de los operadores para el armado de un componente electrónico en una empresa del valle de Toluca. y por ello establecer medidas o cuantificaciones entre unas y otras. salvo que en ésta es posible establecer valores numéricos constantes en las diversas categorías. Ej.

Ej. el cociente o razón entre dos números de la escala también lo es. El tamaño de éstas es conocido y constante. es decir. las categorías se especifican con números. Gastos diarios en transporte de alumnos de la universidad Gasto ($) 0-10 11-20 21-30 31-40 Alumnos 30 25 5 3 Puede tener un gasto de $7. por un lado. que en la escala de razón el punto cero si es significativo. lo que indica que quizá camine diariamente a la universidad • . son también mutuamente excluyentes y exhaustivas.Escala de razón • Es el nivel de medición más alto.50 al día. Su gran diferencia con respecto a la escala de intervalo es.00. Esta escala tiene todas las características que presenta la escala de intervalo. y por otro. pero también podría suceder que tenga un gasto de $0.

Sistematización de los datos • Codificación numérica • Elaboración de la matriz de datos .

Codificación numérica Una vez recolectado los datos para comprobar las hipótesis que responden a tú problema de investigación. La primer etapa del análisis de los datos recolectados es la sistematización de los mismos. deberás reflexionar sobre el hecho de que las respuestas recabadas en el instrumento que aplicaste deberán reflejar una serie de valores o datos. esto implica organizarlos y jerarquizarlos . te permitan desarrollar técnicas y/o pruebas estadísticas. que al expresarse numéricamente o codificarse.

Es importante asignar un valor a aquellos casos en que los sujetos omitieron la respuesta a cualquiera de los ítems del instrumento. Está a las civil que pueden formato relacionada con el y deben de respuesta de los instrumentos. Definir las categorías de codificación considerando los ítems. con esto controlamos los valores perdidos (missing values). ya que les asignaste ser manipulados categorías de respuesta. preguntas. . almacenándolos en un archivo permanente que nos permita su utilización en aumenta las que se requiera el momento variables y parámetros de la Codificación es el proceso por el cual asignamos valores numéricos o puntajes sociedad respuestas recolectadas en el instrumento. 2.Construir la matriz de los datos en forma ordenada. contenidos u observaciones y elaborando para ello un libro o catálogo de códigos.La sistematización incluye 2 pasos básicamente: 1.

.El libro o catálogo de códigos es un documento donde relacionamos las variables. o bien la denominación que le hacemos dado a cada una de las variables o ítems que se incluyen. El libro de códigos cumple 2 funciones. o sus categorías. con sus códigos correspondientes (valores numéricos o símbolos asignados). ítems o preguntas. a) Es la guía para el proceso de codificación y b) Es la guía para localizar variables e interpretar los datos durante el análisis. así como la columna que ocupa en nuestra base de datos.

** Se cuenta con los datos de edad e inscripción a una revista especializada de una muestra de 115 sujetos 1. NO=2 . Asigna un código para las posibles respuestas Variable Código VAR1Edad 18 a 60 VAR2InscRev SI=1. Debes poner en orden numérico sucesivo las variables que incluiste en el estudio. VAR1 Edad (Edad) VAR2 INS REV (Inscripción a revistas) 2. Puedes usar el nombre completo si es largo o abreviar si es corto.Ejemplo: Etiqueta las variables de manera alfa-numérica (con letras y números).

de donde habremos de obtener la información que emplearemos en las pruebas estadísticas.• ELABORACION DE LA MATRIZ DE DATOS Consiste en el vaciado de la información recolectada con los instrumentos de evaluación a una matriz. referidos por caso y pregunta o variable. (el libro de códigos facilita la labor pues unifica los criterios asignados de valores o símbolos) La matriz de datos se elabora registrando en los renglones los casos o sujetos. que servirá para reflejar los datos de manera directa. sábana o archivo. hoja tabular. y en las columnas los valores de las variables .

Siguiendo el ejemplo anterior. la matriz se presenta como sigue: Matriz de datos Caso VAR1Edad VAR2 InscRev 1 2 3 4 5 18 28 35 36 48 1 1 2 1 2 .

posición etc.Análisis Descriptivo • Presentación de la información (tablas o gráficas) • Medidas descriptivas o deductivas (tendencia central.) • Exploración de datos (para confirmar la información antes de elegir una prueba inferencial) .

Un instrumento útil para resumirlos es la distribución de frecuencias. Ésta consiste en una representación de las categorías numéricas de la variable junto con el número de entidades que se clasifican en cada categoría (frecuencia). en las cuales únicamente se anotan los valores de la variable y sus frecuencias. . En el caso de que las tablas incluyan dos variables.Los datos que se obtiene en el curso de la investigación deben organizarse y resumirse con el fin de ser analizados. en el primer caso reciben el nombre de unidimensionales. Las distribuciones pueden presentarse en forma tabular o en forma grafica Las tablas pueden representar una. y para más de dos variables kdimensionales. dos o más variables. Estas tablas se emplean para ver la relación que existe entre variables. se les denominan bidimencionales.

Ejemplo Grupos de edad VAR2 InscRev De 18 a 24 años De 25 a 31 años De 32 a 38 años Si No 8 7 27 20 8 21 .

esto es que se generan intervalos de datos (clases). donde los valores para el análisis están considerados en arreglos incluyentes de un valor mínimo o uno máximo. y el número de veces que se obtuvo cada valor (frecuencia. Intervalo de clase De 18 a 24 años De 25 a 31 años De 32 a 38 años Número total de casos Si 15 47 29 8 27 8 VAR2 InscRev No 7 20 21 . si se trata de datos agrupados o no agrupados.Otra distinción al presentar las tablas es. Los datos no agrupados presentan las observaciones recopiladas en los instrumentos de forma ordenada. f) Edad 18 19 20 Número total de casos Si 3 4 2 2 2 2 VAR2 InscRev No 1 2 1 Los datos agrupados exponen las observaciones en grupos. que determinan las clases en que se clasifican los datos obtenidos. ya sea de menor a mayor o en orden inverso.

Gráficas • Una grafica intenta exponer características o particularidades de tus variables. se trata de esquemas o dibujos que ayudan a comprender las características importantes o propias de tu objeto de estudio • Los gráficos más comunes en el análisis descriptivo son los siguientes Gráficas de Sectores (pastel o pay): consiste en una gráfica circular cuyos segmentos suman 100%. bulimia Anorexia Ansiedad Depresión . Permite visualizar las diferencias en cuanto a frecuencias o distribuciones para las categorías de tipo nominal.

Los histogramas las barras están unidad. ya que representan intervalos de clase. Son útiles para exponer datos en escala intervalar o de razón 70% 60% 50% 40% 30% 20% 10% 0% Series1 . La grafica de barras representa los datos correspondientes a una escala nominal. De acuerdo con el tipo de datos que presentan.• Grafica de barras. para cada categoría se traza una barra vertical y la altura de la barra representa la frecuencia o porcentaje de esa categoría. se considera como de barras o histograma.

Se obtiene al unir en forma consecutiva los puntos de intersección entre los puntos medios de cada clase y su frecuencia incluyendo el punto medio anterior a la primera clase y el punto medio posterior a la última clase. La altura de cada punto indica la frecuencia. (variables cuantitativas) Cantidad de niños vacunados contra el sarampión de 1979-1985 8000 6000 4000 2000 0 1 2 3 4 5 6 7 4991 3549 4123 5020 6876 5543 6334 cantidad de niños • Ojiva.• Polígono de frecuencias o de porcentaje. Es una versión de polígonos de frecuencia con la diferencia de que en ésta se grafican las frecuencias acumuladas de una variable .

las medidas descriptivas proporcionan bases para el cálculo de las características de la población (parámetros). a partir del conocimiento de las características de la muestra (estadísticos) Se describen las características de la distribución de los datos Medidas de tendencia central Medidas de dispersión o variabilidad Medidas de posición Medidas de forma . de ahí que sea necesario obtener un solo valor numérico que concentre la información y nos permita describir los datos. Además de esto.Medidas descriptivas: Tendencia central Las tablas o gráficas no logran sintetizar suficiente la información.

y se alarga a la derecha. bimodal (dos modas). asimétrica negativa (la distribución se alarga a la izquierda al extremo de los valores bajos y se concentra a la derecha. platicúrtica (curtosis negativa). en los valores altos). los valores bajos.De esta manera. asimétrica positiva (las distribuciones se concentra a la izquierda. en los valores altos). mesocúrtica (curva normal) etc. . leptocúrtica (curtosis positiva). rectangular (distribución simétrica con una frecuencia constante para todos los valores). es posible afirmar • que se tiene una distribución normal.

generalmente indica dónde se encuentra localizado el centro de la distribución Debido a que se pueden dar varias interpretaciones de lo que significa valor central de una distribución se estudian 3 MTC AP Moda (Mo) Mediana (Md) Media (~X) .Medidas de tendencia central: es un valor numérico que intenta captar y comunicar la distribución de una variable como un todo.

Es la observación que ocurre con más frecuencia Mediana (Md). es el promedio aritmético de un conjunto de observaciones.MTC Moda (Mo). Es el valor medio en un conjunto de valores ordenados Media X. .

Sign up to vote on this title
UsefulNot useful