Está en la página 1de 15

Recolección y organización de datos

La recolección de datos se refiere al uso de una gran diversidad de técnicas y


herramientas que pueden ser utilizadas por el analista para desarrollar los
sistemas de información, los cuales pueden ser la entrevistas, la encuesta, el
cuestionario, la observación, el diagrama de flujo y el diccionario de datos.

Todos estos instrumentos se aplicarán en un momento en particular, con la


finalidad de buscar información que será útil a una investigación en común. En la
presente investigación trata con detalle los pasos que se debe seguir en el
proceso de recolección de datos, con las técnicas ya antes nombradas.

Instrumento cuantitativo de investigación social mediante la consulta a un grupo de


personas elegidas de forma estadística, realizada con ayuda de un cuestionario.

En poblaciones pequeñas (por ejemplo, los trabajadores de una empresa) se


pueden realizar encuestas censales, es decir, a todos los individuos de un
colectivo, pero normalmente las encuestas se realizan mediante muestras
estadísticamente representativas de una población mayor, para posteriormente
extrapolar los resultados al conjunto de la población. La encuesta se diferencia de
otros métodos de investigación en que la información obtenida ya está de
antemano preparada y estructurada. En este sentido, la encuesta presenta
notables limitaciones, al restringir las posibilidades de obtener información a
validar o refutar hipótesis previamente establecidas en el cuestionario, coartando
el discurso del entrevistado, y sin que resulte posible saber si existe información
relevante que no se tiene en cuenta. Además, al tratarse de entrevistas
individuales, se pierde la riqueza de fenómenos que resultan de la interacción
social.

Según la forma en que se obtienen los datos, las encuestas pueden ser
presenciales, telefónicas o postales. Las encuestas presenciales administradas
por encuestadores cualificados son las más fiables, exhaustivas y, también,
costosas. Por su parte, las encuestas telefónicas permiten una gran rapidez en la
obtención de los datos a un bajo coste, pero presentan limitaciones respecto a la
duración de la entrevista y un riesgo mayor de sesgo muestral. Los sesgos son
precisamente el principal problema a controlar en la realización de una encuesta;
pueden provenir de errores muestrales, que dan como resultado una mayor
presencia de un grupo de individuos con determinadas características, y/o de la
mayor o menor accesibilidad a la entrevista de determinados grupos de personas.
También se pueden producir por errores en el cuestionario, que o bien inducen
determinadas respuestas, o no tienen en cuenta todas las opciones posibles de
los entrevistados. Y, finalmente, pueden aparecer sesgos en el tratamiento
estadístico, al establecer las variables a utilizar y al agrupar los datos o los
individuos en determinadas categorías.
GRÁFICOS ESTADÍSTICOS

Representaciones gráficas de los resultados que se muestran en una tabla


estadística. Pueden ser de formas muy diversas, pero con cada tipo de gráfica se
cumple un propósito. Por ejemplo, en los medios de comunicación, libros de
divulgación y revistas especializadas se encuentran multitud de gráficas
estadísticas en las que, con notable expresividad, se ponen de manifiesto los
rasgos de la distribución que se pretende destacar. Los diagramas de barras, los
diagramas de sectores, los histogramas y los polígonos de frecuencias son
algunas de ellas.

Los gráficos sirven para percibir más fácilmente las características esenciales de
una distribución de frecuencias y comparar una distribución con otra, si se desea.
Estas graficas no deben ser consideradas como sustitutivos del tratamiento
estadístico de los datos, sino más bien como ayudas visuales para pensar en los
problemas estadísticos y para discutirlos más fácilmente.

DIAGRAMA DE BARRAS

En este tipo de gráfica, sobre los valores de las variables se levantan barras
estrechas de longitudes proporcionales a las frecuencias correspondientes. Se
utilizan para representar variables cuantitativas discretas.

Los diagramas de barras pueden ser de diferentes tipos: de barras simples, de


barras múltiples, o de barras compuestas

Las barras pueden representarse horizontalmente. La ventaja de la horizontalidad


estriba en que es más fácil añadir leyendas.

Recibe el nombre de diagrama de barras el gráfico que asocia a cada valor de la


variable una barra, generalmente vertical, proporcional a la frecuencia (o a la
cantidad) con que se presenta.

Requisitos para realizar un diagrama de barras:

1- texto visible

2- separación de las barras menor que su ancho

3- escala presente

4- se comparan longitudes de rectángulos.

El diagrama de barras siguiente representa la distribución del número de hijos de


43 familias:
El diagrama de barras es parecido a un histograma, puede mostrar cantidades o
porcentajes para dos o más variables en el eje vertical.

Gráficos de barras verticales

(Llamados por algún software de columnas)

Representan valores usando trazos verticales, aislados o no unos de otros, según


la variable a graficar sea discreta o continua. Pueden usarse para representar:

 una serie

 dos o más series (también llamado de barras comparativas)


Gráficos de barras horizontales

Representan valores discretos a base de trazos horizontales, aislados unos de


otros. Se utilizan cuando los textos correspondientes a cada categoría son muy
extensos.

 para una serie

 para dos o más series

 Gráficos de barras proporcionales

Se usan cuando lo que se busca es resaltar la representación de los porcentajes


de los datos que componen un total.

Las barras pueden ser:

 Verticales

 Horizontales
Gráficos de barras comparativas

Se utilizan para comparar dos o más series, para comparar valores entre
categorías.

Las barras pueden ser:

 Verticales

 horizontales

 Gráficos de barras apiladas


Se usan para mostrar las relaciones entre dos o más series con el total.
Las barras pueden ser:

 verticales

 horizontales

HISTOGRAMA
Los histogramas se utilizan para representar tablas de frecuencias con datos agrupados en
intervalos. Si los intervalos son todos iguales, cada uno de ellos es la base de un rectángulo cuya
altura es proporcional a la frecuencia correspondiente. El histograma que se muestra a
continuación es el correspondiente a la tabla de frecuencias con intervalos (1.200 calificaciones
distribuidas en 10 intervalos):
El histograma es un grafico constituido por rectángulos en donde se colocan las
clases de una distribución de frecuencias en el eje horizontal y las frecuencias
absolutas en el eje vertical. En la parte superior de cada rectángulo va la
frecuencia relativa de cada clase.

Es una de las tantas formas gráficas de representar la distribución de frecuencias,


consistente en rectángulos o barras proporcionales.

Para dibujar el gráfico o histograma, se medirán los intervalos de clase en el eje


de las abscisas de un plano cartesiano, y las frecuencias de cada intervalo, sobre
el eje de las ordenadas, en forma de barras.

El principio de representación que rige la construcción del histograma es que la


superficie de cada rectángulo sea proporcional a la frecuencia de la clase que
representa, según una constante de proporcionalidad fija e igual para todas las
clases; cuando, como es habitual, las clases son todas ellas de la misma amplitud,
este principio se traduce en que la altura de cada rectángulo representa
directamente la frecuencia de la clase correspondiente.

INTERPRETACIÓN

En la grafica se puede observar que ningún día volaron menos de cincuenta


pasajeros, y tampoco volaron más de ciento diez pasajeros. En dieciocho días
volaron entre setenta y ochenta pasajeros que equivale al 36%, en tres días
volaron entre cincuenta y sesenta pasajeros los cuales equivalen al 6%, y en dos
días volaron entre cien y ciento diez pasajeros lo cual equivales al 4%.
POLÍGONOS DE FRECUENCIA

En el eje horizontal se colocan los puntos medios de cada clase y en el eje vertical
la frecuencia absoluta.

Las distribuciones de frecuencias pueden ser representadas mediante tablas o


mediante histogramas. Otra forma gráfica de representación la constituyen los
polígonos de frecuencias. Para dibujarlos, se levantan en cada uno de los puntos
medios de clase, ordenadas iguales a las frecuencias de cada intervalo de clase
respectivo, es decir, que las abscisas serán iguales a los puntos medios de clase,
y las ordenadas a las frecuencias.

Para que cierre el polígono se toman los puntos medios de clase inferior y superior
a la muestra, con frecuencias CERO; es decir: Sobre el mismo eje de las equis.

Si se unen entre si consecutivamente los puntos medios de las bases superiores


de los rectángulos de un histograma, se obtiene una línea poligonal denominada
polígono de frecuencias. Esta línea acostumbra prolongarse por sus extremos
hasta cortar el eje de abscisas. Para ello, se toman dos intervalos de clase que no
contienen valores de la variable, uno situado por debajo del extremo inferior del
rango de variable y a continuación de él, y el otro, a continuación del extremo
superior del rango y por encima de el, ambos de igual amplitud que las restantes
clases; la línea poligonal se cierra entonces prolongándola por cada lado hasta
unirla con los puntos medios de estos dos intervalos. De esta manera se consigue
que el área de la superficie encerrada por el polígono de frecuencias y el eje de
abscisas sea igual a la suma de las áreas de los rectángulos que integran el
histograma correspondiente, de modo que ambas representaciones resultan ser
equivalentes.
INTERPRETACIÓN

En la grafica se puede observar que ningún día volaron menos de cincuenta


pasajeros, y tampoco volaron más de ciento diez pasajeros. En dieciocho días
volaron entre setenta y ochenta pasajeros que equivale al 36%, en tres días
volaron entre cincuenta y sesenta pasajeros los cuales equivalen al 6%, y en dos
días volaron entre cien y ciento diez pasajeros lo cual equivales al 4%.

FORMAS DE LOS POLÍGONOS DE FRECUENCIA

Los polígonos de frecuencias pueden tomar un número ilimitado de formas. No


obstante, muchos de los procedimientos estadísticos estudiados suponen una
forma particular de distribución que es la curva normal que toma “forma de
campana.

 Distribución leptocúrtica caracterizada por una concentración de datos en el


centro de la distribución.

 Distribución mesocúrtica: toma la forma ideal de la curva normal.

 Platicúrtica: predomina el caso opuesto a la Distribución leptocúrtica.

Se dice que la curva normal es una distribución simétrica, porque si la dobla por la
mitad, ambas partes coinciden. Sin embargo, no todas las curvas simétricas tienen
forma de campana.

A ciertas distribuciones se les ha dado nombres particulares: distribución


rectangular, distribución en u, distribución bimodal.

Cuando una distribución no es simétrica se dice que es sesgada. Al decir que una
distribución es positivamente sesgada queremos decir que decae hacia el extremo
derecho del eje horizontal y que relativamente hay un número menor de
frecuencias en ese extremo. Si, por el contrario decimos que una distribución es
negativamente sesgada queremos decir que hay relativamente menos datos
asociados con el lado izquierdo del eje horizontal.

HISTOGRAMA Y POLÍGONOS DE FRECUENCIAS ACUMULADAS


Si se representan las frecuencias acumuladas de una tabla de datos agrupados se obtiene el
histograma de frecuencias acumuladas o su correspondiente polígono. He aquí los que se obtienen
de la tabla de 1.200 calificaciones:
DIAGRAMA CIRCULAR

En un diagrama de este tipo, los 360º de un círculo se reparten proporcionalmente


a las frecuencias de los distintos valores de la variable.

Se trata de representar, mediante un círculo, la totalidad o el 100% de los datos de


la muestra y, en el mismo, mediante sectores circulares, proporcionalmente, se
representarán los valores parciales. A tal efecto, se pueden obtener en el mercado,
transportadores especiales, graduados en por cientos.

Resultan muy adecuados cuando hay pocos valores, o bien cuando el carácter que se estudia es
cualitativo. El diagrama de sectores siguiente refleja el resultado de una encuesta (realizada a 300
personas) sobre los tipos de película preferidos por el público en general:
El diagrama circular es de especial utilidad para mostrar proporciones o
porcentajes relativos de una variable. Se construye marcando una porción del
círculo correspondiente a cada categoría de la variable.

INTERPRETACIÓN

En la grafica se puede observar que ningún día volaron menos de cincuenta


pasajeros, y tampoco volaron más de ciento diez pasajeros. En dieciocho días
volaron entre setenta y ochenta pasajeros que equivale al 36%, en tres días
volaron entre cincuenta y sesenta pasajeros los cuales equivalen al 6%, y en dos
días volaron entre cien y ciento diez pasajeros lo cual equivales al 4%.

OJIVAS

Cuando se trata de relacionar observaciones en un mismo aspecto para dos


colectivos diferentes no es posible ejecutar comparaciones sobre la base de la
frecuencia, es necesario tener una base estándar, la frecuencia relativa. La ojiva
representa gráficamente la forma en que se acumulan los datos y permiten ver
cuantas observaciones se hallan por arriba o debajo de ciertos valores. Es útil
para obtener una medida de los cuartiles, deciles, percentiles.

Gráficos de líneas

Los gráficos de líneas muestran los datos en forma de puntos y todos los puntos
de la misma serie se unen mediante una línea; de ahí su nombre. Cada valor
aparece representado por un punto que es la intersección entre los datos del eje
horizontal y los del eje vertical.
Gráfico de Barras.

Los gráficos de barras son utilizados para variables de tipo discreto y permiten
representar la frecuencia en cada uno de los niveles de las variables de interés.
Particularmente, la altura de cada barra es proporcional a la frecuencia o cantidad
de elementos que pertenecen a la categoría en particular.

El siguiente gráfico de barras muestra el número de países que pertenecen a cada


región o grupo económico indicado.

Ejercicio.

Superficie plantada con árboles frutales en Chile, período 1990 -1993.

En la Publicación "Informe sobre Chile 1999" de la Editorial Gestión, aparecen los siguientes datos
relativos a la superficie (en hectáreas) plantada con ciruelos, damascos, duraznos y parrones con
uva de mesa, desde 1990 hasta 1993:

Plantación 1990 1991 1992 1993


Ciruelos 8.490 8.530 8.910 9.210
Damascos 1.990 2.000 2.000 1.980
Duraznos 10.150 10.275 10.325 10.395
Parrones 48.460 48.800 48.400 47.800

Para cada uno de los años, dibuje un gráfico de barras que permita apreciar y
comparar la superficie plantada en los diferentes cultivos.
Se define la tasa de crecimiento anual como el porcentaje de la producción del
año inicial, que corresponde a la variación de esa producción respecto del año
siguiente. A modo de ejemplo, la tasa de crecimiento de la superficie plantada de
Ciruelos de 1991 respecto de 1990 es (8530-8490)/8490 = 0.47%.
Determine la tasa de crecimiento anual (respecto del año anterior) de la superficie
empleada para la plantación de cada una de esas especies en los años 1991,
1992 y1993.
Para cada año, compare mediante gráficos de barra las tasas de crecimiento de
superficie que encontró para los distintos cultivos.

Las gráficas circulares

Las gráficas circulares, también llamados gráficos de pastel o gráficas de 360


grados, son recursos estadísticos que se utilizan para representar porcentajes y
proporciones. El número de elementos comparados dentro de un gráfico circular
puede ser de más de 5, y los segmentos se ordenan de mayor a menor, iniciando
con el más amplio a partir de las 12, como en un reloj.

Una manera fácil de identificar los segmentos es sombreando de claro a oscuro,


donde el de mayor tamaño es el más claro y el de menor tamaño, el más oscuro.

Al igual que en la gráfica de barras, el empleo de tonalidades o colores facilita la


diferenciación de los porcentajes o proporciones.

A diferencia de otros tipos de gráficos, el circular no tiene ejes x o y.

Se utilizan en aquellos casos donde interesa no sólo mostrar el número de veces


que se da una característica o atributo de manera tabular sino más bien de
manera gráfica, de tal manera que se pueda visualizar mejor la proporción en que
aparece esa característica respecto del total.
Distribución de frecuencias

En estadística, se le llama distribución de frecuencias a la agrupación de datos


en categorías mutuamente excluyentes que indican el número de observaciones
en cada categoría. Esto proporciona un valor añadido a la agrupación de datos. La
distribución de frecuencias presenta las observaciones clasificadas de modo que
se pueda ver el número existente en cada clase. Estas agrupaciones de datos
suelen estar agrupadas en forma de tablas.

histograma

En estadística, un histograma es una representación gráfica de una variable en


forma de barras, donde la superficie de cada barra es proporcional a la frecuencia
de los valores representados. Sirven para obtener una "primera vista" general, o
panorama, de la distribución de la población, o la muestra, respecto a una
característica, cuantitativa y continua, de la misma y que es de interés para el
observador (como la longitud o la masa). De esta manera ofrece una visión en
grupo permitiendo observar una preferencia, o tendencia, por parte de la muestra
o población por ubicarse hacia una determinada región de valores dentro del
espectro de valores posibles (sean infinitos o no) que pueda adquirir la
característica. Así pues, podemos evidenciar comportamientos, observar el grado
de homogeneidad, acuerdo o concisión entre los valores de todas las partes que
componen la población o la muestra, o, en contraposición, poder observar el grado
de variabilidad, y por ende, la dispersión de todos los valores que toman las
partes, también es posible no evidenciar ninguna tendencia y obtener que cada
miembro de la población toma por su lado y adquiere un valor de la característica
aleatoria-mente sin mostrar ninguna preferencia o tendencia, entre otras cosas.

Polígono de frecuencias

Es un gráfico de líneas que de las frecuencias absolutas de los valores de


una distribución en el cual la altura del punto asociado a un valor de las
variables es proporcional a la frecuencia de dicho valor.

También podría gustarte