Está en la página 1de 20

Organización y presentación de datos

Valor : E s cad a un o d e lo s d ist in to s re su lt ad o s qu e se pu ed e n o bt e ne r en un e st ud io


e st a d íst ico . E j e mp lo e n co n su lto rio se at ie nd e n 1 0 p acie nt es se p ue d en ob t en er d o s
va lo r e s 4 m a scu linos y 6 f e men in o s.

Dato: Es un valor particular de una variable. Un dato puede ser una letra, un número, un signo ortográfico
o cualquier símbolo y que representa una cantidad, una medida, una palabra o una descripción. Un d ato
e s ca d a un o d e lo s valo re s q u e se h a ob t en id o al re a liz ar u n e stu d io e stad ístico . S i
la n z a mo s un a mo n ed a al aire 5 ve ce s ob t en e mo s 5 d ato s: cara, cara, cru z , cara, cr u z .

RECOLECCIÓN DE DATOS: Es el proceso de recolección de información a fin de dar respuesta a un problema


o al planteamiento de una hipótesis. La recolección de datos se refiere al uso de una gran diversidad de
técnicas y herramientas que pueden ser utilizadas por el analista para desarrollar los sistemas de
información, los cuales pueden ser: la entrevistas, la encuesta, el cuestionario, la observación, etc.
Todos estos instrumentos se aplicarán en un momento en particular, con la finalidad de buscar información
que será útil a una investigación en común.

Cada uno tiene ventajas y desventajas. Generalmente, se utilizan dos o tres para complementar el trabajo
de cada uno y ayudar a asegurar una investigación completa. Los datos pueden provenir de observaciones
reales o de registros que se mantienen para otros propósitos. Los datos pueden ayudar a los responsables
de tomar decisiones a hacer suposiciones bien pensadas acerca de las causas y, por tanto, de los efectos
probables de ciertas características en situaciones dadas.

DATOS SIN PROCESAR:

Los datos sin procesar o no procesados. La información puede almacenarse en un archivo, o


simplemente puede ser una colección de números y caracteres almacenados en algún lugar.
Debido a que no ha sido procesado se considera "datos en bruto. Es decir, Son sin procesar
cuando aún no se le has aplicado ninguna metodología estadística, es decir la información
obtenida, antes de ser organizada y analizada.

Ejemplos Datos sin procesar


Edades los 50 pacientes atendidos en los consultorios de la Plaza de la Salud
Ordenamiento o arreglo de datos (Datos procesados):

¿En qué consiste el procesamiento de datos?: Es cualquier ordenación o tratamiento de datos, o


los elementos básicos de información, mediante el empleo de una metodología estadística. El
procesamiento de datos se produce cuando se recaban datos y se traducen a información utilizable. Esa
transformación se convierte en información. El procesamiento empieza con datos en su forma en bruto y
los convierte a un formato más legible (gráficos, documentos, etc.), dándoles la forma y el contexto
necesarios para su interpretación y análisis.

Información: Es un conjunto organizado de datos procesados, que constituyen un mensaje sobre un


determinado ente o fenómeno dándole una utilidad semántica para determinada situación.

Organización de los datos: Uno de los métodos estadísticos más sencillo y útil en el
procesamiento o análisis de datos, Que consiste en la clasificación u ordenación de los mismos. Para que los
datos sean útiles, necesitamos utilizar el método de organización de las observaciones, de modo que se
puedas distinguir algunos patrones en ellos. Los valores se organizan en forma ascendente o descendente
según sean convenientes.

Al organizar los datos nos permite ver rápidamente algunas características. Tales como:

El método de organización de datos es factible cuando se dispone de pocas informaciones, basta


ordenarlos de acuerdo a su magnitud y con un simple examen se podría conocer cuál es la forma de su
distribución; el valor mayor y el menos, y la amplitud general, es decir la diferencia entre los valores
extremos, esto nos dará una idea de su variabilidad, la concentración de los datos alrededor de algunos
valores y otros detalles de la información.
En conclusión, cuando los datos son ordenados de manera compacta y útil, los responsables de tomar
decisiones pueden obtener información confiable sobre el ambiente y usarla para tomar decisiones
inteligentes. La organización de datos es el método más sencillo de análisis de datos.

Distribución de frecuencias
Cuando los datos son numerosos, el método de organización de datos resulta insuficiente y se hace difícil
apreciar las regularidades que existen en el conjunto de datos, realizar análisis o sacar conclusiones: Por
tanto, sebe recurrir agrupar los datos en una tabla de frecuencias, son herramientas de Estadística donde
se colocan los datos en columnas representando los distintos valores recogidos y las frecuencias (las veces)
en que ocurren.

Distribución o tabla de Frecuencias: Es la representación conjunta de los datos en forma de tabla,


correspondiente a un fenómeno en estudio y su ordenamiento es, con base al número de observaciones
que corresponden a cada dato

Frecuencia absoluta o simple (fi): Es el número de veces que aparece un determinado valor en un
estudio estadístico, es decir, es el conteo de operaciones que se repiten en un experimento.
La suma de las frecuencias absolutas es igual al número total de datos, que se representa por n

Frecuencia Relativa simple (fr):: se trata simplemente del cociente entre la frecuencia absoluta o
simple (calculada según las indicaciones del punto anterior) y el tamaño de la muestra o el número de
veces que se haya realizado un experimento, es decir, la proporción de veces que se repite un
determinado dato. La suma de las frecuencias relativas es igual a 1.

Frecuencia absoluta acumulada Creciente Fa (-): es el resultado de sumar sucesivamente las


frecuencias absolutas o relativas, desde el menor al mayor de sus valores. Es decir, la suma de las
frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. Se interpreta como el
número de observaciones menores o iguales al í-esimo valor de la variable

Frecuencia relativa acumulada Creciente Fra (-): Es el número de observaciones menores o


iguales al í-esimo valor de la variable, pero en forma relativa.

Frecuencia Absoluta acumulada decreciente Fa (+): se obtiene de restar las frecuencias absolutas
simples (fi). La primera frecuencia absoluta acumulada (F’1) es igual a “n” (Número total de datos) (F’1 =
n). La última frecuencia absoluta acumulada (Fm) es igual a “fm”

Frecuencia Relativa acumulada decreciente Fra (+): Se obtiene de restar las frecuencias relativas
(hi). La primera frecuencia relativa acumulada (H’1) es igual a “1.000” (H’1 = 1.0000). La última frecuencia
relativa acumulada (Hm) es igual a hm.

Rango o recorrido (R): Es el límite dentro de los cuales están comprendidos los datos de una
determinada distribución de datos. Su cálculo se obtiene de la diferencia entre el valor máximo
y mínimo de una distribución.

Clase o intervalo de clase (IC). Son divisiones o categorías en las cuales se agrupan un conjunto
de datos ordenados con características comunes.
Se puede como cada uno de los grupos o intervalos que forman una distribución de frecuencias.
Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase.
.
Número de clases (NC):
Para organizar los valores la serie de datos hay que determinar un número de clases que sea
conveniente. Es el número total de grupos o intervalos en que se clasifica la información, se recomienda que
no sea menor que 5 ni mayor que 15. En otras palabras, que ese número de intervalos no origine un
número pequeño de clases ni muy grande. Un número de clases pequeño puede ocultar la naturaleza
natural de los datos y un número muy alto puede provocar demasiados detalles como para observar
alguna información de gran utilidad en la investigación.
Para determinar cuántas clases crear, se puede utilizar la siguiente fórmula (fórmula de Sturges),
NC = 1 + 3.32 log N
El intervalo de clase o el ancho de la clase (tamaño de la clase): Es el espacio que hay
entre el límite superior (Ls) y el límite inferior (Li) de la clase, los cuales corresponden a los valores
extremos de la clase. Representan el tamaño de cada clase. Cada intervalo tiene un límite inferior
(Li), que pertenece a ese intervalo (cerrado por la izquierda con un corchete) y un límite superior (Ls)
puede ser abierto o cerrado. Se obtiene al dividir en rango entre el número de clase
Intervalo IC = LS – Li, si la clase esta construida.
Ejemplo: Las calificaciones obtenidas por los alumnos de una sección están
comprendidas entre 80 y 90 puntos. IC = 90 – 80 = 10 puntos.
Si la clase no está construida se utiliza la siguiente formula

IC

Marca de Clase o punto medio (pm).- Es el valor medio de cada clase, se obtiene
sumando los límites superior (Ls) e inferior (Li) del intervalo y dividiendo ésta suma
entre 2. Es el valor que se encuentra en el centro de una clase y representa a todos los valores
que estén en una determinada categoría.

PM
Distribución de frecuencia para variables continúas agrupada en solo número: Se realizó un
experimento sobre el coeficiente de inteligencia de los 20 alumnos de un centro educativo

La Tabla de frecuencia de datos no agrupados: indica las frecuencias con que aparecen
los datos estadísticos sin que se haya hecho ninguna modificación al tamaño de las unidades originales. En
estas distribuciones cada dato mantiene su propia identidad después que la distribución de frecuencia se ha
elaborado. Son las de observaciones realizadas en un estudio estadístico que se presentan en su forma
original tal y como fueron recolectados, para obtener información directamente de ellos. La tabla de
frecuencias de datos no agrupados se emplea si las variables toman un número pequeños de valores o la
variable es discreta. Ejemplo: Edades de las 50 personas que se le realizo la prueba del COVID

Tabla de frecuencia agrupadas clases o intervalos: aquella distribución en la que los datos
estadísticos se encuentran ordenados en clases y con la frecuencia de cada clase; es decir, los datos originales
de varios valores adyacentes del conjunto se combinan para formar un intervalo de clase.

Ejemplo resuelto: Edades de las 50 personas que se le realizo la prueba del COVID

Pasos para construir una distribución de frecuencias en intervalos o clases


1) Organizar los datos

2) Calcule el Rango (R):


R = 49 – 15 = 34
3) Número de Intervalos de Clase (NC).

NC = 1 + 3.32 log (50) = 6.64 = 7 clases


4) Intervalo o Ancho de la clase (IC).

IC = 34/7 = 4.85 = 5
5) Formar las clases y cálculo de las frecuencias simples y agrupadas
6) Marca de Clase o punto medio (pm)
7) Interpretación y análisis
8) Graficas de la frecuencia: Histograma, polígono de frecuencias y las ojivas
Histograma: Es una representación gráfica de una variable en forma de barras todas unidas,
teniendo en cuenta que la superficie de cada barra es proporcional a la frecuencia de los valores
representados. Un histograma nos permite ver cómo se distribuyen los valores de la variable en
estudio. Se grafica uniendo los intervalos de cada clase. Usamos los histogramas cuando
analizamos variables continuas, o cuando trabajamos con variables discretas que toman un gran
número de valores y son agrupadas en intervalos.

Polígono de frecuencias
Es un gráfico que se forma uniendo los puntos medios de la parte superior de las
barras mediante segmentos de recta.
El polígono de frecuencias es de mucha utilidad cuando se representa más de una
serie en una misma gráfica. Los polígonos de frecuencias se trazan tomando en cuenta
las marcas de clase de cada barra.
Ojiva
Es una gráfica asociada a la distribución de frecuencias acumuladas. Nos permite ver cuántos
datos u observaciones se encuentran por encima o por debajo de determinado valor. Las ojivas
se trazan tomando en cuenta los límites superiores de cada clase o intervalo, es decir, tomando
el extremo derecho de la parte superior de cada barra. Dibujar una ojiva es muy similar a dibujar
un polígono de frecuencias acumuladas. Una ojiva también se puede construir con las
frecuencias relativas acumuladas o frecuencias porcentuales acumuladas.

Diferencia entre el polígono de frecuencias y ojiva


El polígono de frecuencias parte desde el histograma de frecuencias absolutas, mientras
que la ojiva parte del histograma de frecuencias acumuladas.

Además, el polígono de frecuencias se forma uniendo los puntos medios de la parte


superior de cada barra, mientras que la ojiva se forma uniendo el extremo derecho de la
parte superior de cada barra.
Presentación de los datos: En estadística, la presentación de datos está definida como aquella
presentación que constituye en sus diferentes modalidades uno de los aspectos de más uso en la estadística
descriptiva. Existen tres formas diferentes de presentar los datos estadísticos, estas son: presentación
escrita, presentación tabular y presentación gráfica.
Presentación escrita:Es una de las tres formas diferentes de presentar los datos estadísticos, la misma se
utiliza cuando una serie de datos incluye pocos valores, por lo cual resulta más apropiada la palabra escrita
como forma de describir el comportamiento de los datos. Asimismo, mediante la forma escrita, se resalta
la importancia de las informaciones principales.
Ejemplo: La baja en las exportaciones hacia Haití también influyó en el indicador general de ventas del
país, pues de acuerdo con un informe estadístico del Banco Central, las exportaciones nacionales sufrieron
una baja de -13.5% el año pasado, al bajar de US$4,637.2 millones en 2014 a US$4,011 en 2015.
Presentación tabular: Cuando los datos estadísticos se presentan a través de un conjunto de filas y de
columnas que responden a un ordenamiento lógico, a este resultado se le llama forma de presentación
tabular o simplemente tabla o cuadro estadístico. La presentación tabular es de gran uso e importancia
para el usuario ya que constituye la forma más exacta de presentar las informaciones
Presentación gráfica:
Un gráfico estadístico es una representación visual de una serie de datos. Es una herramienta muy eficaz.
Le proporciona al lector o usuario mayor rapidez en la compresión de los datos. Esta forma de
presentación le da al usuario un valor aproximado de la información; a diferencia de la presentación
tabular que ofrece exactitud. Sirven para analizar el comportamiento de un proceso o un conjunto de
elementos o signos que permiten la interpretación de un fenómeno.

La representación gráfica permite establecer valores que no se han obtenido experimentalmente sino
mediante la interpolación (lectura entre puntos) y la extrapolación (valores fuera del intervalo
experimental). El uso de la gráfica es bastante amplio en la estadística, para presentar datos o para
comparar varios grupos de datos, dado el hecho de que casi todas las informaciones de características
cuantitativas pueden ser expresadas a través de graficas.

Un buen gráfico:
➢ Capta la atención del lector.
➢ Presenta la información de forma sencilla, clara y precisa.
➢ No induce a error
➢ Facilita la comparación de datos y destaca las tendencias y las diferencias.
➢ Ilustra el mensaje, tema o trama del texto al que acompaña

TIPOS DE GRAFICOS
Gráfico de barras: Representación gráfica en un eje cartesiano de las frecuencias de una variable
cualitativa o discreta. Verticales y Horizontales

La variable principal del gráfico es su variable cualitativa o categórica. Una variable categórica o
cualitativa toma valores discretos, que pueden considerarse como etiquetas. Las categorías pueden
ser nominales u ordinales:

Las categorías nominales son cualitativas y descriptivas. Por ejemplo; género, nombres de países,
color de piel, etc. Las categorías nominales no tienen ningún orden en particular y, por lo tanto, se
pueden trazar en cualquier orden.
Las categorías ordinales tienen un orden particular y siguen una secuencia determinada. Por
ejemplo; semanas, meses, años, grupos de edad, nivel de satisfacción del servicio, etc. Las categorías
ordinales deben trazarse según su orden lógico.

Se recomienda usarlas cuando queremos mostrar una distribución de datos o realizar una
comparación de medidas de diferentes grupos. A partir de una gráfica de barras, podemos ver qué
grupos son los más altos o los más comunes, además de ver cómo otros grupos se comparan con los
demás. Como esta es una actividad común, los gráficos de barras son bastante utilizados no solo por
profesionales estadísticos, analistas y consultores, sino también por académicos, investigadores y
periodistas.
Gráfico de sectores:
Un diagrama de pastel es un círculo dividido en partes, donde el área de cada parte es proporcional
al número de datos de cada categoría. Se usa para representar variables cualitativas o categóricas,
de preferencia nominales. Se utiliza para mostrar la proporción le corresponde a cada categoría.

¿Qué se debe tomar en cuenta para construir una gráfica de pastel?


1) Se debe identificar el todo, así como sus partes.
2) Cada elemento estudiado debe pertenecer solo a una categoría.
3) Se deben representar las proporciones para cada categoría de la variable.
4) La suma de las proporciones no debe exceder al 100%.
5) Se debe utilizar para representar máximo 5 categorías.
6) Si la suma de las categorías más grandes y más importantes suman menos del 100%,
entonces las otras categorías se deben de agrupar en una sola, la cual se debe identificar
con el nombre de “otras”, “varios”, etc.

Debido a que en la gráfica de pastel lo importante es mostrar el porcentaje o proporción que le


corresponde a cada categoría y no el orden, son más adecuadas para representar variables
nominales en lugar de ordinales. Sí es importante mostrar el orden y la comparación entre las
categorías la gráfica de barras es la adecuada.
Gráfico de líneas:
Se utilizan para mostrar el valor cuantitativo en un intervalo o intervalo de tiempo continuo. Es útil al
mostrar tendencias de comportamiento de un evento o proceso (incrementos, decrementos o
tendencias sin variación). Permite visualizar cambios que sufren los procesos en un período de tiempo
específico. El grafico lineal se suele utilizar con variables cuantitativas, para ver su comportamiento
en el transcurso del tiempo. Por ejemplo, en las series temporales mensuales, anuales, trimestrales,
etc.
El gráfico de barras 100%: Es útil para medir varias series como proporción respecto al tiempo
donde la proporción acumulada de cada elemento apilado siempre da un total de 100%. Sirve para
representar la proporción porcentual que tiene cada Serie dentro del total. La altura de cada barra es
el 100 % y los segmentos de barra coloreados representan las contribuciones relativas de los
componentes a la barra total.

Porcentaje de ventas en los últimos 3 años por productos

Gráfico de barras apilado:


Los diagramas de barras apilados son similares a los de barras 100%, ya que se utilizan para mostrar
información de los subgrupos que conforman las diferentes categorías. En estos gráficos, las barras
que representan los subgrupos se colocan una encima de la otra para formar una sola barra. La
longitud total de la barra muestra el tamaño total de la categoría, mientras que se utilizan diferentes
colores o sombras para indicar la contribución relativa de los diferentes subgrupos
Pictograma: También llamada gráfico de imágenes o pictografía. Es un diagrama que utiliza
imágenes o símbolos para mostrar datos para una rápida comprensión. En un pictograma, se utiliza
una imagen o un símbolo para representar una cantidad específica.

Los gráficos de pictogramas utilizan iconos para ofrecer una visión general más
atractiva de pequeños conjuntos de datos discretos. Una advertencia importante con este
tipo de gráfico es que puede hacer que los valores sean más difíciles de leer, ya que el lector necesita
realizar algunas matemáticas mentales para medir los valores relativos de cada categoría.
Cartograma: Es un mapa o diagrama que muestra datos cuantitativos asociados a respectivas
áreas mediante la modificación de los tamaños de las unidades de enumeración. La información se
representa mediante la variación de las superficies reales, empleando cada superficie de enumeración
como un símbolo proporcional, aumentando o disminuyendo en función de los valores
correspondientes. El objetivo de esta herramienta es mostrar de forma impactante la distribución
temática sobre un territorio en el que la superficie toma un tamaño proporcional a los valores de la
variable representada.
BIBLIOGRAFIA

1) Estadística para Administradores y Economía. Anderson Sweneyesta. Cengage


Learning,

2) Estadística para Administradores. Richard Levin. Editora Pearson Prentice

3) ESTADISTICA Elemental. 11ª. Edicion. Johnson, Kuby Cengage Learning.

4) Probabilidad y Estadística. Para Ingeniería y Ciencia. Jay L. Devore. Octava Edicion.

5) www.aulafacil.com/.../estadísticas/estadísticas/introducción-a-la-estadística-
descriptiva

6) www.monografias.com/estadística-descriptiva.../conceptos-básicos-estadistica-
descriptiva-e-inferencial.shtml

7) http://www.monografias.com/trabajos96/conceptos-basicos-estadistica-descriptiva-
e-inferencial/conceptos-basicos-estadistica-descriptiva-e-
inferencial.shtml#ixzz3lG1pXJkb

También podría gustarte