Organización de Los Datos

Republica Bolivariana de Venezuela
Ministerio del poder popular para la educación

I.U.P “Santiago Mariño”
Barcelona – Anzoátegui
Ing. Sistemas
Organización de los datos
Profesor: Alumno:
Ing. Pedro Beltrán Luis Díaz
C.I: 30.078.405
Barcelona, Junio 2020
Introducción
Actualmente los datos suelen ser analizados con ordenador, por lo que deben ser
almacenados en archivos informáticos. Las bases de datos contienen datos
provenientes de un número de observaciones más o menos grande respecto de un
conjunto de variables que puede llegar a ser bastante grande. La generación de una
base de datos supone la codificación previa de las observaciones, la introducción
(grabación) de los datos en archivos informáticos, la depuración de los datos ya
grabados (detección y tratamiento de los errores de grabación y valores faltantes),
y eventualmente la realización de transformaciones y tratamiento de ficheros que
faciliten su posterior tratamiento estadístico.
Organización de datos
Siendo el dato el material que se debe procesar, es decir, la materia prima

de la estadística, el primer paso es entonces la recolección de datos, para
lo cual se emplean diferentes técnicas, como la entrevista personal, el
cuestionario, la observación, etc. El segundo paso es la organización y
ordenamiento de los datos, lo que se hace a través de tablas, las cuales
pueden ser por medio de una distribución de frecuencias simples o una
distribución de frecuencias con intervalos, en ambos casos agrupando
todos aquellos que corresponden a una mismo dato nominal o variable y
expresando en una columna el número de veces que aparece esa variable.
Operaciones con organización de datos
La información es un activo fundamental para las empresas e instituciones, y Widefense
provee servicios orientados al respaldo de información clave.
Actualmente, el universo de datos disponible puede dificultar la toma de decisiones en una

organización principalmente por el exceso de información existente. Su diversidad y lo
cambiante de ella. “Vivimos frente a una avalancha de información originada, por ejemplo, por
la música digital, imágenes médicas, fotografías digitales, redes eléctricas inteligentes, video
vigilancia, redes sociales, televisión digital y sensores para teléfonos, entre otros factores”
Una de nuestras soluciones está orientada al respaldo basado en el uso de la nube.
Esta solución permite administrar los respaldos y la recuperación de la información
de manera sencilla, ágil y rápida. Ideal para empresas que están llevando sus
servicios a la nube tecnológica. La principal ventaja de este servicio es que genera
importantes ahorros para los clientes, ya que dada su naturaleza no implica incurrir
en gastos de hardware.
Otra alternativa es mantener la información siempre en el sitio del cliente. De esta

manera, posibilita el respaldo de un mayor volumen de información, en pequeños
lapsos de tiempo y necesitando un menor espacio de almacenamiento en el servidor,
gracias a la de-duplicación en el origen de los datos. Mediante ella es posible
respaldar equipos de escritorio y notebooks, máquinas virtuales, oficinas remotas,
sistemas de almacenamiento compartido y aplicaciones empresariales.
Ejemplos de cada organización de datos
La Frecuencia:
Es el número de veces que

aparece cada variable o dato
nominal
EJEMPLO:
Se desea hacer una tabla que muestre las calificaciones

en Matemáticas de un grupo escolar. Se ve que hubieron dos alumnos que
sacaron 10 de calificación, siete estudiantes sacaron 9, etc.; se dice entonces
que la frecuencia del dato nominal 10 es de dos; la frecuencia de la variable 9 es
siete, etc.
Una distribución de frecuencias es el resultado de organizar los datos

recolectados en grupos, mostrando la frecuencia de cada uno. Esta puede ser
simple o por intervalos.
Distribución de frecuencias simples:
Organizar los datos recolectados, ya sea de menor a mayor o viceversa, de manera que se
muestre la frecuencia de cada uno de ellos, es hacer una distribución de frecuencias
simple.
El primer paso es localizar el dato menor y el dato mayor dentro del conjunto de datos
recolectados aún en desorden, en el caso que los datos sean de carácter numérico. Una
vez conseguido lo anterior, en una primera columna se escriben todos los números que van
desde el menor hasta el mayor, incluidos éstos. Luego, se cuenta cuántas veces aparece el
primer valor nominal, para lo cual se aconseja ir marcando con una línea ( / ) cada vez que
se cuente uno. El proceso debe repetirse para cada variable. Finalmente se cuentan el
número de marcas que se hayan registrado para cada valor nominal y se procede a
construir la tabla definitiva.
POR EJEMPLO:
Ejemplo 1: Ordenar y construir una tabla de Tercer paso: Se cuenta cuántos datos nominales
frecuencias simple del siguiente conjunto de 20 aparecen y por cada uno que aparezca se pone
datos recolectados: una “rayita” ( / ). Se hace lo mismo para cada
valor:
24 20 32 32 29 21
21 22 33 30 27 26 20 // 24 /// 28 // 32 /////
23 24 20 25 26 32 21 /// 25 // 29 //// 33 ////
28 22 29 29 33 35 22 // 26 // 30 / 34
31 28 32 35 33 32 23 / 27 // 31 / 35 //
27 21 33 29 25 24
A manera de comprobación, para tener la
Solución: seguridad de que no se escapó alguno o no se
Primer paso: Se localizan los números contaron de más, la suma de todas las “rayitas”
más chico y más grande: son el 20 y el 35. ( / ) debe ser igual al número de datos nominales
del conjunto inicial. En este caso existen 36
Segundo paso: Se hace una lista completa datos nominales y 36 “rayitas”, lo que significa
de números desde el 20 hasta el 35: que el conteo fue correcto.
20 24 28 32
21 25 29 33
22 26 30 34
23 27 31 35
Cuarto paso:
Se elabora la tabla definitiva. En una tabla son indispensables

• Los encabezados de columna,
• las líneas horizontales que delimitan la tabla por la parte superior y por la
parte inferior,
• la línea horizontal que delimita por su paste inferior a los encabezados y
• las líneas verticales que delimitan las columnas.
Es conveniente y a veces necesario obtener el total de una columna en una

tabla, lo cual se especifica como lo muestra la tabla anterior. Para evitar
confundir con otro dato nominal, la suma de cualquier columna debe ponerse
“afuera” de la tabla.
Distribución de frecuencias por intervalos:
Los datos recolectados pueden también organizarse por

intervalos. Cada intervalo se llama también clase. El ancho de clase o longitud del intervalo es la resta de el
límite superior menos el límite inferior de cada clase o intervalo. No debe confundirse el ancho de la clase
con el número de datos no minales que contiene el intervalo.
- Cuando se trabaja con variables discretas, el ancho de clase o longitud del intervalo es la resta de el
límite superior menos el límite inferior de cada clase o intervalo, mientras que el número de datos es la
resta de el límite superior menos el límite inferior de cada clase o intervalo más 1.
- Cuando se trabaja con variables continuas, el ancho de clase o longitud del intervalo es, igual que antes, la
resta de el límite superior menos el límite inferior de cada clase o intervalo, mientras que el número de
datos posibles que pudiera contener el intervalo no es posible conocerlos porque caben todos los valores
intermedios.
A la organización de los datos recolectados en tablas por intervalos se le llama distribución de frecuencias
por intervalos. La característica más importante es que el ancho de cada clase o longitud del intervalo debe
ser el mismo para cada intervalo.
POR EJEMPLO:
A manera de comprobación, para tener
Ejemplo2: ordenar y construir una tabla de frecuencias con
la seguridad de que no se escapó alguno
cuatro intervalos del siguiente conjunto de datos recolectados.
o no se contaron de más, la suma de
todas las “rayitas” ( / ) debe ser igual al
24 20 32 32 29 21
número de datos recolectados del
21 22 33 30 27 26
conjunto inicial. En este caso existen 36
23 24 20 25 26 32
datos recolectados y 36 “rayitas”, lo que
28 22 29 29 33 35
significa que el conteo fue correcto.
31 28 32 35 33 32
Después, se cuenta cuántos datos
27 21 33 29 25 24
nominales existen dentro del conjunto.
En este caso hay 16.
Solución:
Conviene iniciar de la misma manera que en la organización de Entonces, como hay 16 datos
frecuencias simple. Entonces se localizan los números más chico nominales y se piden cuatro
y más grande: son el 20 y el 35 y se hace una lista completa de intervalos, simplemente se
números desde el 20 hasta el 35. A continuación se cuentan dividen, por lo que cada intervalo
cuántos datos nominales aparecen por cada uno y se pone una incluirá a cuatro datos nominales,
“rayita” ( / ), de lo que resulta: como lo muestra la siguiente
tabla:
20 // 24 /// 28 // 32 /////
21 /// 25 // 29 //// 33 ////
22 // 26 // 30 / 34
23 / 27 // 31 / 35 //
A manera de comprobación, para tener la seguridad de que no se escapó
alguno o no se contaron de más, la suma de todas las “rayitas” (/ ) debe ser
igual al número de datos recolectados del conjunto inicial. En este caso
existen 36 datos recolectados y 36 “rayitas”, lo que significa que el conteo
fue correcto. Después, se cuenta cuántos datos nominales existen dentro del
conjunto. En este caso hay 16.
Entonces, como hay 16 datos nominales y se piden cuatro intervalos,

simplemente se dividen, por lo que cada intervalo incluirá a cuatro datos
nominales, como lo muestra la siguiente tabla:
Frecuencias acumuladas
Muchas veces resulta de gran utilidad tener información sobre la frecuencia que
a partir del inicio de la tabla se tiene hasta cierto dato nominal determinado. A
lo anterior de se le conoce con el nombre de frecuencias acumuladas (fa) y se
añade en una columna en la misma tabla.
Ejemplo 3: En los datos del ejemplo del Ejemplo 1, sus frecuencias acumuladas
son:
Total: 36 Obsérvese que la columna de las frecuencias acumuladas no se suma,

pero debe coincidir el último valor acumulado con la suma de la columna de las
frecuencias.
Porcentajes y porcentajes acumulados:
Otras dos informaciones muy útiles dentro de la etapa de organización de

datos es calcular el porcentaje de cada variable conforme a su frecuencia,
lo mismo que su porcentaje acumulado, ya sea en una distribución de
frecuencias simple o por intervalos.
Para calcular el porcentaje basta hacer una regla de tres, en donde el

100% es el número N de datos recolectados, o sea el total de las
frecuencias, esto es:
donde:
𝑛 = número total de datos recolectados o frecuencia total
𝑓 = frecuencia particular del dato nominal del que se desea saber su
porcentaje
% = porcentaje correspondiente al dato nominal de frecuencia 𝑓.
O bien, despejando, se obtiene que:
POR EJEMPLO
En la tabla del ejemplo 1, añadir una columna que exprese los porcentajes de
cada dato nominal y otra de sus porcentajes acumulados.
Solución: Para obtener el porcentaje del primer

dato 𝑥 = 20 , se plantea una regla de tres
simple, en donde el número total de datos es el
100%:
Donde:
%=5,5
Se hace lo mismo con los

demás datos, de manera que
la tabla se completa de la
siguiente forma:
Tipos de datos
Se llama tipos de datos de estadísticas o carácter a cada una de las características

que pueden estudiarse de la población.
Los tipos de datos pueden ser de dos tipos, Cualitativos y Cuantitativos.
• Cualitativos: son aquellas en la que los resultados posibles no son valores

numéricos. Por ejemplo: color del pelo, tipo de ropa preferida, lugar de veraneo,
etc.
Por Ejemplo:
 Sexo: Femenino/Masculino.
 Hábitos de fumar: Fumador/No fumador.
 Color de ojos: Negro, azul, marrón…
 Religión: Católica, evangélica….
 Estado civil: Soltero, casado, divorciado….
Y ahora los Cuantitativos:
• Cuantitativos: aquellas cuyo resultado es un número. A su vez, las hay

de dos tipos:
• Cuantitativos discretas: cuando se toman valores aislados. Por

ejemplo: número de amigos de tu pandilla, número de veces que vas al
cine al mes, número de coches que tiene tu familia.
• Cuantitativos continuas: cuando, entre dos valores cualesquiera, puede

haber valores intermedios. Es decir, se toman todos los valores de un
determinado intervalo. Por ejemplo: peso de las personas, nivel sobre
el mar en que se encuentra tu ciudad, medida del perímetro torácico.
Conclusión
Actualmente los datos suelen ser analizados con ordenador, por lo que
deben ser almacenados en archivos informáticos. Las bases de datos
contienen datos provenientes de un número de observaciones más o menos
grande respecto de un conjunto de variables que puede llegar a ser
bastante grande. La generación de una base de datos supone la
codificación previa de las observaciones, la introducción (grabación) de los
datos en archivos informáticos, la depuración de los datos ya grabados
(detección y tratamiento de los errores de grabación y valores faltantes),
y eventualmente la realización de transformaciones y tratamiento de
ficheros que faciliten su posterior tratamiento estadístico.
Bibliografía
 Intef: conceptos básicos. Recuperado de:

http://descargas.pntic.mec.es/cedec/mat3/contenidos/u11/M3_U11_contenidos/1_conceptos_bsi
cos.html
 GoogleSites: estadísticas organización. Recuperado de:

https://sites.google.com/site/estadisticadm/b-organizacion-y-presentacon-de-datos
 PSICOCODE: datos estadísticos. Recuperado de: https://psicocode.com/psicologia/organizacion-

de-datos-estadisticos/
 Halweb: tablas estadísticas. Recuperado por:

http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/LibroElec/Tema1/tablas_estadistica
s.htm
Gracias por su
atención!!

Organización de Los Datos

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Organización de Los Datos

Cargado por

Copyright:

Formatos disponibles

Republica Bolivariana de Venezuela

Ministerio del poder popular para la educación

Organización de los datos

Siendo el dato el material que se debe procesar, es decir, la materia prima

Actualmente, el universo de datos disponible puede dificultar la toma de decisiones en una

Otra alternativa es mantener la información siempre en el sitio del cliente. De esta

Es el número de veces que

Se desea hacer una tabla que muestre las calificaciones

Una distribución de frecuencias es el resultado de organizar los datos

Se elabora la tabla definitiva. En una tabla son indispensables

Es conveniente y a veces necesario obtener el total de una columna en una

Los datos recolectados pueden también organizarse por

Entonces, como hay 16 datos nominales y se piden cuatro intervalos,

Total: 36 Obsérvese que la columna de las frecuencias acumuladas no se suma,

Otras dos informaciones muy útiles dentro de la etapa de organización de

Para calcular el porcentaje basta hacer una regla de tres, en donde el

Solución: Para obtener el porcentaje del primer

Se hace lo mismo con los

Se llama tipos de datos de estadísticas o carácter a cada una de las características

Los tipos de datos pueden ser de dos tipos, Cualitativos y Cuantitativos.

• Cualitativos: son aquellas en la que los resultados posibles no son valores

• Cuantitativos: aquellas cuyo resultado es un número. A su vez, las hay

• Cuantitativos discretas: cuando se toman valores aislados. Por

• Cuantitativos continuas: cuando, entre dos valores cualesquiera, puede

 Intef: conceptos básicos. Recuperado de:

 GoogleSites: estadísticas organización. Recuperado de:

 PSICOCODE: datos estadísticos. Recuperado de: https://psicocode.com/psicologia/organizacion-

 Halweb: tablas estadísticas. Recuperado por:

También podría gustarte