Está en la página 1de 22

ORGANIZACIÓN

DE DATOS

ING. ZAVALA GUEVARA JOSE ANTONIO


 Después de la recolección de datos, es necesario
resumirlos y presentarlos en forma tal, que faciliten
su comprensión y su posterior análisis y utilización.
Para ello, se ordenan en cuadros numéricos y luego
se representan en gráficos.
DISTRIBUCIÓN DE
FRECUENCIAS
 Tenemos:
 Distribución de frecuencias: variable cualitativa
 Distribución de frecuencias: variable cuantitativa discreta.
 Distribución de frecuencias: por intervalos
 Distribución de frecuencias acumuladas
DISTRIBUCIÓN DE FRECUENCIAS:
VARIABLE CUALITATIVA
 Supongamos que en una muestra de n unidades
estadísticas se observan k categorías o modalidades
diferentes C1,C2,C3….Ck, de alguna variable
cualitativa X.
 La frecuencia absoluta fi, es el número de datos
observados en cada categoría o modalidad.
 La suma de todas las frecuencias absolutas es igual
al total n de datos observados.
 La frecuencia relativa hi, se define en cada categoría por
hi=fi/n. La suma de todas las frecuencias relativas es igual a
uno.
 La frecuencia porcentaje pi se define en cada fila por
pi=hi*100% . El total de las frecuencias porcentajes es igual
a cien.
GRÁFICA

 Existe una gran variedad de gráficas para la distribución de


frecuencias de variable cualitativa, las más comunes son la
de barras y la de sectores circulares.
 Las barras se dibujan dejando un espacio entre ellas. Si
la escala es nominal las categorías pueden ser colocadas
en cualquier orden. Pero, si el nivel es ordinal las
categorías deben ir ordenadas.
 En una gráfica circular, los datos de cada categoría C, se
representan por un sector circular cuyo ángulo en el
centro es igual a 360°. Si la gráfica por sectores
circulares es tridimensional es denominada de pastel.
 En una encuesta de opinión acerca de las preferencias de
una marca de bebida gaseosa por sus colores: Negro(N),
Blanco(B) y Rojo(R), 20 consumidores dieron las siguientes
respuestas:
 B, N, N, B, R, N, N, B, B, N,
 B, N, N, R, B, N, B, R, B y N.
 Construir la distribución de frecuencias. Graficar la
distribución
DISTRIBUCIÓN DE FRECUENCIAS:
VARIBLE CUANTITATIVA
DISCRETA
 Suponga que se han recolectado n valores de alguna
variable discreta X. El procedimiento más simple de
organizar estos n datos, consiste en ordenar estos valores
numéricos en forma ascendente.
GRÁFICA

 La representación gráfica más común de una distribución de


frecuencias de variable discreta es del tipo bastón que
consiste en trazar en cada valor distinto de la variable,
segmentos de recta proporcionales a su frecuencia.
 También, se pueden usar barras rectangulares para graficar
una distribución de frecuencias de variable discreta.
 El número de hijos por familia, una muestra de 20 hogares
tiene las siguientes respuestas.
 2,1,2,4,1,3,2,3,2,0,
 3,2,1,3,2,3,3,1,2 y 4.
 Construir la distribución de frecuencias de la variable X.
Graficar.
DISTRIBUCIÓN DE FRECUENCIAS:
POR INTERVALOS
 La distribución de frecuencias por intervalos o clases se usa cuando la
variable estadística es continua o cuando el número de valores distintos
de una variable discreta es muy grande.
 Esta distribución se obtiene dividiendo el rango de variación de los datos
en k intervalos y determinando el número de datos que contiene cada
intervalo.
 Dados n valores de alguna variable cuantitativa X continua (o discreta con
más de 20 valores distintos) uno de los métodos para construir la
distribución de frecuencias es:
1. Determinar el rango (R) de variación de los datos que se define por:
R= Xmax – Xmin
Donde Xmax es el dato máximo y Xmin es el dato mínimo
2. Determinar el número de intervalos, k, teniendo en cuenta la
recomendación
 Un valor aproximado del número de intervalos, k, nos proporciona la regla
de Sturges, donde,
 k = 1+3.32*log(n), n ≥10, redondeado el número al entero inmediato mayor.
3. Determinar la amplitud A del intervalo, dividiendo el rango entre el
número de intervalos. Esto es, A=R/k
 Tener en cuenta que k*A≥R.
 Si los datos son enteros, A es entero, si los datos tienen un
decimal, A tiene un decimal, etc.
4. Determinar los extremos de los intervalos de la siguiente manera:
 Los ingresos quincenales en dólares (variable X) de 45
personas son:
 63 89 36 49 56 64 59 35 78
 43 53 70 57 62 43 68 62 26
 64 72 52 51 62 60 71 61 55
 59 60 67 57 67 61 67 51 81
 53 64 76 44 73 56 62 63 60
 Construir una distribución de frecuencias de 8 intervalos.
MARCA DE CLASE

 La marca de clase o marca del intervalo mi, que se define


como el punto medio del intervalo. Esto es:

 Li : Es el limite inferior del intervalo


 Ui : Es el limite inferior del intervalo
GRÁFICA
 La distribución de frecuencias se representa gráficamente por
medio de un histograma, o de un polígono de frecuencias. A
partir del polígono de frecuencias se puede trazar la curva de
frecuencias.
DISTRIBUCIÓN DE
FRECUENCIAS ACUMULADAS

 Con variables cualitativas a nivel nominal no tienen ningún


significado las frecuencias acumuladas.
 Si la variable es discreta y la distribución de frecuencias es de
la forma dato y frecuencia, entonces, las frecuencias
(absolutas, relativas y porcentajes) se pueden acumular en la
forma menor o igual que un valor determinado de la variable
correspondiente a cada fila.
 La frecuencia absoluta acumulada Fi, del valor xi es la suma
de las frecuencias absolutas de los valores menores o iguales
a xi, se define por:

 La frecuencia relativa acumulada Hi de xi, se define por:

 La frecuencia porcentaje acumulada Pi de xi se define por:


DIAGRAMA DE TALLO Y HOJAS

 Es una técnica que se usa para organizar datos sin perder la


identidad de cada dato observado, como si ocurre en una
distribución de frecuencia por intervalos.
 El diagrama de tallo y hojas se construye partiendo cada dato
numérico en dos. El tallo que consiste del digito o los digitales
iniciales y las hojas que consisten de los dígitos restantes del
dato. Usualmente se eligen entre 5 y 20 tallos.
Con los siguientes datos (ingresos quincenales en dólares del
ejemplo anterior):
a. Desarrolle un diagrama de tallo y hojas
b. Halle el porcentaje de ingresos quincenales inferiores a $52
c. ¿Cuál es el valor de en medio o central?
d. ¿Cuántos valores están entre 50 y 65?
 Los siguientes datos representan el periodo de duración en
meses de 32 bacterias “DURA” doble A:
 3.3 4.0 6.0 4.2 6.0 5.4 4.5 2.8
 1.5 7.0 6.5 7.4 5.2 5.7 6.2 7.1
 5.5 5.2 6.8 3.8 2.4 3.6 6.7 4.7
 5.0 6.2 5.3 6.5 5.5 6.0 5.6 5.9
a. Desarrolle un diagrama de talla y hojas
b. ¿Cuál es el valor de en medio?
c. ¿Cuántas bacterias duraron entre 2.9 y 5.8 meses?

También podría gustarte