Está en la página 1de 30

ORGANIZACIÓN DE DATOS, ANÁLISIS DE DISTRIBUCIONES DE FRECUENCIAS Y SU REPRESENTACIÓN 1

GRÁFICA

TABLA DE FRECUENCIAS PARA VARIABLES CONTINUAS


Supongamos
Un que
ejemplo de variable los son
continua siguientes
los ingresos, datos corresponden
sus categorías a los ingresos
no son finitas y provienen demedir
del proceso de los
empleados de la empresa, donde N=25.
(Variable)
Ingresos Frecuencia Frecuencia
Frecuencia Frecuencia
absoluta relativa
600,0 620,0 450,0 750,0 1100,0 Clase absoluta relativa
Límite Límite acumulad acumulad
𝒇𝒂𝒊 𝒇𝒓𝒊
1020,0 920,0 500,0 450,0 905,0 inferior superior a a
𝑭𝒂𝒂𝒊 𝑭𝒓𝒂𝒊
700,5 650,0 790,5 700,5 1450,0 1 450 617 5 0,2 5 0,2
830,0 800,0 1210,5 500,0 1210,5 2 617 784 8 0,32 13 0,52
1000,0 650,0 620,0 680,0 950,0 3 784 951 6 0,24 19 0,76
En este tipo de variables se 4 951 1118 3 0,12 22 0,88
5 1118 1285 2 0,08 24 0,96
recomienda generar intervalos de 6 1285 1452 1 0,04 25 1
clase, ya que cada valor en muchos TOTAL 25 1
de los casos no se verán repetidos

Carola Flores
ORGANIZACIÓN DE DATOS, ANÁLISIS DE DISTRIBUCIONES DE FRECUENCIAS Y SU REPRESENTACIÓN 2

Procedimiento para datos agrupados por


600,0 620,0 450,0 750,0 1100,0
1020,0 920,0 500,0 450,0 905,0
Paso 1. Se determina el número de clases (k) Regla de Sturges 700,5 650,0 790,5 700,5 1450,0
830,0 800,0 1210,5 500,0 1210,5
𝑘 = 𝑙𝑜𝑔2 𝑛 + 1 𝑘 = 𝑙𝑜𝑔𝟐 𝑛 + 1 𝑙𝑜𝑔 𝑛 +1 1000,0 650,0 620,0 680,0 950,0
𝑙𝑜𝑔 𝟐
=
𝑙𝑜𝑔 25
𝑘 = 𝑙𝑜𝑔𝟐 25 +1= +1 (Variable)
(Variabl Frecuencia
Frecuenci Frecuencia
Frecuenci
𝑙𝑜𝑔 𝟐 e)
Ingresos Frecuencia
Frecuenc Frecuencia
Frecuenc a
absoluta a
relativa
Clase
Cla ia
absoluta ia
relativa
Límite Límite absoluta
acumulad relativa
acumulad
k=5,64 -> absoluta
𝒇𝒂𝒊 relativa
𝒇𝒓𝒊
inferior superior acumula
a acumula
a
Límit Límit
6 e e 𝑭𝒂𝒂𝒊 𝑭𝒓𝒂𝒊
1
2
Paso 2. Calcular la longitud (amplitud) de clase (A) 3
4
𝑥𝑚á𝑥−𝑥𝑚í𝑛 5
𝐴= 𝑘 6
1450,0 − 450,0
𝐴= = 166,6 → 167,0
6
Redondear
SIEMPRE al
ORGANIZACIÓN DE DATOS, ANÁLISIS DE DISTRIBUCIONES DE FRECUENCIAS Y SU REPRESENTACIÓN 2

Procedimiento para datos agrupados por Carola Flores M


ORGANIZACIÓN DE DATOS, ANÁLISIS DE DISTRIBUCIONES DE FRECUENCIAS Y SU REPRESENTACIÓN 2

600,0 620,0 450,0 750,0 1100,0


1020,0 920,0 500,0 450,0 905,0
Paso 3. Construir las clases indicando los extremos 700,5 650,0 790,5 700,5 1450,0
de las mismas. 830,0 800,0 1210,5 500,0 1210,5
a) El límite inferior de la primera clase será el 1000,0 650,0 620,0 680,0 950,0
valor mínimo ( 𝑥𝑚í𝑛 )

b) El límite superior en cada clase se obtiene (Variable) Frecuencia Frecuencia


Ingresos Frecuencia Frecuencia
al sumar la longitud de clase al extremo absoluta relativa
Clase absoluta relativa
Límite Límite acumulad acumulad
inferior. 𝒇𝒂𝒊 𝒇𝒓𝒊
inferior superior a a
𝑭𝒂𝒂𝒊 𝑭𝒓𝒂𝒊
c) El límite inferior de las siguientes clases 1 450 617
tomará el mismo valor obtenido como 2 617 784
3 784 951
límite superior de la clase anterior
4 951 1118
5 1118 1285
6 1285 1452

Carola Flores
ORGANIZACIÓN DE DATOS, ANÁLISIS DE DISTRIBUCIONES DE FRECUENCIAS Y SU REPRESENTACIÓN 3

Procedimiento para datos agrupados por clases


600,0 620,0 450,0 750,0 1100,0
1020,0 920,0 500,0 450,0 905,0
700,5 650,0 790,5 700,5 1450,0
Paso 4. Se calcula las frecuencias absolutas 830,0 800,0 1210,5 500,0 1210,5
para cada clase, sumando el número de
1000,0 650,0 620,0 680,0 950,0
observaciones que se encuentran dentro del
intervalo de clase, considerando el límite
superior como intervalo cerrado.
(VVaria
((Variable) Frecuencia
Frecuenci Frecuencia
Frecuenci
riIngresos
ababll Frecuenc
Frecuencia Frecuenc
Frecuencia a a
ia ia absoluta relativa
C Cll
Clase absoluta relativa absoluta relativa
Paso 5. Se calculan las columnas restantes, Límite
LLíím LLímite
Líími absoluta
𝒇𝒂𝒊 relativa
𝒇𝒓𝒊
acumulad acumulad
correspondientes a la frecuencia absoluta itmit
inferior tmite
superior acumula
a acumula
a
𝑭𝒂𝒂𝒊 𝑭𝒓𝒂𝒊
acumulada, frecuencia relativa y frecuencia 1 45 61 5
1 450 617 5 0,2 5 0,2
relativa acumulada como se indicó 2
2 61
617
78
784 8
8
0,32 13 0,52
anteriormente. 3 78 95 6
3 784 951 6 0,24 19 0,76
4 95 111
4 951 1118 33 0,12 22 0,88
55 111
1118 128
1285 22 0,08 24 0,96
66 128
1285 145
1452 11 0,04 25 1
TTO
TOTAL 2
25 1

Carola Flores
ORGANIZACIÓN DE DATOS, ANÁLISIS DE DISTRIBUCIONES DE FRECUENCIAS Y SU REPRESENTACIÓN 3

(Variable) Frecuencia Frecuencia


Frecuencia Frecuencia DISTRIBUCIÓN ACUMULADA DE INGRESOS
Ingresos absoluta relativa
Clase absoluta relativa 1,2
Límite Límite acumulad acumulad
𝒇𝒂𝒊 𝒇𝒓𝒊 0 617 784 951 1118 1285 1452
inferior superior a a 1 1
0,96
𝑭𝒂𝒂𝒊 𝑭𝒓𝒂𝒊 0,8
0,88
0,76
1 450 617 5 0,2 5 0,2

Número de
0,6
2 617 784 8 0,32 13 0,52 0,52 Ojiva
3 784 951 6 0,24 19 0,76 0,4

4 951 1118 3 0,12 22 0,88 0,2 0,2


5 1118 1285 2 0,08 24 0,96
0
6 1285 1452 1 0,04 25 1 0

TOTAL 25 1

DISTRIBUCIÓN DE INGRESOS DISTRIBUCIÓN DE INGRESOS


9 9
8 8
7 7
6
6
5
5 Polígono de

Número de
4
Número de

4
3 frecuencias
3 2
2 Histograma 1
1 0
366,5 533,5 700,5 867,5 1034,5 1201,5 1368,5 1535,5
0
533,5 700,5 867,5 1034,5 1201,5 1368,5 Título del eje

Carola Flores
ORGANIZACIÓN DE DATOS, ANÁLISIS DE DISTRIBUCIONES DE FRECUENCIAS Y SU REPRESENTACIÓN 3

TABLAS DE DOBLE
Una tabla de doble entrada o tabla de contingencia recoge información de
dos variables, tanto por filas como por columnas y analiza su información
de manera conjunta.

Se quiere evaluar de dónde provienen


GRADO los empleados que no están
DE ACEPTACIÓN
muy conformes con elAlto
nuevoMedio
horario de trabajoTotal
Bajo
Alausí 0 0 3 3
Chambo 1 1 5 7
LUGAR DE Cumandá 2 1 3 6
PROCEDENCIA Penipe 0 1 3 4
Riobamba 3 2 0 5
Total 6 5 14 25

Carola Flores
ORGANIZACIÓN DE DATOS, ANÁLISIS DE DISTRIBUCIONES DE FRECUENCIAS Y SU REPRESENTACIÓN 3

TABLAS DE DOBLE

GRADO DE ACEPTACIÓN
Alto Medio Bajo Total
Alausí 0 0 3 3
Chambo 1 1 5 7 Total marginal
LUGAR DE Cumandá 2 1 3 6 por filas
PROCEDENCIA Penipe 0 1 3 4
Riobamba 3 2 0 5
Total Total marginal 6 5 14 25
por columnas

Total general

Frecuencias
conjuntas

Carola Flores
ORGANIZACIÓN DE DATOS, ANÁLISIS DE DISTRIBUCIONES DE FRECUENCIAS Y SU REPRESENTACIÓN 3

TABLAS DE DOBLE
DISTRIBUCIÓN CONJUNTA DEL GRADO DE ACEPTACIÓN
DEL
NUEVO HORARIO Y LUGAR DE PROCEDENCIA
16
GRADO DE ACEPTACIÓN
14
Alto Medio Bajo Total
Alausí 0 0 3 3 12 Riobamba
Chambo 1 1 5 7 10 Penipe
LUGAR DE Cumandá 2 1 3 6
PROCEDENCIA Penipe

Número de
8 Cumandá
0 1 3 4
Riobamba 3 2 0 5 6 Chambo
Total 6 5 14 25 Alausí
4

0
Alto Medio Bajo
DISTRIBUCIÓN CONJUNTA DEL GRADO DE ACEPTACIÓN DEL NUEVO Grado de aceptación
HORARIO Y LUGAR DE PROCEDENCIA
8

7 Alausí Chambo Cumandá Penipe Riobamba


Cantón
6

4 Bajo
Número de

3 Medio
Alto
2

Carola Flores
ORGANIZACIÓN DE DATOS, ANÁLISIS DE DISTRIBUCIONES DE FRECUENCIAS Y SU REPRESENTACIÓN 3

TABLAS DE DOBLE
Diagrama de
barras apiladas
Se utiliza para mostrar cómo una categoría
más grande se divide en categorías más
pequeñas y cuál es la relación de cada parte
sobre la cantidad total.

Carola Flores
ORGANIZACIÓN DE DATOS, ANÁLISIS DE DISTRIBUCIONES DE FRECUENCIAS Y SU REPRESENTACIÓN 3

TABLAS DE DOBLE DISTRIBUCIÓN CONJUNTA DEL GRADO DE ACEPTACIÓN DEL


NUEVO
HORARIO Y LUGAR DE PROCEDENCIA
6
GRADO DE ACEPTACIÓN
Alto Medio Bajo Total 5
Alausí 0 0 3 3 Alausí
4
Chambo 1 1 5 7
LUGAR DE Cumandá 2 1 3 6
Chambo
PROCEDENCIA Penipe 3

Número de
0 1 3 4 Cumandá
Riobamba 3 2 0 5 2 Penipe
Total 6 5 14 25 Riobamba
1

0
Alto Medio Bajo
DISTRIBUCIÓN CONJUNTA DEL GRADO DE ACEPTACIÓN DEL
Grado de aceptación
NUEVO HORARIO Y LUGAR DE PROCEDENCIA
6

Diagrama de
5

3 Alto
barras agrupadas
Número de

Medio
2
Bajo
1
Se utiliza para representar valores individuales para más de un
0
Alaus
elemento que comparten la misma categoría. Los datos se
Chambo Cumandá Penipe Riobamba
í
Cantón representan mediante grupos de barras rectangulares con

Carola Flores
ORGANIZACIÓN DE DATOS, ANÁLISIS DE DISTRIBUCIONES DE FRECUENCIAS Y SU REPRESENTACIÓN 3

TABLAS DE DOBLE
lon t
git a
ud n
es .
pr
op
orc
ion
ale
s a
los
val
or
es
qu
e
re
pr
es
en

Carola Flores
ORGANIZACIÓN DE DATOS, ANÁLISIS DE DISTRIBUCIONES DE FRECUENCIAS Y SU REPRESENTACIÓN 3

DIAGRAMA DE CAJA Y
Es un gráfico utilizado para representar una variable cuantitativa. Permite
visualizar, a través de los cuartiles, cómo es la distribución (localización
dispersión y simetría) de los datos. Es útil para comparar muestras y se
considera herramienta de diagnóstico de valores extremos (atípicos). Se lo
conoce también como diagrama de caja y bigotes o boxplot

Se quiere visualizar si los


ingresosestánrelacionados
conelgradodeaceptación del nuevo horario de trabajo

Carola Flores
ORGANIZACIÓN DE DATOS, ANÁLISIS DE DISTRIBUCIONES DE FRECUENCIAS Y SU REPRESENTACIÓN 3

DIAGRAMA DE CAJA Y

• La amplitud del diagrama


representa la variabilidad de los
ingresos, a mayor amplitud, mayor
variabilidad. Existe mayor

cuantitativ
Variable
diferencia en los ingresos de los
empleados cuyo grado de
aceptación es bajo (entre $450 y
$1500) en comparación de quienes
tienen un grado de aceptación
alto (entre $600 y $1050)

• El bigote superior representa el valor máximo. Todos los


empleados tienen ingresos inferiores a $1600 Variable
siempre y cualitativa
• El bigote inferior representa el valor mínimo. Los cuando no
empleados cuyo grado de aceptación del nuevo horario hayan valores
atípicos
de trabajo es alto, tienen un ingreso mínimo de $600

Carola Flores
Representación
gráfica
REPRESENTACIÓN 3

Una manera muy eficiente de conocer el comportamiento de un


conjunto de datos es representándolo gráficamente, ya que permite
dar una descripción de manera rápida y fácil. Es muy importante la
descripción gráfica en el análisis estadístico para que el lector pueda
entenderlo de mejor manera.

Carola Flores
REPRESENTACIÓN 4

Diagrama de barras
Se utiliza para representar datos cualitativos y cuantitativos discretos.
Las barras pueden orientarse horizontal o verticalmente. Si son de
forma vertical, en el eje horizontal, se representan los datos de la
variable en estudio y en el eje vertical, se representan sus frecuencias
absolutas, mismas que deben ser proporcionales a las alturas de las
barras. Se debe tener en cuenta que todas las barras deben tener
el mismo ancho y no deben superponerse las unas con las otras.

Carola Flores
REPRESENTACIÓN 4

Barras sencillas Barras apiladas

Barras agrupadas

Carola Flores
REPRESENTACIÓN 4

Diagramas
Llamado también diagramas de pastel o diagramas de sectores. Son
utilizados en condiciones similares al diagrama de barras. Un gráfico de
sectores es un círculo dividido en segmentos, donde el área de cada
uno de los sectores es proporcional a la frecuencia relativa de esa
categoría. El ángulo central de la categoría es igual a fi x 360. Junto a
cada uno de los sectores que constituyen el gráfico, se suele indicar el
nombre, el número de elementos y el porcentaje de cada categoría.

Carola Flores
REPRESENTACIÓN 4

Diagramas
Si los datos son nominales, las categorías se pueden colocar en
cualquier orden; pero si los datos son ordinales, las categorías deben
estar ordenadas.

Estado de entrega de un producto

12% 22%

66%

BuenoRegularMalo

Carola Flores
REPRESENTACIÓN 4

Histogram
Un histograma es un conjunto de rectángulos, cada uno de los cuales
representa un intervalo de agrupación. Sus bases son iguales al
intervalo de clase empleado en la distribución de frecuencias, y las
alturas son proporcionales a la frecuencia absoluta o relativa de la
clase.

El histograma es apropiado para datos continuos, medidos con una


misma escala y se lo emplea cuando un diagrama de tallo y hojas es
tedioso de construir. Igualmente, puede ayudar a detectar
observaciones atípicas y cualquier brecha entre los datos.

Carola Flores
REPRESENTACIÓN 4

Histogram
Para graficarlo se calcula la marca de clase, es decir, el punto medio de
cada intervalo y sobre él se grafican las barras correspondientes a las
frecuencias absolutas o relativas.

Carola Flores
REPRESENTACIÓN 4

Polígono de frecuencias
Un polígono de frecuencias es un gráfico que se obtiene uniendo con
segmentos de recta los puntos que tienen proporcionalmente como
abscisa a la marca de clase y como ordenada la frecuencia respectiva.
Se cierra en ambos extremos en las marcas adyacentes con frecuencia
cero.

Carola Flores
REPRESENTACIÓN 4

Ojiv
La ojiva es un polígono de frecuencias acumuladas; es decir, en las
abscisas se colocan los límites superiores de cada intervalo de clase y
en las ordenadas se coloca la frecuencia acumulada (absoluta o
relativa) de la clase. La ojiva es útil para:

• Calcular el número o el porcentaje de observaciones que


corresponden a un intervalo determinado de la variable.
• Calcular los percentiles de la distribución de los datos.

Carola Flores
REPRESENTACIÓN 4

Ojiv

Carola Flores
REPRESENTACIÓN 4

Caja y alambres (caja y


El diagrama de caja es otra herramienta para describir el
comportamiento (localización dispersión y simetría) de los datos. Es útil
para comparar muestras y se considera herramienta de diagnóstico de
valores extremos (atípicos). El diagrama de caja se basa en los cuartiles
y divide los datos ordenados en cuatro grupos, que contienen, cada
uno, 25% de las mediciones. De esta forma es posible visualizar donde
termina de acumularse 25% de los datos menores, y a partir de donde
se localiza 25% de los datos mayores. Entre estos dos cuartiles se ubica
50% de los datos que están al centro.

Carola Flores
REPRESENTACIÓN 5

Caja y alambres (caja y


• Rango intercuartil, Rc = Q3-Q1
• Barrera interior izquierda, Q1 − 1.5Rc e interior derecha Q3 + 1.5Rc
• Barrera exterior izquierda, Q1 − 3Rc, y exterior derecha Q3 + 3Rc

Carola Flores
REPRESENTACIÓN 5

Caja y alambres (caja y


Para realizar un diagrama de caja se deben seguir los siguientes pasos
1. Ordena los datos de menor a mayor.

2. Obtener los valores correspondientes a:


 Primer cuartil
 Segundo cuartil
 Tercer cuartil
 Rango intercuartil
 Barrera interior izquierda y derecha
 Barrera exterior izquierda y derecha

Carola Flores
REPRESENTACIÓN 5

Caja y alambres (caja y


3. Crear una recta real que contenga todos los datos.

4. Se dibuja una caja de Q1 a Q3 divididas por una recta en Q2. Se corta la


recta real en los puntos correspondientes a las barreras interiores y
exteriores. Luego se extienden los "bigotes" por cada lado de la caja hasta el
dato que se encuentre dentro de la barrera interior izquierda o derecha. Los
datos que superan las barreras interiores pueden ser considerados como
datos alejados con cierta sospecha de ser atípicos y se los representaran por
medio de puntos. Si aún hay datos por fuera de las barreras exteriores, se
representaran con un asterisco. Los datos que queden fuera de estas
barreras exteriores, de manera definitiva pueden considerarse datos muy
alejados, raros o aberrantes.

Carola Flores
REPRESENTACIÓN 5

Caja y alambres (caja y

Carola Flores

También podría gustarte