Está en la página 1de 48

Introducción a la Estadística

U. A. 2
Descripción gráfica de los Datos

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-1
Objetivos
Al completar este tema, usted será capaz de:
 Identificar tipos de datos y niveles de medida
 Crear e interpretar gráficos para describir variables categóricas:
 Distribución de frecuencias, diagrama de barras, diagrama de

torta, diagrama de Pareto


 Crear un diagrama de línea para describir datos en series de tiempo
 Crear e interpretar gráficos para describir variables numéricas:
 Distribuciones de frecuencia, histograma, ojiva, diagrama de tallo y

hojas
 Construir e interpretar gráficos para describir relaciones entre
variables:
 Diagrama de dispersión, tablas cruzadas

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-2
Tipos de Datos
Datos

Categóricos Numéricos

Ejemplos:
 Estado Civil
 Está usted registrado Discretos Continuos
para votar?
 Color de ojos Ejemplos: Ejemplos:
(Categorías o grupos  Número de hijos  Peso
definidos)  Nro Pax en un bus  Diámetro
(Contar elementos) (Medir características)
NUMEROS ENTEROS NUMEROS REALES

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-3
Niveles de Medición
Tiene sentido
multiplicar y dividir Escala de Razón
valores de las
variables Datos
Cuantitativos
Tiene sentido sumar
o restar valores de las Escala de Intervalo
variables

Categorías ordenadas
(rankings, orden, o Escala ordinal
escalamiento)
Datos Cualitativos

Categorías sin orden ni


dirección Escala nominal
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-4
Presentación Gráfica de los
Datos
 Los datos primarios (no procesados) no son
adecuados para la toma de decisiones
 Se necesita algún tipo de organización
 Tablas

 Gráficos

 El tipo de gráfico a usar depende del tipo de


variable a ser resumida y presentada

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-5
Presentación Gráfica de los
Datos
(continuación)
 Técnicas vistas:

Variables Variables
Categóricas Numéricas

• Distribución de • Diagrama de Línea


frecuencias • Distribución de
• Diagrama de Barras Frecuencias
• Diagrama de Torta • Histograma y ojiva
• Diagrama de Pareto • Diagrama de tallo y
hojas
• Diagrama de dispersión
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-6
Tablas y Gráficos para
Variables Categóricas
Datos
Categóricos
(cualitativos)

Tabular datos Graficar datos

Tabla de
Distribución de Diagrama Diagrama Diagrama
Frecuencias de Barras de Torta de Pareto

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-7
Tablas de Distribución de
Frecuencias
Datos organizados por categorías

Pacientes de Hospital por Unidad


Patients by Unit
Unidad Número de Pacientes

Cardiología 1,052
Emergencias 2,245
Terapia Intensiva 340
Maternidad 552
Cirugía 4,630
(Las Variables
son categóricas)
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-8
Diagrama de Barras.
Diagrama de Torta

 Los diagramas de barra y los diagramas


de torta son usados a menudo para datos
cualitativos (categóricos)
 El alto de la barra o el tamaño de la
porción de torta muestra la frecuencia o
porcentaje de participación para cada
categoría

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-9
Ejemplo: Diagrama de Barras
Pacientes por Unidad
Unidad Nro de
del Hospital pacientes 5000

Pacientes por año


4000

Cardiología 1,052 3000


Emergencias 2,245
2000
Terapia Intensiva 340
Maternidad 552 1000

Cirugía 4,630 0

Cardiología

Cirugía
Emergen

intensiva

Maternidad
Terapia
cias

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-10
Ejemplo: Diagrama de Torta

Unidad Número % del


del Hospital de Pacientes Total
Pacientes por Unidad
Cardiología 1,052 11.93
Cardiac Care
Emergencias 2,245 25.46 12%
Cuidado Intensivo 340 3.86
Maternidad 552 6.26
Cirugía 4,630 52.50

Emergency
Surgery 25%
53%

Intensive Care
(Porcentajes 4%
redondeados Maternity
al porciento 6%
más cercano)

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-11
Diagrama de Pareto

 Usado para retratar datos categóricos


 Es un diagrama de barras, donde las categorías se
muestran en orden descendente de frecuencias
 Un polígono acumulativo se muestra a menudo en
la misma gráfica
 Se usa para separa los ”pocos vitales” de los
“muchos triviales”

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-12
Ejemplo: Diagrama de Pareto
Caso: 400 elementos defectuosos son
examinados por la causa del defecto
Fuente de
Error de Manufactura Número de defectos
Soldadura Defectuosa 34
Alineamiento pobre 223
Parte faltante 25
Falla de Pintura 78
Corto circuito 19
Carcasa quebrada 21
Total 400

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-13
Diagrama de Pareto
(continuación)

Paso 1: Ordene por la causa del defecto, en orden


descentente
Paso 2: Determinar el % en cada categoría
category
Fuente de Número de % Defectos
Error de Manufactura defectos Totales
Alineamiento pobre 223 55.75
Falla de pintura 78 19.50
Soldadura defectuosa 34 8.50
Parte faltante 25 6.25
Carcasa quebrada 21 5.25
Corto circuito 19 4.75
Total 400 100%
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-14
Diagrama de Pareto
(continuación)
Paso 3: Muestre los resultados gráficamente
Pareto Diagram: Cause of Manufacturing Defect
% de defectos en cada categoría

60% 100%

% acumulativo (gráfica lineal)


90%

50%
80%
(gráfico de barras)

70%
40%

60%

30% 50%

40%

20%
30%

20%
10%

10%

0% 0%
Poor Alignment Paint Flaw Bad Weld Missing Part Cracked case Electrical Short

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-15
Gráficos para Datos en Series de Tiempo

 Un diagrama lineal (gráfica para series


temporales) se utiliza para mostrar los valores
de la variable a través del tiempo
 El tiempo se mide en el eje horizontal
 La variable de interés se mide en el eje vertical

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-16
Ejemplo Diagrama Lineal
Suscripciones por año

350

300
Miles de suscroptores

250

200

150

100

50

0
1990

1991

1992

1993

1994

1995

1996

1997

1998

1999

2000

2001

2002

2003

2004

2005

2006
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-17
Gráficos para Describir
Variables Numéricas
Datos Numéricos
(cuantitativos)

Distribuciones de Frecuencia y Diagrama


Distribuciones Acumulativas De Tallo y Hojas

Histograma Ojiva

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-18
Distribuciones de Frecuencia

Qué es una Distribución de Frecuencias?


 Es una lista o tabla …
 Que contiene clases agrupantes (categorías o
rangos dentro de los cuales los datos caen) ...
 Y las correspondientes frecuencias (cantidad
de veces) con las cuales los datos caen en
cada categoría

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-19
Por qué usar Distribuciones de Frecuencias?

 Una distribución de frecuencias es una


manera de resumir los datos
 La distribución condensa los datos
primarios en una forma más útil...
 Y permite una interpretación visual rápida
de los datos

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-20
Intervalos de Clase. Límites de Clase.

 Cada clase tiene el mismo ancho


 El ancho de cada clase se calcula con:
W = Rango / m = (Xmax – Xmin) / m
m : número de clases

 Entre 5 y 15 clases
 Los intervalos no deben sobreponerse
 Redondee el ancho de la clase para optimizar
los límites de clase

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-21
Ejemplo: Distribución de Frecuencias

Una fábrica de aislantes selecciona


aleatoriamente 20 días de invierno y registra la
temperatura más alta registrada (en F)

24, 35, 17, 21, 24, 37, 26, 46, 58, 30,
32, 13, 12, 38, 41, 43, 44, 27, 53, 27

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-22
Ejemplo: Distribución de Frecuencias
(continuación)

 Ordene los datos primarios en orden ascendente:


12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58
 Calcule el rango: 58 - 12 = 46
 Elija número de clases: 5 (usualmente entre 5 y 15)
 Calcule el ancho de clase: 46/5 --- 10 (redondear)
 Determine los límites de clase: 10 pero menos de 20, 20
pero menos de 30, . . . , 60 pero menos de 70
 Contar las observaciones y asignar a las clases

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-23
Ejemplo: Distribución de Frecuencias
(continuación)
Datos ordenados:
12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58

Frecuenci
Intervalo Frecuencia Porcentaje
a
Relativa
De 10 a menos de 20 3 .15 15
De 20 a menos de 30 6 .30 30
De 30 a menos de 40 5 .25 25

De 40 a menos de 50 4 .20 20
De 50 a 60 2 .10 10

Total 20 1.00 100


Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-24
Histograma

 Un gráfico de los datos en una distribución de


frecuencia se llama histograma
 Los límites de los intervalos se muestran en
el eje horizontal
 El eje vertical puede ser frecuencia,
frecuencia relativa o porcentaje
 Se usan barras de alturas apropiadas para
representar la cantidad de observaciones
dentro de cada clase
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-25
Ejemplo de Histograma
Histograma: Temperatura diaria m ás
alta
Intervalo Frecuencia 7 6
10  20 3 6 5
20  30 6
5
Frecuencia
30  40 5 4
40  50 4 4 3
50  60 2
3 2
2
1 0 0
0
0 0 10 10 20 20 30 30 40 40 50 50 60 60
(No hay 70
separación
entre barras) Temperature in Degrees
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-26
Excel

1
Seleccionar
Herramientas/Análisis
de datos

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-27
Histogramas en Excel
(continued)

2
Elegir: Histograma

(
Rango de datos de
ingreso y Bin Range
(Bin range es un rango de celdas
3 que contiene los límites
superiores de cada intervalo de
clase)
Seleccione Generar
Diagrama y “OK”
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-28
Preguntas para agrupar datos en clases

 1. Cuánto debe medir el ancho de cada


intervalo?
(Cuántas clases usaremos?)
 2. Cómo se determinan los límites de
clase?
 Por prueba y error, sujeto a juicio del usuario
 El ancho de clase debe ser adecuado
 La meta es mostrar apropiadamente el patrón
de variación de los datos

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-29
Cuántos intervalos?

 Muchos (Intervalos estrechos) 3.5


3
 Puede resultar una distribución 2.5

Frequency
dentada con brechas por clases 2
1.5
vacías 1
0.5
 Puede dar una indicación pobre de 0

4
8
12
16
20
24
28
32
36
40
44
48
52
56
60
More
cómo varía la frecuencia a través de Temperature
las clases
12

 Pocos (Intervalos anchos) 10


8

Frequency
 Puede resultar una distribución muy 6

compacta al comprimir la variación 4

2
 Puede cubrir importantes patrones de 0
0 30 60 More
variación. Temperature
(X axis labels are upper class endpoints)

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-30
La Distribución Acumulativa de Frecuencias

Datos ordenados:
12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58

Frecuencia Porcentaje
Clase Frecuenci Porcentaje
Acumulativa acumulativo
a
[ 10, 20 [ 3 15 3 15
[ 20, 30 [ 6 30 9 45
[ 30, 40 [ 5 25 14 70
[ 40, 50 [ 4 20 18 90
[ 50, 60 ] 2 10 20 100
Total 20 100

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-31
La Ojiva
Graficar Frecuencias Acumulativas

Límite Porcentaje
Intervalo Superior Acumulativo
0 - 10 10 0
10 - 20 20 15 Ojiva: Temperatura diaria más alta
20 - 30 30 45
30 - 40 40 70 100

Porcentaje Acumulativo
40 - 50 50 90
50 - 60 60 100 80
60
40
20
0
10 20 30 40 50 60

Límite derecho de clase


Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-32
Forma de la Distribución
 Una distribución se dice simétrica si las
observaciones se encuentran balanceadas o
distribuidas igualmente alrededor de la media.
Symmetric Distribution

10
9
8
7
Frequency

6
5
4
3
2
1
0
1 2 3 4 5 6 7 8 9

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-33
Forma de la Distribución
(continuación)
 La distribución se denomina sesgada si las
observaciones no están simétricamente
distribuidas alrededor de la media.
Positively Skewed Distribution

Una distribución con sesgo positivo 12

(sesgada a la derecha) tiene una


10

Frequency
cola que se extiende a la derecha en 6

la direción de los valores positivos


4

0
1 2 3 4 5 6 7 8 9

Negatively Skewed Distribution


Una distribución con sesgo negativo 12
(sesgada a la izquierda) tiene una 10

cola que se extiende a la izquierda 8


Frequency

6
en la dirección de los valores 4

negativos. 2

0
1 2 3 4 5 6 7 8 9

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-34
Diagrama de Tallo y Hojas

 Una manera simple de ver los detalles de una


distribución
 MÉTODO: Primero ordenar los datos.
 Luego separar en series: en primeros dígitos
(tallo) y en segundos dígitos (hojas). Puede
ser también: parte entera (tallo) y parte
decimal (hojas).

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-35
Ejemplo
Datos ordenados:
21, 24, 24, 26, 27, 27, 30, 32, 38, 41

 Con el Sistema decimal:


Tallo Hojas
 21 es … 2 1
 38 es … 3 8

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-36
Ejemplo
(continuación)
Datos ordenados:
21, 24, 24, 26, 27, 27, 30, 32, 38, 41

 Diagrama completo de tallo y hojas:


Tallo Hojas
2 1 4 4 6 7 7
3 0 2 8
4 1

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-37
Uso de otros sistemas de unidades

 Centenas en el Tallo:
 Redondear los dígitos a decenas para las
hojas Tallo Hojas

 613 sería 6 1
 776 sería 7 8
 1224 sería 12 2

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-38
Otra forma
(continuación)

 El diagrama completo de tallo y hojas,


con redondeo a las decenas:
Datos:
Tallo Hojas
613, 632, 658, 717, 6 136
722, 750, 776, 827, 7 2258
841, 859, 863, 891, 8 346699
894, 906, 928, 933,
9 13368
955, 982, 1034,
1047,1056, 1140, 10 356
1169, 1224 11 47
12 2
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-39
Relaciones entre Variables

 Los gráficos vistos involucran únicamente una


sola variable
 Cuando existen dos variables hay otras
técnicas:

Variables Variables
Categóricas Numéricas
(Cualitativas) (Cuantitativas)

Tablas Diagramas de
Cruzadas Dispersión
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-40
Diagramas de Dispersión

 Los Diagramas de Dispersión son usados


para pares de observaciones que
provienen de dos variables numéricas
 La variable independiente se mide en el

eje horizontal (X) y la variable


dependiente Y=f(X) de mide en el eje
vertical.

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-41
Ejemplo: Diagrama de Dispersión

Costo por día vs. Volumen de producción


Volumen Costo
por dia por dia
23 125 250
26 140
200
29 146
Costo por dia

150
33 160
38 167 100
42 170 50
50 188 0
55 195 0 20 40 60 80
60 200
Volume por día

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-42
EXCEL

1
Elilja el ícono de Diagrama

2
Elija la opción XY(Scatter
ó Dispersión)

3
Ingrese el rango de
datos, títulos o
leyendas, etc para
completar el diagrama

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-43
Tablas Cruzadas

 Las Tablas Cruzadas (o tablas de


contingencia) listan el número de
observaciones para cada combinación de
valores de dos variables categóricas u
ordinales
 Si hay f categorías para la primera variable
(filas) y hay c categorías para la segunda
variable (columnas), la tabla se denomina r x c

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-44
Ejemplo de Tabla Cruzada
 Tabla Cruzada 4 x 3 para Elecciones por Inversor
(valores en $1000’s)
Categoría Inversor A Inversor B Inversor C Total
De Inversión

Acciones 46.5 55 27.5 129


Bonos 32.0 44 19.0 95
CD 15.5 20 13.5 49
Ahorros 16.0 28 7.0 51
Total 110.0 147 67.0 324

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-45
Graficando Datos
Categóricos Multivariables
 Diagrama Comparativo
Comparación de Inversionistas

Savings

CD

Bonds

Stocks

0 10 20 30 40 50 60

Investor C Investor B Investor A

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-46
Ejemplo Gráfico Comparativo
 Ventas trimestrales para tres territorios:
1st Qtr 2nd Qtr 3rd Qtr 4th Qtr
East 20.4 27.4 59 20.4
W est 30.6 38.6 34.6 31.6
North 45.9 46.9 45 43.9

60

50

40
East
30 West
North
20

10

0
1st Qtr 2nd Qtr 3rd Qtr 4th Qtr

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-47
Resumen del Capítulo
 Revisamos tipos de datos y escalas de medición
 Los datos primarios no son útiles para la toma de
decisiones – se necesita algún tipo de organización:
 Tablas  Gráficos

 Técnicas revisadas en este capítulo:


 Distribución de Frecuencias  Diagrama de línea
 Diagrama de Barras
 Distribución de Frec.
 Histograma y ojiva
 Diagrama de Torta
 Diagrama de Tallo y hojas
 Diagrama de Pareto  Diagrama de Dispersión
 Tablas Cruzadas
 Gráficos comparativos
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 2-48

También podría gustarte