Está en la página 1de 39

Análisis de Datos para la Gerencia

1

Introducción a la Estadística:

Descripción de Datos

Sesión 1

a la Estadística: Descripción de Datos Sesión 1 Notas de clase elaboradas por el Prof. Tomás

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

2

¿Qué es la estadística?

“La Estadística es un campo de la ciencia que

comprende procedimientos destinados a servir en el proceso de decisión cuando hay incertidumbre.

Esta definición puntualiza dos aspectos que el gerente

enfrenta continuamente: toma de decisiones e

incertidumbre. En lo que se refiere al tratamiento de la incertidumbre, la teoría de probabilidades nos da la

oportunidad de una cuantificación del riesgo lo que

permite ganar en eficiencia en la toma de decisiones. Este proceso se torna cada día más “científico” y las técnicas de soporte son por lo tanto una necesidad.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

3

Datos

Los datos son los hechos y los números que se

reúnen, analizan y resumen para su presentación

e interpretación.

y resumen para su presentación e interpretación . Notas de clase elaboradas por el Prof. Tomás
y resumen para su presentación e interpretación . Notas de clase elaboradas por el Prof. Tomás
y resumen para su presentación e interpretación . Notas de clase elaboradas por el Prof. Tomás

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

4

Elementos, Variables, Observaciones

Los

recogemos los datos.

elementos

son

las

entidades

de

las

cuales

Una variable es una característica de interés de cada elemento.

Al conjunto de medidas recogidas de un elemento en particular se le llama observación.

El número total de datos es igual al número de elementos multiplicado por el de
El
número
total
de
datos
es
igual
al
número
de
elementos multiplicado por el de variables.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

5

Escalas de Medición

Las escalas de medición son:

Nominal

Ordinal

De intervalo

De razón

La escala determina la cantidad de información que

debe contener el dato.

La escala indica además qué tipos de resúmenes de

datos y de análisis estadísticos son los más apropiados.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

6

Escalas de Medición

Nominal

Los Datos son etiquetas o nombres usados para Identificar un atributo de un elemento.

Se usan etiquetas no numéricas o códigos

numéricos.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

7

Escalas de Medición

Ordinal

Los datos tienen las propiedades de una

medición nominal y adicionalmente el orden o la

posición relativa de cada categoría tiene

significado.

Se pueden usar una etiqueta no numérica o un

código numérico.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

8

Escalas de Medición

De Intervalo

Los datos tienen las propiedades de los ordinales y las distancias que hay entre las observaciones se miden en términos de una unidad de medida fija.

Datos de Intervalo son siempre numéricos.

Esta escala tiene el cero relativo que indica que

para esta variable el punto cero depende de quien evalúa. En el cero, no siempre no hay nada.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

9

Escalas de Medición

De razón

Los datos tienen todas las propiedades de los de

intervalo y en este caso el cociente de dos valores tiene un significado.

Variables como son distancia, altura, peso, y tiempo usan la escala de razón.

Esta escala tiene el cero absoluto que indica que para esta variable no existe nada en el punto cero.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

10

Cada escala provee diferente información

Nominal TerceroTercero SegundoSegundo GanadorGanador Ordinal Tercero Segundo Ganador Intervalo 20 segundos 1
Nominal
TerceroTercero
SegundoSegundo
GanadorGanador
Ordinal
Tercero
Segundo
Ganador
Intervalo
20 segundos
1 segundo
Razón
1
minuto 59 2 /5 segundos para 1 1 /4 millas

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

11

Estadística Descriptiva

La mayoría de la información estadística en los periódicos, revistas, informes de la compañía, y

otras publicaciones consiste en datos que se

resumen y presentan en una forma que es fácil de entender.

A dichos resúmenes de datos, que pueden ser

tabulares, gráficos, o numéricos, se les conoce como estadística descriptiva.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

12

Inferencia Estadística

Inferencia

Estadística

Población

Muestra

Censo

Encuesta

es el proceso por el que se obtiene

información acerca de la población

partiendo de información contenida en una muestra.

es el conjunto total de elementos de

un estudio.

es un subconjunto de la población.

es recolectar datos de la población.

es recolectar datos de una muestra.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

13

Proceso de Inferencia Estadística

Población 1 con m parámetro desconocido
Población
1 con m
parámetro
desconocido

Extraemos una

muestra de “n” elementos

2
2
Extraemos una muestra de “n” elementos 2 Calculamos X 3 estadístico muestral Usamos el
Extraemos una muestra de “n” elementos 2 Calculamos X 3 estadístico muestral Usamos el
Calculamos X 3 estadístico muestral

Calculamos X

3
3

estadístico

muestral

Usamos el promedio muestral para estimar el parámetro poblacional.

4
4
muestral para estimar el parámetro poblacional. 4 Notas de clase elaboradas por el Prof. Tomás Minauro

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

14

Computadoras y análisis estadístico

Los estadísticos a menudo utilizan programas informáticos para realizar los cálculos estadísticos necesarios con grandes cantidades de datos. Para facilitar el uso del ordenador, muchos de los conjuntos de datos en este libro están disponibles

en el sitio web que acompaña al texto

Los archivos de datos se encuentran en formatos de Minitab o Excel.

los

procedimientos paso a paso para el uso de Minitab, Excel y StatTools.

Anexos

al

final

de

cada

capítulo

con

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

15

Estadística Descriptiva

Datos resumidos y presentados

convenientemente. Dichos resúmenes

pueden ser:

Datos resumidos y presentados convenientemente. Dichos resúmenes pueden ser: tabulares gráficos o numéricos

tabularesDatos resumidos y presentados convenientemente. Dichos resúmenes pueden ser: gráficos o numéricos

gráficos oDatos resumidos y presentados convenientemente. Dichos resúmenes pueden ser: tabulares numéricos

numéricosDatos resumidos y presentados convenientemente. Dichos resúmenes pueden ser: tabulares gráficos o

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

16

Distribución de frecuencias

Una distribución de frecuencias es una tabla

que resume los datos mostrando la frecuencia o número de elementos que hay dentro de cada una

de sus clases, que deben ser mutuamente

excluyentes y colectivamente exhaustivas.

El objetivo es proveer información acerca del

conjunto de datos que no podría obtenerse

rápidamente por simple observación de los datos originales.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

17

Distribución de frecuencias relativas

La frecuencia relativa de una clase es la fracción o proporción del total de datos que pertenecen a

una determinada clase.

Una distribución de frecuencias relativas es una tabla que nos resume un conjunto de datos

mostrando la frecuencia relativa para cada clase.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

18

Gráfico de Barras

Un gráfico de barras es una herramienta gráfica

para trabajar con datos cualitativos.

En un eje (normalmente el horizontal), colocamos

las etiquetas con los nombres de las categorías.

En el otro eje (normalmente el vertical), se puede usar la frecuencia, la frecuencia relativa.

Usamos una barra de ancho fijo que dibujamos arriba de cada etiqueta, con una altura de acuerdo

con su correspondiente frecuencia.

Las barras están separadas para enfatizar que cada clase es una categoría diferente.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

19

Gráfico de Pie

El gráfico de pie es una herramienta gráfica usada generalmente para presentar distribuciones de frecuencia relativa de datos cualitativos.

de frecuencia relativa de datos cualitativos . Primero se traza un círculo; luego usando las frecuencias

Primero se traza un círculo; luego usando las frecuencias relativas se subdivide en sectores que corresponden a la frecuencia relativa de cada clase.

Dado que hay 360° en un circulo, una clase con una

frecuencia relativa de .25 consumirá .25(360) = 90°

de ese círculo.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

20

Distribución de Frecuencias

Para Datos Numéricos

Guías para seleccionar el número de clases

Use entre 5 y 20 clases.

Conjuntos de datos con un número grande de

elementos, generalmente requieren un número grande de clases.

Conjuntos de datos pequeños usualmente requieren pocas clases

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

21

Distribución de Frecuencias Para Datos Numéricos

Guía para seleccionar el Ancho de Clase

Use clases de igual ancho

Ancho aproximado de clase =

Dato más grande - Dato más pequeño Número de Clases

Dato más grande - Dato más pequeño Número de Clases

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

22

Distribución Acumulativa

Distribución Acumulada de Frecuencias muestra el número de observaciones con valores

iguales o menores que el límite superior de cada

clase.

Distribución Acumulada de Frecuencias Relativas muestra la proporción de ítems con

valores menores o iguales al el límite superior de

cada clase.

Distribución Acumulada de Frecuencias Porcentuales muestra el porcentaje de ítems con valores menores o iguales al el límite superior de cada clase.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

23

Usando la función FRECUENCIA de

Excel para Construir una Distribución

de Frecuencias

La función FRECUENCIA no es una función “simple” de Excel.

FRECUENCIA nos proporciona valores múltiples.

En Excel, la formula que dan como respuesta

múltiples valores se llaman fórmula matricial.

Una fórmula matricial tiene una forma especial de ingresar.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

24

Usando la función FRECUENCIA de

Excel para Construir una Distribución

de Frecuencias

Pasos para ejecutar esta función:

Paso 1 Seleccionar la matriz donde deben aparecer las frecuencias

Paso 2 Escribir la siguiente fórmula:

{= FRECUENCIA (Datos,Grupos)}

Paso 3 Presionar CTRL + SHIFT + ENTER (La fórmula aparecerá en toda la matriz seleccionada)

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

25

Histograma

El histograma es una manera muy común de

presentar gráficamente datos cuantitativos.

La variable de interés se coloca en el eje horizontal.

Se dibuja un rectángulo arriba de cada intervalo de

clase con una altura correspondiente a su

frecuencia, frecuencia relativa, o frecuencia porcentual.

A diferencia del gráfico de barras, un histograma

no tiene separaciones entre rectángulos de clases

adyacentes

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

26

Usando Excel para Construir un Histograma

Usando herramientas de Excel

Herramientas Análisis de Datos Histograma
Herramientas
Análisis
de Datos
Histograma
de Excel Herramientas Análisis de Datos Histograma Notas de clase elaboradas por el Prof. Tomás Minauro

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

27

Análisis Exploratorio de Datos

El Análisis Exploratorio de Datos es un conjunto de

técnicas que usan aritmética simple y gráficos fáciles de dibujar para resumir datos rápidamente.

Una de estas técnicas es el diagrama de hoja y tallo.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

28

Diagrama de Hoja y Tallo

Un Diagrama de Hoja y Tallo nos muestra ambos el orden y la forma de la distribución de los datos.

Es muy parecido a un histograma, con la ventaja de

que este diagrama conserva los valores originales.

El primer dígito de cada dato se coloca a la izquierda de una línea vertical.

A la derecha de la línea, registramos el último dígito

de cada dato en orden.

Cada línea en el diagrama se conoce como tallo.

Análisis de Datos para la Gerencia

29

Diagrama de Hoja y Tallo

Si se cree que un diagrama de hoja y tallo está muy concentrado, podemos abrir el diagrama

usando dos tallos para cada dígito inicial.

Dado que tenemos el primer dígito repetido, el

primer valor corresponde a valores de la hoja de

0 - 4, y el segundo a valores de la hoja de 5 - 9.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

30

Diagrama de Hoja y Tallo

Unidades de la Hoja

Cada hoja se define por un sólo dígito.

En el ejemplo anterior, la unidad de la hoja fue 1.

Las unidades pueden ser 100, 10, 1, 0.1, y así.

Cuando no se muestran las unidades de la hoja,

se asume que es 1.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

31

Tablas de Contingencia y

Diagramas de Dispersión

Hasta el momento hemos visto métodos que

resumen datos pero una variable a la vez.

Los gerentes necesitan métodos que les permitan graficar y tabular datos de manera que se entiendan las relaciones entre dos variables.

Tablas de Contingencia y Diagramas de Dispersión

son dos métodos que permiten resumir los datos

para dos (o más) variables simultáneamente.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

32

Tablas de Contingencia

Tabla de contingencia es una forma de resumir en una tabla datos de dos variables simultáneamente. Se puede usar si:

ambas variables son cualitativas, o

Si alguna es cuantitativa, para hacer la tabla debe ser transformada en otra cualitativa.

Las filas y las columnas definen las clases para

cada una de las dos variables.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

33

Diagramas de Dispersión y

Líneas de Tendencia

Un diagrama de dispersión es una representación

gráfica de la relación entre dos variables cuantitativas.

Una de las variables se muestra en el eje vertical

y la otra en el horizontal.

El

patrón

general

que

muestran

los

puntos

sugieren la relación entre las variables.

Una línea de tendencia es una aproximación de la

relación.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

34

Procedimientos Gráficos y Tabulares

Dato
Dato
la Gerencia 34 Procedimientos Gráficos y Tabulares Dato Cualitativo Cuantitativo Métodos Tabulares Métodos
la Gerencia 34 Procedimientos Gráficos y Tabulares Dato Cualitativo Cuantitativo Métodos Tabulares Métodos
Cualitativo
Cualitativo
Cualitativo

Cualitativo

Cualitativo
Cualitativo
34 Procedimientos Gráficos y Tabulares Dato Cualitativo Cuantitativo Métodos Tabulares Métodos Gráficos

Cuantitativo

Gráficos y Tabulares Dato Cualitativo Cuantitativo Métodos Tabulares Métodos Gráficos Métodos
Gráficos y Tabulares Dato Cualitativo Cuantitativo Métodos Tabulares Métodos Gráficos Métodos
Gráficos y Tabulares Dato Cualitativo Cuantitativo Métodos Tabulares Métodos Gráficos Métodos

Métodos

Tabulares

Tabulares Dato Cualitativo Cuantitativo Métodos Tabulares Métodos Gráficos Métodos Tabulares Métodos

Métodos

Gráficos

Cuantitativo Métodos Tabulares Métodos Gráficos Métodos Tabulares Métodos Gráficos • Dist.Frec.

Métodos

Tabulares

Tabulares Métodos Gráficos Métodos Tabulares Métodos Gráficos • Dist.Frec. • Dist.Frec.Relat.

Métodos

Gráficos

Gráficos Métodos Tabulares Métodos Gráficos • Dist.Frec. • Dist.Frec.Relat. • Dist.Frec.Porc.

Dist.Frec.

Dist.Frec.Relat.

Dist.Frec.Porc.

Tab.deConting.

Gráfico de Barras

Gráfico de Pie

Dist. Frec.

Dist.Frec.Relat.

Dist.Frec.Acum.

Dist.Frec.Relat.A

Histograma

Ojiva

Diagrama de Dispersión

cumuladas

Diagrama de

Hoja y Tallo

Tab.deConting.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

35

Errores en Presentación de Datos

1.

Uso de ‘Gráficos engañosos’.

2.

Bases Relativas de

Comparación

diferentes.

3.

Comprimiendo el eje

vertical.

4.

No punto CERO en el eje Vertical.

vertical. 4. No punto CERO en el eje Vertical. Notas de clase elaboradas por el Prof.

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

36

‘Gráfico engañoso’

de Datos para la Gerencia 36 ‘Gráfico engañoso’ Incorrecta 1960: $1.00 1970: $1.60 1980: $3.10 1990:

Incorrecta

1960: $1.00

1970: $1.60 1980: $3.10 1990: $3.80
1970: $1.60
1980: $3.10
1990: $3.80

Correcta

$

4 2 0 1960 1970 1980 1990
4
2
0
1960
1970
1980
1990

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

37

Base Relativa Diferente

de Datos para la Gerencia 37 Base Relativa Diferente Incorrecta Freq. 300 200 100 0 FR

Incorrecta

Freq. 300 200 100 0 FR SO JR SR
Freq.
300
200
100
0
FR
SO
JR
SR

Correcta

%

30% 20% 10% 0% FR SO JR SR
30%
20%
10%
0%
FR
SO
JR
SR

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

38

Compresión de eje Vertical

de Datos para la Gerencia 38 Compresión de eje Vertical Incorrecta Correcta $ $ 200 50

Incorrecta

Correcta

$ $ 200 50 100 25 0 0 Q1 Q2 Q3 Q4 Q1 Q2 Q3
$
$
200
50
100
25
0
0
Q1
Q2
Q3
Q4
Q1
Q2
Q3
Q4

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

Análisis de Datos para la Gerencia

39

No Cero en Eje Vertical

de Datos para la Gerencia 39 No Cero en Eje Vertical Incorrecta 45 42 39 36

Incorrecta

45

42

39

36

$ J M M J S N
$
J
M
M
J
S
N

Correcta

60

40

20

0

$ J M M J S N
$
J
M
M
J
S
N

Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.