Re Sesiones 1 y 2

También podría gustarte

Está en la página 1de 69

“RAZONAMIENTO

ESTOCÁSTICO”
MCI Operaciones Productivas
Prof. Juan Narro Lavi
Sesiones 1 y 2:
Descripción de Datos
“Antes del inicio de la guerra se prevé
que se podrá conquistar la victoria, eso
se debe a los repetidos y minuciosos
cálculos, a las apreciaciones y
planificaciones que se hacen en el
templo…”

Sun Tzu
“Nosotros confiamos en Dios. Todos los demás deben
usar datos”

W.E.Deming
Estadística – Definición

• Diferentes significados según la persona que la analice.


• Ideas comunes :
Observación y Estudio de determinadas características de los
DATOS recolectados.
• Definición formal :
Teoremas, métodos, técnicas y herramientas que nos permiten:
1) Recolectar, seleccionar y clasificar datos.
2) Analizar e Interpretar los datos.
3) Deducir y Evaluar conclusiones en base a datos muestrales.
• ¿Porqué este Análisis ?
TOMA DE DECISIONES
Estadística – Definición

DEFINIR

RECOLECTAR

Es una ciencia que


abarca técnicas que nos ORGANIZAR
TOMA
permiten: DE
DECISIONES
PRESENTAR

ANALIZAR

INTERPRETAR
Toma de Decisiones

1. Datos: Observaciones específicas a través de


mediciones o conteos.
2. Información: Datos procesados y resumidos
para producir hechos y generar ideas.
3. Conocimiento: Información seleccionada y
organizada que proporciona entendimiento,
recomendaciones y el sustento para las
decisiones.
Estadística

Distribuc. Frecuencias
Resumir Numéricas Med. Tend. Central
Dispersión
Descriptiva Histogramas
Polígonos
Presentar Gráficas Curvas
Barras
Pastel
Estadística

Inferencial
Estadística Descriptiva
Tabla de Distribución
Edad N°Trabajadores Diagrama Circular

30 - 34 6
35 - 39 12
40 - 44 8
45 - 49 2
Diagrama de Barras
20 Media Aritmética

10 N n
 Xi  xi
0  i 1
;x  i 1

30-35-40-45- N n
34394449 10
Estadística

Distribuc. Frecuencias
Resumir Numéricas Med. Tend. Central
Dispersión
Descriptiva Histogramas
Polígonos
Presentar Gráficas Curvas
Barras
Pastel
Estadística

Probabilidad
Plantear Dist. Normal
Dist. Normal Std.
Inferencial Supuestos
T Student
Probar Poisson
Chi Cuadrado
Estadística Inferencial

• Estimación
– Ej. Estimar el peso
promedio de la población
usando el peso promedio
de la muestra.
• Prueba de Hipótesis
– Ej. Probar que el peso
promedio de la población
es 65 kg.

Extraer conclusiones y/o tomar decisiones


concernientes a una población basándose en
los resultados de una muestra.
Población vs. Muestra

Población Muestra

Los valores calculados Los valores computados de


usando los datos de la los datos de una muestra
población son llamados se les llama estadísticos o
parametros estimadores.
Población Estadística

Registro de una característica EN TODOS los


elementos del marco poblacional.

Tiene tantos datos como elementos el marco


poblacional.

Habrán tantas poblaciones como características que se


deseen registrar en un marco poblacional.
MARCO POBLACIONAL
(1200 Trabajadores de una Empresa)

Característica
Exper.
Edad Peso laboral Estado Civil
(años)

Registro
de la Población Población Población Población
Caract. P1 P2 P3 Pn
(1200 datos) (1200 datos)
... (1200 datos)
(1200 datos)
Marco Muestral

Subconjunto del marco poblacional.


Comprende los elementos o estratos del marco
poblacional (es representativo).

En contraste con el marco poblacional es más


conveniente porque se obtienen los datos en menor
tiempo y reduciendo los costos.

Ejemplo :

75 trabajadores de una empresa.


Técnicas
Marco Poblacional Marco Muestral
1200 trabajadores de la empresa de muestreo 75 trabajadores de la empresa

Característica

Edad Peso Exper.Lab. Estado civil

Registro
de la POBLACIÓNPOBLACIÓN POBLACIÓN POBLACIÓN
Caract.

...
P1 P2 P3 Pn
Muestra

Registro de una característica en todos los


elementos del marco muestral.

Tiene tantos datos como elementos el marco muestral.

Habrán tantas muestras como características se deseen

registrar en un marco muestral.


Técnicas
Marco Poblacional Marco Muestral
1200 trabajadores de la empresa de muestreo 75 trabajadores de la empresa

Edad Peso Exper.Lab. Estado civil


Característica

Edad Peso Exper.Lab. Estado civil MUESTRA MUESTRA MUESTRA MUESTRA

m1 m2 m3 mn

75 datos

Registro
de la POBLACIÓNPOBLACIÓN POBLACIÓN POBLACIÓN
Caract.

...
P1 P2 P3 Pn
Parámetro y Estimador

Parámetro:
Valor representativo de una población (N).
Se simboliza por letras griegas.
Sólo hay un parámetro en cada población.

m Media poblacional
2 Varianza poblacional
 Desviación estándar poblacional
p Proporción poblacional
Parámetro y Estimador
Estimador
Valor representativo de una muestra (n).
Se simboliza por letras latinas.
Existen tantos estimadores como muestras se
extraigan de una población.
x Media muestral.
s 2 Varianza muestra.
s Desviación estándar muestral.
p Proporción muestral.
Parámetro y Estimador
n1
x1

n2
x2
POBLACIÓN n3
x3
. .
. .
nm
xm
PARÁMETRO

DIFERENTES MUESTRAS OCASIONAN DIFERENTES


VALORES DEL ESTIMADOR
Parámetro y Estimador
Técnicas de MUESTRA
Muestreo (n)
Estimador : x

POBLACIÓN
Estadística Inferencial
(N)

Parámetro : µ -x = Error de muestreo


Estadística – Tipos de Datos

Dato

Atributo Numérico

Ejemplos:
 Estado Civil
 Especialidad Discreto Continuo
 Color de Ojos
(Define categorias o Ejemplos: Ejemplos:
grupos)  Número de Niños  Peso
 Defectos por hora  Voltaje
(Items Contados) (Características Medidas)
1-7

Tipos de Variables

• Variable cualitativa o de atributos: la


característica o variable que se estudia
no es numérica.
• EJEMPLOS: Genero, afiliación religiosa,
tipo de automóvil que se posee, lugar
de nacimiento, color de los ojos.
1-8

Tipos de Variables

• Variable cuantitativa: la variable se


puede registrar numéricamente.
• EJEMPLO: saldo en una cuenta de
cheques, minutos que faltan para que
termine la clase, número de niños en
una familia.
1-9

Tipos de Variables

• Variables discretas: sólo pueden adquirir


ciertos valores y casi siempre hay
“brechas” entre esos valores.
• EJEMPLO: el número de habitaciones en
una casa (1,2,3,..., etc.).
1-10

Tipos de Variables

• Variables continuas: pueden tomar


cualquier valor dentro de un intervalo
específico.
• EJEMPLO: el tiempo que toma volar de
Lima a Tacna.
1-10

Niveles de Medición

Niveles

Nominal Ordinal Intervalo Razón

Diferencia Punto cero


Datos solo se Datos se significativo y
significativa razón entre
clasifican ordenan
entre valores valores

Número de Número de pacientes


Camiseta en Número en la lista Temperatura atendidos
un equipo de la clase. Talla Número de llamadas de
Marca de auto Posición dentro de ventas realizadas
los 10 primeros Distancia a casa
¿Para que usamos el nivel de medición de los Datos?

• El nivel de medición de los datos nos


permite establecer que cálculos podemos
realizar para resumír y presentar los datos.
• Determinar las pruebas estadísticas que
deberían ser llevadas a cabo con los datos.
¿Qué podemos hacer con los datos?

Organizarlos en tablas, gráficos y figuras

Identificar características
de interés para la gestión.
Calcular promedios ( media, mediana, moda y
percentiles ) .

Calcular su dispersión (varianza,


desviación estándar ).
Recolección de
datos

Determinar una ecuación que represente la


relación entre ellos (regresión)

Mejorar la Determinar el grado de asociación entre


Calidad Decisional ellos (correlación).

Analizarlos dentro de un horizonte


temporal (series cronológicas)
Fases del análisis estadístico

Definición
Definición Problema
Problema
Variable
Variable // Atributo
Atributo
Definición
Definición
Población
Población oo Muestra
Muestra
Recolección
Recolección Datos
Datos
Plan
Plan Censal
Censal // Muestral
Muestral
Organización
Organización yy
Presentación
Presentación de
de Datos
Datos
Medidas
Medidas Estadísticas
Estadísticas
Parámetros/Estimador
Parámetros/Estimador
Inferencia
Inferencia Estadística
Estadística
Estimación/P.
Estimación/P. Hipótesis
Hipótesis
Conclusiones
Conclusiones //
Recomendaciones
Recomendaciones
Métodos y técnicas de recolección de datos

Fuente Método Técnica

Secundaria Fichas

Directo Observación

Experimentación
Primaria
Indirecto Encuesta

Entrevista
Estadística descriptiva - Análisis de datos

• Distribución de Frecuencias
– Agrupamiento de datos en categorías que
muestran el número de observaciones en cada
categoría.
• Medidas de Tendencia Central (Posición)
– Aquellas que indican el valor de un punto
medio o típico de un grupo de datos.
• Medidas de Dispersión
– Aquellas que indican como se encuentran
esparcidas las observaciones de un grupo de
datos.
Tablas y los gráficos

• Técnicas:

Variables Variables
Cualitativas Cuantitativas

• Distribución de Frecuencias • Distribución de Frecuencias


• Tabla Cruzada • Lineal
• Barras • Histograma y Ojiva
• Circular • Tallo y Hoja
• Pareto • Dispersión
Tablas y los gráficos

Variable
Cualitativa

Tabulación de Datos Gráfica de Datos

Distribución de
Frecuencias Barras Circular Pareto
Distribución de Frecuencias

Resumen de datos por categoria


Ejemplo: Pacientes de Hospital por Unidad
Unidad Número de Pacientes Porcentaje
Cuidado Cardiaco 1,052.00 11.93%
Emergencia 2,245.00 25.46%
UCI 340.00 3.86%
Maternidad 552.00 6.26%
Cirugía 4,630.00 52.50%
Total 8,819.00 100.00%
(Variables son
categoricas - atributos)
Distribución de Frecuencias
• Gráfico de Barras de pacientes por Unidad
Número de Pacientes
10,000.00

9,000.00 8,819.00

8,000.00

7,000.00

6,000.00

5,000.00 4,630.00

4,000.00

3,000.00
2,245.00
2,000.00
1,052.00
1,000.00 552.00
340.00
-
Cuidado Emergencia UCI Maternidad Cirugía Total
Cardiaco
Tabla Cruzada

• Tabla Cruzada (o de Contingencia), es el


listado del númewro de observaciones para
cada combinación de valores de dos
variables (cuantitativa o cualitativa).
• Si hay r categorias para la primera
variables (filas) y c categorias para la
segunda variable (columnas), la tabla es
llamada “Tabla cruzada de r x c.
Tabla Cruzada

• Tabla Cruzada 3 x 3 para las Alternativas de


Inversión de un Inversionista (en $1000’s)

Inversionista Inversionista Inversionista


Inversión Total
A B C

Acciones 46 55 27 128

Bonos 32 44 19 95

Efectivo 15 20 33 68

Total 93 119 79 291


Tabla Cruzada - Gráficos

• Barras Horizontales lado a lado


Tabla Cruzada - Gráficos

• Barra Acumulada
Tabla Cruzada - Gráficos
• Ventas Trimestrales por Región:
  1er Trim 2do Trim 3er Trim 4to Trim
Norte 20.4 27.4 59 20.4
Centro 30.6 38.6 34.6 31.6
Sur 45.9 46.9 45 43.9
Gráficos de Barras y Circular

• Los gráficos de Barras y Circulares son


frecuentemente usados para presentar
datos cualitativos.
• La altura de la Barra o el tamaño del
Sector Circular muestran la frecuencia o
porcentaje de cada categoría.
Gráficos de Barras y Circular

Unidad Número de Pacientes


Cuidado Cardiaco 1,052.00
Emergencia 2,245.00
UCI 340.00
Maternidad 552.00
Cirugía 4,630.00
Total 8,819.00
Gráficos de Barras y Circular
Número de
Unidad Porcentaje
Pacientes
Cuidado Cardiaco 1,052.00 11.93%
Emergencia 2,245.00 25.46%
UCI 340.00 3.86%
Maternidad 552.00 6.26%
Cirugía 4,630.00 52.50%
Total 8,819.00 100.00%

(Porcentajes
son
redondeados )
Diagrama de Pareto
Pasos Empleo
1. Decidir que elementos se 1. Enfocar el aspecto
estudiarán y colectar datos. principal de un problema.
2. Tabular datos y calcular los 2. Decidir el objetivo y
#s acumulados.
elementos de mejoras.
3. Dibujar los ejes X e Y.
3. Predecir la efectividad de
4. Muestre los datos como
la mejora.
barras.
5. Dibuje una curva 4. Confeccionar diagramas
acumulativa. ordenados por causas.
6. Crear una escala % en eje 5. Comprender la efectividad
vertical adicional. de la mejora.
7. Rotular el diagrama. 6. Emplear pérdidas unitarias
8. Analizar el diagrama. en lugar de casos o unid.
físicas.
Diagrama de Pareto

• En la planta de una empresa metal-mecánica se levantó la siguiente


información referida a las lesiones sufridas por el personal entre el 1ro.
de Enero y 31 de Mayo. Analizar y Concluir

Lesiones Enero Febrero Marzo Abril Mayo


Esguince de espalda 6 10 10 7 5
Quemadura con acido 1 1
Cortadura de mano 1 4 1 3 2
Esguince de tobillo 1 2 1
Cuerpo extraño en el ojo 2 1 1
Cortadura de pierna 1 1 2 1 1
Diagrama de Pareto
Lesiones
Enero – Mayo
1.00
60
0.90

0.80
50
0.70

40 0.60

0.50
30
Cant. de Lesiones

0.40

20 0.30

0.20
10
0.10

0 0.00
ald
a
an
o na illo oj
o
id
o
p ier b el ac
s em ep to
en n
ee ad
e co
d r r ad ced ño a
in
ce du du in tra dur
gu r ta ta gu ex a
Es Co Co
r Es po u em
uer Q
C
Tablas y los gráficos

Datos
Numéricos

Distribucion de Frecuencias y Gráfico Tallo y Hoja


Distribuciones Acumulativas

Histograma Ojiva
Distribución de frecuencias

¿Qué es una Distribución de Frecuencias?


• Una distribución de frecuencias es una lista
o una tabla …
• Conteniendo agrupaciones de clases
(categorias o rangos dentro de los cuales se
encuetran los datos) ...
• Y la correspondiente frecuencia con la cual
los datos se encuentran en cada clase o
categoria.
Distribución de frecuencias - Definiciones
• Intervalo de clase
– Número reducido de datos.
• Frontera/Límite de clase
– Punto medio entre dos extremos de clase
consecutivas.
• Amplitud de clase
– Diferencia entre la frontera superior e inferior
de una clase.
• Marca de clase
– Punto medio entre los extremos/fronteras de
una clase.
• Frecuencia de clase
– Número de variables incluidas en un intervalo
de clase.
Distribución de Frecuencias

• Pasos
1. Determinar el tipo y número de clases
(intervalos).
Regla general : 5 - 20
Sturges : # clases = 1 + 3.3 log N
2. Determinar la amplitud de la clase (i)
i = (Val. Máx. - Val. Min.) / # clases
3. Establecer el extremo inferior.
4. Determinar las fronteras (limites)
5. Calcular la marca de clase (m)
6. Contar el número de observaciones en cada
clase (f).
Ejercicio
PETROLOBITOS
Producción diaria
(en Miles d Barriles)

38 31 41 52 59
33 34 92 74 68
77 68 84 41 40
54 49 60 62 59
78 63 46 74 69
60 37 43 51 61
92 95 81 38 60
70 42 88 94 85
73 66 75 64 56
76 95 69 50 55
69 83 78 74 77
83 49 34 78 48
38 76 99 38 94
68 51 87 53 69
39 60 35 79 80
71 58 83 94 66
67 50 86 70 80
51 57 54 46 46
34 48 64 71 65
61 65 64 98 55
Distribución de Frecuencias

• Pasos
1. Determinar el tipo y número de clases (intervalos).
Sturges : # clases = 1 + 3.3 log N
# de clases= 1 + 3.3 log (100) = 1 + 3.3 * 2 = 7.6
# de clases= 7
2. Determinar la amplitud de la clase (i)
i = (Val. Máx. - Val. Min.) / # clases
i = (99-31) / 7 = 9.7
i = 10
3. Establecer el extremo inferior.
Puede ser 31 o menos.
Por facilidad 30
Distribución de Frecuencias

• Pasos
4. Determinar las fronteras (limites)
Fronteras se expresan con un decimal adicional
Frontera inferior de primera clase pto. Medio entre
29 y 30, es decir 29.5
Frontera superior = 29.5 + 10 = 39.5
Extremo superior de la primera clase sería 39.
5. Calcular la marca de clase (m)
Pto.medio entre extremos o fronteras
(30 + 39) / 2 = 34.5 ó (29.5 + 39.5) / 2 = 34.5
6. Contar el número de observaciones en cada clase (f).
Distribución de Frecuencias

Frontera Frontera Marca Frecuencia


Intervalo Amplitud
Clase (i) Inferior Superior Clase Absoluta
(li) (ls) (m) (f)
30 -39 10 29.5 39.5 34.5 12
40 – 49 10 39.5 49.5 44.5 12
50 – 59 10 49.5 59.5 54.5 16
60 – 69 10 59.5 69.5 64.5 23
70 – 79 10 69.5 79.5 74.5 17
80 – 89 10 79.5 89.5 84.5 11
90 – 99 10 89.5 99.5 94.5 9
Distribución de Frecuencias
Tabla de Frecuencias de la distribución de
PETROLOBITOS
Frecuencia
Intervalo Marca Frecuencia Frecuencia Frecuencia
Clase Clase Absoluta Acumulada Relativa Relativa
Acumulada
30 -39 34.5 12 12 0.12 0.12
40 – 49 44.5 12 24 0.12 0.24
50 – 59 54.5 16 40 0.16 0.40
60 – 69 64.5 23 63 0.23 0.63
70 – 79 74.5 17 80 0.17 0.80
80 – 89 84.5 11 91 0.11 0.91
90 – 99 94.5 10 100 0.09 1.00

Nota. Tomado de Dpto. Operaciones


Histograma

• Un gráfico de los datos arreglados en una


distribución de frecuencias es llamado
histograma.
• Los criterios de valoración de intervalo se
muestran en el eje horizontal
• En el eje vertical se presentan: frecuencia,
frecuencia relativa, o porcentaje
• Barra de altrura apropiada son empleadas
para representar el número de
observaciones que hay dentro de cada
clase.
Histograma
Ejemplo
Gráfico 4: Peso de 100 Personas (en Kg.)
Número de
Personas 25

20

15

10

0
29.5 39.5 49.5 59.5 69.5 79.5 89.5 99.5
Peso
(Kgs)
Fuente: Encuesta, enero 1998
Histograma
Ejemplo
Gráfico 5: Marca de bebida gaseosa preferida por
universitarios (en %)
% 20

15

10

0
Coca Pepsi Inka Fanta Otros
Cola Cola Cola
Fuente: Encuesta a Universitarios, enero 1998
Empleo de histogramas

• ¿Está el centro de la distribución exactamente en


el medio de las especificaciones?
• ¿Es la dispersión demasiado grande o pequeña?
• ¿Aparece algún dato más allá de las
especificaciones?
• ¿Hay un espacio amplio para la distribución dentro
de las especificaciones?
Análisis Gráfico
• Histograma
– Gráfica de barras de una distribución de frecuencias.
• Polígono de frecuencias
– Gráfica lineal de una distribución de frecuencias (marca).
• Curvas
– Polígono de frecuencias suavizado (asimetría, curtosis)
• Ojiva
– Gráfica de una distribución de frecuencias acumulada.
• Barras
– Gráfica de frecuencias para diferentes categorias de datos.
• Pastel
– Para ilustrar divisiones de una cantidad total (%).
Análisis Gráfico
Tabla de Frecuencias de la distribución de
PETROLOBITOS
Frecuencia
Intervalo Marca Frecuencia Frecuencia Frecuencia
Clase Clase Absoluta Acumulada Relativa Relativa
Acumulada
30 -39 34.5 12 12 0.12 0.12
40 – 49 44.5 12 24 0.12 0.24
50 – 59 54.5 16 40 0.16 0.40
60 – 69 64.5 23 63 0.23 0.63
70 – 79 74.5 17 80 0.17 080
80 – 89 84.5 11 91 0.11 0.91
90 – 99 94.5 9 100 0.09 1.00

Nota. Tomado de Dpto. Operaciones


PETROLOBITOS
Frecuencia Histograma

25

20

15

10

0
30-39 40-49 50-59 60-69 70-79 80-89 90-99
Clases

Frecuencia

Nota. Tomado de Dpto. Operaciones


PETROLOBITOS
Frecuencia
Poligono de frecuencias

25

20

15

Frecuencia
Frecuencia

10

0
34.5 44.5 54.5 64.5 74.5 84.5 94.5
Clases

Nota. Tomado de Dpto. de Operaciones


PETROLOBITOS
Frecuencia Frecuencia Acumulada

120

100

80

60

40

20

0
30-39 40-49 50-59 60-69 70-79 80-89 90-99
Clases

Frec. Acum.

Nota. Tomado de Dpto. de Operaciones


PETROLOBITOS
Frecuencia Relativa

90-99 30-39
9% 12%
80-89
11% 40-49
12%

70-79
17% 50-59
16%
60-69
23%

Nota. Tomado de Dpto. de Operaciones

También podría gustarte