Está en la página 1de 67

Redefinamos los

buenos negocios
centrum.pucp.edu.pe
ESTADISTICA
Sesiones 1 -2
Descripción de Datos

1
Objetivos
● Reconozcamos la Estadística como la ciencia de datos y ciencia de la variabilidad

● Identifiquemos la estadística descriptiva y la estadística inferencial

● Definamos el análisis exploratorio de los datos

2
Introducción

3
4
5
6
7
8
9
*En USA
10
11
12
13
14
15
16
17
18
19
20
A nivel nacional – Minería

21
La Estadística
Ciencia de la
Variablidad

22
Definición de Estadística

Estadística es la ciencia de recolectar, organizar,


presentar, analizar e interpretar datos con el
propósito de ayudar a una toma de decisiones más
efectiva.

23
Datos
Los datos son una colección de hechos, como números, palabras, medidas, observaciones o
simplemente descripciones de cosas

24
Población Muestra y
Variable

25
Población
Es un conjunto de
elementos, (personas,
objetos, etc..), que
tienen una o más
características
observables que se
pueden medir en ellos.
26
Ejercicios
En cada uno de los ejemplos definir la población requerida.

Opinión de los estudiantes de la facultad de Ingeniería Industrial PUCP sobre


el servicio de atención en la cafetería.

Estudiar el voltaje requerido para provocar fallas en un dispositivo eléctrico.

Edad promedio de los consumidores de café.

27
Población y Muestra

Población Muestra

• TODOS los posibles Individuos, • PARTE “representativa” de la


objetos, mediciones y conteos Población.
• Un PARÁMETRO describe a una • Un ESTADÍSTICO describe a una
Población. Muestra.
28
29
Variable
Es una característica definida en la población y que puede tomar dos o más valores o modalidades.

VARIABLE

Cualitativos o de atributos Cuantitativos o numéricos

Discretos Continuos
(Conteo) (Medición)

30
Variable cuantitativas
Aquí todo se trata de números. Imagínate el dato cuantitativo como referente de una determinada "cantidad".
Se dividen en discretos y continuos.

Variables discretas: sólo pueden adquirir ciertos valores y casi siempre hay “brechas” entre esos valores.

Variables continuas: Son variables cuantitativas que pueden tomar cualquier valor dentro de un intervalo
específico.

31
Variable cualitativa o de atributos
Los datos cualitativos son no numéricos, sirve para clasificar o categorizar.

32
Estadística
descriptiva e
inferencial

33
Estadística Descriptiva
Conjunto de métodos y procedimientos gráficos y numéricos que organizan, resumen
y presentan datos.

Es usada para transformar datos en información.

• Recolectar Datos

Ej. Encuestas

• Presentar Datos

Ej. Tablas y Gráficos

• Resumir Datos

X
Ej. Media muestral =
i
34
n
Estadística Inferencial
Conjunto de métodos utilizados para saber “algo” acerca de una población basándose en una
muestra.

Es usada para transformar información en conocimiento.

• Estimación

Ej. Estimar el peso promedio de la población usando el peso promedio de la muestra.

• Prueba de Hipótesis

Ej. Probar que el peso promedio de la población es 65 kg.

Extraer conclusiones y/o tomar decisiones concernientes a una población


35
basándose en los resultados de una muestra.
Población desconocida

f(x) ?
X  ?(,  2 )
Variable X

Decisiones

Información

36
ESTADÍSTICA ¿por qué y para qué?
Población
Estadística
Características
Media →  Proceso de
generación de
Variancia → ² información
confiable

Tomar
Objetivo decisiones
NO
SI
Información
37 ¿se dispone de la información?
ESTADÍSTICA ¿por qué y para qué?
Población Captura de datos → Muestreo

Características Clasificación de datos


Gráficos
Media →  Muestra Cuadros
Medidas estadísticas
Variancia → ²
Estadística descriptiva

Generalización
Inferencia
Tomar
Objetivo decisiones Inferencia Estadística
NO
Información
38 ¿se dispone de la información?
Ejercicios
¿Qué campo de la estadística será necesario utilizar?.

1. “Un material que se fabrica continuamente, antes de ser cortado y


enrrollado en grandes rollos, debe ser vigilado en cuanto a su espesor
(mediante un calibrador). Se registró diez mediciones de papel, en mm, y
el promedio resultó 30.1 ”.

2. “Un lote de 1000 CDs debe pasar por control de calidad, se elige al azar
30 CDs para decidir si el lote pasa o no el control de calidad y pueda estar
listo para su distribución ”.
39
Ejercicio

Revisar todos los artículos fabricados que salen de una línea de


ensamble con el fin de detectar defectos sería un procedimiento
costoso que demandaría mucho tiempo. Un método económico y
eficaz para determinar la cantidad de artículos defectuosos implica
la selección y examen de una fracción de los artículos por parte de
un ingeniero de control de calidad. Se calcula el porcentaje de los
artículos examinados que salieron defectuosos y esta cifra se usa
para estimar el porcentaje de todos los artículos fabricados en la
línea que tienen defectos.

Identifique la población, la muestra y el campo de la


40
estadística que corresponden al problema.
Ejercicio
En una revista especializada, se informó de las dimensiones de
desempeño de redes de distribución de agua en el área de
Filadelfia. En una parte del estudio recabaron los siguientes
datos para una muestra de secciones de tuberías de agua.
Identifique los datos como cuantitativos o cualitativos.
1. Diámetro de la tubería (pulgadas)
2. Material de la tubería.
3. Edad (año de instalación)
4. Ubicación.
5. Longitud de la tubería (pies)
6. Estabilidad del suelo circundante (inestable, moderadamente
estable o estable)
41
7. Corrosividad del suelo circundante (corrosivo o no corrosivo)
Análisis exploratorio de los
datos
Distribución y Representación gráfica de las distribuciones
de frecuencias

42
Ordenamiento de Datos

Datos
Numéricos

Arreglo Distribución de Frecuencias


de Datos Distribución Acumulada

Histograma Ojiva

Tablas Polígono

43
Arreglo de Datos

Organiza los datos para enfocar las características importantes.

Los datos son ordenados de mayor a menor o viceversa.

Datos sin procesar, según son recolectados.


24, 26, 24, 21, 27, 27, 30, 41, 32, 38

Datos en un arreglo ordenado.


21, 24, 24, 26, 27, 27, 30, 32, 38, 41

44
Ordenamiento de Datos

Datos
Numéricos

Arreglo Distribución de Frecuencias


de Datos Distribución Acumulada

Histograma Ojiva

Tablas Polígono

45
Tabla de Distribución de Frecuencias

Distribución Frec. Relativa


de Clase Frecuencia Frec. Relativa Acumulada
Frecuencias
Relativas 48.8-49.2 2 0.07 0.07
Acumuladas 49.3-49.7 5 0.16 0.23
49.8-50.2 11 0.37 0.60
50.3-50.7 6 0.20 0.80
50.8-51.2 3 0.10 0.90
51.3-51.7 3 0.10 1.00

30 1.00

46
Distribución de Frecuencias

Ordenamiento de los datos en clases.

Frecuencia
Indica el número de observaciones (datos) que caen en cada clase.

Clase
Grupo de valores que describe una característica de los datos.

Tipos de Clases
Cualitativas
Cuantitativas
Discretas
47
Continuas
Pasos para construir una
Distribución de Frecuencias
1. Calcule el alcance o rango
(Dato mayor - Dato menor).
2. Determine el número de clases.
Usualmente entre 6 y 15.
3. Calcule el intervalo de clase.
Divida el alcance entre el número de clases
4. Determine los límites de cada clase.
Límite Superior y Límite Inferior
6. Asigne las observaciones a cada clase y efectúe el conteo.

48
Intervalos de Clase

Límite Límite Ancho del


Inferior Superior Intervalo
0 9 10
10 19 10
20 29 10
30 39 10
40 49 10
50 59 10
49
Tabla de Distribución de Frecuencias

Datos sin 49.3 51.6 49.8 50.6 51.2 50.1 49.9 49.5 51.7 50.0
Procesar: 50.3 50.4 48.8 49.8 49.7 50.5 50.2 50.0 50.6 49.9
50.0 51.5 49.4 50.9 50.0 48.9 50.3 50.2 49.5 51.0
Variable: Salario Anual en miles de dólares

Alcance: 51.7 – 48.8 = 2.9

Núm. Clases: 6

Intervalo de Clase: 51.8 – 48.8


50
Tabla de Distribución de Frecuencias

Datos sin 49.3 51.6 49.8 50.6 51.2 50.1 49.9 49.5 51.7 50.0
Procesar: 50.3 50.4 48.8 49.8 49.7 50.5 50.2 50.0 50.6 49.9
50.0 51.5 49.4 50.9 50.0 48.9 50.3 50.2 49.5 51.0

Distribución Clase Conteo


de
Frecuencias 48.8-49.2 //
49.3-49.7 ////
49.8-50.2 //// //// /
50.3-50.7 //// /
50.8-51.2 ///
51.3-51.7 ///

51
Tabla de Distribución de Frecuencias
Datos sin 49.3 51.6 49.8 50.6 51.2 50.1 49.9 49.5 51.7 50.0
Procesar: 50.3 50.4 48.8 49.8 49.7 50.5 50.2 50.0 50.6 49.9
50.0 51.5 49.4 50.9 50.0 48.9 50.3 50.2 49.5 51.0

Distribución Clase Conteo Frecuencia


de
Frecuencias 48.8-49.2 // 2
49.3-49.7 //// 5
49.8-50.2 //// //// / 11
50.3-50.7 //// / 6
50.8-51.2 /// 3
51.3-51.7 /// 3

52
Tabla de Distribución de Frecuencias

Marca de Clase
(48.8 + 49.2)/2 = 49.0

Distribución Clase Frecuencia


de
Frecuencias 48.8-49.2 2
49.3-49.7 5
49.8-50.2 11
50.3-50.7 6
50.8-51.2 3
51.3-51.7 3

Límite Superior
Límite Inferior
53
Distribución de Frecuencias Relativas

Distribución
de Clase Frecuencia Frec. Relativa
Frecuencias
Relativas 48.8-49.2 2 0.07
49.3-49.7 5 0.16
49.8-50.2 11 0.37
50.3-50.7 6 0.20
50.8-51.2 3 0.10
51.3-51.7 3 0.10

30 1.00

54
Distribución de Frecuencias Relativas
Acumuladas

Distribución Frec. Relativa


de Clase Frecuencia Frec. Relativa Acumulada
Frecuencias
Relativas 48.8-49.2 2 0.07 0.07
Acumuladas 49.3-49.7 5 0.16 0.23
49.8-50.2 11 0.37 0.60
50.3-50.7 6 0.20 0.80
50.8-51.2 3 0.10 0.90
51.3-51.7 3 0.10 1.00

30 1.00

55
Ordenamiento de Datos

Datos
Numéricos

Arreglo Distribución de Frecuencias


de Datos Distribución Acumulada

Histograma Ojiva

Tablas Polígono

56
Histograma

Clase Frecuencia

48.8-49.2 2
12
49.3-49.7 5
10 49.8-50.2 11
50.3-50.7 6
8 50.8-51.2 3
Frecuencia

51.3-51.7 3
6

0
48.8 49.3 49.8 50.3 50.8 51.3
49.2 49.7 50.2 50.7 51.2 51.7
57
Histograma
➢ El histograma se utiliza para investigar los patrones de los datos, donde se refleja la variación presente en un
conjunto de datos tomados de un proceso.

➢ Su correcta utilización permite tomar decisiones no solo con base en la media, sino también con base en la
dispersión y formas especiales de comportamiento de los datos.

58
Ordenamiento de Datos

Datos Numéricos

Arreglo Distribución de Frecuencias


de Datos Distribución Acumulada

Histograma Ojiva

Tablas Polígono
59
Polígono de Frecuencias

Clase Frecuencia

48.8-49.2 2
12 49.3-49.7 5
49.8-50.2 11
10
50.3-50.7 6
8 50.8-51.2 3
Frecuencia

51.3-51.7 3
6

0
48.8 49.3 49.8 50.3 50.8 51.3
49.2 49.7 50.2 50.7 51.2 51.7
60
Polígono de Frecuencias

Clase Marca Frecuencia

48.8-49.2 49.0 2
12 49.3-49.7 49.5 5
49.8-50.2 50.0 11
10
50.3-50.7 50.5 6
8 50.8-51.2 51.0 3
Frecuencia

51.3-51.7 51.5 3
6

0
48.5 49.0 49.5 50.0 50.5 51.0 51.5 52.0
61
Polígono de Frecuencias

Marca Frecuencia

48.5 0
12 49.0 2
49.5 5
10 50.0 11
8 50.5 6
Frecuencia

51.0 3
6 51.5 3
4
52.0 0

0
48.5 49.0 49.5 50.0 50.5 51.0 51.5 52.0

62
Ordenamiento de Datos

Datos Numéricos

Arreglo Distribución de Frecuencias


de Datos Distribución Acumulada

Histograma Ojiva

Tablas Polígono
63
Ojiva

30
27

24 Clase Frec. Menor Frec.


Abs. que Acum.
Frecuencia Acumulada

48.8-49.2 2 48.8 0
18 49.3-49.7 5 49.3 2
49.8-50.2 11 49.8 7
50.3-50.7 6 50.3 18
50.8-51.2 3 50.8 24
51.3-51.7 3 51.3 27
Relativa

51.8 30
7

2
0
48.8 49.3 49.8 50.3 50.8 51.3 51.8
64
Diagrama de Tallo y Hoja

3.1 4.9 2.8 3.6 2.5 4.5 3.5 3.7 4.1 4.9

2.9 2.1 3.5 4.0 3.7 2.7 4.0 4.4 3.7 4.2

3.8 6.2 2.5 2.9 2.8 5.1 1.8 5.6 2.2 3.4

2.5 3.6 5.1 4.8 1.6 3.6 6.1 4.7 3.9 3.9

4.3 5.7 3.7 4.6 4.0 5.6 4.9 4.2 3.1 3.9

65
66
67

También podría gustarte