Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Parte 1
Es una colección de métodos / herramientas para planificar y realizar
experimentos o estudios, obtener datos y luego analizar, interpretar, y formular
conclusiones basadas en los datos.
Es la ciencia de los datos; implica la recolección, clasificación, síntesis,
organización, análisis e interpretación de los datos
Muestra
Población
LA ESTADÍSTICA QUE ABARCA NUESTRO CURSO
Descripción y análisis de un
Estadística grupo de datos, sin sacar
Datos
descriptiva conclusiones sobre un
conjunto mayor
Longitud de la varilla
1,120 0,206 0,531 0,437 0,348 20,05
Tolerancia
0,423 0,330 0,280 0,175 0,213
20
1,021 0,314 0,489 0,482 0,200
1,069 1,132 1,080 0,275 0,187 19,95
0,271 0,586 0,628 1,084 0,339
0,431 1,118 0,302 0,287 0,224 19,9
0 10 20 30 40 50 60
1,095 0,319 0,179 1,068 1,009
1,088 0,664 1,056 1,069 0,560 Número de medición
ENTRADAS SALIDA V
(Producto) A
P R
Causas Métodos trab. I
R A
Mano de obra
O B
Máquinas C I
Materia prima E L
I
Medio amb. lab. S D
O A
D
ALEATORIEDAD - Ejemplo: Se toman datos del proceso de fabricación de
varillas para ver si las modificaciones realizadas en el proceso lo han mejorado.
Para ello, se tomaron tres muestras de cincuenta mediciones cada una.
¿Podemos afirmar que cada una de las muestras puede ser catalogada como aleatoria?
a) Los valores indican un patrón definido en el tiempo. No es una muestra aleatoria .
b) Los valores muestran una tendencia en el tiempo. No es una muestra aleatoria.
c) Los valores no muestran un patrón o tendencia. Puede ser apropiado tratarlos como una
muestra aleatoria.
¿Es razonable considerar, en los casos d) y e), a los resultados de c) como una muestra
aleatoria representativa, siendo que los datos fueron tomados solo durante la mañana?
d) El proceso productivo se realiza de 7 a.m. a 5 p.m. NO
e) El proceso productivo se realiza de 7 a.m. a 12 a.m. SI
VARIABLES Y DATOS (1)
Estudio observacional: vemos y/o medimos características específicas,
pero no intentamos modificar a los sujetos que estamos estudiando
Experimento: aplicamos algunos tratamientos y luego procedemos a
observar sus efectos sobre los sujetos. En los experimentos, los sujetos se
denominan unidades experimentales
RAZONAR
DATOS / INFORMACIÓN
Datos = Hechos, realidades
Información = Respuestas a preguntas
La “Información incluye “datos”
Los “datos” no necesariamente incluyen “información”
La clave no está en como obtener los datos, sino en, para qué se los
obtiene (que información se necesita)
El proceso de generar información:
1. Formular claramente la pregunta que se desea contestar.
2. Recopilar datos relativos a la cuestión planteada.
3. Analizar los datos para determinar la respuesta a la pregunta formulada.
4. Presentar los datos de forma adecuada para responder claramente cuál
es la respuesta a la pregunta (implica obtener información).
MUESTREO (1)
DEFINICIONES
Gráficos de barras
Gráfico de frecuencias absolutas F
450
f Gráfico de frecuencias
1800
400 1600 absolutas acumuladas
350 1400
300 1200
250 1000
200 800
150 600
100 400
50 200
0 0
I Ciclo II Ciclo III Ciclo IV Ciclo V Ciclo VI Ciclo I Ciclo II Ciclo III Ciclo IV Ciclo V Ciclo VI Ciclo
DISTRIBUCIÓN DE FRECUENCIAS
para datos cuantitativos discretos
Intervalo
Ejemplo: Los datos expresados Id
de clase
f F fr Fr
continuación, representan la cantidad de 1 16 3 3 0,15 0,15
camiones que ingresan diariamente a un 2 17 2 5 0,10 0,25
obrador. 3 18 3 8 0,15 0,40
4 19 2 10 0,10 0,50
20 18 17 20 20 16 21 21 19 20 5 20 5 15 0,25 0,75
16 19 22 20 21 17 18 16 18 21 6 21 4 19 0,20 0,95
7 22 1 20 0,05 1,00
20 1,00
Gráficos de bastones
Gráfico de frecuencias absolutas Gráfico de frecuencias absolutas
f F acumuladas
5 20
4 16
3 12
2 8
1 4
15 16 17 18 19 20 21 22 23 x 15 16 17 18 19 20 21 22 23 x
DISTRIBUCIÓN DE FRECUENCIAS
para datos cuantitativos continuos (Intervalos de clase)
El intervalo de clase corresponde al rango de valores en que se ha decidido
agrupar parcialmente los datos con el propósito de hacer un resumen de ellos.
La cantidad de datos que quedan comprendidos dentro de ese intervalo se
denomina frecuencia del intervalo (f)
La diferencia entre el extremo mayor (límite superior) y el extremo menor (límite
inferior) del intervalo se denomina amplitud ó ancho del intervalo (h)
b) K≈ n
c) Tamaño de muestra n Número de clases K
30 – 60 6–8
60 – 100 7 – 10
100 – 200 9 – 12
200 – 500 11 – 17
500 - 1500 16 – 25
2) Una vez calculado o escogido el valor K de intervalos de clase, se determina la
amplitud h que deben tener los intervalos de clase
El rango es la diferencia que existe entre el mayor y el menor valor registrado que
toma la variable en estudio
h (amplitud del intervalo)= rango / K = x(máx) − x(min) / K
3) Elegimos el valor 70 como límite inferior del primer intervalo de clase, y el valor
250 como límite superior del último intervalo de clase
4) Realizamos el conteo y construimos la columna de frecuencias absolutas
Intervalo de
Id Tabla (conteo de datos) f
clase (Psi)
1 70 ≤ x < 90 2
2 90 ≤ x < 110 3
3 110 ≤ x < 130 6
4 130 ≤ x < 150 14
5 150 ≤ x < 170 22
6 170 ≤ x < 190 17
7 190 ≤ x < 210 10
8 210 ≤ x < 230 4
9 230 ≤ x < 250 2
80
La marca de clase (Mc) es el punto medio del intervalo de clase. Así
para el primer intervalo será:
70 + 90 160
Mc 1 = = = 80
2 2
Finalmente tenemos la tabla de distribución de frecuencias:
HISTOGRAMA Y POLÍGONO DE FRECUENCIAS
para datos cuantitativos continuos
El histograma de frecuencias absolutas es una representación visual de los datos
en donde se evidencian fundamentalmente tres características:
1. Forma
2. Acumulación de datos
Histograma de frecuencias absolutas 3. Dispersión o variabilidad
f
Polígono de frecuencias absolutas
24
22
20
18
16
14
12
10
8
6
4
2