Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Artículos no Artículos
defectuosos defectuosos
• Aquellos que • Los que no
satisfacen los satisfacen esos
requisitos de requisitos.
calidad.
Requisitos de calidad
Diámetros máximos y mínimos de ejes.
Vidas mínimas de los focos.
Valores límites de las resistencias de los
resistores en la producción de radios y TV.
Pesos máximos para los correo aéreo.
Contenidos mínimos de botellas que se llenan
automáticamente.
Tiempo máximo de reacción de los
interruptores.
Valores mínimos de la resistencia de un hilo.
La razón para que existan
diferencias en la calidad de
los productos es la variación
debido a numerosos factores,
cuya influencia no puede ser
predicha de tal modo que la
variación debe considerarse
aleatoria.
Conceptos básicos
• Estadística:
Ciencia que se encarga de
recolectar, organizar, resumir y
analizar datos para después obtener
conclusiones. Se divide en:
• Estadística Descriptiva
• Estadística Inferencial.
• Población estadística:
Conjunto de TODOS los DATOS que se
obtienen al realizar la medición de una
variable en los elementos de una población.
• Muestra:
Subconjunto de una población, que intenta
reflejar las características de la población lo
mejor posible.
• El número de individuos que integran la
muestra, llamado tamaño de la muestra se
representa con la letra n.
Estadística
Población Muestra
Probablidad
Estadística descriptiva
Se encarga de la recolección, organización,
presentación y análisis de los datos de una
población.
Objetivo de la Estadística Descriptiva
Conocer la información que se
tiene para poder identificar e
interpretar aspectos relevantes de
una muestra.
Utilizar esta información para
obtener resultados, planear o
hacer inferencia acerca de la
población bajo estudio.
Estadística Descriptiva
Suministra los instrumentos que permiten el
salto de las observaciones a la inferencia,
siendo el resumen de las observaciones el
paso previo.
Se dedica a expresar regularidades propias de
las observaciones o conjunto de datos, a través
de operaciones numéricas para permitir la
cuantificación.
Agrupa todas aquellas técnicas y
procedimientos que permiten caracterizar una
muestra y población, algunas de estas técnicas
son las medidas de tendencia central,
dispersión, posición, regresión y correlación.
Estadística inferencial
Se encarga de analizar la información
presentada por la estadística descriptiva
mediante técnicas que nos ayuden a
conocer, con determinado grado de
confianza, a la población. Lo que nos
permite tomar decisiones.
Población
ión
In
fe
ipc
re
n
scr
ci
a
De
Muestr
a
Transformación Análisis
Resumir Estimación
Ilustración Hipótesis
• Población:
Conjunto definido de TODOS los
INDIVIDUOS, de donde se observa cierta
característica.
• Variable:
Característica o propiedad de los individuos que se
desea estudiar y se puede medir o calificar; cambia
o varía con el tiempo en un individuo dado, o
cambia o varía de elemento a elemento.
Ej. Edad, peso, sexo, estado civil, número de hijos,
etc.
Variables cualitativas
Variables que denotan una cualidad o atributo y
solo pueden ser clasificadas en categorías o clases
mutuamente excluyentes y exhaustivas, p.e., medir
peso, estatura, temperatura, establecer el número de
hijos.
Variables cuantitativas
Variables que se obtuvieron de un proceso de
conteo o enumeración (discretas) o medición
(contínuas), p.e., sexo, estado civil, grado máximo
de estudios.
Fuentes de información
Encuesta:
Recopilar los datos mediante el uso de
cuestionarios o entrevistas.
Experimento:
Procedimiento utilizado en la investigación
científica para obtener información que
permita conocer el comportamiento de algún
proceso.
Fuentes de Información
Investigación Documental:
Procedimiento para obtener datos
mediante la consulta de información
ya escrita y concentrada en
documentos que se localicen en
libros o revistas en bibliotecas,
hemerotecas, o en centros virtuales.
Orden de datos (Sorting)
El ordenamiento es el proceso mediante el
cual los datos están acomodados de tal
manera que se establece un orden (ascendente
o descendente) entre ellos.
40 43 48 51 49
56 44 42 55 52
52 62 44 50 59
63 50 56 55 45
57 66 63 51 58
Listado en orden ascendente
El proceso consiste en ordenarlos de menor a
mayor
Peso de 25 estudiantes (en kg) Peso de 25 estudiantes (en kg)
42 40 48 51 49
40 42 43 44 44
56 44 43 55 52
45 48 49 50 50
52 62 44 50 59
51 51 52 52 55
63 50 56 55 45
55 56 56 57 58
57 66 63 51 58
59 62 63 63 66
Método de tallo y hojas
Si los números de los datos están
formados por dos dígitos, se hace
una columna con el primer dígito
(decenas) y a la derecha de cada uno
de ellos se escribe, en fila, sólo el
segundo dígito (unidades) de cada
uno de los datos que tengan el
mismo primer dígito.
Datos sin ordenar: Peso de 25 estudiantes (en kg)
4 2,0,8,9,4,3,4,5 42 40 48 51 49
5 56 44 43 55 52
1,6,5,2,2,0,9,0,6,5,7,1,8
52 62 44 50 59
6 2,3,6,3
63 50 56 55 45
57 66 63 51 58
Datos ordenados:
4 0,2,3,4,4,5,8,9
5 0,0,1,1,2,2,5,5,6,6,7,8,9
6 2,3,3,6
Doble tallo
Una variante de este método es en lugar de dividir
en un grupo las decenas, se divide en dos grupos.
El primero abarcando los dígitos del 0 al 4 y el
segundo del 5 al 9.
El ejemplo anterior
queda: 4 0,2,3,4,4
4 5,8,9
5 0,0,1,1,2,2,
5 5,5,6,6,7,8,9
6 2,3,3
6 6
hi = fi/n
Caso de variables
cualitatitivas
• El procedimiento es:
Se identifican todos los valores
diferentes y se acomodan en
columna.
Se agrega una segunda columna en
donde se van registrando, mediante
una línea vertical, la veces que
aparece el valor dado.
Ejemplo
Considera que la variable de estudio es el color de
playera de 25 estudiantes.
Los colores se encuentran en la siguiente tabla:
frecuencias:
Para datos NO agrupados.
Para datos agrupados.
Tabla de frecuencias para datos NO agrupados
Siempre es 1
Intervalo de clase
En ocasiones es conveniente acomodar los datos en
pequeños grupos de igual tamaño, llamados
intervalos de clase.
El punto medio o marca de clase “xi”, se obtiene
con:
Marca de clase = Límite inferior + límite superior
2
El tamaño del intervalo se obtiene mediante la
diferencia de los límites superior e inferior.
Ejemplo
Límite inferior Límite superior Lím inf + Lim sup
2
Intervalo de clase Punto medio “xi”
38 – 42 40
43 – 47 45 +5
48 – 52
+5 50
+5 53 – 57 55
58 – 62 60
63 – 67 65
Límite verdadero del intervalo
• Frontera de clase o límite verdadero del intervalo:
Intervalo de clase Punto medio “xi”
37.5 – 42.5 40
5/2 = 2.5
40 – 2.5 42.5 – 47.5 40 + 2.5 45
47.5 – 52.5 50
+5 52.5 – 57.5
57.5 – 62.5
55
60
62.5 – 67.5 65 +5
Tabla de intervalos con
límites verdaderos
Usando símbolos de Usando
Está incluidoparéntesis y
No está incluido
Está incluido No está incluido
desigualdad corchetes
Intervalo de Punto Intervalo de Punto
clase medio “xi” clase medio “xi”
37.5 ≤ x < 42.5 40 [37.5 , 42.5) 40
42.5 ≤ x < 47.5 45 [42.5 , 47.5) 45
47.5 ≤ x < 52.5 50 [47.5 , 52.5) 50
52.5 ≤ x < 57.5 55 [52.5 , 57.5) 55
57.5 ≤ x < 62.5 60 [57.5 , 62.5) 60
62.5 ≤ x < 67.5 65 [62.5 , 67.5) 65
El tamaño del intervalo es de 5
Si por alguna razón no es fácil decidir el
ancho del intervalo y el número de ellos, se
pueden utilizar las siguientes fórmulas:
m = 1 + 3,3 log(n) (Ley de Sturges)
Donde m = número aproximado de clases
n = número de datos.
R = m*c
c = R /m
Donde: Rango (R) = dato mayor - dato menor.
c = amplitud de los intervalos de clase.
Ejemplo
0.08 x 2/25
100
Intervalo Marca de f h h% F H H%
de clase clase “xi”
38 – 42 40 2 0.08 8 2 0.08 8
43 – 47 45 4 0.16 16 6 0.24 24
48 – 52 50 8 0.32 32 14 0.56 56
53 – 57 55 5 0.20 20 19 0.76 76
58 – 62 60 3 0.12 12 22 0.88 88
63 - 68 65 3 0.12 12 25 1 100
Total 25 1 100
Gráfica de Datos
Existen dos tipos de gráficas mas
usuales:
Polígono de Frecuencias
Histograma
Otros gráficos:
Gráfica de barras
Pictograma
Gráfico circular o de pastel.
Polígono de frecuencias
Es la representación mediante un gráfico de
línea. En él se muestra la distribución de
frecuencias y está formado por segmentos de
línea que unen los puntos correspondientes a la
frecuencia de cada una de las clases.
60
40
10
0
Ejemplo
Interval Marca de
o de clase “xi” fi
clase
Polígono de Frecuencias
38 – 42 40 2
10
43 – 47 45 4
8
48 – 52 50 8
6
53 – 57 55 5
f 4
58 – 62 60 3
2
63 - 68 65 3
0
Total 25 35 40 45 50 55 60 65 70
xi
El eje “y” puede ser sustituido por
las frecuencias relativas o
porcentuales.
Polígono de Frecuencia Relativa
0.35
0.3
0.25
h 0.2
0.15
0.1
0.05
0
35 40 45 50 55 60 65 70
xi
Polígono de Frecuencia Porcentual
35
30
25
% f 20
15
10
0
35 40 45 50 55 60 65
xi
Histograma
Es la representación gráfica de
los datos mediante una
sucesión de rectángulos.
Está formado por rectángulos
14
cuya anchura representa a 12
altura corresponde a la 6
frecuencia. 4
Ejemplo
clase clase“xi” fi
38 – 42 40 2
43 – 47 45 4
48 – 52 50 8
53 – 57 55 5
58 – 62 60 3
63 - 68 65 3
Histograma Total 25
9
8
7
6
5
f 4
3
2
1
0
35 40 45 50 55 60 65
xi
También podemos usar la frecuencia
relativa y la frecuencia porcentual.
%f 20
15
10
5
0
35 40 45 50 55 60 65
xi
Ojiva
Es la representación gráfica de las
frecuencias acumuladas mediante un
gráfico de línea. Se muestra la
distribución de frecuencias
acumuladas de los datos.
En el eje “x” estarán los puntos
38 – 42 40 2 0.08 2
43 – 47 45 4 0.16 6
48 – 52 50 8 0.32 14
53 – 57 55 5 0.20 19
58 – 62 60 3 0.12 22
63 - 68 65 3 0.12 25
Total 25 1
Ojiva
30
25 25
22
20
19
fa 15 14
10
6
5
2
00
35 40 45 50 55 60 65
xi
Usando la frecuencia acumulada y la frecuencia
porcentual.
Intervalo Marca de f h h% F H H%
de clase clase“xi”
38 – 42 40 2 0,08 8 2 0,08 8
43 – 47 45 4 0,16 16 6 0,24 24
48 – 52 50 8 0.32 32 14 0,56 56
53 – 57 55 5 0,20 20 19 0,76 76
58 – 62 60 3 0,12 12 22 0,88 88
63 - 68 65 3 0,12 12 25 1 100
Total 25 1 100
Ojiva con frecuencia relativa acumulada
1
0.9 0.88
0.8
0.76
0.7
0.6
0.56
h 0.5
0.4
0.3
0.24
0.2
0.1 0.08
00
35 40 45 50 55 60
xi
Ojiva con frecuencia porcentual acumulada
100
90 88
80 76
70
60 56
H% 50
40
30
24
20
10 8
00
35 40 45 50 55 60 65
xi
Ejemplo 1
• Súper aleaciones es el nombre colectivo para aleaciones utilizadas
en motores de aviones a chorro y motores de cohetes, que requieren
elevadas temperaturas (típicamente 1800°F 982°C), alta resistencia
y excelente resistencia a la oxidación. Treinta especímenes de
Hastelloy C (acero basado en níquel, modelo de revestimiento)
tuvieron una alta resistencia a la tensión (en 1 000 lbf/pulg2 6,9
MPa), registrados en el orden obtenido y redondeados a valores
enteros,
Ordenando da
Diagrama de tallo y hoja de los datos en el Ejemplo 1
Unidad de la hoja
Histograma
Para grandes conjuntos de datos, los histogramas son
mejores para visualizar la distribución de datos que el
diagrama de tallo y hoja. Las base de los rectángulos son
los intervalos de x 74.5-79.5, 79.5-84.5, 84.5-89.5, 89.5-
94.5, 94.5-99.5, cuyos puntos medios (conocidos como
marca de clase) son x = 77, 82, 87, 92,97, respectivamente.
La altura de un rectángulo con marca clase x es la frecuencia
relativa de la clase frel(x), definida como el número de
valores de datos en el intervalo de clase, dividido en n (= 30
en nuestro caso). De aquí que las área de los rectángulos
son proporcionales a estas frecuencias relativas, 0.10, 0.23,
0.43, 0.17, 0.07, tal que los histogramas dan una buena
impresión de la distribución de los datos.
Histograma de los datos de las súper aleaciones
Algunos métodos para organizar datos
Matriz de Datos
Es una forma de sintetizar la información recogida de la realidad para
Medidas de dispersión
Son números que indican qué tan separados
están los datos entre sí: rango, desviación
estándar, rango intercuaril.
Medidas de Tendencia Central
Lugar donde se centra el conjunto de datos de una distribución particular en la escala de
valores.
Media: Es el valor típico o promedio, representativo del conjunto de datos considerados.
Ventajas: Toma en consideración la realidad de todo el conjunto de datos.
Desventajas: Puede verse afectada por valores extremos no representativos del resto
de los datos.
Mediana: Es un valor que divide la distribución de datos en 2 partes iguales, tal que, el
conjunto de datos por encima de este sea igual al número de datos por debajo de la
misma.
Ventajas: Los valores extremos no afectan a la mediana tan intensamente como a la
media.
Desventajas: Ciertos procedimientos estadísticos que utilizan la mediana son más
complejos que aquellos que utilizan la media, es por ello que, si deseamos utilizar una
estadística de muestra para estimar un parámetro de población, la media es más
cómoda.
Moda: Es el valor que más se repite en una distribución de datos.
Ventajas: No se ve afectada por valores extremos dado que se escoge el valor más
frecuente, puede emplearse aún cuando existan clases de extremo abierto.
Desventajas: Cuando los datos son multimodales resulta complejo interpretar y
comparar
Media. Desviación estándar. Varianza
Las medianas y cuartiles se obtienen ordenando y
contando, prácticamente sin cálculo. Pero no dan una
información completa de los datos: puede cambiar los
valores de los datos hasta una extensión sin cambiar
la mediana. En forma similar para los cuartiles.
El tamaño promedio de los valores de los datos puede
medirse en un forma más definida por la media.
Media
aritmétic
a
Media
= 15,5
Varianza
Desviación
estándar
Medidas de Dispersión Relativa
Son aquellas que nos permiten comparar
muestras diferentes.
Diagrama de barras
Si las variables son cuantitativas discretas las
tablas de frecuencias se realizan con la creación
de diferentes clases en base a los datos que
toma la variable.
Si las variables son cuantitativas continuas, las tablas de
frecuencias se realizan con la creación de intervalos numéricos
que formarán las diferentes clases
Podemos completar esta tabla de frecuencias con una
columna que nos de las frecuencias acumuladas ¿qué
uso tienen?