Está en la página 1de 36

CONTROL DE CALIDAD

POLITÉCNICO GRANCOLOMBIANO
Agenda
Estadística Inferencia
Variables Intervalos

Tendencia Tamaño de muestra

Dispersión Hipótesis

Tipos de errores
Repaso de Estadística
Variable

Las variables son medidas o características de una


“entidad” o cosa.

Ej.: Se puede medir la estatura de una persona o la


cantidad de tiempo que una persona puede estar en una
página web.
Variable aleatoria
Una Variable Aleatoria puede describirse como una
función que asigna un valor, generalmente numérico.
Dicho valor es el resultado de un experimento y el azar.
Así, una variable aleatoria puede tomar cualquier valor
que esté contenido dentro de la población, o una muestra
de la población, para la cual esté definida la variable
aleatoria.

Variables de entrada del proceso Variables de salida


Son las que definen las condiciones Son las características de calidad en
de operación del proceso e incluyen las que se reflejan los resultados
las variables de control y las que obtenidos en un proceso.
aunque no son controladas, influyen
en el desempeño del mismo.
Variable aleatoria

Una Población es el conjunto global de personas,


entidades o datos que comparten características que les
define. Mientras que una Muestra es un subconjunto, que
hace parte de la población, y representa fielmente las
características de dicha población. Una muestra debe ser
aleatoria e insesgada, para que sea una buena
representación de la población.
Variable aleatoria
Supóngase el ejemplo de una variable aleatoria. Esta será
definida para una población y para una muestra.

Sea Xi: la edad de los estudiantes de la institución educativa en


la que usted se encuentra inscrito (Para una población de
estudiantes)

Sea Xi: la edad de los estudiantes del módulo de Control de


Calidad, de la institución educativa en la que usted se
encuentra inscrito. (Para una muestra de estudiantes, pues está
acotando la población a aquellos que hacen parte del módulo
de Control de Calidad)
Tendencia Central
Las medidas de tendencia central hablan del
comportamiento medio de los datos. Esto es, hacía dónde
tienden, en general, a agruparse los datos.
Medidas de

Estas medidas permiten caracterizar información de un


conjunto de datos a través de un único valor. Las más
frecuentes son la media, la moda y la mediana.
Media

La media, también llamada media aritmética o promedio,


indica un punto intermedio o equidistante a todos los
demás puntos u observaciones del conjunto de datos
analizado. Esta medida equivale a la suma de todas las
observaciones, la cual debe ser dividida entre el número
de observaciones analizadas.
σ𝑛𝑖=1 𝑋𝑖
𝑋ത =
𝑛
Media
Para ejemplificar la media de las edades de la variable
aleatoria definida previamente, se presenta la siguiente
muestra de edades recolectada de los estudiantes del
módulo Control de Calidad:

Muestra de edades
i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Xi 24 22 25 23 21 22 23 24 23 22 21 23 20 22 24
Tabla 1. Muestra de edad de los estudiantes Diseño de Experimentos

σ𝑛𝑖=1 𝑋𝑖 24 + 22 + 25 + ⋯ + 20 + 22 + 24

𝑋= = = 22,6
𝑛 15
Moda

La moda es una medida de tendencia central que indica


cuál es el dato que más se repite en una muestra o
población. Estadísticamente se dice que este es el dato
con mayor frecuencia en una distribución determinada de
probabilidad.

De acuerdo con la muestra presentada previamente, la


moda correspondiente es: 22
Mediana
En estadística, la mediana es el valor que se encuentra ubicado
en la posición central de los datos. En este punto, el 50% de las
observaciones son menores y el 50% de las observaciones son
mayores.
Para determinar la mediana se debe tener en cuenta el orden
en que se encuentran las observaciones. Si el número de
observaciones es impar, la mediana es exactamente el valor
de la observación que se encuentre en el medio de todas ellas.
Si el número de observaciones es par, se deben tomar los dos
valores del centro, sumarlos y dividirlos entre dos, así se hallará
la mediana y en este caso no será un valor que coincida con
alguna de las observaciones.
De acuerdo con la muestra presentada previamente, a
mediana correspondiente es: 24
Desviación

La desviación da una idea de la dispersión de los datos,


consolidando las distancias que hay entre cada una de las
observaciones y el valor medio del grupo de datos. Se
denota como σ (la letra griega sigma) para el caso de una
población y como S (la letra latina s) para referirse a la
muestra. La expresión que permite calcular la desviación
es:

σ𝑛𝑖=1 𝑋𝑖 − 𝑋ത 2
𝑆=
𝑛−1
Desviación

Para ejemplificar la desviación de las edades de la


variable aleatoria definida previamente, se presenta la
siguiente muestra de edades recolectada de los
estudiantes del módulo Control de Calidad:
Muestra de edades
i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Xi 24 22 25 23 21 22 23 24 23 22 21 23 20 22 24
Tabla 1. Muestra de edad de los estudiantes de Diseño de Experimentos

24 − 22,6 2 + 22 − 22,6 2 + ⋯ + 22 − 22,6 2 + 24 − 22,6 2


𝑆= = 1,352
15 − 1
Varianza
La varianza, al igual que la desviación, presenta información sobre
qué tan dispersas se encuentran las observaciones con relación a la
media de los datos. Esta equivale al cuadrado de la desviación y se
representa como σ2 en el caso de la población o como S2 en el
caso de la muestra.

De acuerdo con el cálculo de la desviación anterior, la varianza


sería su cuadrado. Así, para el ejemplo de la muestra presentado, la
varianza es:

𝑆 2 = 1,352 2
= 1,828
Rango
El rango es una medida de dispersión basada en el intervalo
de los datos. Su cálculo es la diferencia entre el valor máximo
y el mínimo de las observaciones. Cuanto mayor es el rango,
se podría considerar que más dispersos están los datos.
Inversamente, a menor rango, mayor concentración de las
observaciones.

De acuerdo con la muestra presentada con la edad de los


estudiantes, el valor máximo es 25 y el valor mínimo es 20. A
partir de estos valores se puede calcular el rango como:

R = 25 – 20 = 5.
Inferencia Estadística
Intervalos de
Confianza

Los intervalos de confianza se componen de dos valores, un mínimo y un


máximo, que definen un rango para el cual se puede considerar la
existencia de un cierto parámetro, a cierto nivel de confianza.

P(L ≤ ɵ ≤ U) = 1 - α
Donde:
L Representa el valor mínimo del rango del intervalo
U Representa el valor máximo del rango del intervalo
ɵ Representa el parámetro para el cual se construye el intervalo
(1 - α) Es la confianza a la cual se define el intervalo
confianza - Media
Intervalos de

A continuación se sustituyen las fórmulas correspondientes en la


ecuación planteada anteriormente y se presenta un ejemplo para el
cálculo del intervalo de confianza de la media poblacional
correspondiente a la variable definida, correspondiente a la edad de
los estudiantes.

𝜎 𝜎
𝑃 𝑋ത − 𝑍𝛼 ത
≤ 𝜇 ≤ 𝑋 + 𝑍𝛼 =1−𝛼
2 𝑛 2 𝑛
confianza - Media
Intervalos de

Suponga que la varianza de la edad de los estudiantes de la


institución educativa en la que usted se encuentra inscrito es
conocida y es: σ2 = 1,96
Así las cosas, el intervalo de confianza del 95% para la media de los
estudiantes de la institución educativa es:
1,4 1,4
𝑃 22,6 − 𝑍𝛼 ≤ 𝜇 ≤ 22,6 + 𝑍𝛼 = 0,95
2 15 2 15
Para el estadístico Z se requiere de
una tabla de la distribución normal
o hacer uso de la función 1,4 1,4
correspondiente en MS Excel 𝑃 22,6 − 1,95 ≤ 𝜇 ≤ 22,6 + 1,95 = 0,95
=INV.NORM.ESTAND(probabilidad). 15 15

𝑃 21,895 ≤ 𝜇 ≤ 23,304 = 0,95


Intervalos de
Confianza
Parámetro Límite inferior Límite superior
 𝑠 𝑠

𝑋 − 𝑡𝛼 ത
𝑋 + 𝑡𝛼
(con el estadístico t) 2 𝑛 2 𝑛

2 𝑛 − 1 𝑆2 𝑛 − 1 𝑆2
𝑋𝛼2ൗ ,𝑛−1 2
𝑋1− 𝛼ൗ ,𝑛−1
2 2

P
𝑝(1
Ƹ − 𝑝)Ƹ 𝑝(1
Ƹ − 𝑝)Ƹ
Proporciones 𝑝Ƹ − 𝑍𝛼 𝑝Ƹ + 𝑍𝛼
2 𝑛 2 𝑛
Tamaño de

En ocasiones es necesario calcular el tamaño de la muestra con el


muestra

cual se puede lograr que la estimación tenga un error máximo E.

Como se aprecia de los intervalos de confianza, el error máximo está


dado por:
𝑆
𝐸 = 𝑡𝛼,𝑛−1
2 𝑛
2
Y despejando para n (tamaño muestra), se tiene:
𝑆
𝑛 = 𝑡𝛼,𝑛−1
2 𝐸
Tamaño de

𝑡𝛼,𝑛−1
Como depende de n (la incógnita), para propósitos
muestra

2
prácticos y con tamaños de muestra n ≥ 30, el valor de la
distribución t tiende a aproximarse a 2.

2 2
𝑆 2𝑆
𝑛 = 𝑡𝛼,𝑛−1 𝑛=
2 𝐸 𝐸
muestra – Ejemplo

Suponga que en el grosor de los discos se quisiera un error


Tamaño de

máximo de estimación E = 0.004

¿Cuál sería el tamaño de muestra n requerido, si la


desviación del proceso es 0,0267?

2
2𝑆 4 0.00071
𝑛= = 2
= 177.5 ≅ 178
𝐸 0.004
Pruebas de
hipótesis

Se tienen unos conceptos a priori y se desea verificar si,


estadísticamente, estos son válidos o no. Para ello, se
puede realizar una prueba de hipótesis mediante el
siguiente procedimiento:

• Plantear las hipótesis correspondientes


• Computar el estadístico de prueba
• Comprobar contra el criterio de rechazo
Pruebas de
Puede partir de una afirmación sobre los valores de los
parámetros de una población o proceso. Dicha afirmación
hipótesis

es susceptible de probarse a partir de la información


contenida en una muestra.

Hipótesis nula H0:


Afirmación acerca del valor de un parámetro poblacional que se
considera válida para desarrollar el procedimiento de prueba.
Hipótesis alternativa Ha:
Afirmación que se considera válida si los datos muestrales
proporcionan evidencia de que la hipótesis nula es falsa.
Pruebas de
Formulación que permite calcular un número (valor) a partir
de los datos y de la H0. La magnitud de este número
hipótesis

permite discernir si H0 debería ser rechazada o no, con


base en cierto nivel de confianza con el que se quiera
desarrollar la prueba
Donde:

El estadístico de prueba para la Z0 Se conoce como el estadístico de prueba


media se presenta a continuación 𝑋ത Es la media muestral, a partir de la cual se va a
validar la hipótesis para la media poblacional
µ Es la media poblacional sobre la cual se ha
establecido un supuesto previamente y se
𝑋ത − µ quiere probar
𝑍0 = 𝜎
ൗ 𝑛  Corresponde a la desviación poblacional de los
datos que se están evaluando
n Es el tamaño de la muestra utilizado para la
prueba
Pruebas de
Se construye bajo el supuesto de que H0 es verdad y a su
vez responde al comportamiento de una variable aleatoria
hipótesis

que sigue una distribución conocida.

Si en efecto, H0 es verdad, el valor del estadístico de


prueba debería caer en la región de “aceptación”. En
caso contrario, de caer en la zona de rechazo, se
considera evidencia suficiente para concluir que el
supuesto bajo el cual se construyó H0 está mal o es falso.
Pruebas de
hipótesis
Pruebas de
H0: µ = µ1 Por lo general denota igualdad y se considera cierta
hipótesis

Casos Criterios de rechazo

HA: µ ≠ µ1 |Z0| > Zα/2

HA: µ > µ1 Z0 > Zα

HA: µ < µ1 Z0 < -Zα


Pruebas de
Un profesor decide apostar con los estudiantes de un curso
como el que usted está estudiando.
hipótesis

El profesor sugiere que la edad promedio de los estudiantes de


la institución es de al menos 21 años o más. Mientras que los
estudiantes, queriéndose sentir jóvenes, insisten en que dicha
edad promedio es muy alta.

Por experiencia histórica se conoce que la varianza de la edad


para estos estudiantes (σ2) es 1,96. Para determinar quién
puede tener la razón, se realiza una prueba de hipótesis con
una confianza del 95% y a continuación se detalla el
procedimiento
Pruebas de
H0: La edad promedio de todos los estudiantes de la institución
educativa es de 21 años (μ = 21).
hipótesis

Ha: La edad promedio de todos los estudiantes de la institución


educativa es menor a los 21 años (μ < 21).

Se utiliza la misma muestra de


𝑋ത − µ 22,6 − 21 edades que se utilizó con el
𝑍0 = 𝜎 = = 4,426 ejemplo del intervalo de
ൗ 𝑛 1,4 confianza

15

De acuerdo con la evidencia estadística aportada y a un nivel de


confianza del 95%, se tiene que el estadístico de prueba cae en la
región de no rechazo (prueba de una sola cola con 𝑍0,05 = −1,65).
Pruebas de
Hipótesis Estadístico de prueba Criterios de rechazo
hipótesis
H0: 𝜇 = 𝜇0 𝑥ҧ − 𝜇 𝑡0 > 𝑡𝛼,𝑛−1
𝑡0 = 2
Ha: 𝜇 ≠ 𝜇0 𝑆ൗ
𝑛 𝑡0 > 𝑡𝛼,𝑛−1
Ha: 𝜇 > 𝜇0
𝑡0 < −𝑡𝛼,𝑛−1
Ha: 𝜇 < 𝜇0

H0: 𝜎 2 = 𝜎02 𝑛 − 1 𝑆2 𝑥02 > 𝑥𝛼2,𝑛−1 𝑜 𝑥02 < 𝑥1−


2
𝛼
Ha: 𝜎 2 ≠ 𝜎02 𝑥02 = 2 ,𝑛−1
2
𝜎02 𝑥02 > 𝑥𝛼,𝑛−1
2
Ha: 𝜎 2 > 𝜎02
Ha: 𝜎 2 < 𝜎02 𝑥02 < 𝑥1−𝛼,𝑛−1
2

H0: 𝑝 = 𝑝0 𝑋 − 𝑛𝑝0 𝑍0 > 𝑍𝛼


𝑍0 = 2
Ha: 𝑝 ≠ 𝑝0 𝑛𝑝0 1 − 𝑝0 𝑍0 > 𝑍𝛼
Ha: 𝑝 > 𝑝0
𝑍0 < −𝑍𝛼
Ha: 𝑝 < 𝑝0
Tipos de
errores
Cuando se realizan pruebas de hipótesis, estas se encuentran
asociadas a cierto nivel de confianza. Así las cosas, estas
pruebas no son 100% exactas. Entre otras cosas, porque
dependen de una muestra aleatoria que puede variar de una
prueba a otra.

Estos errores se conocen como Error tipo I (α), que ocurre


cuando se rechaza la hipótesis nula y esta es verdadera. El otro,
conocido como Error tipo II (β), ocurre cuando no se rechaza la
hipótesis nula y esta es falsa.
Tipos de
El equivalente, algebraicamente, para cada uno de los tipos de errores es:
errores

𝐸𝑟𝑟𝑜𝑟 𝑡𝑖𝑝𝑜 𝐼 = 𝛼 = 𝑃 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 𝐻0 𝑒𝑠 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎}


𝐸𝑟𝑟𝑜𝑟 𝑡𝑖𝑝𝑜 𝐼𝐼 = 𝛽 = 𝑃 𝑁𝑜 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 𝐻0 𝑒𝑠 𝑓𝑎𝑙𝑠𝑎}

Como se puede apreciar por la notación, el error tipo I, que también es


conocido como alfa (α) es el equivalente a lo que se ha definido como la
significancia de la prueba.

Por otra aparte, también se considera la potencia de la prueba. Dicha


potencia siempre se querrá tan alta como sea posible.
𝑃𝑜𝑡𝑒𝑛𝑐𝑖𝑎 = 1 − 𝛽 = 𝑃 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 𝐻0 𝑒𝑠 𝑓𝑎𝑙𝑠𝑎}
Gracias

También podría gustarte