Intervalos de Confianza y Regresión Lineal

I.E.S.T.P.
“Manuel Seoane Corrales” CARRERA PROFESIONAL: Química Industrial
INTERVALOS DE CONFIANZA DE LA MEDIA DE UNA POBLACIÓN
De una población con media “μ” y desviación típica “σ” se pueden tomar muestras de “n”
elementos. Cada una de estas muestras tiene a su vez una media. Se puede demostrar que la
media de todas las medias muestrales coincide con la media poblacional: μ X = μ. Pero
además, si el tamaño de las muestras es lo suficientemente grande, o la distribución
poblacional es normal, la distribución de medias muestrales es, prácticamente, una
distribución normal (o gaussiana) con media μ y una desviación típica dada por la siguiente
expresión σ X =
σ
√n
; esto se representa como X (
N μ;
σ
√n )
. Si estandarizamos, se
X−μ
sigue que: z = σ N(0; 1).
√n
En una distribución z N(0; 1) puede calcularse fácilmente un intervalo
dentro del cual caiga un determinado porcentaje de las observaciones, esto es sencillo
hallar z1 y z2 tales que P[ z 1 ≤ z ≤ z 2 ] = 1 – α donde (1 – α)100% es el porcentaje deseado.
En esta distribución normal de medias se puede calcular el intervalo de confianza
donde se encontrará la media poblacional si solo se conoce una media muestral (X), con una
confianza determinada. Habitualmente se manejan valores de confianza del 95 y del 99 por
ciento. A este valor se le llamará 1 – α (debido a que “α” es el error que se cometerá, un
término opuesto).
Para ello se necesita calcular el punto X α/2 o, mejor dicho, su versión estandarizada
z α / 2 o valor crítico junto con su "opuesto en la distribución" - X α/2 . Estos puntos delimitan la
probabilidad para el intervalo, como se muestra en la siguiente imagen:
Dicho punto es el número tal que:

P[ x ≥ X α /2 ] = P[ z ≥ z α /2 ] = α /2
Y en la versión estandarizada se cumple que: z−α /2 = −z α / 2
Así: [
P X−z α /2
σ
√n
≤ μ ≤ X + zα/ 2
σ
√n
=1-α ]
De lo cual se obtendrá el intervalo de confianza
( X−z α/ 2
σ
√n
; X + z α /2
σ
√n )
Obsérvese que el intervalo de confianza viene dado por la media muestral (X)± el
σ
producto del valor crítico z α / 2por el error estándar . Si no se conoce y “n” es grande
√n
(habitualmente se toma n ≥ 30):
U.D.: Control de Calidad en la Agroindustria I Página 1
I.E.S.T.P. “Manuel Seoane Corrales” CARRERA PROFESIONAL: Química Industrial
Aproximaciones para el valor z α / 2 para los niveles de confianza estándar son 1,96 para 1 – α =
95 % y 2,576 para 1 – α = 99%.
Resolución de problemas
Problema 01
Se toman 35 muestras de una máquina de llenado de sacos de cinc con un promedio de
llenado de 57,75 lb y una desviación estándar de 3 lb. Determinar un intervalo de confianza
con un nivel de confianza del 99%.
Resolución
Procedemos a extraer los datos del problema:
n = 35; X = 57,75 lb; s = 3 lb; 1 – α = 99%; α/2 = 0,5%
Las fórmulas a emplear son:
σ
LIC = X −z α / 2
√n
σ
LSC = X + z α /2
√n
Realizamos la gráfica para entender lo que se hace y ubicar los datos:
α/2 -z +z α/2
1-α
LIC LSC
99% + 0,5% = 99,5% = 0,995
Empleamos la tabla para determinar el valor que corresponde a z α / 2, por lo tanto, tenemos
que interpolar:
2,57 → 0,9949 Calculamos el valor de “a”:
x 0,0001
0,01 0,0002 0,0001(0,01)
zα/ 2 → 0,9950 x= = 0,005
0,0002
2,58 → 0,9951 Luego calculamos “z”:
z α / 2 = 2,570 + 0,005 = 2,5750
Finalmente, los intervalos de confianza serán:
LIC = 57,75 – 2,575 ( √335 ) = 56,444 lb
LSC = 57,75 + 2,575 ( √335 ) = 59,056 lb
Interpretación: Con una confianza del 99% la media de llenado de sacos de cinc está entre
56,444 lb y 59,056 lb.
Problema 02
La media y la desviación estándar muestrales para todos los pesos de llenado de las 100
cajas son X = 12,05 kg y s = 0,1 kg. Encuentre un intervalo del 95% de confianza para la
media de los pesos de la caja.
Resolución
n = 100; X = 12,05 lb; s = 0,1 lb; 1 – α = 95%; α/2 = 2,5%

s
LIC = X −z α / 2
√n
s
LSC = X + z α /2
√n
α/2 -z +z α/2
1-α
LIC LSC
95% + 2,5% = 97,5% = 0,975
Empleamos la tabla para determinar el valor que corresponde a z α / 2, del cual obtenemos:
z α / 2 = 1,96
LIC = 12,05 – 1,96 ( √0,1100 ) = 12,0304 lb
LSC = 12,05 + 1,96 ( √0,1100 ) = 12,0696 lb
Interpretación: Con una confianza del 95% la media de llenado de las cajas está entre
12,0304 kg y 12,0696 kg.
Problema 03
La media de las medidas de los diámetros de una muestra aleatoria de 200 bolas de
rodamiento, fabricadas por cierta máquina, fue de 0,824 cm, y la desviación típica fue de
0,042 cm. Halla los límites de confianza al 95% para el diámetro medio de las bolas
fabricadas por esa máquina.
Resolución
n = 200; X = 0,824 cm; s = 0,042 cm; 1 – α = 95%; α/2 = 2,5%
s
LIC = X −z α / 2
√n
s
LSC = X + z α /2
√n
α/2 -z +z α/2
1-α
LIC LSC
95% + 2,5% = 97,5% = 0,975

z α / 2 = 1,96
LIC = 0,824 – 1,96 ( 0,042

√ 200 )
= 0,81818 cm
LSC = 0,824 + 1,96 ( 0,042

√ 200 )
= 0,82982 cm
Interpretación: Con una confianza del 95% las medias de las medidas de diámetros de las
bolas de rodamiento están entre 0,81818 cm y 0,82982 cm.
Problema 04
Se supone que un proceso de manufactura se inspecciona una vez cada hora. Se sugiere que
se tome una muestra de cinco piezas cada hora, luego calcule la media de la muestra, X. La
desviación estándar del proceso se supone que es constante en 0,255 pulg. ¿Dentro de qué
límites se esperaría que 95% de las medias de la muestra estén si el promedio del proceso
es estable en μ = 4,500 pulg? Suponga que las mediciones son de una población normal.
Resolución
n = 5; X = 4,500 pulg; s = 0,255 cm; 1 – α = 95%; α/2 = 2,5%
s
LIC = X −z α / 2
√n
s
LSC = X + z α /2
√n
α/2 -z +z α/2
1-α
LIC LSC
95% + 2,5% = 97,5% = 0,975
z α / 2 = 1,96
LIC = 4,500 – 1,96 ( 0,255

√5 )
= 4,27648 pulg
LSC = 4.500 + 1,96 ( 0,255

√5 )
= 4,72352 pulg
Interpretación: Con una confianza del 95% las mediciones realizadas en un proceso de
manufactura están entre 4,27648 pulg y 4,72352 pulg.

CORRELACIÓN LINEAL Y REGRESIÓN LINEAL SIMPLE
Para estudiar la relación lineal existente entre dos variables continuas es necesario
disponer de parámetros que permitan cuantificar dicha relación. Uno de estos parámetros
es la covarianza.
La covarianza
Indica el grado de variación conjunta de dos variables aleatorias. Se define como la
media aritmética de los productos de las desviaciones de cada una de las variables
respecto a sus medias respectivas. La covarianza se representa por s xy o σxy y se calcula
por:
sxy =
∑ ( X i −X ) ( Y i−Y ) (datos no agrupados)
N
sxy =
∑ ( X i −X ) ( Y i−Y ) . f i (datos agrupados)
N
sxy =
∑ i i Y i −XY (datos agrupados)
f X
N
La covarianza indica el sentido de la correlación entre las variables. Si σxy > 0
(positivo) la correlación es directa, es decir, que ambas variables tienden a variar de la
misma forma. Si σxy < 0 (negativo) la correlación es inversa, es decir, que si una aumenta la
otra tiende a disminuir y viceversa. La covarianza cercana a cero, indica que no hay
asociación entre las variables.
La covarianza presenta como inconveniente, el hecho de que su valor depende de las
unidades de medida elegida para los ejes. Es decir, la covarianza variará si expresamos la
altura en metros o en centímetro. También variará si el dinero lo expresamos en euros o en
dólares.
Coeficiente de correlación lineal (Índice de correlación lineal de Pearson)

El coeficiente de correlación lineal es el cociente entre la covarianza y el producto de
las desviaciones típicas de ambas variables. El coeficiente de correlación lineal es una
medida de asociación lineal independiente de las unidades de medida, se expresa mediante
la letra “r” y se calcula por:
s xy
r=
σ xσ y

donde la desviación estándar se calcula por:
Propiedades del coeficiente de correlación

σx =
√ ∑ ( X i− X )2 y σ
N
y =
√ ∑ ( Y i−Y )2
N
1. El coeficiente de correlación no varía con la escala de medición empleada, es decir, si

expresamos la altura en metros o en centímetros el coeficiente de correlación no varía.
2. El signo del coeficiente de correlación es el mismo que el de la covarianza. Si la
covarianza es positiva, la correlación es directa. Si la covarianza es negativa, la
correlación es inversa, Si la covarianza es nula, no existe correlación.
3. El coeficiente de correlación lineal es un número real comprendido entre -1 y +1. Es
decir:
-1 ≤ r ≤ +1.
4. Si el coeficiente de correlación lineal toma valores cercanos a -1 la correlación es fuerte
e inversa, y será tanto más fuerte cuanto más se aproxime “r” a -1.
5. Si el coeficiente de correlación lineal toma valores cercanos a +1 la correlación es fuerte
y directa y será tanto más fuerte cuanto más se aproxime “r” a +1.
6. Si el coeficiente de correlación lineal toma valores cercanos a 0, la correlación es débil.
7. Si r = +1 ó -1, los puntos de la nube están cobre la recta creciente o decreciente. Entre
ambas variables hay dependencia funcional.
De acuerdo a estas propiedades algunos autores han determinado los siguientes
rangos para interpretar valores a “r”:
-1 ≤ r < -0,8 Asociación fuerte y negativa 0 ≤ r < 0,4 No hay asociación
-0,8 ≤ r < -0,4 Asociación débil y negativa 0,4 ≤ r < Asociación débil y positiva
0,8
-0,4 ≤ r < 0 No hay asociación 0,8 ≤ r < 1 Asociación fuerte y positiva
Ejemplo
En la producción de herramientas, el método para deformar acero a temperatura normal
mantiene una relación inversa con la dureza del mismo ya que, a medida que la deformación
crece, se ve afectada la dureza del acero. Para investigar esta relación se ha tomado la
siguiente muestra:
X; deformación en mm 6 9 11 13 22 26 28 33 35
Y; dureza Brinell en Kg/mm2 68 67 65 53 44 40 37 34 32
Hallar la covarianza y el coeficiente de variación e interpretar dichos valores.
Resolución
Preparamos la siguiente tabla:
N° Xi Yi Xi – X Yi – Y (Xi-X)(Yi-Y) (Xi – X)2 (Yi – Y)2
01 6 68 -14,33 19,11 -273,85 205,35 365,19
02 9 67 -11.33 18,11 -205,19 128,37 327,97
03 11 65 -9,33 16,11 -150,31 87,05 259,53
04 13 53 -7,33 4,11 -30,13 53,73 16,89
05 22 44 1,67 -4,89 -8,17 2,79 23,91
06 26 40 5,67 -8,89 -50,41 32,15 79,03
07 28 37 7,67 -11,89 -91,20 58,83 141,37
08 33 34 12,67 -14,89 -188,66 160,53 221,71

09 35 32 14,67 -16,89 -247,78 215,21 285,27

Σ 183 440 -1 245,70 944,01 1 720,90
Cálculo de la media:
183 440
X= = 20,33 ; Y = = 48,89
9 9
Cálculo de la covarianza:
−1245,70
sxy = = -138,41
9
Calculo del coeficiente de correlación:
944,01
σx =
9 √= 10,24
s xy s xy
σy =
1720,90
9
−138,41
√= 13,83
r= = = = -0,977 = -0,98
σ x σ y σ x σ y (10,24)(13,83)
Regresión lineal simple
La regresión lineal simple consiste en generar un modelo de regresión (ecuación de

una recta) que permita explicar la relación lineal que existe entre dos variables. A la
variable dependiente o respuesta se le identifica como “Y” y a la variable predictora o
independiente como “X”. El modelo de regresión lineal simple se describe de acuerdo a la
ecuación:
Y = β0 + β1X + ϵ
Siendo β0 la ordenada en el origen, β1 la pendiente y “ϵ” el error aleatorio. Este último

representa la diferencia entre el valor ajustado por la recta y el valor real. Recoge el
efecto de todas aquellas variables que influyen en “Y” pero que no se incluyen en el modelo
como predictores. Al error aleatorio también se le conoce como residuo.
En la gran mayoría de casos, los valores β0 y β1 poblacionales son desconocidos, por lo
que, a partir de una muestra, se obtienen sus estimaciones β 0 y β 1. Estas estimaciones se
conocen como coeficientes de regresión o least square coefficient estimates
(estimaciones del coeficiente del mínimo cuadrado), ya que toman aquellos valores que
minimizan la suma de cuadrados residuales, dando lugar a la recta que pasa más cerca de
todos los puntos. El método matemático que se utiliza para calcular la recta de regresión
lineal que minimiza los residuos, se denomina “técnica de los mínimos cuadrados”.

Método de los mínimos cuadrados

Existen numerosas leyes físicas en las que se sabe
de antemano que dos magnitudes “X” e “Y” se
relacionan a través de una ecuación lineal Y = mX + b
donde las constantes “b” (ordenada en el origen) y
“m” (pendiente) dependen del tipo de sistema que se
estudia y, a menudo, son los parámetros que se
pretende encontrar. El método más efectivo para
determinar los parámetros m y b se conoce como
técnica de “mínimos cuadrados”. Consiste en someter
el sistema a diferentes condiciones, fijando para ello
distintos valores de la variable independiente “X”, y
anotando en cada caso el correspondiente valor
medido para la
variable dependiente “Y”. De este modo se dispone de una serie de puntos (x 1, y1), .... (xn, yn)
que, representados gráficamente, deberían caer sobre una línea recta. Sin embargo, los
errores experimentales siempre presentes hacen que no se hallen perfectamente alineados
(ver figura). El método de mínimos cuadrados determina los valores de los parámetros “m” y
“b” de la recta que mejor se ajusta a los datos experimentales. Para ello se aplicarán las
fórmulas siguientes:
n ( ∑ X i Y i ) −( ∑ X i)( ∑ Y i )
m= 2
n ( ∑ X i ) −( ∑ X i )
2
b=
( ∑ Y i ) −m ( ∑ X i ) = Y - mX
n
Ejemplo
En la producción de herramientas, el método para deformar acero a temperatura normal
mantiene una relación inversa con la dureza del mismo ya que, a medida que la deformación
crece, se ve afectada la dureza del acero. Para investigar esta relación se ha tomado la
siguiente muestra:
X; deformación en mm 6 9 11 13 22 26 28 33 35

2
Y; dureza Brinell en Kg/mm 68 67 65 53 44 40 37 34 32
Se pide:
a) Graficar los puntos dados en la tabla anterior en papel milimétrico.
b) Realizar el ajuste de recta empleando el método de los mínimos cuadrados.
c) Graficar los puntos reajustados en papel milimétrico e interpretar la gráfica obtenida.
Resolución
a) Realizamos la gráfica respectiva.
a) Completamos la tabla siguiente
N° Xi Yi X i2 Xi.Yi Yajust.
01 6 68 36 408 67,8032
02 9 67 81 603 63,8444
03 11 65 121 715 61,2052
04 13 53 169 689
05 22 44 484 968
06 26 40 676 1 040
07 28 37 784 1 036
08 33 34 1 089 1 122
09 35 32 1 225 1 120
Σ 183 440 4 665 7 701
Calculo de la pendiente y ordenada en el origen de la ecuación siguiente:
Yajust. = mX + b
9 ( 7 701 )−(183)( 440) 69 309−80520 −11211
m= = = = -1,3196
9 ( 4 665 )−(183)
2
41 985−33 489 8 496
440−(−1,3196)(183) 440+241,4868 681,4868
b= = = = 75,7208
9 9 9
La ecuación de ajuste es: Yajust. = -1,3196X + 75,7208
b) Realizamos la nueva gráfica

Intervalos de Confianza y Regresión Lineal

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Intervalos de Confianza y Regresión Lineal

Cargado por

Copyright:

Formatos disponibles

I.E.S.T.P.

“Manuel Seoane Corrales” CARRERA PROFESIONAL: Química Industrial

INTERVALOS DE CONFIANZA DE LA MEDIA DE UNA POBLACIÓN

Dicho punto es el número tal que:

LIC = 57,75 – 2,575 ( √335 ) = 56,444 lb

LSC = 57,75 + 2,575 ( √335 ) = 59,056 lb

n = 100; X = 12,05 lb; s = 0,1 lb; 1 – α = 95%; α/2 = 2,5%

LIC = 12,05 – 1,96 ( √0,1100 ) = 12,0304 lb

LSC = 12,05 + 1,96 ( √0,1100 ) = 12,0696 lb

U.D.: Control de Calidad en la Agroindustria I Página 3

LIC = 0,824 – 1,96 ( 0,042

LSC = 0,824 + 1,96 ( 0,042

LIC = 4,500 – 1,96 ( 0,255

LSC = 4.500 + 1,96 ( 0,255

U.D.: Control de Calidad en la Agroindustria I Página 4

CORRELACIÓN LINEAL Y REGRESIÓN LINEAL SIMPLE

Coeficiente de correlación lineal (Índice de correlación lineal de Pearson)

U.D.: Control de Calidad en la Agroindustria I Página 5

donde la desviación estándar se calcula por:

Propiedades del coeficiente de correlación

1. El coeficiente de correlación no varía con la escala de medición empleada, es decir, si

U.D.: Control de Calidad en la Agroindustria I Página 6

09 35 32 14,67 -16,89 -247,78 215,21 285,27

Regresión lineal simple

La regresión lineal simple consiste en generar un modelo de regresión (ecuación de

Siendo β0 la ordenada en el origen, β1 la pendiente y “ϵ” el error aleatorio. Este último

U.D.: Control de Calidad en la Agroindustria I Página 7

Método de los mínimos cuadrados

U.D.: Control de Calidad en la Agroindustria I Página 8

U.D.: Control de Calidad en la Agroindustria I Página 9

También podría gustarte