Está en la página 1de 23

Contenido

Apunte de Probabilidades y estadísticas: Distribución de la media de un muestreo. Teorema del límite central. Ejemplos.

DISTRIBUCION DE LA MEDIA DE UN MUESTREO

Sea X 1 , X 2 ,

,

X n una muestra aleatoria de una distribución con valor medio μ y desviación estándar σ. Entonces:

1.

E(X) = μ x = μ

2.

V(X) = σ x ² = σ ²/n y σ x = σ/√n

Además, con T 0 = X 1 + X 2 +

...

+ X n (la muestra total), E(T 0 ) = n.μ, V(T 0 ) = n.σ ², y σ.T 0 = √n.σ.

Contenido Apunte de Probabilidades y estadísticas: Distribución de la media de un muestreo. Teorema del límite

N: número de muestras. n: número de muestras en el subconjunto extraído del conjunto madre de N muestras. μ x = μ x

σ x ² = σ ²/n σ x = σ/√n

A medida que aumentan las muestras, la variabilidad disminuye.

Sea X 1 , X 2 ,

X n una muestra aleatoria de una distribución normal con valor medio μ y desviación estándar σ. Entonces,

, para cualquier n, X está normalmente distribuida (con media μ y desviación estándar σ/√n), como es T 0 (con media n.μ desviación

estándar √n.σ).

 

TEOREMA DEL LIMITE CENTRAL

Teorema:

Sea X 1 , X 2 ,

,

X n una muestra aleatoria de una distribución con media μ y varianza σ ². Entonces, si n es suficientemente

distribución normal con μ T0 = n.μ, σ ² T0 = n.σ ². Cuanto mas grande sea el valor de n, mejor será la aproximación. El Teorema del Límite Central garantiza una distribución normal cuando n es suficientemente grande Si n > 30, se puede usar el TLC. Si la distribución madre es normal, la distribución de la media muestral también es normal, independientemente del tamaño.

x

≈ N(μ x ; σ x )

x ≈ N(μ x ; σ x )

Ejemplo 1:

Si se sabe que la dureza Rockwell de pernos de cierto tipo tiene un valor medio de 50 y desviación estándar de 1,5.

a)

Si la distribución es normal, ¿cuál es la probabilidad de que la dureza muestral media para una muestra aleatoria de 9 pernos

sea por lo menos 52?

b)

¿Cuál es la probabilidad (aproximada) de que la dureza muestral media para una muestra aleatoria de 40 pernos sea al menos

52?

x

= 50

σ = 1,5

x

≈ N(50; 1,5)

a)

 

n = 9

x

= 52

x

≈ N(50; 1,5.√9)

z = (x - μ)/(σ/√n)

La probabilidad de que la media muestral sea superior a 52 es:

P(x ≥ 52) = P(z ≥ 4) = 0
P(x ≥ 52) =
P(z ≥ 4) = 0

Con el valor de z obtenido de tablas:

P(x 1 ≤ x ≤ x 2 ) =

P(x ≥ 52) = P(z ≥ 4) = 0 Con el valor de z obtenido detablas : P(x ≤ x ≤ x ) = P(z ≤ z ≤ z ) = φ(z) Tener en cuenta que los valores para: φ(z) = P(z ≤ z ) b) n = 40 Con el valor de z obtenido de tablas : P(x ≥ 52) = P(z ≥ 8,4327) = 0 INTERVALO DE CONFIANZA 1) Para la media μ de una población normal: L = x ± z .σ/√n Tener en cuenta que una confianza del 95% significa: α/2 = 0,95 p = 1 - q p = x/n 2) Para la media X : i/s (n - 1)(1 - α/2) t( se busca en tabla 3) Para la varianza S²: X² se busca en tabla 4) Para el desvío estándar S: 5) Para muestras grandes: Un intervalo de confianza 100(1 - α)% para la proporción p de una población, de muestras grandes, es: p ± z √p.q/n Dónde p = x/n, n tamaño muestral, x es el número observado de éxitos, y q = 1 - p. Este intervalo se puede emplear siempre que n.p ≥ 5 y n.q ≥ 5. Ejemplo: El gerente financiero de una gran cadena de tiendas seleccionó una muestra aleatoria de 200 de sus clientes que utilizan tarjetas de crédito, y encontró que 136 habían incurrido en cargos por intereses durante el año anterior debido a falta de pago de sus saldos. " id="pdf-obj-1-16" src="pdf-obj-1-16.jpg">

P(z 1 ≤ z ≤ z 2 ) = φ(z)

Tener en cuenta que los valores para:

φ(z) = P(z ≤ z 1 )

b)

n = 40 Con el valor de z obtenido de tablas:

P(x ≥ 52) = P(z ≥ 8,4327) = 0
P(x ≥ 52) =
P(z ≥ 8,4327) = 0

INTERVALO DE CONFIANZA

1) Para la media μ de una población normal:

L i/s = x ± z α/2 .σ/√n

Tener en cuenta que una confianza del 95% significa:

α/2 = 0,95 p = 1 - q p = x/n

2) Para la media X :

L i/s = x ± t (n - 1)(1 - α/2) .S/n

t( α,v) se busca en tabla

3) Para la varianza S²:

P(x ≥ 52) = P(z ≥ 4) = 0 Con el valor de z obtenido detablas : P(x ≤ x ≤ x ) = P(z ≤ z ≤ z ) = φ(z) Tener en cuenta que los valores para: φ(z) = P(z ≤ z ) b) n = 40 Con el valor de z obtenido de tablas : P(x ≥ 52) = P(z ≥ 8,4327) = 0 INTERVALO DE CONFIANZA 1) Para la media μ de una población normal: L = x ± z .σ/√n Tener en cuenta que una confianza del 95% significa: α/2 = 0,95 p = 1 - q p = x/n 2) Para la media X : i/s (n - 1)(1 - α/2) t( se busca en tabla 3) Para la varianza S²: X² se busca en tabla 4) Para el desvío estándar S: 5) Para muestras grandes: Un intervalo de confianza 100(1 - α)% para la proporción p de una población, de muestras grandes, es: p ± z √p.q/n Dónde p = x/n, n tamaño muestral, x es el número observado de éxitos, y q = 1 - p. Este intervalo se puede emplear siempre que n.p ≥ 5 y n.q ≥ 5. Ejemplo: El gerente financiero de una gran cadena de tiendas seleccionó una muestra aleatoria de 200 de sus clientes que utilizan tarjetas de crédito, y encontró que 136 habían incurrido en cargos por intereses durante el año anterior debido a falta de pago de sus saldos. " id="pdf-obj-1-68" src="pdf-obj-1-68.jpg">

(α,v) se busca en tabla

4) Para el desvío estándar S:

P(x ≥ 52) = P(z ≥ 4) = 0 Con el valor de z obtenido detablas : P(x ≤ x ≤ x ) = P(z ≤ z ≤ z ) = φ(z) Tener en cuenta que los valores para: φ(z) = P(z ≤ z ) b) n = 40 Con el valor de z obtenido de tablas : P(x ≥ 52) = P(z ≥ 8,4327) = 0 INTERVALO DE CONFIANZA 1) Para la media μ de una población normal: L = x ± z .σ/√n Tener en cuenta que una confianza del 95% significa: α/2 = 0,95 p = 1 - q p = x/n 2) Para la media X : i/s (n - 1)(1 - α/2) t( se busca en tabla 3) Para la varianza S²: X² se busca en tabla 4) Para el desvío estándar S: 5) Para muestras grandes: Un intervalo de confianza 100(1 - α)% para la proporción p de una población, de muestras grandes, es: p ± z √p.q/n Dónde p = x/n, n tamaño muestral, x es el número observado de éxitos, y q = 1 - p. Este intervalo se puede emplear siempre que n.p ≥ 5 y n.q ≥ 5. Ejemplo: El gerente financiero de una gran cadena de tiendas seleccionó una muestra aleatoria de 200 de sus clientes que utilizan tarjetas de crédito, y encontró que 136 habían incurrido en cargos por intereses durante el año anterior debido a falta de pago de sus saldos. " id="pdf-obj-1-76" src="pdf-obj-1-76.jpg">

5) Para muestras grandes:

Un intervalo de confianza 100(1 - α)% para la proporción p de una población, de muestras grandes, es:

p ± z α/2 √p.q/n

Dónde p = x/n, n tamaño muestral, x es el número observado de éxitos, y q = 1 - p. Este intervalo se puede emplear siempre que n.p ≥ 5 y n.q ≥ 5. Ejemplo:

El gerente financiero de una gran cadena de tiendas seleccionó una muestra aleatoria de 200 de sus clientes que utilizan tarjetas de crédito, y encontró que 136 habían incurrido en cargos por intereses durante el año anterior debido a falta de pago de sus saldos.

a)

Calcule un intervalo de confianza de 95% para la verdadera proporción de clientes que utilizan tarjetas de crédito, quienes han

incurrido en cargos por intereses durante el año anterior.

b)

Si la longitud deseada del intervalo de 90% es 0,05, ¿qué tamaño muestral es necesario para asegurar esto?

c)

Calcule el intervalo de confianza de 82% para la verdadera proporción.

n = 200

x = 136

a)

Para 1 - α/2 = 0,95

p = x/n p = 136/200 = 0,68

q

p = 1 - q

q = 1 - p

= 1 - 0,68 = 0,32

L i/s = p ± z (1 - α/2) .√p.q/n

L i/s = 0,68 ± z ( 0,95) .√0,68.0,32/200 De tabla z (0,95) = 1,645 L i/s = 0,68 ± 1,645.0,33 L i/s = 0,68 ± 0,054

(0,626; 0,734)

b)

n

=

[z (1 - α/2) ².p.q]/L ²

n = 1,645 ².0,5.0,5/(0,25 ²) Sin sondeo previo tomar p = q = 0,5

n = 10,82 clientes

  • c) Para el 82%

L i/s = p ± z (1 - α/2) .√p.q/n

α = 0,82

1

- α = 0,18

α/2 = 0,09

1

- α/2 = 0,91

De tabla e interpolando z (1 - α/2) = 1,3425

L i/s = 0,68 ± z (0,91) .√0,68.0,32/200 De tabla z (0,91) = 1,645 L i/s = 0,68 ± 1,3425.0,33 L i/s = 0,68 ± 0,0443

Contenido

Apunte de Probabilidades y estadísticas: Variable aleatoria discreta. Variable aleatoria continua. Esperanza. Variancia de una variable aleatoria. Teorema de Bayes.

VARIABLE ALEATORIA

Dado un experimento aleatorio y su correspondiente espacio muestral se denomina variable aleatoria a la función que asigna a cada elemento del espacio muestral un número real.

X: S

R/X(s) x

Ejemplo: Si se define la variable aleatoria X = número de caras obtenidas al arrojar dos monedas

¿Quá valores puede tomar x? X(SS) = 0 X(CS) = X(SC) = 1 X(CC) = 2

¿Quá valores puede tomar x? X(SS) = 0 X(CS) = X(SC) = 1 X(CC) = 2 Se denomina recorrido Rx al conjunto de valores que puede tomar la variable.

VARIABLE ALEATORIA DISCRETA

Una variable aleatoria es discreta cuando toma un número contable de valores.Entonces entre dos valores consecutivos de una variable aleatoria discreta no hay ningún número que pertenezca al recorrido de la variable

Rx = {X1;X2;

...

,Xn,

...

}

donde cada Xi es un valor de la v.a.

En general , estos valores no serán igualmente probables, sino que cada X tendrá asignada una probabilidad.

Luego, para caracterizar una variable aleatoria discreta es necesario conocer su recorrido y la probabilidad de cada elemento del recorrido

Sigamos con el ejemplo X = Cantidad de caras al tirar dos monedas P(X = 0) = P(SS) = ¼ P(X = 1) = P(SC;CS) = ½ P(X = 2) = P(CC) = ¼

Función de distribución de probanilidad

¿Quá valores puede tomar x? X(SS) = 0 X(CS) = X(SC) = 1 X(CC) = 2
Propiedades 1) P(X i ) ≥ 0 X i 2)
Propiedades
1) P(X i ) ≥ 0
X i
2)

P(x i ) = 1

VARIABLE ALEATORIA CONTINUA

Una variable es continua en un intervalo cuando puede tomar cualquier valor perteneciente al intervalo.

En general definiremos variables aleatorias continuas cuando las experiencias consistan en medir peso, altura, longitud, tiempo, temperatura, etc.

En este caso se define (en lugar de la función de distribución) una función de densidad de probabilidad que tiene las siguientes propiedades

1) f(x) ≥ 0 2) X ε R f(x).dx = 1 3) a < b P(a
1) f(x) ≥ 0
2)
X ε R
f(x).dx = 1
3) a < b
P(a ≤ x ≤ b) =

f(x).dx

ESPERANZA DE UNA VARIABLE ALEATORIA

La esperanza es un parámetro de la distribución. Es una medida de tendencia central. Si X es discreta:

μ = E(X) = Si X es continua
μ = E(X) =
Si X es continua

x i .p(x i )

μ = E(X) = ∫x.f(x).dx

La esperanza E(x) no es un resultado que esperararíamos cuando X se observa sólo una vez.

Pero si observáramos un gran número de observaciones independientes de X el promedio de esos resultados estará cerca de E(x).

Ejemplo:

En una operación comercial se puede obtener una utilidad de $1000 o sufrir una pérdida de $500. Si la probabilidad de una utilidad es de 0,6, demuestre que la utilidad esperada en dicha operación es de $400.

Primero definimos la variable aleatoria X = utilidad en operación comercial

μ = E(X) = x i .p(x i ) E(X) = 1000*0,6+(-500)*0,4 E(X) = 400
μ = E(X) =
x i .p(x i )
E(X) = 1000*0,6+(-500)*0,4
E(X) = 400

PROPIEDADES DE LA ESPERANZA

Sean X e Y variables aleatorias y c una constante perteneciente a los reales:

1) E (c ) = c 2) E (X+c ) = E(X) + c 3) E (cX) = c E(X) 4) E (X+Y) = E(X) + E(Y) 5) E (X-Y) = E(X) - E(Y) 6) Si X e Y son independientes E (XY) = E(X) * E(Y)

VARIANCIA DE UNA VARIABLE ALEATORIA

La variancia es un parámetro de la distribución. Es una medida de dispersión de los valores de x alrededor de E(X)

Var(X) = σ² = E(X - μ)² Var(X) = σ² = E(X² - [E(X)]²) PROPIEDADES DE LA VARIANCIA

Sean X e Y variables aleatorias y c una constante perteneciente a los reales:

1) V (c ) = 0 2) V (X + c ) = V(X) 3) V (cX) = c2 V(X) 4) Si X e Y son independientes V (X + Y) = V(X) + V(Y) 5) Si X e Y son independientes V (X - Y) = V(X) + V(Y)

TEOREMA DE Bayes

1) f(x) ≥ 0 2) X ε R f(x).dx = 1 3) a < b P(a

REPASANDO CONCEPTOS DE CONTEO

Permutaciones: Algunos arreglos de r objetos seleccionados de n posibles objetos.

n.P r = n! / (n - r)

Nota: El orden de los arreglos es importante en las permutaciones.

Combinaciones: El número de formas de elegir r objetos de un grupo de n objetos sin considerar el orden.

n.C r = n! / r!.(n - r)

Distribuciones Discretas y Continuas

La Distribución Binomial

Binomial y Normal

Llamaremos experimento dicotómico a un experimento aleatorio cuyos resultados posibles son sólo dos, o nos interesa considerarlos como dos. Por ejemplo:

1) Lanzar una moneda y observar si sale cara o cruz.

2) Sacar una carta de una baraja y observar si es una figura o no lo es.

3) Elegir una ficha de un dominó y observar si el total de sus puntos es un número par o impar.

En este tipo de experiencias a uno de los dos resultados posibles se le suele llamar "éxito" y a su contrario "fracaso". A la probabilidad del suceso llamado éxito se la suele representar por p y a la de su contrario por q. Se verifica, claro está, quep+q = 1 (¿Por qué?) . En los ejemplos anteriores podríamos considerar:

1) éxito = "cara", fracaso = "cruz" y, si la moneda no está trucada, p = q = 1/2.

2) éxito = "figura", fracaso = "no figura" y, en una baraja española, p = 12/40 y q = 28/40.

3) éxito = "suma par", fracaso = "suma impar" ¿Cuánto valdrían p y q?

Un experimento binomial consiste en repetir una cierta cantidad de veces, y siempre en las mismas condiciones, un experimento dicotómico. Llamaremos "tirada" a cada una de las veces que repetimos el experimento dicotómico. Por ejemplo, son experimento binomiales:

1) Lanzar una misma moneda repetidas veces y observar el número de caras (éxitos) obtenidas.

2) Sacar, con reemplazamiento, varias cartas de una misma baraja y observar el número de figuras (éxitos) obtenidas.

3) Extraer, con reemplazamiento, varias fichas de un dominó y observar la cantidad de veces que obtenemos una en la que el número total de puntos que aparece es par.

Vamos a representar por B(n,p) a una binomial con n tiradas y probabilidad de éxito igual a p.

Puede interesar conocer cual es la probabilidad que de las n pruebas, salgan exactamente x0 casos favorables a A; o bien calcular la probabilidad que los casos A sean entre x1 y x2, ambos menores que n. Conceptualmente puede decirse que x es una variable aleatoria discreta que toma valores entre 0 (puede no aparecer nunca el suceso) y n (puede aparecer siempre) . Es decir que el campo de definición de la variable es: 0 ≤ x ≤ n.

Bajo estas condiciones Bernoulli desarrolló la distribución de probabilidad denominada Binomial, cuya expresión matemática, P(x) , está dada por:

Donde:

P(x) = C n,x .p x .q n - x

x es la variable aleatoria que varía entre 0 y n. n y p son los datos o parámetros (*) de la distribución Binomial.

(Número combinatorio)

Ejemplo de Binomial

C n,x

=

n! n!.(n - x) !

De los pinos integrantes de un extenso bosque, un 20 % se encuentra afectado por un hongo parásito. Si se seleccionan al azar 4 pinos, calcular la probabilidad que los afectados por el hongo sean:

  • a) Exactamente 2

  • b) Más de uno

Respuesta:

Análisis de las características del problema:

Se realizan 4 observaciones al azar (n = 4 es un dato)

Ante cada observación, los pinos pueden estar A = afectado (por el hongo) ; = no afectado. Es decir dos resultados posibles en cada prueba.

No se tienen elementos para decir que la probabilidad de que cada pino observado varíe de uno a otro, es decir: p = 0,2 probabilidad de que cada uno de los pinos esté afectado. Será entonces: q = 0,8 probabilidad de pino no afectado.

Las preguntas planteadas se refieren a la cantidad de pinos que resultarán estar afectados (x = variable).

Se dan exactamente las condiciones exigidas para utilizar la Distribución Binomial, y para calcular la probabilidades pedidas, es posible aplicar su función.

  • a) P(x = 2) = C 4,2 .0,2².0,8 (4 - 2) = 6.0,04.0,64 = 0,1536

  • b) P(x>1) = ∑ C 4,x .0,2 x .0,8 4 - x

Sumatoria desde x = 2 hasta 4. P(x>1) = 0,1536 + 4.0,008.0,8 + 1.0,0016.1 = 0,1536 + 0,0256 + 0,0016 = 0,1808 También se podría haber calculado como: 1 - P(x < 2).

La Distribución Normal

A lo largo de la historia, matemáticos como De Moivre, Gauss o Galton se sorprendieron por la frecuencia con la que aparece la llamada curva Normal o de Gauss en estudios estadísticos tan aparentemente distintos como la distribución de alturas de un grupo de personas, la resistencia de un tipo determinado de piezas, el número total de caras que obtenemos al lanzar reiteradamente una moneda, y muchos otros.

La curva normal, como cualquier otra curva de probabilidad, verifica que:

el área total que limita con el eje de abscisas es igual a 1.

la probabilidad de la variable X tome valores entre a y b coincide con el área limitada por la curva, el eje OX y las rectas x = a y x = b.

la probabilidad de que X tome un valor concreto es igual a 0. ¿Por qué?

No existe una única curva normal; su gráfica, como vas a observar en la siguiente escena, depende de su media, y de su desviación típica.

Normal

Distribuciones de probabilidad normales

La distribución de probabilidad normal (D.P.N.) se considera como la distribución de probabilidad más importante. Hay una cantidad ilimitada de variables aleatorias continuas que tienen una distribución normal o aproximadamente normal. La D.P.N. tiene una variable aleatoria continua y usa dos funciones: una para determinar las ordenadas (valores de y) de la gráfica que representa la distribución, y otra para determinar probabilidades. La siguiente fórmula expresa la ordenada que corresponde a cada abscisa y de denomina función de distribución de probabilidad normal:

Las preguntas planteadas se refieren a la cantidad de pinos que resultarán estar afectados (x =

para toda x real.

Cuando se traza una gráfica de tales puntos, aparece la curva normal (en forma de campana) como se muestra en el siguiente gráfico:

Las preguntas planteadas se refieren a la cantidad de pinos que resultarán estar afectados (x =

La probabilidad asociada con el intervalo a ≤ x ≤ b está dada por:

P(a ≤ x ≤ b) = f(x).dx
P(a ≤ x ≤ b) =
f(x).dx

La Distribución Normal Estandard

Hay un número ilimitado de distribuciones de probabilidad normal, aunque afortunadamente todas están relacionadas con una distribución, la distribución normal Estandard.

Propiedades de la Distribución Normal Standard

El área total bajo la curva normal es igual a 1.

La distribución tiene forma de campana y es simétrica; se extiende en ambas direcciones y el eje x es su asíntota.

Tiene media igual a 0 y desviación standard igual a 1.

La media divide el área en dos mitades.

Casi toda el área está entre z = -3 y z = +3.

Ejemplo:

En una granja modelo de la Provincia de Entre Ríos, en un momento determinado de su desarrollo, los cerdos que producen tienen en cuanto a su peso, una distribución Normal con un promedio de 75 kg. y un desvío estándar de 6 kg.

Es decir: x ~ N (75 , 6) a variable Normal Estándar será: z = (x - μ)/σ = (x - 75)/6 Donde: z ~ N (0,1)

Con esa información calcular:

P(μ - k σ < x < μ + k.σ) = P(- k.σ < x - μ < k.σ) = P(- k < (x - μ)/σ < k) = Dándole valores a k se tiene:

Para k = 1 P(|z| < 1) = P(-1 < z < 1) = F(1) - F(-1) = 0.84134 - 0.15866 = 0,68268 El 68 % de los cerdos tendrán pesos comprendidos entre un desvío estándar en más y en menos de la media (es decir entre 69 y 81 kg.) (μ ±σ) Para k = 2 P(|z| < 2) = P(-2 < z < 2) = F(2) - F(-2) = 0.97725 - 0.02275 = 0,9545 El 95 % de los cerdos tendrán pesos comprendidos entre dos desvíos estándar en más y en menos de la media (es decir entre 63 y 87 kg.) (μ ± 2.σ) Para k = 3 P(|z| < 3) = P(-3 < z < 3) = F(3) - F(-3) = 0.99865 - 0.00135 = 0,9973 Casi el 100% (99.73%) de los cerdos tendrán pesos entre tres desvíos estándar en más y en menos de la media (es decir 57 y 93 kg.) (μ ± 3.σ)

b)

P(x > 72) = P (z > (x - 75) /6 = -0.50) = 1 - F(-0.50) = 1 - 0.19146 = 0,80854

El 81 % de los cerdos tendrán pesos superiores a 72 kg.

c)

P (69 < x < 87) = P (-1 < z < 2) = F(2) - F(-1) = 0.97725 - 0.15866 = 0,81859

El 82 % de los cerdos tendrán pesos comprendidos entre 69 y 87 kg.

d)

De 20 cerdos elegidos aleatoriamente, ¿cuántos se esperan que pesen más de 81 kg.? = 20.

P(x > 81) = 20 . P (z > 1) = 20.[1 - F(1)] = 20.(1 - 0,84134) = 20.0,15866 = 3,1732 cerdos Se espera que tres (o cuatro) cerdos tengan pesos superiores a 81 kg.

e)

¿Cuál es el peso que es superado por el 10 % de los cerdos?: Con las Tablas que se dispone para este Curso, se tienen

algunos valores:

P (x > x 0 ) = ~ 0,10

P (z > z 0 ) = ~ 0,10

z 0 = 1,28;

o bien P (z ≤ z 0 ) = ~ 1 - 0,10

F (z 0 ) = ~ 0,90 no disponible en las Tablas.

Si z = (x - μ) /σ

x = z . σ + μ;

y para x 0 será:

x 0 = 1,28 . 6 + 75 = 82,68 kg.

El peso de los cerdos que es superado por el 10 % de ellos es 82,68 kg.

f)

Determinar el valor de peso que supera al 5 % de los cerdos:

P (x < x 0 ) = P (z < z 0 ) = 0,05; de donde surge que z 0 es un valor negativo y simétrico a:

P (z > z 0 ´) = 0,05;

z 0 ´ = 1,645 y será:

z 0 = - 1,645

x 0 = - 1,645.6 + 75 = 65,03 kg.

Análisis de Regresión y Correlación Introducción

Muchas veces las decisiones se basan en la relación entre dos o más variables.Ejemplos Dosis de fertilizantes aplicadas y rendimiento del cultivo.

La relación entre la radiación que reciben los sensores con la que se predicen los rendimientos por parcelas con los rendimientos reales observados en dichas parcelas.

Relación entre tamaño de un lote de producción y horas -hombres utilizadas para realizarlo. Distinguiremos entre relaciones funcionales y relaciones estadísticas

Relación funcional entre dos variables

Una relación funcional se expresa mediante

una función matemática.

Si X es la variable independiente e Y es la variable dependiente, una relación funcional tiene la forma:

Y=f(X)

Ejemplo 1

Parcela

Dosis

Rendimiento(kg/h)

1

75

150

2

25

50

3

130

260

Figura 1

 

Relación funcional perfecta entre dosis y rendimientos

Ejemplo 1 Parcela Dosis Rendimiento(kg/h) 1 75 150 2 25 50 3 130 260 Figura 1

Nota: Las observaciones caen exactamente sobre la línea de relación funcional

Relación estadística entre dos variables

 

A diferencia de la relación funcional, no es una relación perfecta, las observaciones no caen exactamente sobre la curva de relación entre las variables

Ejemplo 2

Lote de productos

Tamaño del lote

Horas hombre

1

30

73

2

20

50

3

60

128

4

80

170

5

40

87

Figura 2

Relación estadística entre tamaño del lote y horas hombre

z = - 1,645 x = - 1,645.6 + 75 = 65,03 kg. Análisis de Regresión

Nota: La mayor parte de los punto no caen directamente sobre la línea de relación estadística. Esta dispersión de punto alrededor de la línea representa la variación aleatoria

Figura 3

Coordenadas de puntos de control utilizados para corregir la columna de los niveles digitales de una imagen satelital

Nota : La mayor parte de los punto no caen directamente sobre la línea de relación

Nota: se trata de un terreno rugoso donde varían notablemente las condiciones de observación del sensor, para corregir errores geométricos de la imagen, se aplican funciones de segundo grado. Los datos sugieren que la relación estadística es de tipo curvilínea.

Conceptos básicos

Análisis de Regresión: Es un procedimiento estadístico que estudia la relación funcional entre variables.Con el objeto de predecir una en función de la/s otra/s. Análisis de Correlación: Un grupo de técnicas estadísticas usadas para medir la intensidad de la relación entre dos variables Diagrama de Dispersión: Es un gráfico que muestra la intensidad y el sentido de la relación entre dos variables de interés. Variable dependiente (respuesta, predicha, endógena): es la variable que se desea predecir o estimar Variables independientes (predictoras, explicativas exógenas). Son las variables que proveen las bases para estimar. Regresión simple: interviene una sola variable independiente Regresión múltiple: intervienen dos o más variables independientes. Regresión lineal: la función es una combinación lineal de los parámetros. Regresión no lineal: la función que relaciona los parámetros no es una combinación lineal

Gráfico de dispersión

Los diagramas de dispersión no sólo muestran la relación existente entre variables, sino también resaltan las observaciones individuales que se desvían de la relación general. Estas observaciones son conocidas como outliers o valores inusitados, que son puntos de los datos que aparecen separados del resto.

Gráfico de dispersión entre Bandas

Nota : La mayor parte de los punto no caen directamente sobre la línea de relación

Coeficiente de correlación lineal

El Coeficiente de Correlación (r) requiere variables medidas en escala de intervalos o de proporciones

  • - Varía entre -1 y 1.

  • - Valores de -1 ó 1 indican correlación perfecta.

  • - Valor igual a 0 indica ausencia de correlación.

  • - Valores negativos indican una relación lineal inversa y valores positivos indican una relación lineal directa

Correlación Negativa Perfecta

Correlación Negativa Perfecta Correlación Positiva Perfecta Ausencia de Correlación

Correlación Positiva Perfecta

Correlación Negativa Perfecta Correlación Positiva Perfecta Ausencia de Correlación

Ausencia de Correlación

Correlación Negativa Perfecta Correlación Positiva Perfecta Ausencia de Correlación

Correlación Fuerte y Positiva

Correlación Fuerte y Positiva Fórmula para el coeficente de correlación (r) Pearson Modelos de Regresión Un

Fórmula para el coeficente de correlación (r) Pearson

Correlación Fuerte y Positiva Fórmula para el coeficente de correlación (r) Pearson Modelos de Regresión Un

Modelos de Regresión

Un modelo de regresión, es una manera de expresar dos ingredientes esenciales de una relación estadística:

  • - Una tendencia de la variable dependiente Y a variar conjuntamente con la variación de la o las X de una manera sistemática

  • - Una dispersión de las observaciones alrededor de la curva de relación estadística Estas dos características están implícitas en un modelo de regresión, postulando que:

    • - En la población de observaciones asociadas con el proceso que fue muestreado, hay una distribución de probabilidades de Y para cada nivel de X.

    • - Las medias de estas distribuciones varían de manera sistemática al variar X.

Representación gráfica del modelo de Regresión Lineal

Correlación Fuerte y Positiva Fórmula para el coeficente de correlación (r) Pearson Modelos de Regresión Un

Análisis de Regresión

Objetivo: determinar la ecuación de regresión para predecir los valores de la variable dependiente (Y) en base a la o las variables independientes (X).

Procedimiento: seleccionar una muestra a partir de la población, listar pares de datos para cada observación; dibujar un diagrama de puntos para dar una imagen visual de la relación; determinar la ecuación de regresión.

Supuestos de Regresión Lineal Clásica

Cada error está normalmente distribuido con:

  • - Esperanza de los errores igual a 0

  • - Variancia de los errores igual a una constante σ².

  • - Covariancia de los errores nulas para todo i ≠ Ψ

Proceso de estimación de la regresión lineal simple

Modelo de regresión

Datos de la muestra

y = β 0 + β 1 x + ε

 

x

y

Ecuación de regresión

x

1

y 1

E(y) = β 0 + β 1 x

x

2

y 2

Parámetros desconocidos

 
 

.

.

β 0 1

 
 

.

.

.

.

x

n

y n

b 0 y b 1

Ecuación estimada de regresión

proporcionan estimados

y = b 0 +b 1 x

β 0 y β 1

Estadísticos de la muestra

 

b 0 .b 1

Líneas posibles de regresión en la regresión lineal simple

Sección A

Relación lineal positiva

Análisis de Regresión • Objetivo: determinar la ecuación de regresión para predecir los valores de la

Sección C

No hay relación

Análisis de Regresión • Objetivo: determinar la ecuación de regresión para predecir los valores de la

Sección B

Relación lineal negativa

Sección B Relación lineal negativa Estimación de la ecuación de Regresión Simple Y´ = a +

Estimación de la ecuación de Regresión Simple

Y´ = a + b.X, donde:

  • - es el valor estimado de Y para distintos X.

  • - a es la intersección o el valor estimado de Y cuando X=0

  • - b es la pendiente de la línea, o el cambio promedio de para cada cambio en una unidad de X

  • - el principio de mínimos cuadrados es usado para obtener a y b:

Sección B Relación lineal negativa Estimación de la ecuación de Regresión Simple Y´ = a +

a = (∑Y)/n - b.(∑X)/n

Mínimos cuadrados - Supuestos

El modelo de regresión es lineal en los parámetros. Los valores de X son fijos en muestreo repetido. El valor medio de la perturbación εi es igual a cero. Homocedasticidad o igual variancia de ε i .

No autocorrelación entre las perturbaciones. La covariancia entre ε i y X i es cero.

El número de observaciones n debe ser mayor que el número de parámetros a estimar. Variabilidad en los valores de X. El modelo de regresión está correctamente especificado. No hay relaciones lineales perfectas entre las explicativas.

Estimación de la variancia de los términos del error (σ²)

Debe ser estimada por varios motivos Para tener una indicación de la variabilidad de las distribuciones de probabilidad de Y. Para realizar inferencias con respecto a la función de regresión y la predicción de Y.

La lógica del desarrollo de un estimador de σ² para el modelo de regresión es la misma que cuando se muestrea una sola población

La variancia de cada observación Yi es σ²,la misma que la de cada término del error

Dado que los Y i provienen de diferentes distribuciones de probabilidades con medias diferentes que dependen del nivel de X, la desviación de una observación Y i debe ser calculada con respecto a su propia media estimada Y i .

Y i - Ŷ i = e i

Por tanto, las desviaciones son los residuales Y la suma de cuadrados es:

Sección B Relación lineal negativa Estimación de la ecuación de Regresión Simple Y´ = a +

La suma de cuadrados del error, tiene n-2 grados de libertad asociados con ella, ya que se tuvieron que estimar dos parámetros. Por lo tanto, las desviaciones al cuadrado dividido por los grados de libertad, se denomina cuadrados medios

Sección B Relación lineal negativa Estimación de la ecuación de Regresión Simple Y´ = a +

Donde CM es el Cuadrado medio del error o cuadrado medio residual. Es un estimador insesgado de σ²

Análisis de Variancia en el análisis de regresión

El enfoque desde el análisis de variancia se basa en la partición de sumas de cuadrados y grados de libertad asociados con la variable respuesta Y.

La variación de los Y i se mide convencionalmente en términos de las desviaciones

(Y i - Y i )

La medida de la variación total SC tot , es la suma de las desviaciones al cuadrado

(Y i - Y i )² Desarrollo formal de la partición

Consideremos la desviación

(Y i - Y i )

Podemos descomponerla en

(Y i - Y)

=

i - Y)

+

(Y i - Ŷ i )

T

R

E

(T):

desviación total

(R): es la desviación del valor ajustado por la regresión con respecto a la media general

(E):

es la desviación de la observación con respecto a la línea de regresión

Si consideremos todas las observaciones y elevamos al cuadrado para que los desvíos no se anulen

(Y i - Y)² = i - Y)² + (Y i - Ŷ i

SC tot

SC reg

SCer

(SC tot ): Suma de cuadrados total (SC reg ): Suma de cuadrados de la regresión

(SCer): Suma de cuadrados del error Dividiendo por los grados de libertad, (n-1), (k) y (n-2), respectivamente cada suma de cuadrados, se obtienen los cuadrados medios del análisis de variancia.

Coeficiente de Determinación

Coeficiente de Determinación, R2 - es la proporción de la variación total en la variable dependiente Y que es explicada o contabilizada por la variación en la variable independiente X.

- El coeficiente de determinación es el cuadrado del coeficiente de correlación, y varia entre 0 y 1.

Cálculo del R² a través de la siguiente fórmula R² = [∑(Ŷ c - Y)²]/[∑(Ŷ o - Y)²]

Inferencia en Regresión

Los supuestos que establecimos sobre los errores nos permiten hacer inferencia sobre los parámetros de regresión (prueba de hipótesis e intervalos de confianza), ya que los estimadores de β 0 y β 1 pueden cambiar su valor si cambia la muestra.

Por lo tanto debemos conocer la distribución de los estimadores para poder realizar prueba de hipótesis e intervalos de confianza

Ejemplo

Se desean comparar los rendimientos predichos a partir de la información obtenida por 3 sensores sobre los rendimientos reales por parcelas de lotes de maíz. Los rendimientos (Y) y el los rindes predichos de 4 sensores se presentan a continuación

¿Qué sensor refleja mejor el rendimiento de esa zona? Descripción Gráfica y cuantitativa de la relación

¿Qué sensor refleja mejor el rendimiento de esa zona?

Descripción Gráfica y cuantitativa de la relación entre cada sensor y el rendimiento

¿Qué sensor refleja mejor el rendimiento de esa zona? Descripción Gráfica y cuantitativa de la relación

Y = 338.71*X - 4.87 R² = 0.32

¿Qué sensor refleja mejor el rendimiento de esa zona? Descripción Gráfica y cuantitativa de la relación

Y = 155.37*X - 13.25 R² = 0.57

Y = -1004.34*X +112.24 R² = 0.44 CALCULO DE PROBABILIDADES • La expansión del cultivo de

Y = -1004.34*X +112.24 R² = 0.44

CALCULO DE PROBABILIDADES

La expansión del cultivo de soja en la Argentina es objeto de una fuerte controversia entre quienes aprecian las ventajas económicas actuales de dicha expansión y quienes alertan sobre problemas de contaminación ambiental, de empobrecimiento cultural y de fragilidad de la economía asociados con ella. En parte, los problemas mencionados son característicos delmonocultivo y ya han ocurrido en regiones donde el cultivo hegemónico era otro.

Nuestro problema será encontrar una manera para evaluar en qué medida la adopción del cultivo de soja está asociada con la práctica del monocultivo a partir de los datos de una encuesta en la cual se registran los cultivos realizados en los diferentes establecimientos agrícolas de un área determinada. Para ello utilizaremos las herramientas conceptuales y metodológicas que la estadística provee para realizar una evaluación de este tipo.

Problema (datos ficticios)

En un estudio de la actividad agrícola en un partido de la Pampa Ondulada se registraron los cultivos estivales de cosecha realizados en la última campaña en 100 establecimientos elegidos al azar dentro del partido. La planilla que llevaban los encuestadores permitía registrar las siguientes opciones: Maíz, Girasol, Sorgo, Soja, Cártamo. Entre los resultados de la encuesta se encontró que en 90 de los 100 establecimientos relevados se había cultivado soja y que, en 40 de ellos, la soja era el único cultivo estival; además, 2 establecimientos realizaron otro tipo de monocultura (datos ficticios).

Identificar la población bajo estudio.

Identificar la muestra.

Detallar las 31 diferentes posibilidades para la lista de los cultivos realizados en un establecimiento (los 31 eventos simples que componen el espacio muestral).

Indicar cuáles eventos simples componen los siguientes eventos compuestos:

"en el establecimiento se cultivó soja"

"en el establecimiento de cultivó maíz y girasol"

"el establecimiento realizó un único cultivo estival"

"en el establecimiento se realizaron más de 3 cultivos diferentes"

DEFINICIONES

Probabilidad: Es un valor comprendido entre 0 y 1, incluidos estos dos valores, que describe la posibilidad de ocurrencia de un evento.

Experimento: Cualquier proceso que produce un resultado.

Determinístico: Ante la repetición del mismo se obtiene siempre el mismo resultado.

Aleatorio: Repitiendo el experimento en idénticas condiciones se obtienen distintos resultados.

Punto muestral ó Resultado: Es un resultado particular de un experimento.

Evento: Es una colección de uno o mas resultados de un experimento.

DEFINICIONES EVENTO O SUCESO ALEATORIO

Evento o Suceso Aleatorio: Es una colección de uno o mas resultados de un experimento.

E1 = Sacar un 5 al tirar un dado

E2 = Sacar un número par al tirar un dado.

E3 = Sacar un número menor que 7 al tirar un dado = EVENTO CIERTO

E4 = Sacar un número mayor que 6 al tirar un dado = EVENTO IMPOSIBLE

DEFINICIONES SUCESOS COMPUESTOS

Sucesos mutuamente excluyentes:

Dos sucesos A y B son mutuamente excluyentes cuando la ocurrencia de uno de ellos impide la ocurrencia del otro.

P(A

B) = P(AyB) = P(AB) = 0

Sucesos colectivamente exhaustivos

Dos sucesos A y B son colectivamente exhaustivos cuando al menos uno de ellos deba ocurrir siempre que se realiza el experimento.

Dicho en otras palabras, deberá cumplirse que la suma de las probabilidades de todos los sucesos deberá ser igual a 1.

DEFINICIONES ESPACIO MUESTRAL

Espacio muestral: Es el conjunto de todos los posibles resultados de un experimento.

Suele representarse con la letra S. Puede visualizarse a través de

Listas

 

-

Conjunto de posibles resultados al tirar un dado = {1;2;3;4;5;6}

Diagramas de arbol

-

Conjunto de posibles resultados al tirar dos monedas

 

C

C á

S

C

S

á

 

S

 

Tablas rejilla

-

Conjunto de posibles resultados al tirar un dado rojo y uno azul

 

21

61

11

31

  • 2 41 51

6

12

  • 2 42 52 2

32

13

  • 23 43 53 63

33

14

  • 24 44 54 64

34

15

  • 25 45 55 65

35

16

2

36

46 56 6

6

6

Conjuntos (Diagramas de Venn)

  • - Se pretende representar a las mujeres, a los universitarios pero es necesario tener en cuenta que existen mujeres universitarias.

• Tablas de doble entrada - Cuando se tienen dos o mas variables con dos o

Tablas de doble entrada

- Cuando se tienen dos o mas variables con dos o mas categorías cada una, por ejemplo hombres y mujeres, Ingenieros Agrónomos y Licenciados en Economía y Administración Agraria.

Ingenieros

Agrónomos

Licenciados en

Economía y

Administración

M

40

25

65

H

60

30

90

100

55

155

Recordemos cuales son los totales marginales y el gran total.

DEFINICIONES DE PROBABILIDAD

• Tablas de doble entrada - Cuando se tienen dos o mas variables con dos o

DEFINICION CLASICA

Se basa en que todos los resultados son

igualmente probables o equiprobables.

Mutuamente excluyentes

Colectivamente exhaustivos

Probabilidad de un evento =

Número de resultados favorables Número de resultados posibles

DEFINICION FRECUENCIAL

Cuando los resultados no son equiprobables la probabilidad de ocurrencia de un evento se determina por observación del número de veces que eventos similares ocurrieron en el pasado. (frecuencia relativa)

Probabilidad de un evento =

Número de veces que el evento ocurrió en el pasado

Número de observaciones

Ejemplo:

Sea el experimento de estudiar una droga que cura cierta enfermedad en vacunos enfermos. Se aplicó a 1000 vacunos y se curaron 700.

El espacio muestral será S = {curado; no curado}

Consideremos el evento de que el vacuno se cure.

Probabilidad de curado = 700/1000 = 0,7

DEFINICION SUBJETIVA

Cuando no se tienen datos para ningún tipo de cálculo, ni posibilidad de efectuar repetidamente el experimento, se recurre a un experto, quien de acuerdo a su buen saber y entender estimará la probabilidad.

Ejemplos:

Calcular la probabilidad de que un tenista gane un campeonato

Calcular la probabilidad de que un club de futbol salga campeón

Calcular la probabilidad de que el precio de las acciones de una compañía se incremente en dos años.

AXIOMAS DE PROBABILIDADES

Independientemente de que definición de probabilidad utilicemos, siempre se deberán cumplir los siguientes tres axiomas.

Axiomas:

Axioma 1: La probabilidad de un evento existe y es un número mayor o igual a cero 0 ≤ P(A)

Axioma 2: La probabilidad de todo el espacio muestral es 1. P(S) = 1

Axioma 3: Si dos eventos A y B son mutuamente excluyentes

P(A

B) = P(A) + P(B)

CONSECUENCIAS DE LOS AXIOMAS DE PROBABILIDADES

P(Φ) = 0 Si Ā = suceso complementario de A es decir Ā = S - A, será P(Ā) Si A1 A2, entonces P(A1) ≤ P(A2) " A se cumple que P(A) ≤ 1

= 1 - P(A)

REGLA GENERAL DE LA SUMA

Si A y B son dos sucesos no mutuamente excluyentes, luego la probabilidad de la unión entre ambos está dada por la siguiente fórmula.

P(A

B) = P(A) + P(B) - P(A

B)

     
 

A y B

B

 

A

   

Si A y B son dos sucesos mutuamente excluyentes, se cumple:

P(A

B) = P(A) + P(B)

Ejemplo:

Un experimento genera un espacio muestral que contiene ocho sucesos E1, definen así:

...

,E8

con p(Ei) = 1/8, i = 1,

...

,8.

Los sucesos A y B se

A = {E1,E4,E6} B = {E3,E4,E5,E6,E7} Encuentre:

 
(a) P(A) (b) P(Ā) (c) P(A B) a) P(A) = 3/8 (b) P(Ā) = 5/8 (c)
(a)
P(A)
(b)
P(Ā)
(c)
P(A
B)
a) P(A) = 3/8
(b)
P(Ā) = 5/8
(c)
P(A U B) = P(A) + P(B) - P(A
B)
P(A U B) = 3/8 + 5/8 - 2/8 = 6/8 = 0,75
resultado que es muy fácil verificar visualmente en el diagrama.
INDEPENDENCIA
• Dos eventos A y B son independientes cuando se cumple que la probabilidad conjunta es igual al producto de las
probabilidades marginales.
P(A
B) = P(A)*P(B)
PROBABILIDAD CONDICIONAL
• Probabilidad Condicional es la probabilidad de ocurrencia de un evento en particular, dado que otro evento ha ocurrido. La
probabilidad condicional de el evento A dado que el evento B ha ocurrido se escribe P(A|B).
REGLA GENERAL DEL PRODUCTO
• Dados dos eventos A y B la probabilidad conjunta de que ambos sucedan se calcula según la siguiente fórmula:
P(A
B) = P(A)*P(B|A) = P(B
A) = P(B)*P(A|B)
• Si los eventos A y B son independientes la probabilidad conjunta de que ambos sucedan se calcula según la siguiente fórmula:
P(A
B) = P(B
A) = P(A)*P(B) = P(B)*P(A)
Ejemplo:
Un experimento genera un espacio muestral que contiene ocho sucesos E1,
definen así:
...
,E8
con p(Ei) = 1/8, i = 1,
...
,8.
Los sucesos A y B se
A = {E1,E4,E6}
B = {E3,E4,E5,E6,E7}
Resolver:
(a)
¿Son los sucesos A y B mutuamente excluyentes? ¿Por qué?
(b)
¿Son los sucesos A y B independientes? ¿Por qué?
(c)
P(A B)
(d)
P(A/B)
(a) No, porque A B ≠ 0 (b) No, porque P(A)*P(B) ≠ P(A B) 3/8 *

(a)

No,

porque A

B ≠ 0

(b)

No, porque P(A)*P(B) ≠ P(A B)

3/8 * 5/8 ≠ 2/8

(c)

P(A

B) = 2/8 = 0,25

(d)

P(A/B) = P(A

B) / P(B) = (2/8) / (5/8) = 2/5

Esto puede verse en el diagrama, ya que saber que B ocurrió, reduce nuestro espacio muestral a los cinco elementos de B. Y de ellos, sólo dos pertenecen a A.

PROBLEMAS A RESOLVER

 

1) Dos candidatos a los consejos de administración A y B, compiten por el control de una corporación. Las probabilidades de ganar de estos candidatos son 0,7 y 0,3, respectivamente. Si gana A, la probabilidad de introducir un nuevo producto es 0,8; si gana B, la correspondiente probabilidad es 0,4. Demuestre que, antes de las elecciones, la probabilidad de que sea introducido un nuevo producto es 0,68.

Sugerencias: Recordar probabilidad condicional y probabilidad conjunta Considerar todo el espacio muestral Datos:

P(A) = 0,7 P(N/A) = 0,8 P(B) = 0,3 P(N/B) = 0,4

 
Solución: P(N) = P(N A) + P(N B)
Solución:
P(N) = P(N
A) + P(N
B)

P(N) = P(N/A)*P(A) + P(N/B)*P(B) P(N) = 0,8*0,7 + 0,4*0,3 = 0,68

2) El 34% de los árboles de un bosque tienen más de 15 años. El 54% son de la variedad A. De los de la variedad A, el 7% tiene más de 15 años. Si se elige un árbol al azar,

  • a) ¿Cuál es la probabilidad de que tenga más de 15 años y sea de la variedad A?

  • b) ¿Cuál es la probabilidad de que teniendo menos de 15 años, sea de la variedad A?

Sugerencias: Recordar probabilidad condicional y probabilidad conjunta Considerar tablas de contingencia

+15

-15

 

A

0,0378 0,5022 0,54

 

A

0,3022 0,1578 0,46

 

0,34

0,66

1

Solución:

 

a)

P(+15 A) = P(+15/A)*P(A) = 0,07*0,54 = 0,0378

b)

P(A/-15) =

P(A

-15) / P(-15) = 0,5022 / 0,66 = 0,76

3) El 70% del ganado es inyectado con una vacuna para combatir una enfermedad grave. La probabilidad de recuperarse de la enfermedad es 1 en 20 si no ha habido tratamiento y de 1 en 5 si hubo tratamiento. Si un animal infectada se recupera, ¿cuál es la probabilidad de que haya recibido la vacuna preventiva?

Sugerencias: Recordar probabilidad condicional y probabilidad conjunta Regla del producto. Datos:

P( I ) = 0,7 P( R / I ) = 0,2 P( Ī ) = 0,3 P( R / Ī ) = 0,05 Incógnita:

 

P( I /R )

+15 -15 A 0,0378 0,5022 0,54 A 0,3022 0,1578 0,46 0,34 0,66 1 Solución: a) P(+15