Documentos de Académico
Documentos de Profesional
Documentos de Cultura
No es difícil aceptar que todo proceso de la naturaleza está sujeto a cierta incertidumbre (o
variabilidad), por ejemplo: Es imposible predecir exactamente el crecimiento máximo de un rió
para prevenir una inundación. Esto se debe a que el crecimiento del mismo responde a diversos
(infinitos) factores, lluvias en la zona, temperatura ambiente, permeabilidad del suelo,
deforestaciones cercanas, etc. que producen lo que nosotros llamaremos variabilidad.
La estadística se ocupa de estudiar el comportamiento del fenómeno teniendo en cuenta su
variabilidad y lo hace extrayendo información de observaciones reales del fenómeno.
¿En qué área se necesita de la estadística?
Física: Para establecer una ley física se deben realizar experimentos
Medicina: La efectividad de una droga para tratar una cierta enfermedad varía de acuerdo a las
características físicas de cada persona, edad, peso, sexo, alimentación, actividades que realiza,
otras enfermedades, etc.
Área social: En un hospital público es necesario predecir la cantidad de pacientes, por día, que
tendrá, para calcular la cantidad de insumos necesarios.
Política: La cantidad de votos que un determinado candidato tendrá en la próxima elección.
Comercial: Un comerciante puede estar interesado en saber cuál será el volumen de ventas de
alimentos perecederos para el próximo mes, para no traer de más y tampoco que le falte
mercadería.
Una de las áreas que más ha experimentado el impacto del desarrollo de la estadística es la
ingeniería y la administración industrial.
La estadística es una herramienta que nos permite realizar diversas tareas como el cálculo de
la duración promedio de las interrupciones de una computadora; prever las averías de un taller y
diseñar un equipo de mantenimiento; la evaluación de la eficacia de productos comerciales;
predicción de la confiabilidad de un producto mediante la medición de la duración de sus
componentes; para la construcción de un puente de gran longitud, nos permite estimar cuál será el
viento máximo en los próximos años, etc.
Hoy en la industria se presta una extraordinaria atención a mejoramiento de calidad. Japón
experimentó un “milagro industrial” en la segunda mitad del siglo XX y gran parte de este éxito se
debe al uso de métodos estadísticos de control de calidad.
En esta materia se trata de dar las herramientas estadísticas básicas para presentar y describir
información, obtener conclusiones acerca de las poblaciones basándose en información de
muestras, cómo mejorar procesos y obtener pronósticos confiables sobre variables de interés. Esto
nos permitirá tomar decisiones más informadas y concientes.
1
2) La Estadística Descriptiva
- Condensación o resumen de datos para ser presentados en forma óptima
- Realización de gráficos y diagramas.
3) La Inferencia Estadística
- Se ocupa de la interpretación y generalización de la información obtenida a partir de los
datos
- Permite tomar decisiones con un cierto nivel de riesgo
- Permite realizar estimaciones y predicciones.
Observación: En esta materia no se estudiarán las técnicas para recolectar adecuadamente los
datos, si no que se parte de un conjunto de datos dado.
MANEJO DE DATOS
Lote de datos: Es una serie de mediciones de una o más características de interés que
llamaremos variables, estas variables se dividen en dos tipos
I. Variables Cualitativas o Categóricas: Son las que describen cualidades o atributos, pero no
toman valores numéricos.
Ejemplos:
a)“Tamaño de empresas”
Categorías: {pequeñas, medianas, grandes}
b) “Causas de falla de una máquina”
Categorías: {Fluctuaciones de corriente, Error del operador, Engranajes desgastados, etc.}
c) Nacionalidad
d)”Tipos de medios de transporte según distancia que recorren”
Categorías: {corta, media, larga}
Se puede observar que en el ejemplo a) y d) las categorías tienen un orden natural, en este
caso se dice que la variable tiene Escala Ordinal
Si las categorías no tienen ningún orden, como en el ejemplo b) y c), se dice que la variable
tiene Escala Nominal
2
II. Variables Cuantitativas: Son aquellas que toman valores numéricos.
Ejemplos:
a) “Cantidad de artículos fabricados en un día por una empresa”
Valores que puede tomar: {0, 1, 2, …, n}
Una variable que puede tomar un número finito de valores o infinito numerable, como en el
ejemplo a), se llama variable Discreta. Por lo general las variables discretas toman valores
enteros.
Una variable que puede tomar valores en todo un intervalo se llama variable Continua, como
es el caso del ejemplo b)
Nota: ¿Cómo identifico una variable? Observando su recorrido, o sea los valores que puede
tomar (no los valores observados) y con esto identifico el tipo y escala.
DISTRIBUCIONES DE FRECUENCIA
Primer caso: Supongamos que se cuenta con datos de una variable Cualitativa ( nominal u ordinal)
3
Ejemplo 4: Variable Cualitativa
Los accidentes en una planta fabril se clasifican de acuerdo a la zona del daño. Los datos
son: manos, ojos, manos, brazos, manos, ojos, ojos, ojos, piernas, pie, pie, brazos, piernas,
brazos, manos, ojos.
n = 16
Segundo caso: Datos provenientes de una variable Cuantitativa discreta con pocos valores
0 2 3 0 1 4 1 0 2 3
No de Accidentes
Cantidad de intersecciones
0 = 3
1 = 2
2 = 2
3 = 2
4 = 1
4
No de Accidentes automovilísticos en 10 intersecciones céntricas de una ciudad.
Diciembre de 2000.
No de Accidentes
Cantidad de Intersecciones
0 3 ( 30%)
1 2 ( 20%)
2 2 ( 20%)
3 2 ( 20%)
4 1 ( 10%)
Total 10 (100%)
Tercer Caso: Observaciones de una variable Cuantitativa Continua o Discreta con muchos valores
Para construir las clases, se subdivide el rango de datos en subintervalos, según la siguiente
regla
Regla
- Selección del número de clases n de clases 1.75 n donde n es la cantidad de datos
o 3
(tamaño muestral)
max min
- Selección de la amplitud de cada clase Amp de clase o
n de clases
- Elegir intervalos semiabiertos y disjuntos que cubran todo el rango de datos
- Elegir los limites de los intervalos, en lo posible, enteros y múltiplos de 5.
- Elegir los limites de los intervalos, de manera tal que no haya clases vacías, en lo posible
Los siguientes datos son los tiempos de procesamiento por computadora, en segundos, de
ciertas solicitudes:
5
* n = 20
o
* n de clases = 175
. 3
n = 4.75 5
30 11 = 3.8 4
* amplitud de clase =
5
Total 20 Total 20
Distribución de frecuencias:
[10,15) 3 15
[15,20) 4 20
[20,25) 6 30
[25,30) 6 30
[30,35) 1 5
Total 20 100
Observación: La cantidad de clases resultantes puede diferir del número de clases calculada con la
fórmula, en una clase más o una menos
Diagrama de Barras
- Datos de variables cualitativas
- Datos de variables cuantitativas discretas con pocos valores
- Se pueden graficar frecuencias absolutas, Frecuencias relativas o porcentajes
En un diagrama de barras en el eje horizontal se indican los valores posibles de la variable o
categorías y en el eje vertical las frecuencias absolutas, relativas o porcentajes.
6
Ejemplo 7: Diagrama de Barras
f 6
5
4
3
2
1
0
Manos Ojos Brazos Piernas Pie
Zona del Daño
Diagrama de Pareto
% 40
30
20
10
0
Ojos Manos Brazos Piernas Pie
Diagrama de puntos
- Datos de variables cuantitativas
- Se utilizan cuando tenemos menos de 20 datos
- Consiste en un eje horizontal sobre el cual se marcan las observaciones con puntos.
- Se puede utilizar para comparar dos muestras en una misma escala
7
Computadora A:
11 12 16 25 28 21 23 19 20 14
10 15 20 25 30
s
Computadora B:
15 29 24 23 20 19 26 27 30 26
10 15 20 25 30
s
Histograma
- Sirve para datos de variables cuantitativas continuas o discretas con muchos valores. Es
decir para datos en clase.
Consiste en un conjunto de rectángulos cuyas bases son iguales a la amplitud de los
intervalos o clases, cuyos extremos o valores centrales se indican en el eje horizontal, las alturas de
los rectángulos, marcadas en el eje vertical son tales que el área del rectángulo es proporcional a la
frecuencia de cada clase.
Ejemplo 9: Histograma
5
Frecuencia
0
10 15 20 25 30 35
Tiempo (seg)
8
Notas:
1) Cuando decimos forma hablamos de asimetría, uniformidad, bimodal, truncada, etc.
a) Asimetría positiva
14
12
10
8
6
4
2
0
b) Simetría
12
10
8
6
4
2
0
c) Uniforme
5
4
3
2
1
0
9
d) Bimodal
6
5
4
3
2
1
0
e) Truncada
8
7
6
5
4
3
2
1
0
f) Asimetría negativa
14
12
10
8
6
4
2
0
2) Los gráficos siempre deben llevar Título y Fuente, escala y unidades en que está medida la
variable.
10
MEDIDAS DE POSICIÓN Y DISPERSIÓN
(Solo para datos de variables cuantitativas)
Son valores numéricos, calculados a partir de los datos que describen ciertas características de
la muestra
Medidas de posición:
1 n
x xi
Media: es el promedio de los datos
n i 1
Computadora A:
10
x
1 1
x i (11 12 ... 14 ) 18 .9
10 i 1 10
3 4 6 6 1
x 12 .5 17.5 22 .5 27.5 32 .5 22
20 20 20 20 20
k
Media para datos agrupados en clases x x i f r (x i ) donde
i 1
- xi centro de cada intervalo
- k cantidad de clases
- fr(xi) frec. relativa de la clase con centro xi
Es una forma aproximada, por lo tanto, si se cuenta con los datos originales conviene calcular la
media a partir de ellos.
n
Nota: - Ejercicio: Verificar la propiedad de equilibrar los desvíos, es decir:
(x i x) 0
i 1
- La media se ve afectada por asimetría y por “valores alejados”.
Ejemplo: 8 becas de $200 y una beca de $2000. Beca promedio es de $400
11
Mediana:
- Si n es impar, la mediana es el valor central de la muestra ordenada
- Si n es par, la mediana es el promedio de los dos datos centrales de la muestra ordenada
Procedimiento:
1) Ordenar de menor a mayor. (A la muestra ordenada la denotamos por x(i).)
n 1
2) pos ~x
2
3) si n 2 k 1 pos ~x k 1 ~ x x (k 1)
2k 1 x ( k ) x ( k 1) No confundir
4) si n 2 k pos ~
x ~
x mediana con
2 2 posición de la
mediana
Ejemplo 12: Mediana
Computadora A: 11 12 16 25 28 21 23 19 20 14
Lote ordenado: 11 12 14 16 19 20 21 23 25 28
n 1
pos. med = = 5.5 med = ~
x = 19.5
2
pos Q1
x 1
pos ~
- Primer Cuartil donde [ ] es la función “parte entera”.
2
- Para el tercer cuartil se cuenta desde el final de la muestra ordenada
Computadora A:
Lote ordenado:
11 12 14 16 19 20 21 23 25 28
pos Q
pos. med 1 5 1 3 Q 14
1
2 2 Q 3 23
12
Observaciones:
- La media y la mediana coinciden aproximadamente en caso de tener una muestra simétrica.
No así, necesariamente la moda.
- En caso de tener una muestra asimétrica positiva, la media será mayor que la mediana, si
tiene asimetría negativa, la media será menor que la mediana.
Ejemplo 19, pág 10.
Medidas de dispersión:
Ejemplo: Nota promedio de dos alumnos: 8
Un alumno tiene notas (6, 6 ,8 , 10, 10) y otro alumno (8, 8, 8, 8, 8)
¿Cómo los comparo? ¿Cuál es la diferencia?
Una medida de dispersión es una medida de cuan alejados están los datos del centro de la
distribución (media o mediana).
1 n Es la media de los
Varianza: Varianza ˆ 2
n i 1
xi x 2
desvíos, respecto de la
media, al cuadrado
1 n
Desviación estándar: Desv. Est.
ˆ x i x 2
n i 1
x x 2
1
Otra medida s i
n 1 i 1
n
Desv . Est . ˆ fr ( x i )x i x 2
i 1
Computadora A:
10
(x
1
ˆ2 i x ) 2 28.52
ˆ 5.34
n i 1
13
1 10
2
s
n 1 i 1
( xi x )2 31.70 s 5.63
5
ˆ 2 (x
i 1
i x ) 2 fr ( x i )
3 4 1
(12 .5 22) 2 (17.5 22) 2 (32 .5 22) 2 32 . 25
20 20 20
ˆ 5.68 .
Interpretación:
- Se puede probar que en el intervalo (x 2 ˆ , x 2 ˆ ) se encuentra como mínimo el
75% de los datos.
- Si se encuentra toda la muestra en el intervalo, los datos están muy concentrados.
Computadora A:
11 12 14 16 19 20 21 23 25 28
8.22
x 2 ˆ Están todos los datos, según Chebyshev debe haber por lo menos 1- ¼
29.58
= 0.75
14
Importante:
- Estas tres medidas toman como centro a la media, por lo tanto están asociadas a ella
- Si el lote de datos es simétrico y no tiene valores alejados, utilizaremos a la media y la
desviación estándar o s para describir el lote de datos.
Meda: Se define como la mediana de los valores absolutos de los desvíos respecto de la mediana
de los datos Meda mediana{ x i ~ x}
Procedimiento:
- Calcular los desvíos absolutos respecto de la mediana
- Ordenar y calcular la mediana de estos valores
Computadora A:
11 12 14 16 19 20 21 23 25 28
Desvíos absolutos:
8.5 7.5 5.5 3.5 0.5 0.5 1.5 3.5 5.5 8.5
Desvíos ordenados:
0.5 0.5 1.5 3.5 3.5 5.5 5.5 7.5 8.5 8.5
Meda = 4.5
Rango intercuartíl: RI = Q3 – Q1
Interpretación:
- En el intervalo (~
x meda, ~ x meda) se encuentran al menos el 50% central de los datos
- Para el RI, como ejercicio, encontrar la interpretación (entre Q1 y Q2 está el 50%)
Importante:
- Estas dos medidas de dispersión están asociadas a la mediana
- Si el lote de datos es asimétrico o tiene valores alejados utilizaremos a la mediana y
el RI o la Meda para describir el lote de datos.
15
~
2) Calculo el valor x x 100 si es > que 20 % la muestra es asimétrica
̂
Si es < que 10 % la muestra es simétrica
Si esta entre el 10 y el 20 % es un caso indefinido, debo
utilizar el gráfico
Ejemplo 18: Notas de una evaluación a 20 estudiantes
2 3 3 4 4 4 5 5 5 5 6 6 6 6 6 7 7 7 8 9
Valores alejados:
Si un valor xi de la muestra es menor que Q1 – 1.5(Q3 – Q1) , entonces xi es alejado por defecto
Si un valor xi de la muestra es mayor que Q3 + 1.5(Q3 – Q1) , entonces xi es alejado por exceso
No significa que haya que descartar ese dato, significa que hay que estudiar
ese caso y usar medidas que no se vean afectadas por valores alejados
Minutos
60
50
40
30
20
10
35
26
17
17
Informe: Posición, variabilidad, asimetría, valores máximo y mínimo, y valores alejados
29.4 44.2 12.2 53.3 21.2 33.8 38.7 24.8 47.6 22.6 16.8 24.2 26.6 31.2 33.5
s11.49 1.73
0.15
med X 1.73 11.49
Informe:
Se midieron los porcentajes de humedad en una cierta ciudad durante la primer quincena
de agosto de 2001. Las lecturas de humedad oscilan entre un mínimo de 12% y un máximo de
53%. Las mismas están concentradas alrededor del 29%. Se observa una mayor concentración
para valores bajos y una mayor dispersión para valores altos, es decir, se presenta una asimetría
positiva. No se observan días con porcentaje de humedad extremos.
Introducción:
Dado una unidad experimental podemos observar o medir más de una variable
simultáneamente. Por lo general se necesitan estudiar todas las variables a la vez, no analizar a
cada una por separado. A este tipo de estudio en Estadística se le llama análisis multivariado de las
variables, en caso de 2 variables se llama análisis bidimensional.
Por ejemplo: X = “peso de una persona”
Y = “altura de una persona”
18
Ejemplo 22:
Se clasifican los artículos de acuerdo a su lote y al número de defectos.
Distribuciones Marginales:
Son las distribuciones de frecuencias de cada una de las variables por separado, se obtienen
calculando los totales por filas y por columnas, respectivamente.
Nota: Una vez calculadas las marginales, se pide escribirlas aparte en una distribución de
frecuencias univariada.
19
Distribución de frecuencias conjunta
Explicación
En el ejemplo 22 observamos que las variables son:
X = “condición de fumador”
Y = “condición de hipertenso”
Para saber en que sentido tenemos que calcular los porcentajes tenemos que preguntarnos que
variable influye sobre cual
¿fumar influye en tener o no hipertensión, o tener o no hipertensión, influye en la decisión de
fumar?
Una vez resuelto este problema calculamos los porcentajes sobre los totales de las categorías de la
posible variable influyente.
No siempre es fácil identificar cuál es la variable influyente, incluso a veces es útil calcular los
porcentajes en los dos sentidos.
20
UNIDAD 2: Concepto de probabilidad
Al comenzar con el estudio de la probabilidad hay tres cuestiones a resolver:
Qué es la probabilidad?
Cuáles son sus reglas?
Y cómo se calculan las probabilidades?
Con respecto a qué es, es un concepto muy difícil de definir y hay varias interpretaciones
filosóficas al respecto. La corriente clásica, la frecuencialista y la subjetiva.
Interpretaciones:
– Clásica: sucesos igualmente verosímiles.
– Frecuencialista: la probabilidad es la frecuencia relativa
– Subjetiva: depende del sujeto.
Sin embargo, como no han llegado a un acuerdo entre ellas, en numerosas bibliografías se encuentra
la definición axiomática de probabilidad que es la que adoptaremos en este curso.
Experimento aleatorio: Es un proceso cuyo resultado no se puede predecir con exactitud, pero se
puede proporcionar un conjunto de todos los resultados posibles.
S1 = {cara, sello}
S2 = {0, 1, 2, . . . } = N U {0}
S3 = {t / t 0} = [0, )
S4 = {1, 2, 3, 4, 5, 6}
Se clasifican en:
- Discreto, si contiene un número finito o infinito numerable de elementos
- Continuo, si es un intervalo continuo de IR
Ejercicio
En el ejemplo anterior indicar espacios muestrales Discretos y Continuos
12
Sucesos: Un suceso es un subconjunto del espacio muestral. Se denotan con letras mayúsculas,
A,B, M, N
Ejemplo 4: Sucesos
= Se arroja un dado
S = {1, 2, 3, 4, 5, 6}
Relacionemos con frecuencia relativa: Ejemplo Tirar una moneda muchas veces.
Ejemplo:
= “se arroja un dado equilibrado”
S = {1, 2, 3, 4, 5, 6}
¿Cómo calcularían cuál es la probabilidad de obtener un 3? ¿y la probabilidad de obtener un número
par?
No todos lo espacios muestrales se pueden expresar con elementos igualmente probables Por
ejemplo: Se desea calcular la probabilidad de que una persona se reciba de ingeniero antes de los 25
años de edad.
13
b) B = {sss}
P(B) = 1/8
Ejercicio: responder las preguntas anteriores si la moneda es tal que la probabilidad de obtener
una cara es 1/3 y de obtener un sello es 2/3.
1) A F P(A) 0
2) P(S) = 1
3) Si A1, A2, … es una sucesión de sucesos disjuntos ( i j AiAj = ) entonces
P A i P(A i )
i1 i1
Propiedades
1) P() = 0
n n
2) Si A1, A2, …, An tales que i j AiAj = entonces P A i P(A i )
i1 i1
3) A S P(Ac) = 1 P(A)
4) A S 0 P(A) 1
5) Si A, B S y A B entonces P(A) P(B)
6) Si A, B S entonces P(AB) = P(A) + P(B) – P(AB)
Generalización: Si A, B, C S entonces
P(ABC) = P(A) + P(B) + P(C) – P(AB) – P(AC) – P(BC) + P(ABC)
Recordemos que
A= ABC AB
(AB) C = ACBC
(AB) C = ACBC
14
Ejemplo 8:
En una cierta población, el 10% de la gente es rica, el 5% es famosa y un 3% es
rica y famosa. Se elige una persona de la población al azar.
a) ¿Cuál es la probabilidad de que la persona no sea rica?
b) ¿Cuál es la probabilidad de que la persona sea rica pero no famosa?
c) ¿Cuál es la probabilidad de que la persona sea rica o famosa?
a) A = La persona no es rica.
A = Rc P(A) = 1– P(R) = 1– 0.10 = 0.90
R = (RF) U (RFc)
P(R) = P(RF) + P(RFc) P(B) = P(R ) - P(RF) = 0.10 – 0.03= 0.07
Ejercicio: Probar todas las propiedades enunciadas. (Las demostraciones pueden encontrarlas
en el libro de Meyer)
Demostración Propiedad 2)
Sea Si A1, A2, …, An tales que i j AiAj =
Sea An+1 = An+2, = … =
Entonces i j AiAj =
Luego por Axioma iii) se tiene que P Ai P( Ai )
i 1 i 1
Entonces:
n n
P Ai P Ai P( Ai ) P( Ai )
i 1 i 1 i 1 i 1
15
PROBABILIDAD CONDICIONAL
Ejemplo
= Se lanza un dado
S = {1, 2, 3, 4, 5, 6 }
Si ahora, por alguna razón, sabemos que al lanzar el dado se obtuvo un n o par, la
probabilidad de que se obtenga un 2 es 1/3.
S
A
A
B 2 4
2 6 1
6 espacio muestral reducido
4 3
5
16
C
Se pide P(F / R ) .
Como la probabilidad condicional es una probabilidad, se tiene:
P( FC / R ) 1 P( F / R ) 1 0.30 0.70
P(Fc R ) 0.07
P ( FC / R ) 0.70
P( R ) 0.10
Dados E y S
Si A y B son sucesos de S entonces P(AB) = P(A) P(BA) si P(A) >0
= P(B) P(AB) si P(B) >0
Nota:
Este teorema se puede generalizar a n sucesos, por ejemplo para n = 3:
P(ABC) = P(A) P(B/A)P(C/AB) si P(AB)>0
Ejemplo:
Consideremos un lote de 100 artículos, que consta de 20 defectuosos y 80 sin
defectos. Elegimos 2 al azar sin sustitución. ¿Cuál es la probabilidad de que ambos
artículos sean defectuosos?
17
c) La segunda componente funciona.
1ª componente 2ª componente
0.95 Funciona
Funciona
0.90
0.05 Falla
0.80 Funciona
0.10
Falla
0.20 Falla
Independencia de sucesos
18 1 12 1 6 1
P( A ) P(B) P( A B)
36 2 36 3 36 6
P( A B) 1 / 6 1
P(B / A ) P(B)
P( A ) 1/ 2 3
P( A B) 1 / 6 1
P( A / B) P( A )
P(B) 1/ 3 2
Por lo tanto, A y B son independientes.
18
Definición de Sucesos Independientes
Existen casos en donde la ocurrencia de un suceso no afecta a la probabilidad de ocurrencia del otro
suceso, es decir que:
P(AB) = P(A), si es que P(B)>O ó
P(BA) = P(B), si es que P(A)>O
Esto podría ser una definición de independencia, pero tenemos la restricción que P(B)>O ó P(A)>O,
por lo que generalizamos el concepto con la definición.
Definición:
Dados dos sucesos A, B en S, decimos que A y B son independientes sí y sólo sí
P(AB) = P(A) P(B)
AB = AC = BC = { s1 }
P(AB) = 1/4 = P(A) P(B)
P(AC) = 1/4 = P(A) P(C)
P(BC) = 1/4 = P(B) P(C)
19
UNIDAD III: DISTRIBUCIONES DE PROBABILIDAD – 1ra Parte
Definición:
Sea un experimento aleatorio y S su espacio muestral. Una variable aleatoria es una
función que asigna a cada elemento s de S un número real X(s).
Es decir: X: S R
s X(s)
Rx = {0, 1, 2}
Nota:
- En muchos casos el resultados del espacio muestral ya es un número, en este caso
X(s)=s
- El conjunto de todos los valores posibles de X se llama recorrido de la variable X, se
denota con RX
Ejemplo 3: Se lanzan 3 monedas → S = {ccc, ccs, csc, scc, css, scs, ssc, sss}
X = Se cuenta el número de caras. RX = {0, 1, 2, 3}
P (X = 0) = P({sss})=1/8
P (X = 1) = P({css, scs, ssc })=3/8
P (X = 2) = P({ccs, csc, scc })3/8
P (X = 3) = P({ccc})=1/8
S lR
A
B
5 4 20 10
𝑝𝑋 (0) = 𝑃(𝑋 = 0) = 𝑃{𝑁𝑁} = = =
8 7 56 28
5 3 3 5 30
𝑝𝑋 (1) = 𝑃(𝑋 = 1) = 𝑃{𝑁𝐷, 𝐷𝑁} = + =
8 7 8 7 56
32 6
𝑝𝑋 (2) = 𝑃(𝑋 = 2) = 𝑃{𝐷𝐷} = =
8 7 56
La función de masa es:
x pX(x)
10
0
28
15
1
28
3
2
28
1
b) Continua: Se dice que un variable aleatoria X es continua, si es que existe una función
fX no negativa, definida sobre la recta real, tal que para cualquier intervalo A.
P(X A) f X ( x )dx
A
donde fX se denomina función de densidad de probabilidad (fdp) y cumple con las
siguientes condiciones:
i) fX(x) 0
ii) f X (x )dx 1
Ejemplo 5: Variable aleatoria continua.
1/ 2 0 x 2
f X (x)
0 en otro caso
área = 1
1/2
0 1 2
Observaciones:
a) La función de densidad no es una probabilidad.
b) En el caso de una variable aleatoria continua, la probabilidad en un punto es cero.
FX ( x ) p X (x j )
x j x
x pX(x)
10
0
28
15
1
28
3
2
28
1
Si x < 0 F X (x) = 0
10
Si 0 x <1 F X (x) = P (X x) = p X (0) =
28
10 15 25
Si 1 x < 2 F X (x) = P (X x) = p X (0) + p X (1) =
28 28 28
10 15 3 28
Si x 2 F X (x) = P (X x) = p X (0) + p X (1) + p X (2) = 1
28 28 28 28
Es decir:
0 x0
10
0 x 1 FX(x)
28
Fx ( x ) 1
25 1 x 2 25
28 28
1 x2
10
28
0 1 2 x
b) Sea X v.a. continua, fX su función de densidad
x
FX ( x ) f X (t )dt
1 / 2 0x2
f X (x)
0 en otro caso fX (x)
1/2
x
x0 FX ( x ) f
X ( t )dt 0
x x
1 2 x
1 x
0x2 FX ( x ) f
X ( t )dt 2 dt 2
0
x 2
1
x2 FX ( x )
f X ( t )dt
0
2
dt 1
FX(x)
0 x0 1
x
FX ( x ) 0x2
2
1 x2
1 2
x
Observaciones:
1) Para el caso discreto, la Función de Distribución Acumulada tiene un salto en cada punto
del recorrido, igual a la probabilidad en dicho punto.
x
'
2) En el caso continuo FX ( x ) f X (t )dt bajo ciertas hipótesis FX ( x ) f X ( x )
Propiedades
a) Calcular P(0.5<X<1.5)
P(0.5<X<1.5) = FX(1.5) –FX(0.5)= 1.5/2- 0.5/2= 0.5
b) Calcular P(X<1)
P(X<1)= FX(1)=1/2=0.5
Sea X una variable aleatoria con distribución de probabilidad conocida, entonces Y = g(X)
es también una variable aleatoria
Caso Discreto
Si X es discreta, entonces Y = g(X) también es discreta
Sea X v.a. con recorrido RX = {-1, 0, 1, 2} tal que px (x) =1/4 para todo xRx. Sea Y = X2.
Encuentre la función de masa de Y.
RY = {0, 1, 4}
pY (0) = P (Y = 0) = P (X2 = 0) = P(X = 0) = 1/4
Y pY(y)
pY (1) = P (Y = 1) = P (X2 = 1) = P(X = 1) =1/2 0 1/4
pY (4) = P (Y = 4) = P (X2 = 4) = P(X = 2) = ¼ 1 1/2
4 1/4
1
Caso Continuo
Sea X una v. a. continua, entonces Y = g(X) puede ser discreta
continua
1 / 4 0x4 1 si x 1
f X (x) Y( x)
0 en otro caso 1 si x 1
1 1
1 1
P (Y = -1) = P ( X < 1 ) = f (x)dx
0
4
dx
4
4
1 3
P (Y = 1) = P( X 1) f ( x)dx
1
4 dx 4
1
0.3
0 v 10 0 w 0.3
– Sea w : 0 w 0.3
FW ( w ) PW w P 0.003V 2 w P V w
0.003
w w
P V FV
0.003 0.003
1
w 1 w 2
1 1 12 10 1 10 1 2
f W (w ) f V w 10 w
0.003 2 10 2 2 3
0.003 3
1 10 1
w 2 0 w 0.3
f W (w) 2 3
0
en otro caso
UNIDAD III: DISTRIBUCIONES DE PROBABILIDAD – 2da Parte
CARACTERÍSTICAS DE VARIABLES ALEATORIAS
Si una empresa de seguros nos informa que se espera que una mujer de 40 años viva
38 años más, no significa que toda mujer de 40 años hoy vivirá hasta cumplir 78 años
solamente. Habrá mujeres de 40 años hoy que vivirán 10 años más otras 50 años más otras
20, etc. La expectativa debe ser interpretada como que en promedio todas las mujeres de 40
años hoy vivirán 38 años más.
Caso Discreto
Sea X un v. a. discreta, RX = {x1, x2, …} su recorrido y pX(xi) i = 1, 2, … su función de
masa de probabilidad.
El valor esperado de X se define como:
x pX(x)
10
0
28
15
1
28
3
2
28
10 15 3 21 3
EX 0 1 2 0.75
28 28 28 28 4
Caso continuo:
Sea X una v. a. continua con función de densidad fX, el valor esperado de X se define
como:
EX X x f X (x)dx siempre que exista x f X ( x )dx
Ejemplo 13: Esperanza Matemática caso continuo (mostrar gráficamente ubicación de
la media)
Suponga que el error en la temperatura de reacción, en oC, para un experimento es una
variable aleatoria continua con función de densidad de probabilidad dada por:
1 2
x 1 x 2
f X (x) 3
0 en otro caso
Determine el valor esperado del error en la temperatura de reacción.
2 2
1 2 x4 16 1 15 5
EX
1
3
x xdx
12 1
12
12 4
Observaciones:
1) La esperanza matemática no tiene porque ser un valor del recorrido de la variable
2) Es una medida de posición de la distribución de probabilidad. Es el centro de gravedad
de la distribución de probabilidad.
3) Cuando el número de observaciones es muy grande la media muestral tiende a la
esperanza matemática.
Propiedades:
Se puede demostrar que:
- Sea X v.a. tal que existe EX, sean a, b , entonces
E(aX + b) = a EX + b
E(X) 65 V(X) 20
Y=aX+b EY = a EX + b y y = a x
a EX b 75 a 65 b 75
a X 10 a 20 10
a = 1/2 = 0.5
1 65
65 b 75 b 75 75 32.5 42.5
2 2
Por lo tanto la transformación a realizar es:
Y = 0.5 X + 42.5
Esperanza de una función de una v. a.
TEOREMA:
Nota:
Este resultado nos permite calcular la esperanza de una v. a. Y que es función de
otra variable aleatoria X con distribución conocida, sin necesidad de obtener la función de
densidad o de masa de Y.
V( X) 2X (x )
2
Caso continuo f X ( x)dx siempre que exista E(X2)
Caso discreto V( X) 2X ( x i ) 2 p X ( x i ) siempre que exista E(X2)
i 1
Propiedades:
1) Sea X v.a. tal que existe V(X), entonces V(X) EX 2 ( EX) 2
Demostración: V(X) EX 2 E X 2 2X 2 EX 2 2EX 2 EX 2 2
P X k
1
donde k es un número real positivo.
k2
P 0.11
P 0.06
Observaciones:
1. La cota proporcionada puede ser muy precisa o muy alejada.
2. Me proporciona información acerca de las probabilidades sin conocer nada de las
distribuciones de probabilidad
3. Sirve para acotar las probabilidades de ciertos intervalos sólo conociendo y .
Ejemplo 19: Desigualdad de Chebyshev o Tchebychev.
k = 3/2
3 4
P X 0.44
2 9
1 2
2
2 4 1 1
EX = 1 y V(X)
12 12 3 3
3 1 3
P X 1 P X 1 1 P 3 X 1 3
2 2 2
2 3
3
1
3 3 2
1 3
1 P1
2
X 1
2
1 2
dx 1
2
0.13
3
1
2
Conclusión: el resultado no es exacto pero si consistente y se obtuvo sin saber nada acerca
de la forma de la distribución de la variable aleatoria.
1
y g( x ) g( X ) g ( X )(x X )
g ( X )(x X ) 2
2!
despreciando los demás términos. Tomando esperanza en ambos miembros
g ( X )
Ey g ( X ) 2X
2
Despreciando el segundo término y tomando varianza
V(Y) g ( X )2 2X
Ejemplo 20: Esperanza y Varianza aproximada de una transformada.
x
2
e 2 1 1 e 2
2
1 e
x
EY e dx 0.432
0
2 2 2 2
0
2
e 2x e 4 1 1 e 4
2
1
2x
EY e 2
dx
2 4 4 4
0 0
2
1 e 4 1 e 2
V(Y) EY (EY ) 2
2
0.058
4 2
Distribución de Bernoulli
Sea X v.a. tal que Rx= {0,1} p x(1) = p ; p x(0) = 1 – p con 0 p 1
Lo que es lo mismo p x(x) = px(1-p)1-x con x =0 , 1
Proceso de Bernoulli
El proceso de Bernoulli es un experimento en el que se cumplen las siguientes hipótesis:
Distribución Binomial
En un proceso de Bernoulli la v. a. Binomial se define como:
Recorrido de X, RX = {0, 1, 2, …, n}
n
Nota: X X i , donde Xi son ensayos Bernoulli.
i 1
Notación: X b(n, p)
Nota: Se puede demostrar que
21
n
1) p
r 0
X (r ) 1
2) EX = np
3) V(X) = np(1 – p)
2) Función de masa:
n
p x ( x ) p x (1 p) n x x 0, 1, 2, , n
x
x 4 x
4 1 1
p x ( x ) 1 x 0, 1, 2, , n
x 4 4
0 4
4 1 3
p x (0) 0.316
0 4 4
1 3
4 1 3
p x (1) 0.422
1 4 4
2 2
4 1 3
p x (2) 0.211
2 4 4
3 1
4 1 3
p x (3) 0.047
3 4 4
4 0
4 1 3
p x ( 4) 0.004
4 4 4
22
pX(x) p < 0.5
x px(x)
0.422
0 0.316
1 0.422 0.316
2 0.211
3 0.047 0.211
4 0.004
0.004
0 1 2 3 4 x
3) P(X = 1) = 0.422
Ejemplo 2:
d) EX= 15 x 0.4 = 6
V(X) = 15 x 0.4 x 0.6 = 3.60 x = 1.90
Observaciones:
23
Xb(n,p)
X="Número de éxitos en n ensayos de Bernoulli"
P(X=k)
Si ahora consideramos
Y="Numero de fracasos en n ensayos de Bernoulli"
Yb(n, 1-p)
P(X=k)=P(Y=n-k)
Distribución Geométrica
RX = {1, 2, 3, …}
P(X = r) = (1-p)r-1p
Notación: X Geom(p)
24
- Nro. de errores de tipeo por página: suceso puntual error
soporte continuo página
- Cantidad de defectos en una plancha metálica: suceso puntual defecto
soporte continuo área de metal
RX = {0, 1, 2, …}
(t ) x
PX(x) = P[X = x] = e t x = 0, 1, 2, …
x!
donde >0, es el número promedio de partículas emitidas por unidad de tiempo.
Notación: X P(t)
25
tres accidentes en cada uno?
Nota: El tiempo entre dos sucesos de Poisson se modela con la distribución Exponencial.
Una variable aleatoria X se dice que tiene distribución Exponencial, XE(), si su función de
densidad es:
Nota:
Se puede probar que:( hacerlo como ejercicio)
1) f
x ( x )dx 1
2) EX = 1/
3) V(X) = 1 / 2
26
Ejemplo 5: Distribución Exponencial.
X ~ E(0.1)
a) EX = 1/ = 10 años
1
8
0
0.1e 0.1x dx 1 e 0.1x
8
0
1 e 0.8 e 0 e 0.8 0.4490
Entonces FT’(t) = e - t para t >0 y cero en otro caso, que es la función de densidad de
probabilidad de la v. a. Exponencial.
Suponga que llegan 3 camiones por hora, en promedio, para ser descargados en
una bodega, ¿cuál es la probabilidad de que el tiempo entre el arribo de sucesivos
camiones sea a lo sumo 5 minutos?
27
X ~ P(3)
T= “Tiempo entre el arribo de dos camiones sucesivos en horas”
T~ E(3)
P (T 5 min) = P (T 1/12)
1 / 12
0
3e 3x dx 1 e 1/ 4 0.221
1 e
1
4
1 4 0
1 e
1
4 0.221
0!
5 3 15 1
Observación: t .
60 60 4
Distribución Uniforme
2) f
a
X ( x )dx 1 (Demostrar como ejercicio)
ab (b a ) 2
3) EX y V(X) (Demostrar como ejercicio)
2 12
4) Notación: X U[a, b]
La Distribución Normal
2
28
donde , son constantes tales que < < y > 0.
Nota: Se puede demostrar que
1) fX(x) > 0 < x <
2) f
X ( x )dx 1
3) EX = y Var(X) = 2
4) Notación: XN( , )
5) XN( , ) es simétrica alrededor de .
Observaciones:
1) (-z) = 1 – (z)
2) Ejemplos:
Si (z) = 0.8 z = 0.84
Si (z) = 0.3 1 – (–z) = 0.3 (–z) = 0.7 – z = 0.52 z =–0.52
29
=0.8643- (1 - 0.7224) =0.5867 (por tabla)
Ejemplo 8:
Una compañía fabrica focos cuya duración es una variable aleatoria con
distribución Normal con media igual a 800 hs. y desviación estándar igual a 40 hs.
Encuentre la probabilidad de que un foco dure entre 778 y 834 hs.
Ejemplo 9:
Entonces:
d d 1 0.90 d
2 1 0.90 0.95 1.65
0 .2 0.2 2 0.2
30
UNIDAD 5: Distribuciones de funciones de variables aleatorias –1ra Parte
DISTRIBUCIONES CONJUNTAS
Definición de V. A. Bidimensional:
Sea un experimento aleatorio y S su espacio muestral. Sean X e Y vs. as. tal que a cada s
de S le asignan los números reales X(s) e Y(s) respectivamente. Entonces se dice que el par
(X, Y) es una variable aleatoria bidimensional.
lR2
S
(X(s), Y(s))
Distribuciones Bidimensionales
a) Caso discreto
(X, Y) es una v. a. Bidimensional Discreta si el conjunto de valores posibles (recorrido)
es finito o infinito numerable, es decir:
RXY = {(xi, yj): i = 1, 2, …n, … j = 1, 2, …, m, …}
Para todo y RY p Y ( y) p
x
XY ( x , y)
Ejemplo 1:
En una planta automotriz dos tareas estarán a cargo de robots. La primera consiste
en soldar dos bisagras y la segunda en apretar dos tornillos. Sea X el número de soldaduras
defectuosas, e Y el número de tornillos apretados incorrectamente. La siguiente tabla
muestra la distribución de probabilidad conjunta.
Y
0 1 2
X
0 0 0.15 0.10 0.25
1 0.15 0.20 0.05 0.40
2 0.10 0.15 0.10 0.35
0.25 0.50 0.25 1
26
P (X = 2, Y = 2) = 0.10
P (X = 2) = 0.35
P (Y = 1) = 0.50
b) Caso Continuo
(X, Y) es una v. a. Bidimensional Continua si existe una función fXY llamada función de
densidad de probabilidad Conjunta que satisface las siguientes condiciones:
i) fXY(x, y) 0 para todo (x, y) 2
ii) f
XY ( x, y)dxdy 1
Para todo y RY f y ( y) f
XY ( x , y)dx
Observaciones:
1) En el caso bidimensional el recorrido es una región de 2, y se recomienda graficar
en el plano dicha región.
2) La probabilidad en este caso es el volumen debajo de la superficie.
3) La probabilidad (el volumen) sobre un punto o una curva es cero.
Ejemplo 2:
Sea (X, Y) una v.a. bidimensional continua cuya f.d.p. conjunta está dada por:
6 0 x 1 x2 y x
f XY ( x, y)
0 en otro caso
27
y y = x2
y=x
1/2
1/2 1 x
1 x 1 x 1
Volumen ( 6dy )dx 6 y
0 x2
0
x 2
dx 6( x x 2 )dx
0
1
x2 x3
6 1
1 1
6
2 3 2 3
0
b) Sea x : 0 x 1
6( x x 2 ) 0 x 1
x
f X ( x ) 6dy 6 x x f X (x)
2
x 2 0 en otro caso
Sea y: 0y1
6( y y) 0 y 1
y
f Y ( y)
f Y ( y) 6dx 6
y
y y
0 en otro caso
1 1 1
2 x
1 2 2
1 x
c) P X , Y
2 2 6 dy dx 6 y| x2
dx 6( x x 2 )dx
0 x2 0 0
28
1/ 2
x2 x3 1 1 1
6 6
2 3 8 24 2
0
Ejemplo 3:
Con los datos del ejemplo 1:
Y
0 1 2
X
0 0 0.15 0.10 0.25
1 0.15 0.20 0.05 0.40
2 0.10 0.15 0.10 0.35
Ejemplo 4:
Con los datos del ejemplo 2:
6 0 x 1 x2 y x
f XY ( x, y)
0 en otro caso
Se sigue que:
6( x x 2 ) 0 x 1
f X (x)
0 en otro caso
6( y y) 0 y 1
f Y ( y)
0 en otro caso
29
Ejemplo 5:
Se lanza un dado y una moneda. La función de masa conjunta está dada por:
1
x 0,1; y 1, 2, ..., 6
p XY ( x, y)12
0 en otro caso
6
p XY (x, y) 12
6 1
p X (x) x 0, 1
y 1
2
1
pXY (x, y) 12 6
2 1
p Y ( y) y 1, 2, ..., 6
x 0
Ejemplo 6:
1 x
1 0 x 1
1
f X ( x ) 1 dy 1, 0 x 1
0
f X ( x)
0 en otro caso
Análogamente,
1 0 y 1
f Y ( y)
0 en otro caso
Luego X e Y son independientes.
30
Teorema: Esperanza de una función de varias variables aleatorias
Se puede demostrar que:
Propiedades de la esperanza
1) Sean X1, …, Xn vs. as. cuyas esperanzas existen a1, …, an constantes, entonces:
E(a1X1 + … +anXn) = a1EX1 + … +anEXn
2) Si X e Y son v. a. independientes cuyas esperanzas existen, entonces: E(XY) =
EXEY
Generalización:
Sean X1, …, Xn v. a. independientes, tales que EXi < i = 1, 2, …, n, entonces:
n
E(X1...X n ) EX
i 1
i
X –1 0 1
Y
0 0 1/3 0
1 1/3 0 1/3
EX = 0
EY = 1x1/3 + 0x1/3 + 1x1/3 = 2/3
E(XY) = E(X3)= -1x1/3 + 0x1/3 + 1x1/3 = 0
Por lo tanto E(XY) = EX.EY
Pero X e Y no son independientes ya que, por ejemplo,
pXY(0, 1) = 0 y pX(0) . pY(1) = 1/3 . 2/3 = 2/9
31
Covarianza
La Covarianza es una medida de Asociación Lineal entre dos variables. Se define como:
Cov(X, Y) =E(X – X ) (Y – Y) siempre que X y Y .
2 2
Interpretación: gráfico
Propiedades de la covarianza
Sean X e Y vs. as. tales que existen 2X y 2Y
1) Cov 2 (X, Y) 2 X 2 Y
2) Cov(aX+b, cY+d) = acCov(X, Y) para todo a, b, c, d ℝ (como ejercicio)
3) Cov(X+Y, Z)=Cov(X,Z)+Cov(Y,Z) (como ejercicio)
4) X e Y independientes Cov(X, Y)=0 (como ejercicio)
Ejemplo 8:
Suponga que X e Y son variables aleatorias tales que la. Cov(X,Y) =1. Calcule la
Cov(2X,3Y+1)
.
Cov(2X,3Y+1) = 2.3.Cov(X,Y)= 6
Observación:
Cov(X, Y)=0 X e Y independientes
Coeficiente de correlación
La covarianza es una medida de asociación lineal entre dos variables aleatorias. Tiene el
inconveniente de que no está acotada y depende de las particulares unidades de medidas de
32
las variables X e Y, por ello no podemos saber cuándo esta asociación es fuerte o débil. Por
eso definimos el coeficiente de asociación lineal:
Cov(X, Y)
(X, Y)
XY
Propiedades
1) (X,Y)1
(X,Y) 1 Existe una fuerte asociación lineal (positiva o negativa) entre
las variables
(X,Y) 0 No hay asociación lineal entre las variable.
(no indica independencia)
2) X e Y independientes (X, Y)=0
1 si a 0
3) Y=aX+b, a0 (X, Y) ( como
1 si a 0
ejercicio)
Propiedades de la Varianza
1) Sea X una v. a. tal que 2 X < y sean a y b entonces V(aX+b)=a 2 V(X)
2) Sean X e Y vs. as. tales que 2 X < y 2 Y < entonces
V(X+Y)=V(X)+V(Y)+2Cov(X,Y)
Consecuencia: Si X e Y son independientes, entonces V(X+Y)=V(X)+V(Y)
Generalización: Si X1, …, Xn vs. as. independientes, tales que, para todo i 2 i <
n n
V X i V(X i )
i 1 i 1
Ejemplo 10:
Suponga que X e Y están correlacionadas negativamente. ¿V(X+Y) es mayor o menor
que V(X-Y)?
Ejemplo 11:
Suponga que X, Y y Z son variables aleatorias tales que:
V(X) = 1 V(Y) = 4 V(Z) = 8 Cov(X, Y) = 1 Cov(X, Z) = -1 Cov(Y, Z) = 2.
Calcule:
a) V(X+Y+Z)
b) V(3X-Y-2Z+1)
33
UNIDAD 5: Distribuciones de funciones de variables aleatorias –2da Parte
n n n
la variable aleatoria a i X i N a i i , i a 2 2
i 1 i 1 i 1
2
n n
Ejercicio: Calcular E a i X i y V a i X i
i 1 i 1
E X i E( X i ) n
n n n
i1 i1 i 1
V X i V( X i ) 2 n 2
n n n
i1 i1 i 1
Y por lo tanto, según el Teorema de las combinaciones lineales de las v.a. Normales
independientes para este caso particular:
X i
N(n , n) ,
Además
1 n 1 n 1 n 1 n 1
E(X) E X i E X i E(X i ) n
n i 1 n i 1 n i 1 n i 1 n
1 n 1 n 1 n 1 n 2 1 2
V( X ) V X i 2 V X i 2 V( X i ) 2 2 n
2
n i 1 n i 1 n i 1 n i1 n n
26
Y por lo tanto, según el Teorema de las combinaciones lineales de las v.a. Normales
independientes para este caso particular:
1 n
X X i N ,
n i1 n
Xi ~ N(800, 20)
4
Xi Pesopromedio
1
X
4 i 1
27
X ~ N 800 , 20
4
X
Xi
X N , pero, si estandarizamos
Dado que entonces
n n
X
N(0,1) cuando n tiene a infinito
/ n
X = Peso total
25
X Xi ~ N (1700, 125) Por Teorema Central del Límite
i 1
X 1700 1900 1700
P(X 1900 ) 1 P(X 1900 ) 1 P
125 125
1 (1.6) 1 0.9452 0.055
n n2
X i ó X n
a X i i
i 1
Tesis
Independencia
SIMILITUDES
Llevan a la normal
Xi
X
29
Corolario 1: Aproximación de la distribución Binomial por una distribución Normal
Sea X b(n, p) entonces
X np
Estandarizando Z N(0, 1)
np(1 p)
n
Justificación: X ~ b(n, p), sea Yi ~ B(p) con i = 01,2, ..., n , luego X = Yi
i 1
Nota:
1) En la práctica si np (1 – p ) > 5 la aproximación es aceptable.
30
a) P( X 15 ) = P ( X 15.5)
X 20 15 .5 20
P 1.13 1 1.13 1 0.8708 0.1292
4 4
b) P ( X = 15 ) = P (14.5 X 15.5)
14 .5 20 X 20 15 .5 20
P 1.13 1.38
4 4 4
1 1.13 1 1.38 1.38 1.13 0.9162 0.8708 0.0454
X N(, ), por el T. C. L.
X
Estandarizando Z N(0, 1)
Justificación: X ~ P(λ), sea Yi ~ P(1) con i = 1, 2, ..., ( ℕ grande) , luego X= Yi .
i 1
Nota:
1) En la práctica si > 5 la aproximación es aceptable.
2) También estamos aproximando una v. a. discreta por una continua, por lo tanto debe
aplicarse corrección por continuidad.
X P(5.8)
> 5 X N(5.8, 5.8 ) por Teorema Central del Límite
31
Resumen de las Aproximaciones
b(n, p) P()
= np(1 p)
N (, )
32
UNIDAD 6: Introducción a la Inferencia Estadística
Inferencia Estadística:
Población:
Es una variable aleatoria con una cierta distribución de probabilidad con sus
correspondientes parámetros.
Ejemplo: Se desea estudiar la población de todos los pesos de los recién nacidos en
Tucumán durante el mes de Setiembre de 2019.
En muchos casos es imposible acceder a todos los valores de una población, por las
siguientes razones:
i) Costo económico
ii) Costo en tiempo
iii) Muestreo destructivo
IMPORTANTE:
Dada una m.a, esto es: X1, X2,...,Xn. iid con media y varianza 2, se tiene que:
1 n 1 n 1 n 1 n 1
E( X ) E X i E X i E(X i ) n
n i 1 n i 1 n i 1 n i 1 n
1 n 1 n 1 n 1 n 2 1 2
V( X ) V X i 2 V X i 2 V( X i ) 2 2 n
2
E X i E( X i ) n
n n n
i1 i1 i 1
i1 i1 i 1
acerca de esta población..
Observar que X1, X2,...,Xn iid como X.
42
Ejemplo 1:
Suponga que se quiere hacer un estudio sobre la edad de los ingresantes a
una cierta facultad en el año 1997. La siguiente tabla muestra la composición de
las edades de los ingresantes:
Edad 17 18 19 20 21 22
% 12 30 30 15 10 3
La población es el conjunto de todas las edades o sea {17, 18, 19, 20, 21, 22} con
sus respectivas probabilidades 0.12, 0.30, 0.30, 0.15, 0.10, 0.03.
Se tiene:
X = edad de los ingresantes
X PX(X)
17 0.12
18 0.30
19 0.30
20 0.15
21 0.10
22 0.03
43
que es lo que estudiaremos en esta Unidad.
Si disponemos de la posibilidad de tomar muestras, utilizamos esa muestra, Sino podemos
hacerlo existe una herramienta estadística para generar una muestra llamada simulación.
El método de Montecarlo
Simulación de m.a.
El método de Montecarlo es un procedimiento para simular una muestra de cualquier
distribución de probabilidad. y se basa en el siguiente teorema:
Aplicación
U = FX(X) ⇒ X= FX-1 (U).
Ejemplo 2:
1
1 1 e 2 x x0
X ~ E FX ( x )
2
0 en otro caso
44
1 1
x x
u FX (x) u 1 e 2 e 2 1 u
1
x ln (1 u ) x 2 ln (1 u)
2
Ejemplo 3:
Entonces
x xi
i ui 1 (u i )
Luego:
x1 x2 x3
0.59 0.08 1.61
x1 = (–0.59) + = 288.2
x2 = 298.4
x3 = 332.2
45
Ejemplo 4:
El número de llamadas que llegan por minuto a una central es una variable
aleatoria con distribución P(1). Se desea generar el comportamiento de la central
en tres períodos de 1 minuto.
x FX(x)
x<0 0
0 x <1 0.3679
1x<2 0.7358
2x<3 0.9197
3x<4 0.9810
: :
. .
Los números al azar son:
u1 = 0.0032 u2 = 0.9367 u3 =0.5369
Chequeo de la distribución
Supongamos que se observa una m. a. simple X1, X2, …, Xn de una v. a. X que tiene
una cierta distribución de probabilidad. Existen muchos casos en los que dicha distribución
es desconocida, por ello, en base al razonamiento o a la experiencia suponemos una cierta
46
distribución para los datos, y luego debemos verificar si los datos realmente responden a la
distribución postulada (identificación del modelo).
E FX (X ( j) ) j
n 1
FX x ( j)
j
n 1
Interpretación: Los valores observados, se espera, que dividan el área debajo de la curva
en n+1 partes iguales, cada una de área 1/ (n+1)
FX x ( j)
j j
x ( j ) 1 j
1 e
x ( j) ln 1
n 1 n 1 n 1
Es decir que la relación entre los valores observados ordenados y los números
j
ln 1 debe ser aproximadamente lineal, si esto no ocurre se concluye que los datos
n 1
no provienen de una distribución Exponencial.
Ejemplo 5:
j x j
FX ( x ( j) ) 1 e ( j)
n 1 n 1
j 1 j
λ x (j) ln 1 x (j) ln 1
n 1 λ n 1
47
j x(j) j/(n+1) - ln (1- j/(n+1))
1 0.03 0.1 0.11
2 0.16 0.2 0.22
3 0.23 0.3 0.36
4 0.53 0.4 0.51
5 0.53 0.5 0.69
6 1.12 0.6 0.92
7 1.39 0.7 1.20
8 1.61 0.8 1.61
9 3.71 0.9 2.30
x (j) 4
0
0 0,5 1 1,5 2 2,5
- ln (1 - j/(n+1))
Conclusión:
j
Como x(j) vs ln 1 ajusta a una recta, se concluye que los datos provienen
n 1
de una distribución Exponencial.
(RECORDAR que hay que ordenar los datos, que la ordenada al origen es cero y que la
1
pendiente es )
48
x ( j) j j
x ( j) 1
n 1 n 1
1 j
Es decir que la relación entre los valores observados ordenados y los números
n 1
debe ser aproximadamente lineal, si esto no ocurre se concluye que los datos no provienen
de una distribución Normal.
Ejemplo 6:
Los siguientes datos son las calificaciones obtenidas en una evaluación de niños de
escuela primaria:
7.2 6.2 7.7 8.8 8.7 9.2 5.3
Se quiere verificar que los datos siguen efectivamente una distribución Normal.
x (i) μ i x (i) μ 1 i 1 i
n 1 x (i) σ μ
σ σ n 1 n 1
49
12
x(i)
9
0
-1,5 -1 -0,5 0 0,5 1 1,5
-1 (i/(n+1))
Conclusión:
i
Como x(i) vs 1 ajusta a una recta, se concluye que los datos provienen de
n 1
una distribución Normal.
Entonces si graficamos x vs ln f obs (x) ln( x!) debemos obtener aproximadamente una
recta. Si esto no ocurre se concluye que los datos no tienen distribución Poisson.
Ejemplo 7:
La cantidad de errores de tipeo que comete una secretaria por página son:
2 2 0 4 2 3 4 3 1 0.
Verificar que estos datos siguen efectivamente una distribución de Poisson.
50
f obs (x) λx
P(X x) e λ
n x!
ln f obs (x) ln n λ x ln λ ln x!
ln f obs (x) ln x! x ln λ ( ln n λ)
x
1
ln f obs (x) ln x! 1 ln n λ
ln λ ln λ
x fobs(x) ln fobs(x) + ln x!
0 2 0.69
1 1 0
2 3 1.79
3 2 2.48
4 2 3.87
10
4,5
x(i)
1,5
0
0 1 2 3 4 5
ln fobs(x) + ln x!
Conclusión:
Como x(i) vs ln fobs(x) + ln x! ajusta a una recta, se concluye que los datos
provienen de una distribución Poisson.
1
(Observar que la pendiente es ).
ln
51
UNIDAD 7: Estimación
Estimación Puntual
Por ejemplo:
Si nos interesa conocer el valor esperado de X, parece razonable pensar que un
1 n
“estimador” de X será X = X i . Es decir que, al no conocer el verdadero valor de
n i =1
X lo mejor que tenemos es X .
Observación:
▪ X = EX es un número fijo, pero desconocido (parámetro poblacional)
▪ X es una v. a. (cuando la muestra esté tomada, tomará un valor particular para esa
muestra, x )
▪ No siempre es fácil encontrar el estimador adecuado para un determinado parámetro,
para ello existen Métodos de Estimación.
Definición:
▪ El momento de orden i, de X, con respecto del origen es m i = E(Xi)
n
X
j=1
i
j
Supongamos X1, X2, …, Xn es una m. a. de X con XFX(x, 1, 2, …, k ) donde i son
los parámetros de la distribución de probabilidad.
52
Escribimos los parámetros de la distribución como funciones de los momentos
poblacionales:
θ1 = g1 (m1 , m2 , . . . , mk )
θ = g 2 (m1 , m2 , . . . , mk )
{ 2
⋮ ⋮
θk = g k (m1 , m2 , . . . , mk )
θ̂1 = g1 (m ̂ 1, m
̂ 2, . . . , m
̂ k)
̂θ2 = g 2 (m̂ 1, m
̂ 2, . . . , m
̂ k)
⋮ ⋮
{θ̂ k = g k (m
̂ 1, m
̂ 2, . . . , m
̂ k)
Procedimiento:
• Identifique los parámetros a estimar.
• Considere tantas ecuaciones como parámetros a estimar.
• Escriba los parámetros en términos de esperanzas.
• Estime las esperanzas y reemplace.
La cantidad de errores de tipeo que comete una secretaria por página, variable
que siguen una distribución de Poisson, son: 2 2 0 4 2 3 4 3 1 0.
Encuentre el estimador del parámetro de la distribución.
Observamos que 𝑋1 , … , 𝑋𝑛 vs.as. iid como X, con X P(λ).
̂(X) = X
E entonces ˆ = X = 2.1
53
Ejemplo 2: Estimación por el Método de los Momentos.
Ejemplo 3:
μ= EX(1)
{
σ2 = EX − (EX)2 (2)
2
m ̅
̂1 = X
{ 1
̂ 2 = ∑ X2i
m
n
54
Por el Método de los Momentos:
De (1) ˆ = X
X (X
1 1
De (2) ˆ 2 = 2
i − X2 = i − X) 2
n n
Luego ˆ = 9.69 y ˆ 2 = 1.80 ˆ = 1.34
Ejemplo 4:
Sea X U (-, +). Encontrar ̂ y ̂ por el método de los momentos:
1
α−β< x<α+β
Recuerden que fX (x) = { 2β
0 en otro caso
EX=
EX2=2 + 2/3 (Hacerlo como ejercicio)
Entonces reemplazo por los momentos muestrales:
ˆ = x
n n
2 1 ̂2 1 1 ̂2 1
α + β
̂ = ∑ xi 2 entonces x̄ 2 + β = ∑ xi 2 ⇒
3 n 3 n
i=1 i=1
2 ∑ni=1 xi 2
̂
β = 3( − x̄ 2 )
n
n 2
̂ = √3 (∑i=1 xi − x̄ 2 )
entonces β ∴ ̂ = √3σ
β ̂
n
̅
Distribución de 𝐗
55
Se sabe que:
2
▪ E( X ) = y V( X ) =
n
▪ Si X1, …, Xn iid con distribución Normal ̅ XNormal, por T. de Combinaciones
Lineales
▪ Si X1, …, Xn iid con otra distribución y n suficientemente grande X
̅ Aprox
Normal, por T. Central del Límite
X como estimador de .
Estas son buenas propiedades de ̅
Ejemplo 1 (continuación):
Para los datos del ejemplo 1 de esta sección, encuentre el desvío estándar del
estimador propuesto y estime dicho desvío.
σ λ 2 ̂ ̂
V(λ̂ ) = V(X̄) = n = n ̂(λ̂ ) = λ ⇒ σ
⇒V
λ
̂ λ̂ = √ = 0.46
n n
Ejemplo 2 (continuación):
Para los datos del ejemplo 2 de esta sección, encuentre el desvío estándar del
estimador propuesto.
ˆ ) = V 1
V ( f (x) =
1
f ' (x) = −
1
X x x2
1 1 1 1 1 1
≅ 1 + (− X̄2 ) |1⁄λ (X̄ − λ) = λ + (−λ2 ) (X̄ − λ) ya que E(X̄) = EX = λ
X̄ ⁄λ
σ2 4 1 λ2 λ
V(λ̂ ) ≅ (−λ2 )2 V(X̄) = λ4 =λ 2 = ⇒ σλ̂ ≅
n λ n n √n
2
λ̂ λ̂
̂(λ̂ ) ≅
V ⇒σ
̂ λ̂ ≅
n √n
56
̂𝟐
Distribución muestral de 𝝈
1
Se puede probar que E(σ̂ 2 ) = (1 − n) σ2 entonces, si definimos el estimador s2 como:
nˆ 2 1 n
2
s = =
n − 1 n − 1 i =1
(X i − X ) 2 se tiene que: E(s 2 ) = 2
1 n
s= s = 2
n − 1 i=1
(X i − X) 2 .
Definición:
Sea X1, X2, …, Xn una m. a. de X donde X tiene una función de distribución
acumulada FX(x, ), y sea el parámetro que deseo estimar.
Un intervalo del (1–)100 % de confianza para es un par de vs. as. ˆ 1 y ˆ 2 ,
funciones de la muestra tales que:
(ˆ
P1
ˆ =1−
2 )
x1,…,xn
x1,…,xn
57
Interpretación:
Que un intervalo tenga, por ejemplo, un 95 % de confianza, significa que: Si
tomáramos 100 muestras y construyéramos sus respectivos intervalos de confianza,
aproximadamente 95 de ellos contendrían el verdadero valor del parámetro.
X −
Estadístico pivote N (0, 1)
n
Observaciones
X − 1) en el 2o paso al multiplicar por –1 la
P − z1− z1− = 1 − expresión queda igual
2 2
n 2) el intervalo se construye para , y no
para X
3) no reemplazar los valores en la
P − z 1− X − z 1− =1−
probabilidad (reemplazarlos en el
n 2 n 2
intervalo)
P − z 1− − X z 1− =1−
n 2 n 2
P X − z 1− X + z 1− =1−
n 2 n 2
Entonces el intervalo del 100(1–) % de confianza para será: X z1− 2
n
X−
~ N(0, 1) por Teorema de Combinaciones Lineales.
n
58
X−μ
P(−z1−α⁄2 < < z1−α⁄2 ) = 1 − α
σ⁄√n
X−μ
P(−z1−0.025 < < z1−0.025 ) = 0.95
σ⁄√n
σ σ
P(− z0.975 < X̄ − μ < z0.975) = 0.95
√n √n
σ σ
P(X̄ − z0.975 < μ < X̄ + z0.975) = 0.95
√n √n
0.15
2.25 ± 1.96
6
59
Para el intervalo de confianza:
X̄ − μ
P (−t1−α(n−1) < s < t1−α(n−1) ) = 1 − α
2 ⁄ n 2
√
…
s
Entonces el intervalo del 100(1–) % de confianza para será: X̄ ± t α
√n 1−2(n−1)
X̄ − μ
P(−t1−α(n−1) < s < t1−α(n−1) ) = 1 − α
2 ⁄ n 2
√
s s
P(−t1−α(n−1) < X̄ − μ < t1−α(n−1) ) = 1 − α
2 √n 2 √n
s s
P(X̄ − t1−α(n−1) < μ < X̄ + t1−α(n−1) ) = 1 − α
2 √n 2 √n
s 0.023
X̄ ± t1−α(n−1) = 1.002 ± 2.31
2 √n √9
60
Intervalo para la diferencia de dos medias de poblaciones Normales con igual
varianza y desconocido
Sean
(Solo tengo s12 y s22 y por lo general s12 s22 por que las muestras son diferentes, pero se
supone que, por información adicional que los son iguales.)
Se debe buscar un estimador para , para aprovechar toda la información se usa un
estimador combinado (pool) de 2 de la siguiente forma:
(n − 1)sX2 + (m − 1)sY2
sp2 =
n+m−2
X̄−Ȳ−(μX −μY )
Entonces:
1 1
t (n + m – 2)
sp √ +
n m
Entonces:
X̄ − Ȳ − (μX − μY )
P −t1−α(n+m−2) < < t1−α(n+m−2) =1−α
2 1 1 2
( sp √n + m )
1 1
X̄ − Ȳ ± t1−α(n+m−2) sp √n + m intervalo del (1–)100 % de confianza para
2
X – Y
61
Ejemplo 7: Intervalo de confianza para la diferencia de medias con σ
desconocido.
Suponga que el número de piezas fabricadas, por día, por las máquinas A y B
siguen una distribución N(A,) y N(B,) respectivamente. El valor de σ es
desconocido.
El número diario de piezas fabricadas por la máquina A en 5 días ha sido:
50 48 53 60 37
y por la máquina B en los mismos 5 días ha sido:
40 51 62 55 64
X A = 49 .6 S A = 8.38 X B = 54 .4 S B = 9.61
4 x 8.38 2 + 4 x 9.612
s 2p = = 81 .29 sp = 9.02
5+5−2
X A − X B − ( A − B )
P(− t1− 2 t1− 2 ) = 1 −
1 1
sp +
n m
Algebraicamente llegamos a:
1 1
XA − XB sp + t
5 5 1− 2 (8)
Observación: En un intervalo:
1) Si se requiere mayor confiabilidad, se pierde precisión (intervalo más
grande)
2) Si se requiere mayor precisión, se pierde confiabilidad
3) Para tener mayor precisión sin perder confiabilidad se necesita mayor
información, por ejemplo, aumentando el tamaño muestral.
62
Intervalo de confianza para la proporción p en muestras grandes
X̄ − p
P −z1−α < =1−α < z1−α
p(1 − p) 2 2
√ ⁄n
( )
Trabajando como antes se llega a que el intervalo para p sería:
p(1 − p)
X̄ ± z1−α √
2 n
Pero depende de p, que es desconocido. Entonces reemplazamos p por su estimador por
el Método de los Momentos p̂ = X̄, es decir:
̄
X(1−X) ̄
X̄ ± z1−α √ n es un intervalo aproximado del 100(1–) % para p.
2
Xi − p
n N(0, 1) donde q = 1 - p
pq
n
Xi − p
P(− z n z ) =1-
1− pq 1−
2 2
n
Xi
−p
P(− z n z ) = 0.90
1− pq 1−
2 2
n
63
P (−z
pq
Xi − p z
pq
) = 0.90
1− n n 1− n
2 2
P(
Xi − z
pq
p
Xi + z
pq
) = 0.90
n 1− n n 1− n
2 2
4 4 196 1
1.65 0.02 0.01 (0.01, 0.03)
200 200 200 200
64
UNIDAD 8: Test de Hipótesis
Introducción:
Existe otra forma de hacer inferencia además de la estimación, se llama test de
hipótesis. A menudo el científico o el ingeniero se enfrentan al problema no tanto de estimar,
sino a la necesidad de tomar decisiones en base a los datos observados. La herramienta
estadística que resuelve este problema se denomina Test de Hipótesis.
Ejemplo 1:
a) Decidir si tomar café aumenta el riesgo de cáncer entre los hombres.
b) Decidir si hay diferencia de precisión entre dos tipos de medidores, etc.
1
Se presentan pruebas y, si son suficientes, se lo declara culpable, de lo contrario se declara
inocente, aunque no se pruebe que lo es.
Pueden ser:
1. Referidas a 1 población: Se refieren al valor de 1 parámetro en 1 población
2. Referidas a 2 poblaciones: Comparan cierto parámetro en 2 poblaciones.
De acuerdo a cómo se definan pueden ser:
1. Simples: quedan definidas con una igualdad
2. Compuestas: quedan definidas con un intervalo o unión de intervalos.
Referidas a 2 poblaciones
H0: 1= 2 Simple
H1: 1 2 ó 1> 2 ó 1< 2. Compuestas
Definición de Test:
Un test o prueba de hipótesis es una regla que especifica
a) Para qué valores de cierto estadístico calculado a partir de la muestra se decide
aceptar H0 como cierta, y
b) Para qué valores del estadístico, calculado a partir de la muestra se decide
rechazar H0 y aceptar H1 como cierta.
El subconjunto del espacio muestral para el cual H0 es rechazada se denomina región de
rechazo ó región crítica. El complemento de la región de rechazo se denomina región de
aceptación. La región de rechazo depende del nivel del nivel de significancia del test: y
cambia de acuerdo a la hipótesis alternativa. Se pueden presentar los siguientes casos:
a) Test de 2 colas (hacer gráfico y explicar lo de valor del estadístico poco frecuente,
introducir )
b) Test de una cola (hacer gráfico y explicar lo de valor del estadístico poco frecuente)
2
Notas:
Cuánto más chico es más significativo es el test
En general se recomienda hacer un test de 2 colas.
Metodología para un test:
La metodología comprende los siguientes pasos:
1- Definir H0 y H1.
Ejemplo:
H0: = 0
H1: ≠ 0 o > 0 o < 0
2- Definir el estadístico a utilizar y su distribución de probabilidad bajo H 0. la forma
general de este estadístico será:
estimador parámetro bajo H 0
Estadístico =
desviación estándar del estimador
Ejemplo:
H0: = 0
H1: ≠ 0 o > 0 o < 0
x o
t (n 1) (aclarar: exacta o aproximada, respectivamente)
s
n
3- Dado el nivel de significación , determinar la región crítica y con los datos tomar la
decisión, (explicar haciendo gráficas correspondientes en cada caso)
Alternativa de dos colas: H1: ≠ 0
Dado , se tiene t crítico = t1-/2, la región de rechazo es: │t observado │> t crítico,
Alternativa cola derecha: H1: > 0
Dado , se tiene t crítico = t1-, la región de rechazo es: t observado > t crítico,
Alternativa cola izquierda: H1: < 0
Dado , se tiene t crítico = tα, la región de rechazo es: t observado < t crítico.
H0: = 46
H1: ≠ 46
x o 42 46
t ( n 1) t o 1.16
s 11 .9
n 12
Observaciones
Cuando los datos no dan suficiente evidencia para rechazar H0, ésta no se puede rechazar.
Los datos no dan suficiente evidencia cuando el valor observado del estadístico tobservado es
un valor de alta probabilidad (valor p grande) o equivalentemente cuando el valor
observado del estadístico tobservado no cae en la región de rechazo.
Todos los procedimientos de test son similares, sólo cambian los estadísticos a utilizar:
4
Para la media :
X1,X2,… Xn iid como X N(, ), desconocido ó
X1,X2,… Xn iid como X FX, con EX = y Var (X) = 2 (desconocido), y n grande para
aplicar el T.C.L.
x o
t (n 1) (aclarar: exacta o aproximada, respectivamente)
s
n
Para la proporción p:
X1,X2,… Xn iid como X B(p), con n grande para aplicar el T.C.L.
p̂ x
H0: p=p0
H1:pp0
p̂ p o
N(0,1)
p 0 (1 p 0 )
n
5
Prueba de Hipótesis para 2 poblaciones:
Frecuentemente se presentan situaciones en la que es necesario comparar 2 poblaciones o 2
subpoblaciones de una población.
En general se desea comparar las medias, las varianzas de dos poblaciones o bien las
proporciones de cierto atributo. Vamos a comenzar con:
s 2 (n 1) s Y 2 (m 1)
donde s p 2 X
nm2
6
Ejemplo 6: Comparación de dos medias
Se lleva a cabo un experimento para comparar el desgaste por abrasivo de dos diferentes
materiales laminados.
Se prueban 12 piezas del material X obteniéndose X= 85 y sX = 4 y 10 piezas del
material Y resultando Y= 81 y sY = 5.
a) ¿Se puede concluir que tienen el mismo desgaste abrasivo ambos materiales?
Considere =0.05
X1, …, X12 iid N(μX, )
Y1, …, Y10 iid N(μY, ) muestras independientes, común y desconocido.
Hipótesis:
H0: X = Y
H1: X ≠ Y
X Y 0
t ~ t (n m2) bajo H 0 t observdo 2.085
1 1
sp
n m
t crítico = t0.975(20) = 2.09, como tobservado< t1-/2(20) No hay evidencia suficiente para
rechazar H0.
b) Si se sabe que el material X no puede tener menor desgaste que el material Y. ¿Se
puede concluir que el desgaste del material X es mayor que el del material Y? Considere
=0.05.
Hipótesis:
H0: X = Y
H1: X > Y
tobservado= 2.085 > t1–(20) = 1.72 Hay evidencia suficiente para rechazar H0.
Observaciones:
En este caso se puede utilizar el test de una cola por tener información adicional.
Note que el test de una cola es más potente pues detecta la diferencia que el test de dos
colas no pudo.
Nota: Las hipótesis son análogas a las del intervalo de confianza para la diferencia de medias.
7
Observación: Para realizar este tipo de pruebas se necesitan 2 muestras independientes y no
resuelve el caso, por ejemplo, antes y después de un tratamiento. Es decir, cuando se tiene una
misma población observada en 2 momentos o situaciones diferentes. En este caso se utiliza
comparación de Medias Apareadas
8
Estadístico:
d
t ~ t ( n 1) t (9) bajo H 0
sD
10
3 .5
t observado 4.99
2.22
10
Z
p̂ X p̂ Y
N(0,1), p
X i Yi óp
np̂ X mp̂ Y
1 1 nm nm
pq
n m
9
¿Se podría concluir que la proporción de votantes a favor es mayor en la ciudad A que
en la B?
X1, …, X200 iid B(pA)
Y1, …, Y500 iid B(pB) muestras independientes.
H 0 : pA = p B
H1 : p A p B
p̂ A p̂ B n A p̂ A n B p̂ B 120 240
Z N(0,1), por TCL p̂ 0.514
1 1 nA nB 700
p̂(1 p̂)
A
n n B
1 1 1 1
0.514 (1 0.514 )
1 1
p̂(1 p̂) 0.00175 p̂(1 p̂) 0.042
nA nB 200 500 nA nB
0.6 0.48
z observado 2.86
0.042
Valor p = P(| Z |> | Zobservado |) = P(| Z| > 2.86 ) = 1– P(| Z| ≤ 2.86 ) = 2 – 2 (2,86)=0.004
Como valor p es pequeño, se rechaza H0.
10
Ejemplo 10:
Un ingeniero desea estudiar el sesgo en una medición de ph. Se reúnen datos de una
sustancia neutra, ph = 7, se toma una muestra de 10 mediciones. Los datos son:
7.07, 7.00, 7.10, 6.97, 7.00, 7.03, 7.01, 7.01, 6.98, 7.08
Las hipótesis a probar son:
H0: = 7.00
H1: ≠ 7.00,
El estadístico del test es:
X7
~ t n 1
s
n
Trabajando algebraicamente,
s 0.044
x t 0.975(9) 7.025 2.262
n 10
(6.995, 7.055)
Como 7 IC0.95 No hay evidencia suficiente para pensar que el Medidor está
sesgado, pues puede ser igual a 7.
Análogamente se analizan y relacionan las pruebas de hipótesis estudiadas con los
correspondientes IC1-.
11
Ejemplo 11:
Se lanza 20 veces una moneda obteniéndose 5 caras. ¿Hay suficiente evidencia
para rechazar que la moneda está balanceada? Suponga = 0.10.
Si considero un test de hipótesis tengo
H0: p = 0.5
H1: p ≠ 0.5
pˆ 05
z N (0,1) por TCL
po (1 po )
n
Como = 0.10 Z 0.95 = 1.64
0.25 0.5
z0 2.24 z 0.95
0.11
Hay evidencia suficiente para rechazar H0.
Si considero IC0.90
p̂ p
P z 0.95 z 0.95 0.90
p̂(1 p̂)
n
Trabajando algebraicamente:
Como 0.5 IC1- Hay suficiente evidencia para afirmar que la moneda no está
balanceada.
Ejercicio:
Escribir la región de aceptación y rechazo para la diferencia de medias.
Región de aceptación:
x1 x2 t s 1 2 x1 x2 t
p s p
1 ( n1 n2 2) 1 ( n1 n2 2)
2 2
12
Errores al realizar un test:
Al realizar un test se pueden cometer 2 tipos de errores:
H0
Decisión Verdadera Falsa
Aceptar Decisión correcta Error Tipo II
Rechazar Error Tipo I Decisión correcta
Observaciones:
1) Cuando
2) La potencia del test = 1- = 1- P (Aceptar H0/H1) =
P (Rechazar H0/H1) = P (Aceptar H1/H1)
3) Es mejor informar el valor p, que fijar un nivel de significación, pues así estamos
concientes de cuan lejos o cerca estamos de rechazar H0.
13
UNIDAD 9: Regresión Lineal Simple
Vamos a estudiar la relación entre dos variables, a fin de observar una y predecir la otra. La
variable dependiente será predicha por la variable independiente.
Nosotros estudiamos el caso en que la variable independiente es no aleatoria, por lo tanto
esta se considera como variable controlada, fija y observada y ajustamos sólo relaciones lineales.
Ejemplo 1:
Se quiere medir la mejora en el rendimiento de un determinado fertilizante.
El experimento consiste en evaluar el rendimiento a diferentes dosis del fertilizante. Se
puede controlar las dosis de los fertilizantes perfectamente, no así el crecimiento de la planta.
DIAGRAMA DE DISPERSIÓN
El primer paso en el análisis de regresión es graficar los datos, que son pares de valores
(xi,yi), mediante un diagrama de dispersión.
Del gráfico observamos si es razonable, o no, la suposición de que la relación entre X e Y es
lineal. Si es razonable proponemos el modelo
Yi x i i i 1, 2, ..., n
x fijos
i
i , ..., n vs . as. con E( i ) 0
V ( i ) 2 M.R.L.S.
Cov( i , j ) 0 i j
, y 2 son los parámetros a estimar
Observaciones:
1) E(Y i )=E(+ x i + i )= + x i +E( i )= + x i
2) V(Y i )=V(+ x i + i )=V( i )= 2
Ejemplo 2:
Las cantidades de un compuesto químico Y que se disuelven en 100 gr. de agua a
diferentes temperaturas X que se registran como sigue:
x(oc) y(gr.)
0 8
15 12
30 25
45 31
60 44
75 48
Con los valores observados (xi, yi) construimos un gráfico llamado Diagrama de
Dispersión
62
Cantidad Disuelta vs Temperatura
C ant.D isuelta
(gr)
50
40
30
20
10
0
0 10 20 30 40 50 60 70 80
Tem peratura
Del gráfico observamos que es razonable suponer que la relación entre X e Y es lineal,
luego proponemos el modelo de regresión lineal simple:
y
n n
h(ˆ , ˆ )
i 1
e i2
i 1
i (ˆ ˆ x i ) 2
sea mínima.
ˆ
2 i 1
y i ˆ ˆ x i 0
Ecuaciones Normales
h 2 y ˆ ˆ x x 0
n
ˆ i 1
i i i
y i nˆ ˆ x i y ˆ ˆ x ˆ y ˆ x
y x i i ˆ x i ˆ x i2
y x y ˆ x n x ˆ x n x y n x ˆ ˆ x n x y ˆ x nx
2 2 2 2
i i i i
i
ˆ
y x nx y i i
x nx 2 2
i
63
Luego los estimadores son:
ˆ y ˆ x
ˆ
y x n x y (x x)(y y)
i i i i
(x x)
y
x nx 2 2 2
i i
2h 2h
2 x i 2n x 2 x i2
ˆ ˆ ˆ 2
2n
2nx
2n x
2 x i2
4n x i2 4n 2 x 4n x i2 n x 4n ( x i x ) 2 0
2 2
Por lo tanto es un mínimo.
Estimación de 2
n
e
1
Se puede demostrar que ˆ con e i y i ŷ i es un estimador insesgado para 2.
2 2
n2
i
i 1
n
Ayuda para sacarlo con la calculadora:
ˆ2 (1 R 2 ) ˆ 2y
n2
Ejemplo 2
Para este caso:
ˆ 6.429 6.4 ˆ 0.575 0.6
ŷ i 6.4 0.6x i
ˆ 2 6.771 ˆ 2.602
r2 = 0.98 (coef. de determinación) r = 0.99 (coef. de correlación)
representa el valor promedio de y cuando x vale 0, (sujeto a que esta interpretación tenga
sentido, muchas veces no la tiene).
representa cuanto cambia Y en promedio cuando X cambia en una unidad. Es decir la tasa de
cambio de Y por unidad de cambio de X
E( ̂ ) = V(ˆ )
x 2
i
2
n (x x) i
2
2
E( ̂ ) = V(ˆ )
(x i x) 2
64
Ejercicio: Demostrar las Esperanzas.
Suponiendo además que los errores tienen distribución i N(0,σ2)
Como ̂ y ̂ son variables aleatorias, tienen su distribución de probabilidades:
Se puede probar que
ˆ t(n-2) Donde SE()= V(ˆ )
SE ()
ˆ t(n-2) Donde SE()= V(ˆ )
SE ()
Y se pueden realizar sobre estos test de hipótesis y calcular estimación por intervalos como se
vió en las unidades anteriores.
Nota
Las predicciones son válidas sólo dentro del rango de los datos (no se puede extrapolar).
Ejemplo 3:
Gráfico de valores
y 30
25
20
15
10
5
0
0 1 2 3 4 5 6
x
Proponemos el modelo
yi = + xi2 + i
65
yi z i i
z1 , z 2 , ... , z n vs. observadas
i v. a
E ( ) 0 V ( ) 2
i i
Cov ( i , j ) 0 i j
, , parámetros a estimar
2
0 0 0 0 0 -0.15 0.15 0
1 1 1 1 1 0.92 0.08 1
2 4 5 20 16 4.14 0.86 25
3 9 8 72 81 9.49 -1.49 64
4 16 17 272 256 16.98 0.02 289
5 25 27 675 625 26.62 0.38 729
1040 979 1108
ˆ 0.15 ˆ 1.07
n
ei23.13
ˆ 2 i 1 0.78
n2 4
n
ei2 3.13
R 2zy 1 i 1 1 0.994
n 547.33
( y i y) 2
i 1
Yi X i i Linealidad
Las hipótesis a chequear son: E( i ) 0 media cero
V( i )
2
var ianza const.
Cov( i , j ) 0 i j no correlación
Se construye el gráfico de e i vs Ŷi (ó ei vs xi) (xi sirve solo para el caso de regresión lineal
simple)
66
Gráfico de residuos vs y_estimado
0,3
0,2
0,1
0
0 1 2 3 4 5 6
-0,1
-0,2
-0,3
Gráfico correcto
0,15
0,1
0,05
0
0 1 2 3 4 5 6
-0,05
-0,1
-0,15
-0,2
-0,25
Varianza no constante
0,15
0,1
0,05
0
0 1 2 3 4 5 6
-0,05
-0,1
-0,15
-0,2
Correlación entre los residuos
67
Bondad del Modelo (o del ajuste)
(Y Ŷ )
i i
2
(Ŷ i Y) 2
1
(Y Y ) i
2
(Y i Y) 2
Proporción de la Proporción de la
variabilidad total variabilidad total
no explicada por explicada por la
la recta recta
R 2
(ŷ y )i i
2
(x i x )( y i y)
2
1
e 2
i
( y y) i
2
(x i x) 2 (y i y) 2 (y i y) 2
R 1
2 e 2
i
(y i y) 2
Conclusión
R2 indica la proporción de variabilidad de y explicada por el modelo (x).
Cuanto más próximo a 1 es R2 mejor es el ajuste
Cuanto más próximo a cero es R2 peor es el ajuste
NOTA:
No confundir la Bondad del ajuste con la validez del modelo. Ambas, la validez y
la bondad deben reunirse al ajustar un modelo (idealmente)
Ejemplo 4
En un estudio sobre los efectos de pesticidas sobre especies que están expuestas a
ellos, se llevó a cabo un experimento en el cual se suministraron dosis de un pesticida a 25
ratones hembras con características similares.
La respuesta “Y” fue una medición de la actividad cerebral.
Animal 1 2 3 4 5 6 7 8 9 10 11 12 13
Dosis 0.0 0.0 0.0 0.0 0.0 2.3 2.3 2.3 2.3 2.3 4.6 4.6 4.6
Actividad 10.9 10.6 10.8 9.8 9.0 11.0 11.3 9.9 9.2 10.1 10.6 10.4 8.8
Cerebral
Animal 14 15 16 17 18 19 20 21 22 23 24 25
Dosis 4.6 4.6 9.2 9.2 9.2 9.2 9.2 18.4 18.4 18.4 18.4 18.4
Actividad 11.1 8.4 9.7 7.8 9.0 8.2 2.3 2.9 2.2 3.4 5.4 8.2
Cerebral
68
Respuesta de los ratones a la acción de los pesticidas
Actividad
Cerebral
12
10
0 Dosis
0 5 10 15 20
Se propone el modelo
yi x i i i 1, ..., n
i variable aleatoria
E ( i ) 0
2
V ( i )
Cov (i , j ) 0 i j i, j 1,..., n
x i v. observada
, , 2 parámetros a estimar
Se pueden cargar los datos en la planilla de cálculo Excel y se obtiene las estimaciones:
ˆ
x y nxy 1092 .27 25 6.9 8.4 0.3437
i i
x nx 2
i 2248 .25 25 6.9
2 2
e i 1
2
i
73 .782
ˆ 2 3.208
n2 23
r 1
2 ê 2
i
1
73 .782
0.6288
(y i y) 2
198 .760
69
Si se grafica los datos en Excel se puede obtener, haciendo doble clic sobre los puntos del
Actividad
Cerebral y = -0,3437x + 10,812
12 R2 = 0,6288
10
0 Dosis
0 5 10 15 20 25
salida:
Resumen
Estadísticas de la regresión
Coef. de correlación 0.792962004
múltiple
Coef. de determinación R^2 0.62878874
R^2 ajustado 0.61264912
Error típico 1.791064172
Observaciones 25
ANÁLISIS DE VARIANZA
Grados de libertad Suma de Promedio de los F Valor crítico de
cuadrados cuadrados F
Regresión 1 124.97805 124.97805 38.9593275 2.28032E-06
Residuos 23 73.78195 3.20791087
Total 24 198.76
Se puede guardar las predicciones y residuos y luego graficarlos, para analizar la bondad.
70
Observación Pronóstico Actividad Cerebral Residuos
( ŷi )
1 10.8115 0.0885
2 10.8115 -0.2115
3 10.8115 -0.0115
4 10.8115 -1.0115
5 10.8115 -1.8115
6 10.021 0.979
7 10.021 1.279
8 10.021 -0.121
9 10.021 -0.821
10 10.021 0.079
11 9.2305 1.3695
12 9.2305 1.1695
13 9.2305 -0.4305
14 9.2305 1.8695
15 9.2305 -0.8305
16 7.6495 2.0505
17 7.6495 0.1505
18 7.6495 1.3505
19 7.6495 0.5505
20 7.6495 -5.3495
21 4.4875 -1.5875
22 4.4875 -2.2875
23 4.4875 -1.0875
24 4.4875 0.9125
25 4.4875 3.7125
2
Residuos
-2
-4
-6
0 2 4 6 8 10 12
Pronóstico Actividad Cerebral
Los residuos no tienen varianza constante.
71
OTROS MODELOS
Existen otras relaciones entre variables que se pueden evaluar utilizando el Modelo Lineal,
por ejemplo:
1
2. Y x realizo la transformación Y* y ajusto el modelo Y * x i i
1
Y
72
UNIDAD 10: Control de calidad
59
Definición:
Se dice que un proceso está bajo control cuando hayamos eliminado todas las causas
asignables de variabilidad, de modo que la variabilidad sea debida sólo a causas no asignables.
Bajo esta condición, la característica a estudiar X, se puede suponer que es una variable
aleatoria. Suponemos X~N(µ, s).
Intervalos de tolerancia
El intervalo de tolerancia se define como el conjunto de valores de X que se consideran
admisibles: (LT1, LT2). Lo fija la empresa, la gerencia.
Este intervalo es simétrico respecto de µ, donde µ es la media o valor esperado que en
control de calidad se llama Valor Nominal.
Índice de Capacidad
Dado el intervalo de tolerancia (LT1 , LT2) se define el Índice de Capacidad como
LT2 - LT1
IC =
6s
60
¨ El índice de capacidad sirve para decidir si mejoramos el proceso de fabricación, es decir
resolver costos, réditos, etc.
¨ También sirve para determinar cómo muestrear, la frecuencia de muestreo, tamaño de la
muestra, etc.
• La capacidad del proceso se determina a partir de datos recogidos cuando el proceso está
supuestamente bajo control.
• Determinar la capacidad del proceso es equivalente estimar s
Se toman varias muestras tratando de eliminar todas las causas asignables de variabilidad,
estas muestras deben estar igualmente espaciadas a lo largo del proceso
61
Supongamos que se toman k muestras de tamaño n. Es decir:
media Desv. est.
X11 X12 … X1n X1 ŝ 1
…
Xk1 Xk2 … Xkn Xk ŝ k
X ŝ
å xi å å x ij
i =1 j=1 N = kn
i =1
x= =
k N
1 k
sˆ = å sˆ i
k i =1
3. Contrastar si las medias son homogéneas
( x - µ) » N(0, 1) si N es grande
sˆ / c 2 n
é sˆ sˆ ù
Luego x i Îê x - 3 , x +3 ú con probabilidad 0.997.
ë c 2 n c 2 n û
Se verifica que cada xi pertenezca al intervalo.
Si alguna media sale de los límites, significa que la media de esa muestra no es homogénea
con las demás (es decir que el proceso está fuera de control), luego se elimina esta muestra y se
realiza todos los cálculos nuevamente. Recordemos que el estado de control es un logro y no el
estado natural del proceso. En consecuencia es posible que el proceso pueda haber pasado a una
situación de falta de control durante el muestreo y producir la muestra no homogénea.
62
Observación: el coeficiente c2 es una corrección para que ŝ sea un estimador insesgado de
s , y está tabulada en función de n, tamaño de cada una de las muestras.
La variabilidad de cada muestra se estima por ŝi . entonces el intervalo del 99% de
Si algún punto sale de los límites, se dice que no es homogéneo con los demás. Luego se lo
descarta y se realiza todos los cálculos de nuevo.
No de muestra 1 2 3 4 5
xi 53 51 58 48 49
ŝ i 9 3 2 1 4
Entonces:
X = 51.8 sˆ = 3.8
3.8 1
X ± 3´ = X ± 5.36 Þ (46.44, 57.16)
0.8686 6
X = 50,25 sˆ = 4.25
63
4.25 1
X ± 3´ =X±6 Þ (44.25, 56.25)
0.8686 6
X = 49.33 sˆ = 2.67
2.67 1
X ± 3´ = X ± 3.76 Þ (45.57, 53.09)
0.8686 6
Ù sˆ 2.67
Capacidad = 6 =6 = 18.44
c2 0.8686
Ù 25
IC = = 1.36 Þ p < 0.3%
18.44
Control de fabricación
Una vez estimada la capacidad del proceso, con los límites de tolerancia se puede estimar el
LT - LT1 LT2 - LT1
índice de capacidad IĈ = 2 = , y con este dato determinar la frecuencia de
6 sˆ 6 s
ˆ
C2
muestreo.
Se construyen los gráficos de control para la media y la desviación estándar, se toma una
muestra cada cierto periodo de tiempo y se comprueba que el proceso esté bajo control.
sˆ
X+3
c2 n
X
sˆ
X-3
c2 n
64
Gráfico de Control para las desviaciones
B 4 ŝ
ŝ
B 3 ŝ
El control de procesos se realiza con las medias de las muestras por que son más eficaces
que las observaciones para detectar cambios en la media.
Ejemplo 2:
Muestra 1 2 3 4 5 6 7
Media 1511 1508 1522 1488 1524 1519 1504
Desv. Estándar 220 140 113 182 107 132 76
sˆ 138.57
X ±3 = 1510.86 ± 3 = 1510.85 ± 195.39 Þ(1315.47, 1706.23)
c2 n 0.8686 6
Todas las medias están dentro de la banda.
B3 = 0.030, B4 = 1.970
(B 3 138.57, B 4 138.57) = (4.157, 272.98)
b)
65
1706,23
1315,47
1 2 3 4 5 6 7 8
Las medias están en la banda, pero hay tendencia, por lo tanto el proceso no está bajo control.
Ejemplo 3:
Un proceso con media 100 mm. y desviación estándar 5 mm. Calcular la probabilidad de
detectar un cambio de 10 mm. en la media sí:
a) Considera 4 observaciones individuales.
b) Considera una media con 4 observaciones.
66
Interpretación de los gráficos de control
Periodicidad Inestabilidad
67
siguientes.
68
UNIDAD 11: Introducción al Diseño de Experimentos
Hasta este momento el material presentado acerca de test o prueba de hipótesis se refirió a 1 o 2
poblaciones a lo sumo. El caso de la comparación de 1 parámetro en 2 poblaciones se denomina
también problema de un solo factor, muchas veces llamado tratamiento y con dos niveles:
tratamiento y control, o bien tratamiento A y B. Por ejemplo, se desea comparar el tiempo
promedio que tarda en curar una gripe con una droga 1 y con una droga 2. La hipótesis nula es:
H0: 1=2.
Cuando en el experimento involucramos más de dos niveles, supongamos k niveles con k>2
necesitaremos k muestras y el procedimiento estadístico se denomina Análisis de la Varianza
(ANOVA).
Las hipótesis para llevar a cabo el ANOVA son: k muestras aleatorias independientes con
distribución Normal con medias 1, 2, 3,…k. y común, todos desconocidos.
Los datos se obtienen a partir de tantas muestras como tratamientos se tengan. Para determinar si
las medias son iguales o no, se compara la variabilidad presente en cada muestra (variabilidad
dentro de cada tratamiento) contra la variabilidad de muestra en muestra (variabilidad entre
tratamientos).
Esquemáticamente:
...
Y1. Y2 . ... Yk .
65
El estadístico utilizado es:
SSA /(k 1)
F= Fk-1,(n-1)k
SSE /(n 1)k
donde
SSA es la variabilidad entre los tratamientos
SSE es la variabilidad dentro de cada tratamiento
k n y
SSA n ( y i. y.. ) 2 y i.
ij
11 j 1
n
k n k n y
SSE ( y ij y i. ) 2 y
ij
11 j 1 i 1 j 1
kn
Interpretación:
Si el valor p es pequeño se rechaza H0.
Al rechazar H0 puedo estar interesado en saber cual de las medias es la diferente. En este caso se
realizan las comparaciones múltiples.
Existen varios métodos para realizar las comparaciones de a pares que mantienen el nivel .
Ellas son:
- Pruebas de Tuckey
66
- Pruebas de Duncan
- Pruebas de Dunnett
Las dos primeras comparan de a pares todas las medias, mientras que la de Dunnett compara
todas las medias con un control.
Generan intervalos de confianza para la diferencia de medias i - j. Luego, para probar las
hipótesis:
H0: i - j = 0 (o equivalentemente i = j ) para i j
H1: i - j 0 (o equivalentemente i j )
Se observa si 0 IC.
Ejemplo 1:
700
Respuesta
600
500
400
1
Mezcla
67
H0: 1 = 2 = ... = 5
H1: Al menos una es diferente.
1 2 3 4
2 -135,3
103,3
3 -176,5 -160,5
62,2 78,2
68
Normal Probability Plot of the Residuals
(response is Respuest)
Normal Score 1
-1
-2
Residual
Mezcla Respuesta
1 551
1 457
1 450
1 731
1 499
1 632
2 595
… …
5 563
5 631
5 522
5 613
5 656
5 679
Observación:
Para que el ANOVA sea válido deben cumplirse las hipótesis de:
- Normalidad de los datos.
- Varianza común.
- Independencia.
En este curso hemos aprendido a chequear normalidad de los datos. La comparación de varianzas
se realiza con un test F pero escapa a los conocimientos del curso.
69