Unidad 2. Comparación Simple

Ingeniería
Civil
Industrial
Estadística para
Ingeniería
Arica, 08 de abril de 2019

U2
nidad
ingeniería
civil
industrial
ingeniería
2 civil
industrial
Temas.
i. Conceptos estadísticos básicos.
ii. Muestreos y distribuciones de muestreos.
3
ingeniería
2 civil
industrial
i. Conceptos estadísticos básicos
2019
4
Un ejemplo para mostrar tratamientos y
prueba de hipótesis.
Un ingeniero está interesado
en comparar la fuerza de una
nueva formulación de mortero
que se le ha agregado emulsiones
de látex de polímeros, con
respecto al mortero sin modificar.
Se tiene 10 observaciones de
la nueva formulación y 10
observaciones del mortero sin
modificar. Cada uno de estas
formulaciones se denomina
tratamiento.
5
No se puede concluir sin evidencia
estadística significativa.
Cada tratamiento tiene los siguientes promedio:

𝑦1 = 16,76 𝑘𝑔𝑓/𝑐𝑚2 y 𝑦2 = 17,92 𝑘𝑔𝑓/𝑐𝑚2 . Se ve una
diferencia entre los tratamientos y se podría pensar que el
segundo tratamiento posee una fuerza mayor al primero. Sin
embargo, no hay evidencia estadística significativa, por
ahora, que señale que esta diferencia sea de la magnitud
suficiente para implicar que los dos tratamientos sean en
realidad diferentes.
6
Los valores de las corridas individuales
de la variable respuesta difieren entre sí
a causa del error experimental.
Las observaciones del experimento se denominan
corridas, sus valores individuales pueden diferir debido a las
fluctuaciones o ruidos, llamado error experimental, que es
causado por la “variación que es inevitable y no está bajo
control”.
La presencia de este ruido, lleva a que la variable de
respuesta sea una variable aleatoria, la cual puede ser
discreta o continua.
Si el conjunto de todos los valores posibles de la
variable aleatoria es finito o contablemente infinito se dice
discreta. Si el conjunto de todos los valores posibles de la
variable aleatoria es un intervalo se dice continua.
7
Los métodos gráficos simples son útiles
para analizar datos de un experimento.
Algunos métodos gráficos empleados son:
◦ Diagrama de puntos.
◦ Histogramas.
◦ Diagrama de caja y bigotes.
Diagrama de puntos: Útil para pocas observaciones ( 20),
permite ver de las observaciones su tendencia central y su
dispersión.
Histograma: Útil para numerosas observaciones (> 20),
muestra la tendencia central, dispersión y la forma de
distribución de los datos. Se construye dividiendo el eje
horizontal en intervalos donde el área del rectángulo del
intervalo es proporcional al número de observaciones.
8
El intervalo de un histograma es
proporcional a 𝑛𝑗 que es el número de
observaciones que tiene ese intervalo.
9
El diagrama de caja – bigotes (box plot)
emplea percentiles.
Diagrama de caja y
bigotes: Muestra el
mínimo, el máximo,
los cuartiles inferior
(𝑃25 ) y superior
(𝑃75 ) y la mediana
(𝑃50 ).
Todos los métodos gráficos son útiles para resumir la

información de una muestra de datos. Para describir con
mayor detalle una muestra, se usa el concepto de
distribución de probabilidad.
10
Una variable aleatoria (𝑦), la estructura
de la probabilidad se describe mediante
una distribución de probabilidad.
Cuando 𝑦 es discreta se refiere a su distribución de
probabilidad (𝑝(𝑦)) como la función de probabilidad de y.
La altura de la función 𝑝(𝑦𝑗) representa la

probabilidad.
11
La distribución de probabilidad de una
variable aleatoria puede ser discreta o
continua.
Cuando 𝑦 es continua se refiere a su distribución de
probabilidad ( 𝑓(𝑦) ) como la función de densidad de
probabilidad de y. El área bajo la curva dado por el intervalo
representa la probabilidad.
12
La media 𝜇 de una distribución de
probabilidad es una medida de su
tendencia central.
Puede expresarse mediante el operador 𝐸, conocido
como el valor esperado o el valor promedio a la larga de la
variable aleatoria 𝑦, tal como, se señala a continuación:
13
La varianza 𝜎 2 representa la variabilidad
o grado de dispersión de una
distribución de probabilidad.
Puede expresarse, como se señala a continuación:
Si se emplea el operador 𝐸, se tendría que:
Si se emplea el operador 𝑉, se tendría que:
14
Propiedades de una variable aleatoria 𝑦
2
con media 𝜇, varianza 𝜎 y constante 𝑐.
Para una variable aleatoria se cumple esto:
15
2
Para dos variables aleatorias se cumple esto:
Donde:
Es la covarianza de las variables aleatorias 𝑦1 y 𝑦2, y
representa la asociación lineal entre ambas. Si 𝑦1 y 𝑦2, son
independientes, entonces:
16
2
Para dos variables aleatorias independientes, se

cumple esto:
17
ingeniería
2 civil
industrial
ii. Muestreo y distribuciones de

muestreo
2019
18
El objetivo de la inferencia estadística es
concluir acerca de la población usando
una muestra de la misma.
Se supondrá que se emplea muestreo aleatorio. Si se
tiene una población de 𝑁 elementos y una muestra de 𝑛,
significa que de las 𝑁!/ 𝑁 − 𝑛 ! 𝑛! posibles muestras, cada
una tiene igual probabilidad de ser escogidas.
Un estadístico, será cualquier función de las
observaciones de una muestra que no contiene parámetros
desconocidos. Si 𝑦1, 𝑦2,…, 𝑦𝑛, representan las observaciones
de una muestra. Se definen los siguientes estadísticos,
promedio y varianza muestral:
19
El promedio y la varianza muestral son
estimadores puntuales de la media y
varianza poblacional.
Un estimador de un parámetro desconocido es un
estadístico que corresponde con dicho parámetro.
Un estimador es una v.a.
El valor específico que tenga un estimador de una
muestra se le denomina estimación.
Un estimador puntual tiene las siguientes propiedades:
◦ Debe ser insesgado, que a la larga tienda al parámetro
poblacional.
◦ Debe tener la varianza mínima, posee la menor varianza que
cualquier otro estimador del parámetro.
20
La distribución de probabilidad de un
estadístico se le conoce como
distribución de muestreo.
La distribución de muestro más importante es la
distribución normal.
Sea 𝑦 una v.a. normal, su distribución de probabilidad
de 𝑦 es:
Se denota por:
𝑦~𝑁(𝜇, 𝜎 2 )
21
Un caso particular de la distribución
normal es la distribución normal
estándar, con 𝜇=0 y 𝜎 2 =1
Para una distribución de probabilidad estándar, se
tiene que la siguiente v.a.
La cual se le conoce como estandarización de la v.a.

normal.
La cual se denota como:
𝑧~𝑁(0,1)
En muchas técnicas se supone que la v.a. sigue una
distribución normal y surge por ello el Teorema del Límite
Central.
22
Teorema del límite central, señala que
para distribuciones independientes a la
larga tienden a la normal.
Si 𝑦1, 𝑦2, … , 𝑦𝑛 es una sucesión de 𝑛 v.a.
independientes que tienen una distribución idéntica entre
ellas, con:
𝐸 𝑦𝑖 = 𝜇;
𝑉(𝑦𝑖 ) = 𝜎2.
𝑥 = 𝑦1 + 𝑦2 + … + 𝑦𝑛 entonces:
Tiene una distribución aproximadamente normal
~𝑁(0, 1).
Cuando se trabaja con varias fuentes independientes,
surge el error experimental, por lo tanto, la distribución
normal es un modelo recomendable para este tipo de error.
23
Distribución 𝜒2
Si 𝑧1, 𝑧2, … , 𝑧𝑛 sean v.a. con una distribución normal e

independientes con media 0 y varianza 1 (~𝑁𝐼𝐷(0,1)),
entonces la v.a.:
sigue una distribución 𝜒 2 , con k grados de libertad

La función de densidad de distribución es asimétrica y
sesgada con:
24
Distribución 𝜒2
25
Distribución t - student
Si 𝑧 es una v.a. normal estándar y 𝜒 2 , la v.a.:
sigue una distribución 𝑡-student, con k grados de

libertad
La función de densidad de distribución es simétrica e
insesgada con:
26
Distribución t - student
Si k tiende a infinito, entonces ~𝑁(0,1)
27
Distribución F (Fisher)
Si 𝜒𝑢2 y 𝜒𝑣2 son dos v.a. chi-cuadrado independientes

con 𝑢 y 𝑣 grados de libertad respectivamente, entonces el
cuociente:
sigue una distribución 𝐹 con 𝑢 grados de libertad en el

numerados y 𝑣 grados de libertad en el denominador.
Si x es una v.a. F, entonces la función de densidad de
distribución de x es:
28
Distribución F (Fisher)
29

Unidad 2. Comparación Simple

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Unidad 2. Comparación Simple

Cargado por

Copyright:

Formatos disponibles

Ingeniería

Arica, 08 de abril de 2019

i. Conceptos estadísticos básicos

Cada tratamiento tiene los siguientes promedio:

Todos los métodos gráficos son útiles para resumir la

La altura de la función 𝑝(𝑦𝑗) representa la

Si se emplea el operador 𝐸, se tendría que:

Si se emplea el operador 𝑉, se tendría que:

Para una variable aleatoria se cumple esto:

Para dos variables aleatorias se cumple esto:

Para dos variables aleatorias independientes, se

ii. Muestreo y distribuciones de

La cual se le conoce como estandarización de la v.a.

Si 𝑧1, 𝑧2, … , 𝑧𝑛 sean v.a. con una distribución normal e

sigue una distribución 𝜒 2 , con k grados de libertad

Si 𝑧 es una v.a. normal estándar y 𝜒 2 , la v.a.:

sigue una distribución 𝑡-student, con k grados de

Si k tiende a infinito, entonces ~𝑁(0,1)

Si 𝜒𝑢2 y 𝜒𝑣2 son dos v.a. chi-cuadrado independientes

sigue una distribución 𝐹 con 𝑢 grados de libertad en el

También podría gustarte