Está en la página 1de 29

Ingeniería

Civil
Industrial

Estadística para
Ingeniería

Arica, 08 de abril de 2019


U2
nidad

ingeniería
civil
industrial
ingeniería
2 civil
industrial

Temas.
i. Conceptos estadísticos básicos.
ii. Muestreos y distribuciones de muestreos.

3
ingeniería
2 civil
industrial

i. Conceptos estadísticos básicos

2019
4
Un ejemplo para mostrar tratamientos y
prueba de hipótesis.
Un ingeniero está interesado
en comparar la fuerza de una
nueva formulación de mortero
que se le ha agregado emulsiones
de látex de polímeros, con
respecto al mortero sin modificar.
Se tiene 10 observaciones de
la nueva formulación y 10
observaciones del mortero sin
modificar. Cada uno de estas
formulaciones se denomina
tratamiento.
5
No se puede concluir sin evidencia
estadística significativa.

Cada tratamiento tiene los siguientes promedio:


𝑦1 = 16,76 𝑘𝑔𝑓/𝑐𝑚2 y 𝑦2 = 17,92 𝑘𝑔𝑓/𝑐𝑚2 . Se ve una
diferencia entre los tratamientos y se podría pensar que el
segundo tratamiento posee una fuerza mayor al primero. Sin
embargo, no hay evidencia estadística significativa, por
ahora, que señale que esta diferencia sea de la magnitud
suficiente para implicar que los dos tratamientos sean en
realidad diferentes.
6
Los valores de las corridas individuales
de la variable respuesta difieren entre sí
a causa del error experimental.
Las observaciones del experimento se denominan
corridas, sus valores individuales pueden diferir debido a las
fluctuaciones o ruidos, llamado error experimental, que es
causado por la “variación que es inevitable y no está bajo
control”.
La presencia de este ruido, lleva a que la variable de
respuesta sea una variable aleatoria, la cual puede ser
discreta o continua.
Si el conjunto de todos los valores posibles de la
variable aleatoria es finito o contablemente infinito se dice
discreta. Si el conjunto de todos los valores posibles de la
variable aleatoria es un intervalo se dice continua.
7
Los métodos gráficos simples son útiles
para analizar datos de un experimento.
Algunos métodos gráficos empleados son:
◦ Diagrama de puntos.
◦ Histogramas.
◦ Diagrama de caja y bigotes.
Diagrama de puntos: Útil para pocas observaciones ( 20),
permite ver de las observaciones su tendencia central y su
dispersión.
Histograma: Útil para numerosas observaciones (> 20),
muestra la tendencia central, dispersión y la forma de
distribución de los datos. Se construye dividiendo el eje
horizontal en intervalos donde el área del rectángulo del
intervalo es proporcional al número de observaciones.
8
El intervalo de un histograma es
proporcional a 𝑛𝑗 que es el número de
observaciones que tiene ese intervalo.

9
El diagrama de caja – bigotes (box plot)
emplea percentiles.
Diagrama de caja y
bigotes: Muestra el
mínimo, el máximo,
los cuartiles inferior
(𝑃25 ) y superior
(𝑃75 ) y la mediana
(𝑃50 ).

Todos los métodos gráficos son útiles para resumir la


información de una muestra de datos. Para describir con
mayor detalle una muestra, se usa el concepto de
distribución de probabilidad.
10
Una variable aleatoria (𝑦), la estructura
de la probabilidad se describe mediante
una distribución de probabilidad.
Cuando 𝑦 es discreta se refiere a su distribución de
probabilidad (𝑝(𝑦)) como la función de probabilidad de y.

La altura de la función 𝑝(𝑦𝑗) representa la


probabilidad.
11
La distribución de probabilidad de una
variable aleatoria puede ser discreta o
continua.
Cuando 𝑦 es continua se refiere a su distribución de
probabilidad ( 𝑓(𝑦) ) como la función de densidad de
probabilidad de y. El área bajo la curva dado por el intervalo
representa la probabilidad.

12
La media 𝜇 de una distribución de
probabilidad es una medida de su
tendencia central.
Puede expresarse mediante el operador 𝐸, conocido
como el valor esperado o el valor promedio a la larga de la
variable aleatoria 𝑦, tal como, se señala a continuación:

13
La varianza 𝜎 2 representa la variabilidad
o grado de dispersión de una
distribución de probabilidad.
Puede expresarse, como se señala a continuación:

Si se emplea el operador 𝐸, se tendría que:

Si se emplea el operador 𝑉, se tendría que:

14
Propiedades de una variable aleatoria 𝑦
2
con media 𝜇, varianza 𝜎 y constante 𝑐.

Para una variable aleatoria se cumple esto:

15
Propiedades de una variable aleatoria 𝑦
2
con media 𝜇, varianza 𝜎 y constante 𝑐.

Para dos variables aleatorias se cumple esto:

Donde:
Es la covarianza de las variables aleatorias 𝑦1 y 𝑦2, y
representa la asociación lineal entre ambas. Si 𝑦1 y 𝑦2, son
independientes, entonces:

16
Propiedades de una variable aleatoria 𝑦
2
con media 𝜇, varianza 𝜎 y constante 𝑐.

Para dos variables aleatorias independientes, se


cumple esto:

17
ingeniería
2 civil
industrial

ii. Muestreo y distribuciones de


muestreo

2019
18
El objetivo de la inferencia estadística es
concluir acerca de la población usando
una muestra de la misma.
Se supondrá que se emplea muestreo aleatorio. Si se
tiene una población de 𝑁 elementos y una muestra de 𝑛,
significa que de las 𝑁!/ 𝑁 − 𝑛 ! 𝑛! posibles muestras, cada
una tiene igual probabilidad de ser escogidas.
Un estadístico, será cualquier función de las
observaciones de una muestra que no contiene parámetros
desconocidos. Si 𝑦1, 𝑦2,…, 𝑦𝑛, representan las observaciones
de una muestra. Se definen los siguientes estadísticos,
promedio y varianza muestral:

19
El promedio y la varianza muestral son
estimadores puntuales de la media y
varianza poblacional.
Un estimador de un parámetro desconocido es un
estadístico que corresponde con dicho parámetro.
Un estimador es una v.a.
El valor específico que tenga un estimador de una
muestra se le denomina estimación.
Un estimador puntual tiene las siguientes propiedades:
◦ Debe ser insesgado, que a la larga tienda al parámetro
poblacional.
◦ Debe tener la varianza mínima, posee la menor varianza que
cualquier otro estimador del parámetro.

20
La distribución de probabilidad de un
estadístico se le conoce como
distribución de muestreo.
La distribución de muestro más importante es la
distribución normal.
Sea 𝑦 una v.a. normal, su distribución de probabilidad
de 𝑦 es:

Se denota por:
𝑦~𝑁(𝜇, 𝜎 2 )

21
Un caso particular de la distribución
normal es la distribución normal
estándar, con 𝜇=0 y 𝜎 2 =1
Para una distribución de probabilidad estándar, se
tiene que la siguiente v.a.

La cual se le conoce como estandarización de la v.a.


normal.
La cual se denota como:
𝑧~𝑁(0,1)
En muchas técnicas se supone que la v.a. sigue una
distribución normal y surge por ello el Teorema del Límite
Central.
22
Teorema del límite central, señala que
para distribuciones independientes a la
larga tienden a la normal.
Si 𝑦1, 𝑦2, … , 𝑦𝑛 es una sucesión de 𝑛 v.a.
independientes que tienen una distribución idéntica entre
ellas, con:
𝐸 𝑦𝑖 = 𝜇;
𝑉(𝑦𝑖 ) = 𝜎2.
𝑥 = 𝑦1 + 𝑦2 + … + 𝑦𝑛 entonces:
Tiene una distribución aproximadamente normal
~𝑁(0, 1).
Cuando se trabaja con varias fuentes independientes,
surge el error experimental, por lo tanto, la distribución
normal es un modelo recomendable para este tipo de error.
23
Distribución 𝜒2

Si 𝑧1, 𝑧2, … , 𝑧𝑛 sean v.a. con una distribución normal e


independientes con media 0 y varianza 1 (~𝑁𝐼𝐷(0,1)),
entonces la v.a.:

sigue una distribución 𝜒 2 , con k grados de libertad


La función de densidad de distribución es asimétrica y
sesgada con:

24
Distribución 𝜒2

25
Distribución t - student

Si 𝑧 es una v.a. normal estándar y 𝜒 2 , la v.a.:

sigue una distribución 𝑡-student, con k grados de


libertad
La función de densidad de distribución es simétrica e
insesgada con:

26
Distribución t - student

Si k tiende a infinito, entonces ~𝑁(0,1)

27
Distribución F (Fisher)

Si 𝜒𝑢2 y 𝜒𝑣2 son dos v.a. chi-cuadrado independientes


con 𝑢 y 𝑣 grados de libertad respectivamente, entonces el
cuociente:

sigue una distribución 𝐹 con 𝑢 grados de libertad en el


numerados y 𝑣 grados de libertad en el denominador.
Si x es una v.a. F, entonces la función de densidad de
distribución de x es:

28
Distribución F (Fisher)

29

También podría gustarte