TP Final Probabilidad y Estadística UTN

Se estudiarn las resistencias de hormigones a 28 das.
Los datos fueron

obtenidos
mediante
ensayos
independientes.
Presentamos
datos:
realizados
compresin,
Resistencia a 28 das
(kg/cm2)
444 379 492 427 450
442 441 490 433 458
427 480 486 472 447
437 470 477 491 451
402 382 478 473 449
435 433 458 472 445
427 405 384 502 478
406 406 382 459 433
417 446 452 482 410
365 444 414 437 414
472 427 370 456 484
474 459 369 421 471
423 446 407 421 478
410 414 402 473 459
431 407 452 473 419
421 433 459 487 406
435 427 468 486 465
402 421 454 447 484
410 424 452 436 378
393 455 463 449 457
100
ensayos
continuacin la base de
Estudios estadsticos
A continuacin se muestran los datos organizados para su estudio mediante
tcnicas y herramientas de Estadstica Descriptiva, con el fin de hacer una
descripcin lo ms sencilla posible de los resultados de la muestra.
Lo haremos mediante representaciones grficas y resmenes numricos.
La siguiente tabla de frecuencias, nos muestra cuantas de las probetas
ensayadas resistieron entre, por ejemplo, 365 y 379 kg/cm (frecuencia
absoluta) y el cociente entre sta y la cantidad total de la muestra (n=100),
frecuencia relativa.
Intervalos
365<=x<38
0
380<=x<39
5
395<=x<41
0
410<=x<42
5
425<=x<44
0
440<=x<45
5
455<=x<47
0
470<=x<48
5
485<=x<50
0
500<=x<51
5
Fr.
Absoluta
Fr. Relativa
Fr.
Acumulada
0,05
0,04
0,09
18
14
0,14
32
15
0,15
47
17
0,17
64
12
0,12
76
17
0,17
93
0,06
99
0,01
100
Mediante estos grficos se puede ir pensando en que la distribucin de los

datos sea normal (hiptesis que ser probada ms adelante). Pero ya en el
primer grfico, observamos como el histograma ms o menos se adapta a una
campana, y en el segundo ()
Continuamos el anlisis con las medidas de centralizacin, que nos indican en
torno a qu valor se distribuyen los datos. Estos fueron calculados con todos
los datos, es decir, sin tener en cuenta los intervalos, y los clculos fueron
realizados en Excel:
Media aritmtica
x i =440,12
X =
n
La media es una medida apropiada de medida central para muchos
conjuntos de datos, este valor puede verse afectado de manera
desproporcionada por la existencia de algunos valores extremos, como
en nuestro caso no hay valores atpicos, podemos decir que este nmero
es representativo de la muestra, nos indica que la media de la rotura a
compresin estuvo aproximadamente a 440 kg/cm.
Mediana
Ente caso, al tener una cantidad de datos par, se toman los dos datos
centrales y se calcula su promedio o se utiliza la frmula:
x n+ x n
~
x=
+1
=443,7
Como podemos ver, este parmetro se asemeja a la media, con lo cual

podemos seguir pensando que la distribucin de los datos estudiados
sea normal.
Moda
La moda es el valor de mayor frecuencia absoluta.
Mo=427
Ahora procedemos a estudiar las medidas de dispersin. Estas nos
muestran la variabilidad de una distribucin, indicando por medio de un
nmero, si las diferentes puntuaciones de una variable estn muy
alejadas de la mediana, o de la media. Cuanto mayor sea ese valor,
mayor ser la variabilidad, cuanto menor sea, ms homognea ser a la
mediana o la media.
Rango
Rango=X max X min =502365=137

Este valor nos mide la amplitud de los valores de la muestra. Debe
aclararse que si existen valores extremos, esta forma de calcular el
rango no sirve ya que no sera representativo. No es nuestro caso, ya
que ms adelante se probar que no hay valores extremos.
Desvo medio
Dm=
| Xi X |=26,51
n
Esta medida nos da buena informacin sobre la dispersin de los datos,

nos dice cuanto se alejan del valor medio, en promedio. Sin embargo,
esta forma de medir la desviacin no resulta muy til pues no posee
buenas propiedades estadsticas.
Varianza
2
( Xi X )
s=
=1026
2
(n1)
Desvo estndar
s=+ s2=32,03
Este parmetro nos indica cuando se alejan, en promedio, las
resistencias del valor medio.
A continuacin, presentamos un grfico en el cul nos acercamos ms an a la

idea de que los datos estn distribuidos normalmente.
Este grfico fue hecho con Excel, en donde se toman los valores, la media, el
desvo estndar y Excel calcula la funcin de distribucin.
Como podemos ver, la grfica toma forma de campana.
Diagrama de caja o de bigotes

Con l, se prueba la no existencia de valores atpicos.
Llegamos a la conclusin de que no existen valores atpicos, ya que el valor

mnimo de nuestro rango de datos (365) es mayor al lmite inferior (347,65) y
adems, el mximo valor de nuestro rango (502) no supera el lmite superior
(536,85).
Los lmites fueron calculados con Excel, mediante las siguientes frmulas:
Li=Q11,5RIC
Ls=Q3+1,5R IC
Bondad de ajuste
Aplicacin de la prueba de bondad de ajuste
Esta prueba nos sirve para establecer si es razonable pensar que nuestros
datos recogidos en una muestra provienen de una determinada distribucin
especfica, pensar que provienen de distribucin normal en nuestro caso. Es
decir, esta prueba sirve para determinar que tan bien se ajustan las
frecuencias observadas en nuestra muestra a la distribucin normal, que es la
terica propuesta.
Para aplicar la prueba de bondad de ajuste sobre nuestra base de datos
procedemos de la siguiente forma:
Lo que queremos saber es si, con un nivel de significacin del 5%, las
resistencias a compresin de las probetas de hormign de nuestra muestra,
siguen una distribucin normal.
1) Vamos a estudiar si las probetas siguen una distribucin normal. Para hacer
una prueba de bondad de ajuste se necesita probar una distribucin concreta,
por lo tanto para poder proponer una distribucin hay que proponerla completa
junto con sus parmetros. Si no sabemos qu valores de los parmetros tendr
la distribucin que vamos a proponer, primero debemos estimaros.
La distribucin normal tiene dos parmetros: y . Se usara los estimadores
habituales de dichos parmetros. Se obtiene:
n
xi
x = i=1
n
S=
= 440,12
( x x i)2
1
= 32,03
n1
Entonces se propondr que las resistencias tienen (en kg/cm) una distribucin
N (440,12; 32,03).
2) Se proponen las hiptesis, las que en nuestro caso nos quedan:
H0: Los datos de nuestra muestra provienen de una distribucin N (440,12;

32,03).
H1: Los datos de nuestra muestra no provienen de tal distribucin.
3) Tomando los siguientes intervalos calculando las correspondientes
probabilidades:
Categora
365<=x<38
0
380<=x<39
5
395<=x<41
0
410<=x<42
5
425<=x<44
0
440<=x<45
5
455<=x<47
0
470<=x<48
5
485<=x<50
0
500<=x<51
5
Pi
0,02066
0,04922
0,09434
0,14557
0,18082
0,17724
0,14657
0,08859
0,05053
0,02743
4) Se calculan las frecuencias esperadas:

Categora
365<=x<38
0
380<=x<39
5
395<=x<41
0
410<=x<42
5
425<=x<44
0
440<=x<45
5
455<=x<47
0
470<=x<48
5
485<=x<50
0
500<=x<51
Pi
n*Pi
0,02066
2,066
0,04922
4,922
0,09434
9,434
0,14557
14,557
0,18082
18,082
0,17724
17,724
0,14657
14,657
0,08859
8,859
0,05053
0,02743
5,0526
2,7434
5) Como la primera, segunda y ltima categora tienen frecuencia esperada

menor que 5, debemos agrupar categoras. Agruparemos la primera categora
con la segunda, y la ltima con la anterior a ella. Entonces nos queda:
Categora
365<=X<=39
5
395<=x<410
410<=x<425
425<=x<440
440<=x<455
455<=x<470
470<=x<485
485<=X<=51
5
Pi
n*Pi
0,06988
0,09434
0,14557
0,18082
0,17724
0,14657
0,08859
6,988
9,434
14,557
18,082
17,724
14,657
8,859
0,07796
7,796
6) Se agregan las frecuencias observadas y se determina el valor emprico del

estadstico de prueba:
Categora
365<=X<=39
5
395<=x<410
410<=x<425
425<=x<440
440<=x<455
455<=x<470
470<=x<485
485<=X<=51
5
Pi
n*pi
xi
((xi-n*pi)^2)/(n*Pi)
0,06988
0,09434
0,14557
0,18082
0,17724
0,14657
0,08859
6,988
9,434
14,557
18,082
17,724
14,657
8,859
9
9
14
15
17
12
17
0,57929937
0,019965656
0,021312702
0,525313793
0,029574362
0,48165716
7,481192121
0,07796
7,796
0,0812745
( xinpi)
nPi
i=1
9,219589665
7) Como =0,05, k=8 (nmero de categoras) y c=2 (porque se estimaron dos

parmetros):
X21-; k-c-1
se busca en la tabla X20, 95; 5=11,070
Como X2< X20, 95; 5, no se rechaza Ho, y por lo tanto con un nivel de
significacin del 5% se dice que los datos recogidos provienen de una
distribucin N (440,12; 32,03).
Intervalo de confianza para la media de una poblacin

Para estimar un parmetro poblacional, un intervalo de confianza es un rango
de valores (calculado en una muestra) en el cual se encuentra el verdadero
valor del parmetro, con una probabilidad determinada. En nuestro caso,
quisimos estimar la media poblacional, y lo hicimos de la siguiente manera:
t
L12=x
1 ; ( n1)
2
s=440,12
t 0,975 ;99
1,66
32,03=440,12
32,03
10
100
L12=[ 434,8 ; 445,43 ]
Sabiendo que es una distribucin normal con

de significacin
desconocido y con un nivel
=0,05 . Con este resultado, estamos un 95% seguros de
que el intervalo contenga verdaderamente a la media poblacional.

TP Final Probabilidad y Estadística UTN

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

TP Final Probabilidad y Estadística UTN

Cargado por

Copyright:

Formatos disponibles

Se estudiarn las resistencias de hormigones a 28 das.

Los datos fueron

Mediante estos grficos se puede ir pensando en que la distribucin de los

Como podemos ver, este parmetro se asemeja a la media, con lo cual

La moda es el valor de mayor frecuencia absoluta.

Rango=X max X min =502365=137

Esta medida nos da buena informacin sobre la dispersin de los datos,

A continuacin, presentamos un grfico en el cul nos acercamos ms an a la

Como podemos ver, la grfica toma forma de campana.

Diagrama de caja o de bigotes

Llegamos a la conclusin de que no existen valores atpicos, ya que el valor

H0: Los datos de nuestra muestra provienen de una distribucin N (440,12;

4) Se calculan las frecuencias esperadas:

5) Como la primera, segunda y ltima categora tienen frecuencia esperada

6) Se agregan las frecuencias observadas y se determina el valor emprico del

7) Como =0,05, k=8 (nmero de categoras) y c=2 (porque se estimaron dos

se busca en la tabla X20, 95; 5=11,070

Intervalo de confianza para la media de una poblacin

L12=[ 434,8 ; 445,43 ]

Sabiendo que es una distribucin normal con

desconocido y con un nivel

=0,05 . Con este resultado, estamos un 95% seguros de

que el intervalo contenga verdaderamente a la media poblacional.

También podría gustarte