Está en la página 1de 13

Camilo Andrs Diaz Pinzn

Caterin Daniela Gonzlez Puentes


Tito Leonardo Len Buitrago
Proyecto de aula estadstica inferencial

Se toman las medidas de calzado de 10 personas.


Los resultados fueron los siguientes:

persona numero calzado


1 36
2 38
3 40
4 42
5 37
6 40
7 39
8 39
9 41
10 38

1. Con la informacin recogida calcule la media aritmtica y la desviacin


estndar.

> mean(datos)
[1] 39

> sd(datos)
[1] 1.825742

La longitud promedio del calzado observado es de 39 centmetros con una


desviacin estndar de 1.83cm.

2. Determine el nmero de muestras de tamao 2, 3 y 4, que se pueden


obtener de esa poblacin hipottica.

a. Con orden y con reemplazo

Para muestras con n=4:


> 10^4
[1] 10000

Hay 10.000 posibles muestras de tamao 4 con orden y con reemplazo

Para muestras con n=3:


> 10^3
[1] 1000
Camilo Andrs Diaz Pinzn
Caterin Daniela Gonzlez Puentes
Tito Leonardo Len Buitrago

Hay 1.000 posibles muestras de tamao 3 con orden y con reemplazo

Para muestras con n=2:


> 10^2
[1] 100

Hay 100 posibles muestras de tamao 2 con orden y con reemplazo

b. Con orden y sin reemplazo

Para muestras con n=4:

> 10*9*8*7
[1] 5040

Hay 5.040 posibles muestras de tamao 4 con orden y sin reemplazo.

Para muestras con n=3:

> 10*9*8
[1] 720

Hay 720 posibles muestras de tamao 3 con orden y sin reemplazo.

Para muestras con n=2:

> 10*9
[1] 90

Hay 90 posibles muestras de tamao 2 con orden y sin reemplazo.

c. Sin orden y con reemplazo

Para muestras con n=4:

> choose(13,4)
[1] 715

Hay 715 posibles muestras de tamao 4 sin orden y con reemplazo.

Para muestras con n=3:


Camilo Andrs Diaz Pinzn
Caterin Daniela Gonzlez Puentes
Tito Leonardo Len Buitrago
> choose(12,3)
[1] 220

Hay 220 posibles muestras de tamao 4 sin orden y con reemplazo.

Para muestras con n=2:

> choose(11,2)
[1] 55

Hay 55 posibles muestras de tamao 4 sin orden y con reemplazo.

d. Sin orden y sin reemplazo

Para muestras con n=4:

> choose(10,4)
[1] 210

Hay 210 posibles muestras de tamao 4 sin orden y sin reemplazo.

Para muestras con n=3:

> choose(10,3)
[1] 120

Hay 120 posibles muestras de tamao 3 sin orden y sin reemplazo.

Para muestras con n=2:

> choose(10,2)
[1] 45

Hay 45 posibles muestras de tamao 2 sin orden y sin reemplazo.

3. Halle todas las muestras posibles de tamaos 2, 3 y 4 con sus


correspondientes medias muestrales.

a. Con orden y con reemplazo

Para muestras con n=2:


Camilo Andrs Diaz Pinzn
Caterin Daniela Gonzlez Puentes
Tito Leonardo Len Buitrago

En la siguiente tabla se tiene la especificacin de las 100 posibles muestras con


n=2 con orden y con reemplazo y sus respectiva medias muestrales (las matrices
son demasiado grandes, as que se opt por no colocarlas).

Var1 Var2 mediam1


1 36 36 36.0
2 38 36 37.0
3 40 36 38.0
4 42 36 39.0
5 37 36 36.5
6 40 36 38.0

Para muestras con n=3:

En la siguiente tabla se tiene la especificacin de las primeras 250 de las 1000


posibles muestras con n=3 con orden y con reemplazo y sus respectivas medias
muestrales (las matrices son demasiado grandes, as que se opt por no
colocarlas).

Var1 Var2 Var3 mediam2


1 36 36 36 36.00000
2 38 36 36 36.66667
3 40 36 36 37.33333
4 42 36 36 38.00000
5 37 36 36 36.33333
6 40 36 36 37.33333

Para muestras con n=4:

En la siguiente tabla se tiene la especificacin de las 10.000 posibles muestras


con n=4 con orden y con reemplazo y sus respectivas medias muestrales (las
matrices son demasiado grandes, as que se opt por no colocarlas).

Var1 Var2 Var3 Var4 mediam3


1 36 36 36 36 36.00
2 38 36 36 36 36.50
3 40 36 36 36 37.00
4 42 36 36 36 37.50
5 37 36 36 36 36.25
6 40 36 36 36 37.00

b. Sin orden y sin reemplazo

Para muestras con n=2:


Camilo Andrs Diaz Pinzn
Caterin Daniela Gonzlez Puentes
Tito Leonardo Len Buitrago
En la siguiente tabla se tiene la especificacin de las 45 posibles muestras con
n=2 sin orden y sin reemplazo y sus respectivas medias muestrales.

1 2 media1
V1 36 38 37.0
V2 36 40 38.0
V3 36 42 39.0
V4 36 37 36.5
V5 36 40 38.0
V6 36 39 37.5

Para muestras con n=3:

En la siguiente tabla se tiene la especificacin de las 120 posibles muestras con


n=3 sin orden y sin reemplazo y sus respectiva medias muestrales.

1 2 3 media2
V1 36 38 40 38.00000
V2 36 38 42 38.66667
V3 36 38 37 37.00000
V4 36 38 40 38.00000
V5 36 38 39 37.66667
V6 36 38 39 37.66667

Para muestras con n=4:

En la siguiente tabla se tiene la especificacin de las primeras 200 de las 210


posibles muestras con n=4 sin orden y sin reemplazo y sus respectiva medias
muestrales.

1 2 3 4 media3
V1 36 38 40 42 39.00
V2 36 38 40 37 37.75
V3 36 38 40 40 38.50
V4 36 38 40 39 38.25
V5 36 38 40 39 38.25
V6 36 38 40 41 38.75

4. Construya la distribucin muestral y el grfico correspondiente de las


medias mustrales encada uno de los casos mencionados en los encisos 3a y
3b.

a. con orden y con reemplazo

Para n=2
Camilo Andrs Diaz Pinzn
Caterin Daniela Gonzlez Puentes
Tito Leonardo Len Buitrago
Como resultado se obtiene la siguiente distribucin de probabilidades de las
medias muestrales:

[,1]
36 1
36.5 2
37 5
37.5 8
38 12
38.5 14
39 16
39.5 14
40 12
40.5 8
41 5
41.5 2
42 1

Y el grfico de la distribucin de probabilidades es:

Para n=3

Como resultado se obtiene la siguiente distribucin de probabilidades de las


medias muestrales:

[,1]
36 0.001
36.3333333333333 0.003
36.6666666666667 0.009
37 0.019
37.3333333333333 0.036
37.6666666666667 0.057
Camilo Andrs Diaz Pinzn
Caterin Daniela Gonzlez Puentes
Tito Leonardo Len Buitrago
38 0.083
38.3333333333333 0.105
38.6666666666667 0.123
39 0.128
39.3333333333333 0.123
39.6666666666667 0.105
40 0.083
40.3333333333333 0.057
40.6666666666667 0.036
41 0.019
41.3333333333333 0.009
41.6666666666667 0.003
42 0.001

Y el grfico de la distribucin de probabilidades es:

# Para n=4

Como resultado se obtiene la siguiente distribucin de probabilidades de las


medias muestrales:

[,1]
36 0.0001
36.25 0.0004
36.5 0.0014
36.75 0.0036
37 0.0081
37.25 0.0156
37.5 0.0272
37.75 0.0424
38 0.0608
Camilo Andrs Diaz Pinzn
Caterin Daniela Gonzlez Puentes
Tito Leonardo Len Buitrago
38.25 0.0796
38.5 0.0966
38.75 0.1080
39 0.1124
39.25 0.1080
39.5 0.0966
39.75 0.0796
40 0.0608
40.25 0.0424
40.5 0.0272
40.75 0.0156
41 0.0081
41.25 0.0036
41.5 0.0014
41.75 0.0004
42 0.0001

El grfico de la distribucin de probabilidades anterior es:

b. sin orden y sin reemplazo

Para n=2

La siguiente es la tabla de distribucin de probabilidad de la media muestral para


muestras de tamao n=2 seleccionadas sin orden y sin reemplazo:

[,1]
36.5 0.02222222
37 0.04444444
37.5 0.08888889
Camilo Andrs Diaz Pinzn
Caterin Daniela Gonzlez Puentes
Tito Leonardo Len Buitrago
38 0.11111111
38.5 0.15555556
39 0.15555556
39.5 0.15555556
40 0.11111111
40.5 0.08888889
41 0.04444444
41.5 0.02222222

El siguiente es el respectivo grfico de la distribucin de probabilidad de la


media muestral:

Para n=3

La siguiente es la tabla de distribucin de probabilidad de la media muestral para


muestras de tamao n=3 seleccionadas sin orden y sin reemplazo:

[,1]
37 0.01666667
37.3333333333333 0.02500000
37.6666666666667 0.05833333
38 0.08333333
38.3333333333333 0.11666667
38.6666666666667 0.12500000
39 0.15000000
39.3333333333333 0.12500000
39.6666666666667 0.11666667
40 0.08333333
40.3333333333333 0.05833333
Camilo Andrs Diaz Pinzn
Caterin Daniela Gonzlez Puentes
Tito Leonardo Len Buitrago
40.6666666666667 0.02500000
41 0.01666667

El siguiente es el respectivo grfico de la distribucin de probabilidad de la


media muestral:

Para n=4

La siguiente es la tabla de distribucin de probabilidad de la media muestral para


muestras de tamao n=4 seleccionadas sin orden y sin reemplazo:
[,1]
37.25 0.004761905
37.5 0.019047619
37.75 0.033333333
38 0.057142857
38.25 0.085714286
38.5 0.109523810
38.75 0.123809524
39 0.133333333
39.25 0.123809524
39.5 0.109523810
39.75 0.085714286
40 0.057142857
40.25 0.033333333
40.5 0.019047619
40.75 0.004761905
El siguiente es el respectivo grfico de la distribucin de probabilidad de la
media muestral:
Camilo Andrs Diaz Pinzn
Caterin Daniela Gonzlez Puentes
Tito Leonardo Len Buitrago

5. Tomando en cuenta los valores de las medidas muestrales obtenidas,


obtenga tres probabilidades que hagan o tengan sentido con sus datos. Es
decir que utilice valores que estn en el rango de valores utilizados, calculados
o construidos por ustedes. A continuacin se da un ejemplo del tipo de
probabilidades que se espera que formulen y desarrollen.

a. Calcular la probabilidad P(X<48)

Se toman las muestras sin orden y sin reemplazo de tamao n=4:

[1] 0.2142857

Quiere decir que la probabilidad de que la media de una muestra de tamao 4


tomada sin orden y sin reemplazo sea menor que 48 es de 0.2142.

b. Calcular la probabilidad P(media>50):

[1] 0.6047619

Quiere decir que la probabilidad de que la media de una muestra de tamao 4


tomada sin orden y sin reemplazo sea mayor que 50 es de 0.6047.

c. Calcular la probabilidad P(40<=media<=50):

[1] 0.3952381
Camilo Andrs Diaz Pinzn
Caterin Daniela Gonzlez Puentes
Tito Leonardo Len Buitrago
Quiere decir que la probabilidad de que la media de una muestra de tamao 4
tomada sin orden y sin reemplazo se encuentre entre 40 y 50 es de 0.3952.

6. Pruebe los resultados del teorema del Lmite Central para el punto 4.

Como se observa en los resultados, mientras mayor es el tamao demuestra el


comportamiento de la distribucin de probabilidades se va pareciendo ms al de
una distribucin normal (Campana de Gauss). Esto comprueba lo que establece
el Teorema del Lmite Central.

Los grficos siguientes muestran cmo al aumentar el tamao de muestras


seleccionadas con orden y con reemplazo, por ejemplo, el comportamiento
probabilstico se comporta cada vez ms como una distribucin normal.
Camilo Andrs Diaz Pinzn
Caterin Daniela Gonzlez Puentes
Tito Leonardo Len Buitrago

7. Si es posible, obtenga una conclusin al comparar, considerando en forma


separado las situaciones originadas en 3a y 3b, la dispersin de las
distribuciones mustrales de medias de tamaos 2, 3 y 4.

En primer lugar se observaron las muestras de tamao 2, 3 y 4 con un mtodo de


seleccin con orden y con reemplazo. Se observa siempre que la distribucin de
probabilidades se acerca ms a la normal a medida que aumenta el tamao de
muestra. En este caso el conteo de posibles medias es mucho ms alto que para
el caso en el que la seleccin se realiza sin orden y sin reemplazo.

Si se comparan las medias de las medias muestrales para cada uno de los tamaos,
se tiene que el promedio es igual en todos los casos. Sin embargo, para al observar
las desviaciones estndar, se nota que a mayor tamao de muestra menor variacin
de los datos respecto a la media:

c(mean(mediasp1), mean(mediasp2), mean(mediasp3))


media n=2 39
media n=3 39
media n=4 39
c(sd(mediasp1), sd(mediasp2), sd(mediasp3))
des.estndar n=2 1.2309149
des.estndar n=3 1.0005004
des.estndar n=4 0.8660687