Está en la página 1de 5

Carlos de la Puente Viedma 145

11.2 Aplicación de la probabilidad (variables continuas)


Cualquier variable que se le asuma que tiene una distribución normal o cualquier valor
de una variable que se le asuma distribución normal (N( X , S )), se le puede aplicar el criterio de
transformación en puntuación típica o z (N(0,1)) y calcular probabilidades o porcentajes.
Además de calcular la superficie por debajo o por encima de cierto valor de la variable, otra
posibilidad es la de calcular superficies entre dos valores que llamaremos intervalos.
Si una variable tiene la distribución normal según f(x) conocida (Tabla 78), se puede
calcular la superficie para determinados valores y tomar la superficie como una probabilidad o
porcentaje. Los resultados obtenidos a través de la función de la normal y la función de la
normal tipificada son iguales. Se utiliza la f(z) por estar tabulada y su criterio de
estandarización se puede aplicar a otras variables numéricas.
Para el cálculo de intervalos se plantea cuál es la probabilidad de que un caso esté en
el intervalo de la media más/menos n-veces la desviación típica, como aplicación del Teorema
de Tchebycheff, simbólicamente y el gráfico se muestran en la Tabla 84.

Tabla 84 Probabilidad por intervalos.


Intervalo Gráfico
Genéricamente:

P X  nuS  X  X  nuS

Aplicado a una variable N(50,20):


El intervalo para n = 1
Y = f(x)

50  1u 20  50  50  1u 20

0 10 20 30 40 50 60 70 80 90 100
((50-(1x20))<50<(50+(1x20)))

El intervalo para n = 2:

50  2u 20  50  50  2u 20
Copyright © 2010. Editorial Complutense. All rights reserved.

Y = f(x)

0 10 20 30 40 50 60 70 80 90 100

((50-(2x20))<50<(50+(2x20)))

Al transformar cualquier variable en puntuación típica se convierte en una variable Z, N(0,1). Al sustituir los valores
de la media de 50 por la media de z = 0 y de la desviación típica de 20 por el de z = 1, los intervalos de
probabilidad para diferentes valores de n, son:

Puente, Viedma, Carlos de la. Estadística descriptiva e inferencial y una introducción al método científico, Editorial Complutense, 2010. ProQuest Ebook Central,
http://ebookcentral.proquest.com/lib/bibliotecafuaasp/detail.action?docID=3188261.
Created from bibliotecafuaasp on 2018-03-20 09:16:05.
146 Estadística descriptiva e inferencial y una introducción al método científico

Tabla 84 Probabilidad por intervalos.


Intervalo Gráfico
n = 1,

0  1u1  0  0  1u1 simplificando,


0,45
1  0  1 y la probabilidad,
0,40

P 1 0 1 0,6826 0,35

0,30

Llamamos: 0,25

Y = f(z)
Nc=0,6826
(1) y (1) : Intervalo de confianza. 0,20 Zona de aceptación
de Ho

0,15
Nc: Nivel de confianza. Ns/2=0,3174/2=0,1587
0,10 Ns/2=0,3174/2=0,1587
Ns: Nivel de significación. Zona de rechazo
de Ho
Zona de rechazo
de Ho
Nc + Ns = 1 0,05

Ns = 1 – Nc = 1 – 0,6826 = 0,3174 0,00


P = 0,6826

-5 -4,5 -4 -3,5 -3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5
P 1  0  1 ((-1)<0<(+1))

1 0 1
³1 f ( z) u dz ³1 f ( z) u dz  ³0 f ( z) u dz
0,3413  0,3413 0,6826

n = 1,96,

1,96  0  1,96 y la probabilidad, 0,45

0,40

P 1,96 0 1,96 0,9500 0,35

0,30
(1,96) y (1,96) : Intervalo de confianza.
0,25
Y = f(z)

Nc: Nivel de confianza. 0,20


Nc=0,9500
Ns: Nivel de significación. 0,15
Zona de aceptación
de Ho
Nc + Ns = 1
0,10
Ns = 1 – Nc = 1 – 0,9500 = 0,0500 Ns/2=0,0500/2=0,0250 Ns/2=0,0500/2=0,0250
Zona de rechazo Zona de rechazo
0,05 de Ho de Ho
P 1,96  0  1,96 P = 0,9500
0,00
-5 -4,5 -4 -3,5 -3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5
1,96 0 1,96 ((-1,96)<0<(+1,96))

³1,96 f ( z) u dz ³1,96 f ( z) u dz  ³0 f ( z ) u dz

0,4750  0,4750 0,9500

n = 2,
0,45
2 0 2 y la probabilidad,
0,40

P 2 0  2 0,9544 0,35


Copyright © 2010. Editorial Complutense. All rights reserved.

0,30
(2) y ( 2) : Intervalo de confianza.
0,25
Y = f(z)

Nc=0,9544
Zona de aceptación
Nc: Nivel de confianza. 0,20 de Ho

Ns: Nivel de significación. 0,15


Nc + Ns = 1
0,10
Ns = 1 – Nc = 1 – 0,9544 = 0,0456 Ns/2=0,0456/2=0,0228 Ns/2=0,0456/2=0,0228
Zona de rechazo Zona de rechazo
0,05 de Ho de Ho
P  2  0  2 P = 0,9544
0,00
-5 -4,5 -4 -3,5 -3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5
2 0 2 ((-2)<0<(+2))

³2 f ( z ) u dz ³2 f ( z ) u dz  ³0 f ( z ) u dz

0,4772  0,4772 0,9544

Puente, Viedma, Carlos de la. Estadística descriptiva e inferencial y una introducción al método científico, Editorial Complutense, 2010. ProQuest Ebook Central,
http://ebookcentral.proquest.com/lib/bibliotecafuaasp/detail.action?docID=3188261.
Created from bibliotecafuaasp on 2018-03-20 09:16:05.
Carlos de la Puente Viedma 147

Tabla 84 Probabilidad por intervalos.


n = 3,
0,45
3  0  3 y la probabilidad,
0,40

P 3 0 3 0,9974 0,35

0,30

(3) y (3) : Intervalo de confianza. 0,25

Y = f(z)
Nc=0,9974
Zona de aceptación
0,20
Nc: Nivel de confianza. de Ho

Ns: Nivel de significación. 0,15


Ns/2=0,0026/2=0,0013 Ns/2=0,0026/2=0,0013
Nc + Ns = 1 0,10
Zona de rechazo
de Ho
Zona de rechazo
de Ho
Ns = 1 – Nc = 1 – 0,9974 = 0,0026
0,05

P 3 0  3 0,00
P = 0,9974

-5 -4,5 -4 -3,5 -3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5
((-3)<0<(+3))
3 0 3
³3 f ( z) u dz ³3 f ( z) u dz  ³0 f ( z) u dz
0,4987  0,4987 0,9974

La superficie contemplada dentro del intervalo de confianza se denomina Nivel de


Confianza (simbólicamente Nc) y la superficie que queda por fuera a ambos lados del
intervalo de confianza se denomina Nivel de Significación (Ns). La superficie total debajo de
la curva normal, es la unidad, por lo tanto, Nc + Ns = 1, Ns = 1 – Nc y Nc = 1 – Ns. El Ns se
distribuye por igual a ambos lados del intervalo de confianza. La superficie correspondiente al
Ns también puede recibir el nombre de p-valor o D. La zona correspondiente al Nc es la de
aceptación de Ho y la del Ns rechazo de Ho. Este aspecto se tratará detalladamente desde el
Epígrafe 15. En la Tabla 85 se muestran algunos ejemplos de cálculo de probabilidades de
una variable numérica continua.

Tabla 85 Otros ejemplos.


Ejemplo Gráfico
Sea una variable X N(50,20), calcular la probabilidad de que un
caso esté en el intervalo x1 = 40 y x2 = 80.
P x1  x  x2 P z1  z  z 2
P 40  x 80 P 40 50
 z 80 50 , P 40  x  80 P  0,5  z  1,5
20 20

1,5
P  0,5  z  1,5 ³0,5 f ( z)dz
1,5 0 1,5
³0,5 f ( z)dz ³0,5 f ( z)dz  ³0 f ( z )dz 0,1915  0,4332 0,6247

La probabilidad de que un caso esté en el intervalo


Copyright © 2010. Editorial Complutense. All rights reserved.

especificado de X es de 0,6247, o en el intervalo se


encuentran el 62,5% de los casos (zona sombreada).
Sea una variable X N(10,2), calcular la probabilidad de que un
caso esté en el intervalo x1 = 8 y x2 = 12.
P x1  x x2 P z1  z  z2
P 8  x  12 P 810 z 1210 , P 8  x  12 P 1  z  1
2 2
1
P 1  z  1 ³1 f ( z)dz
1 0 1
³1 f ( z)dz ³1 f ( z)dz  ³0 f ( z)dz 0,3413  0,3413 0,6826

La probabilidad de que un caso esté en el intervalo


especificado de X es de 0,6826, o en el intervalo se
encuentran el 68,3% de los casos (zona sombreada).

Puente, Viedma, Carlos de la. Estadística descriptiva e inferencial y una introducción al método científico, Editorial Complutense, 2010. ProQuest Ebook Central,
http://ebookcentral.proquest.com/lib/bibliotecafuaasp/detail.action?docID=3188261.
Created from bibliotecafuaasp on 2018-03-20 09:16:05.
148 Estadística descriptiva e inferencial y una introducción al método científico

Tabla 85 Otros ejemplos.


Sea una variable X N(30,2), calcular la probabilidad de que un
caso esté por debajo de x1 = 25.
P X  x1 P Z  z1 , P X  25 PZ 2530
2
P X  25 P z   2,5
2,5
P z   2,5 ³f f ( z )dz 0,0062
Proceso de este cálculo:
La tabla de Z que se utiliza es entre z = 0 y z. La superficie
pedida está por debajo de un valor negativo (-2,5). Al ser la
curva simétrica, la superficie por debajo de z = -2,5, es la
misma que la superficie por encima de z = 2,5. Para hallar la
superficie por encima de z = 2,5, se ha de obtener la superficie
que facilita la Tabla, que es entre z = 0 y z = 2,5, y proceder
algebraicamente para obtener la superficie deseada.
2,5 0
³0 f ( z )dz
³ 2,5 f ( z)dz 0,4938

2,5 0 0
³ f f ( z )dz ³f f ( z)dz  ³ 2,5 f ( z)dz 0,5  0,4938 0,0062

La probabilidad de que un caso esté por debajo de 25 en la


variable X es de 0,0062, o el 0,06% de los casos están por
debajo de 25 (zona sombreada).
Sea una variable X N(40,10), calcular la probabilidad de que un
caso esté por encima de x1 = 47.
P x! x1 P z ! z1 , P x! 47 P z! 47  40
10

P x ! 47 P z ! 0,7
f
P z ! 0, 7 ³0,7 f ( z)dz 0,2420

Proceso:
Se busca en la Tabla la superficie comprendida entre z = 0 y z
= 0,7 y se le resta a 0,5. La superficie buscada es 0,5 – 0,2580
= 0,2420
f 0,7
P z ! 0,7 ³0 f ( z)dz  ³0 f ( z )dz 0,5  0,2580 0,2420

La probabilidad de que un caso esté por encima de 47 en la


variable X es de 0,2420, o el 24,2% de los casos están por
encima de 47 (zona sombreada).

2
11.3 Otras funciones: F , t y F (variables continuas).
Copyright © 2010. Editorial Complutense. All rights reserved.

2
Otras variables tipificadas que se utilizan en Sociología son: F , t y F. La función que
genera la curva es diferente a la Z y presentan la característica de tener grados de libertad (gl).
Cada valor de grado de libertad genera una tabla de función de densidad de probabilidad
distinta, pero los conceptos y aplicación de la probabilidad son iguales que los vistos para la
función de densidad de probabilidad de la normal tipificada.
La representación de los gráficos de las variables mencionadas se realiza en un sistema
de coordenadas cartesianas de dos dimensiones. En el eje de abscisas u horizontal se
representa la variable y en el eje de ordenadas o vertical la Y, considerando que y = f(x). Las
2
variables Z y t, toman valores de -f a f, y F y F sólo toman valores positivos. Las
distribuciones tienden a normalizarse a medida que aumentan los gl. La superficie bajo la
curva y por encima del eje de abscisas vale la unidad y representa al total de los casos, por lo

Puente, Viedma, Carlos de la. Estadística descriptiva e inferencial y una introducción al método científico, Editorial Complutense, 2010. ProQuest Ebook Central,
http://ebookcentral.proquest.com/lib/bibliotecafuaasp/detail.action?docID=3188261.
Created from bibliotecafuaasp on 2018-03-20 09:16:05.
Carlos de la Puente Viedma 149

que se puede hablar en términos de probabilidad o de porcentajes. La forma de obtener los


grados de libertad se verán en los Epígrafes correspondientes a los desarrollos de los
estadísticos, en este apartado sólo se indicarán los valores (Tabla 86).
2
Tabla 86 Funciones de densidad de probabilidad: F , t y F.
La distribución t de Student se hace más apuntada a medida que aumentan los gl y a partir de 10.000 se va aproximando a Z.
En 30.000 gl se puede decir que es Z. Estos valores son orientativos para indicar la relación entre t y Z.
Los grados de libertad de la distribución t se obtienen restando una unidad al tamaño de la muestra (n-1). A medida que n
aumenta, la diferencia entre la distribución Z y t desaparece.
gl = 1 gl = 10 gl = 1.000 gl = 10.000

0,4 0,4 0,4 0,4

0,3 0,3 0,3 0,3


Y = f(t)

Y = f(t)

Y = f(t)

Y = f(t)
t 0,2 0,2 0,2 0,2

0,1 0,1 0,1 0,1

0 0 0 0
-5 -3 -1 1 3 5 -6 -4 -2 0 2 4 6 -6 -4 -2 0 2 4 6 -6 -4 -2 0 2 4 6
t t t t

gl = 1 gl = 2 gl = 3 gl = 4

1,8 0,6 0,25 0,2

1,5 0,5 0,2 0,16


Y = f(Chi-2)

Y = f(Chi-2)

Y = f(Chi-2)

Y = f(Chi-2)
1,2 0,4

F2
0,15 0,12
0,9 0,3
0,1 0,08
0,6 0,2

0,3 0,1 0,05 0,04

0 0 0 0
0 2 4 6 8 10 0 2 4 6 8 10 12 0 4 8 12 16 0 4 8 12 16 20
Chi-2 Chi-2 Chi-2 Chi-2

gln = 1; gld = 1.000* gln = 2; gld = 1.000 gln = 3; gld = 1.000 gln = 10; gld = 1.000

(X 1,E49)
4 1 0,8 1

0,8 0,8
3 0,6
Y = f(F)

Y = f(F)

Y = f(F)

Y = f(F)
0,6 0,6

F 2
0,4
0,4
0,4
1 0,2
0,2 0,2

0 0 0 0
0 1 2 3 4 5 0 1 2 3 4 5 0 1 2 3 4 5 0 1 2 3 4 5
F F F F

Nota:
* gln: gl numerador y gld: gl denominador.

2
Tabla 87 Funciones de densidad de probabilidad: F , t y F.
Se muestran las curvas superpuestas para ver la relación entre ellas

gl=10.000
gl=10 y 1.000

0,4

gl=1
Las curvas de gl = 10 y gl = 1.000 0,3
están superpuestas. A medida que
aumentan los grados de libertad
Y = f(t)

aumenta la curtosis de la curva y las


Copyright © 2010. Editorial Complutense. All rights reserved.

t 0,2
colas laterales se juntan al eje de
abscisas. La curva tiende a
normalizarse.
0,1

0
-6 -4 -2 0 2 4 6

Puente, Viedma, Carlos de la. Estadística descriptiva e inferencial y una introducción al método científico, Editorial Complutense, 2010. ProQuest Ebook Central,
http://ebookcentral.proquest.com/lib/bibliotecafuaasp/detail.action?docID=3188261.
Created from bibliotecafuaasp on 2018-03-20 09:16:05.

También podría gustarte