Está en la página 1de 19

Estadı́stica Inferencial

Dr. Sergio Damián Vázquez

Universidad Tecnológica del Norte de Guanajuato

25 de marzo de 2020

Dr. Sergio Damián Vázquez Estadı́stica Inferencial 1 / 19


Probabilidad

Regla del suceso infrecuente para estadı́stica inferencial


Si, bajo un supuesto dado, la probabilidad de un suceso particular observado es
extremadamente pequeña, concluimos que el supuesto probablemente es incorrecto.

Definitions
Suceso: Es cualquier conjunto de
resultados o consecuencias de un
procedimiento.
Suceso simple: Es un resultado o
un suceso que ya no puede
desglosarse en componentes más
simples.
Espacio muestral: Está formado
por todos los resultados que ya
no pueden desglosarse más.

Dr. Sergio Damián Vázquez Estadı́stica Inferencial 2 / 19


Probabilidad

Procedimiento Ejemplo de suceso Espacio muestral completo

Un solo nacimiento Niña (suceso simple) { f, m }

3 Nacimientos 2 niñas y un niño (ffm, { fff, ffm, fmf, fmm, mff, mfm,
fmf, mff son sucesos sim- mmf, mmm }
ples que dan como resulta-
do 2 niñas y un niño)

Dr. Sergio Damián Vázquez Estadı́stica Inferencial 3 / 19


Probabilidad

Regla 1: Aproximación de la probabilidad por frecuencias relativas


Realice (u observe) un procedimiento un gran número de veces y cuente las veces que
el suceso A ocurre en realidad.

n úmero de veces que ocurri ó A


P (A ) =
n úmero de veces que se repiti ó el ensayo

Ejemplo 1: Anotación de un tiro libre


Calcule la probabilidad que tiene el jugador de
básquetbol de la NBA, Reggie Miller, de anotar un
tiro libre después de recibir una falta. En cierto
momento de su carrera, anotó 5915 tiros libres
entre 6679 intentos (de acuerdo con datos de la
NBA).

Solución:
5915
P (A ) = = 0.886
6679

Dr. Sergio Damián Vázquez Estadı́stica Inferencial 4 / 19


Probabilidad

Regla 2: Método clásico de la probabilidad


Suponer que un procedimiento dado tiene n sucesos simples distintos y que cada uno
de esos sucesos simples tiene la misma probabilidad de ocurrir.

n úmero de formas en que puede ocurrir A s


P (A ) = =
n úmero de sucesos simples diferentes n

Ejemplo 2: Genotipo
Como parte de un estudio sobre los genotipos AA,
Aa, aA y aa, anote cada genotipo individual en una
ficha, luego mezcle las cuatro fichas y elija una al
azar. ¿qué probabilidad tiene que elegir el genotipo
Aa?

Solución:
1
P (Aa) =
4

Dr. Sergio Damián Vázquez Estadı́stica Inferencial 5 / 19


Probabilidad

Regla 3: Probabilidades subjetivas


P(A), la probabilidad del suceso A, se estima con base en el conocimiento de las
circunstancias relevantes.

Ley de los número grandes


Conforme un procedimiento se repite una y otra
vez, la probabilidad de frecuencias relativas (a
partir de la regla 1) de un suceso, tiende a
aproximarse a la probabilidad real.

La probabilidad de un suceso imposible es 0.


La probabilidad de un suceso que ocurrirá
con certeza es 1.
Para cualquier suceso A, la probabilidad de A
se encuentra entre 0 y 1, inclusive. Es decir,
0 ≤ P (A ) ≤ 1.

Dr. Sergio Damián Vázquez Estadı́stica Inferencial 6 / 19


Problemas en Clase

Problema 1: Clonación de Seres Humanos


Se seleccionan adultos al azar para una encuesta Gallup y se les pregunta si
consideran que la clonación de seres humanos debe permitirse o no. Entre los adultos
elegidos al azar y encuestados, 91 dijeron que se debe permitir la clonación de seres
humanos, 901 que no se debe permitir y 20 se abstuvieron de opinar. Con base en
estos resultados, estime la probabilidad de que una persona elegida al azar considere
que se debe permitir la clonación de seres humanos.

Problema 2: Géneros de los hijos.


Determine la probabilidad de que exactamente dos de los tres hijos de una pareja
sean varones. Suponga que es igualmente probable dar a luz un niño que una niña, y
que el género de cualquier hijo no influye en el género de otro.

Dr. Sergio Damián Vázquez Estadı́stica Inferencial 7 / 19


Probabilidad

Sucesos complementarios
El complemento de un suceso A , denotado por A , consiste en todos los resultados en
los cuales el suceso A no ocurre.

Ejemplo: Género al nacer


En realidad nacen más niños que niñas.
En un grupo tı́pico, hay 205 bebés recién
nacidos y 105 de ellos son niños. Si un
bebé del grupo es seleccionado al azar,
¿cuál es la probabilidad de no sea un
niño?

Solución:

100
P (no seleccionar a un niño)= P (nino) = P (nina) = = 0.488
205

Dr. Sergio Damián Vázquez Estadı́stica Inferencial 8 / 19


Probabilidad

Redondeo de probabilidades
Cuando se expresa el valor de una probabilidad, hay que dar la fracción o el número
decimal exacto, o bien, redondear los resultados decimales finales a tres cifras
significativas. Todos los dı́gitos en un número son significativos, excepto los ceros que
se incluyen para la colocación apropiada del punto decimal.

Ejemplos:
La probabilidad de 0.021491 tiene cinco dı́gitos significativos (21491) y puede
redondearse a 0.0215, con tres dı́gitos relevantes.
La probabilidad de 1/3 puede permanecer como fracción o redondearse a 0.333
(no 0.3).
La probabilidad de obtener cara en el lanzamiento de una moneda puede
expresarse como 1/2 o 0.5; como 0.5 es exacto, no hay necesidad de expresarlo
como 0.500.
La fracción 432/7842 es exacta, pero su valor no es obvio. Exprésela como el
decimal 0.0551.

Dr. Sergio Damián Vázquez Estadı́stica Inferencial 9 / 19


Rectas de Regresión de Mı́nimos Cuadrados

La recta de regresión por mı́nimos La recta de regresión por mı́nimos


cuadrados de Y sobre X es: cuadrados de X sobre Y es:

Y = a0 + a1 X (1) X = b0 + b1 Y (6)

donde a0 y a1 se obtienen de las donde b0 y b1 se obtienen de las


ecuaciones normales ecuaciones normales
X X X X
Y = a0 N + a1 X (2) X = b0 N + b1 Y (7)

X X X X X X
XY = a0 X + a1 X2 (3) XY = b0 X + b1 Y2 (8)

Que dan Que dan

( Y )( X 2 ) − ( X )( XY ) ( X )( Y 2 ) − ( Y )( XY )
P P P P P P P P
a0 = P 2 P 2 (4) b0 = P 2 P 2 (9)
N X − ( X) N Y − ( Y)
P P P P P P
N XY − ( X )( Y ) N XY − ( X )( Y )
a1 = P 2 P 2 (5) b1 = P 2 P 2 (10)
N X − ( X) N Y − ( Y)

Dr. Sergio Damián Vázquez Estadı́stica Inferencial 10 / 19


Error Estándar de Estimación
Una medida de la dispersión respecto a la recta de regresión de Y es el error
estándar de estimación de Y sobre X ,
rP
(Y − Yest )2
sY .X = (11)
N

donde Yest es el valor estimado para Y utilizando la Ec. (1) para un valor de X dado.
Análogamente, el error estándar de estimación de X sobre Y es,
rP
(X − Xest )2
sX .Y = (12)
N

La Ec. (11) también puede expresarse de la forma,


rP
Y 2 − a0 Y − a1 XY
P P
sY .X = (13)
N
Para pequeñas muestras, el error estándar modificado está dado por,
r
N
ŝY .X = s (14)
N − 2 Y .X

Dr. Sergio Damián Vázquez Estadı́stica Inferencial 11 / 19


Coeficiente de Correlación, r

Coeficiente de determinación
Es el cociente de la variación explicada entre la variación total.
Nota: Si hay cero variación explicada, este cociente es o; si hay cero variación no
explicada, este cociente es 1.

r s
(Yest − Y )2
P
variación explicada
r =± =± (15)
variación total (Y − Y )2
P

donde r es el coeficiente de correlación. La desviación estándar de Y es,


rP
(Y − Y )2
sY = (16)
N
También el coeficiente de correlación puede calcularse con,
v
t
s2
r = 1 − Y .X (17)
sY2

Dr. Sergio Damián Vázquez Estadı́stica Inferencial 12 / 19


Coeficiente de Correlación, r
Las Ecuaciones (1) y (6) pueden expresarse, respectivamente como,
P ! P !
xy xy
y= P x (18) x= P y (19)
x2 y2

donde x = X − X y y = Y − Y , y la X o Y significa el promedio aritmetico de todos los


datos de X y Y , respectivamente.
Si se supone que entre dos variables existe una relacion lineal, la fórmula de
Producto-Momento es, P
xy
r=p P (20)
( x 2 )( y 2 )
P

donde r es el coeficiente de correlación con el signo adecuado automáticamente.


Entonces, rP rP
P
sXY =
xy
(21) x2 y2
N s X = (22) sY = (23)
N N

donde sX y sY se conocen como las desviaciones estandar de X y Y , respectivamente,


y sX2 y sY2 son las varianzas. La nueva cantidad SXY es la covarianza de X y Y .
El coeficiente de correlación puede expresarse como,
sXY
r= (24)
sX · sY

Dr. Sergio Damián Vázquez Estadı́stica Inferencial 13 / 19


Coeficiente de Correlación, r

Una forma simplificada para el cálculo del coeficiente correlación es,


P P P
N XY − ( X )( Y )
r = qh (25)
P 2 P 2i h P 2 P 2i
N X − ( X) N Y − ( Y)

Ejemplo 1:
En la siguiente tabla, X y Y son las estaturas de 12 padres y de sus hijos maayores.
(a) Con estos datos, construir un diagrama de dispersión.
(b) Desarrollar la recta de regresión de Y sobre X .
(c) Desarrollar la recta de regresión de X sobre Y .
(d) Calcular el error estándar de estimación Y sobre X , sY .X .
(e) Calcular el error estándar de estimación X sobre Y , sX .Y .
(f) Calcular el coeficiente de correlación, r.

Dr. Sergio Damián Vázquez Estadı́stica Inferencial 14 / 19


Solución: Ejemplo 1
a) Con los datos proporcionados, se puede graficar un diagrama de dispersión con los
datos en Excel o LibreOffice Calc.

Dr. Sergio Damián Vázquez Estadı́stica Inferencial 15 / 19


Solución: Ejemplo 1
b) Primero, se necesita construir la siguiente tabla para obtener los cálculos.

Utilizando la Ecuación (4) y (5) y los datos de la Tabla se obtiene:

( Y )( X 2 ) − ( X )( XY )
P P P P
(811)(53418) − (800)(54107)
a0 = P 2 P 2 = = 35.8248
N X − ( X) 12(53418) − (800)2
P P P
N XY − ( X )( Y ) 12(54107) − (800)(811)
a1 = P 2 P 2 = = 0.4764
N X − ( X) 12(53418) − (800)2
Dr. Sergio Damián Vázquez Estadı́stica Inferencial 16 / 19
Solución: Ejemplo 1
Por lo tanto, la Recta de Regresión de Y sobre X (Ec. 1) es:

Y = 35.8248 + 0.4764X (26)


c) Utilizando la Ecuación (9) y (10) y los datos de la Tabla se obtiene:

( X )( Y 2 ) − ( Y )( XY )
P P P P
(800)(54849) − (811)(54107)
b0 = P 2 P 2 = = −3.3769
N Y − ( Y) 12(54849) − (811)2
P P P
N XY − ( X )( Y ) 12(54107) − (800)(811)
b1 = P 2 P 2 = = 1.0364
N Y − ( Y) 12(54849) − (811)2
Por lo tanto, la Recta de Regresión de X sobre Y (Ec. 6) es:

X = −3.3769 + 1.0364Y (27)


d) Se necesita los promedios aritméticos de X y Y , que se obtienen con:
P
X 800
X= = = 66.6667
N 12
P
Y 811
Y= = = 67.5833
N 12

Dr. Sergio Damián Vázquez Estadı́stica Inferencial 17 / 19


Solución: Ejemplo 1
Para construir las columnas C6 y C7 de la tabla de resultados, Xest y Yest
respectivamente, simplemente se sustituye los valores X o Y con las Ecuaciones
obtenidas en el inciso b y c. Por ejemplo, el primer valor de la columna C6 se obtiene
con la Ec. (27) y el primer valor de la columna C2,

Xest = −3.3769 + 1.0364Y = −3.3769 + 1.0364(68) = 67.0985


y ası́, sucesivamente. De igual manera el primer valor de C7 se obtiene con la Ec. (26)
y el primer valor de la columna C1,

Yest = 35.8248 + 0.4764X = 35.8248 + 0.4764(65) = 66.7894


Nota: Los valores pueden diferir si se maneja Excel u otro programa de cálculo.

La columna C8 se construye de la diferencia de los valores de la columna C1 y C6. De


igual forma, la columna C9 se construye de la diferencia de los valores de la columna
C2 y C7. La columna C10 se obtiene elevando al cuadrado cada valor de la columna
C8. La columna C11 se obtiene elevando al cuadrado cada valor de la columna C9.
Por lo tanto, el error estándar de estimación de Y sobre X , sY .X , se puede calcular con
la Ec. (11) y la suma de la columna C11,
rP r
(Y − Yest )2 19.7028
sY .X = = = 1.2814
N 12

Dr. Sergio Damián Vázquez Estadı́stica Inferencial 18 / 19


Solución: Ejemplo 1

e) El error estándar de estimación de X sobre Y , sX .Y , se puede calcular con la Ec. (12)


y la suma de la columna C10,
rP r
(X − Xest )2 42.8651
sX .Y = = = 1.89
N 12
f) El coeficiente de correlación, r, se obtiene con la Ecuación (25) y con los datos de la
Tabla,

P P P
N XY − ( X )( Y ) 12(54107) − (800)(811)
r = qh i h i = qh ih i
N X 2 − ( X )2 N Y 2 − ( Y )2 12(53418) − (800)2 12(54849) − (811)2
P P P P

Por lo tanto, r = 0.7027

Dr. Sergio Damián Vázquez Estadı́stica Inferencial 19 / 19

También podría gustarte