Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Bioestadistica Apuntes Temas 1 10 PDF
Bioestadistica Apuntes Temas 1 10 PDF
03. Probabilidad
Introducción
! "
# $
$
% $
& '
% &
&
'
$
$
& & &
! "
Conceptos básicos
Fenómenos aleatorios
) '
&
&
* & $
+ &
+ '
∈ E
& A
B $ ∪
' ∈ E
&
AyB $ $ ∩
)
$
⊂
* ,
) = * ,
Ejemplo
- & !
"
( '
'*
'#
'* ∅
'* $
' A
A.
Ejercicio:
( * . /0 *1 , . /0
,1 % . /0 * 0 ,1
& ' 2 3
2 3 2% $ 4 3 25 A ∪ B3
Nota:
) ⇔ ∩ = ∅ ⇔#
* ,
Ejemplo
" '
*./6 1
,./6 1
%./6 6 1
)./6 6 6 1
7./6 6 1
8./6 1
9./6 : 1
) , #
# * % ) ! ,"
* $ )! ,"
# 7 ) *
# , 8
# , 9
Ejemplo
& '
*./ 1 ,./ 1
. /0 % 1 )./ 1
2 3 2< 3
Concepto de Probabilidad
% $
-
% &" '
! "' ( ) (
$
2% 3
Definición frecuentista
=> $
$
=>
!
" >? !
"
#
" * '
&
! "
! "
25 3
# ' 25
@ 3 2% $
& 3
Definición Axiomática
% &
*
( (
: [0,1] ⊂ ℝ
'
"( A ( ) ≥0
( ∪ ) = ( ) + ( )
"# =' ( ) = 1
# $ $
Regla de Laplace
9
$
$ + $
4$
*
! '
Ejemplo:
& '
Principales propiedades
0 ≤ ( ) ≤1
* ' ( ) = 1– ( )
⊂ ⇒ ( )≤ ( )
* , % % '
( ∪ ) = ( ) + ( ) − ( ∩ )
( ∪ ∪ ) = ( ) + ( ) + ( ) − ( ∩ ) − ( ∩ ) −
( ∩ ) + ( ∩ ∩ )
* , % : '
( ∪ )= ( )+ ( )
( ∪ ∪ ) = ( ) + ( ) + ( )
( ∩ ∩ ) = 1 − ( ∪ ∪ )
Ejemplo:
?>A B>A ?A
2% $
& 3
*./9 1 ( ) = 0,5
,./9 1 ( ) = 0,2
/9 1 ∩ ( ∩ ) = 0,05
C+ # # % , D ∪ =/9 1
( 2% $
& 3* '
'
( E
( F
( F
( F E
( F E
% $
=
Ejercicio en clase
Probabilidad condicionada
, *
) ,
*
)
, *
# 9( / ) '
( ∩ )
( / )=
( )
Ejemplo
* = E
G 25 3
$ ( /G1 /
G1 & /B G E1 / B G
E1
$ 2
3
: G
+ '
# '
( '
B
= {4}, ( ) = C
1 1 1 1
= {2, 4, 6} ( )=
6
+ 6
+ 6 = 2
∩ = {4} ( ∩ ) = 1/6
( '
1
( ∩ ) 6 1
( / )= = =
( ) 1 3
2
) * ,
) '
P( / ) = ( )
6 ,
*
+ '
* , % '
( ∩ )= ( / ) ( ) = ( / ) ( )
% '
( ∩ ∩ )= ( / ) ( ) ( / ∩ )
* , % '
( ∩ )= ( ) ( )
% '
( ∩ ∩ )= ( ) ( ) ( )
( / ) = 1 − ( / )
Ejemplo:
=?A H?A
EA
2% $
3
# *. - .
( ) = 0,75
# ,. " - % '
( ) = 0,15
% - *" - %
∩ '
( ∩ ) = 0,06
0 ( / ), ,! "
*! "
( '
( ∩ ) 0,06
( / )= = = 0,08
( ) 0,75
/ . 0 * 12 3 3 3
+ + + !
( '
2 $
3
: * -
- $ !
( '
( ∩ )
( / )=
( )
( ∩ )
$
) '
0,06
( / ) = 1 − ( / ) = 1 − = 0,6
0,15
/ . + 42
" & 25
( / )3 2 ( / )3
) ! B, G, … . , I) #
'
∀ 1, K ⇒ B ∩ G .∅
) ! B, G, … . , I) $ '
I
L M =
MNB
) $
$
#
% &
% $
! B, G, … . , I) ,
'
I
( ) = O ( / M) ( M)
MNB
I $
'
( $ ! B, G, … . , I)
'
= ( B ∩ )∪ ( G ∩ ) ∪ ……∪ ( I ∩ )
'
( ) = ( B ∩ )+ ( G ∩ ) + ⋯…+ ( I ∩ )
< '
( ) = ( / B) ( B) + ( / G) ( G) + ….+ ( / I) ( I)
Ejemplo
I J H?A
&
KA =>A
5 B & - - '! 5 ( )
B C 3 6 D # '
( B) = 0,75
G C 3 # 6 D # '
( G) = 0,25
#
'
( / B) = 0,92
#
'
( / G) = 0,9
El desfibrilador
( / 1) = 0,92 no es
defectuoso
Adquirido al
primer
( 1) = 0,75 proveedor (A1)
El desfibrilador
es defectuoso
La Clínica
B es el suceso “El desfibrilador no es defectuoso”.
recibe un
desfibrilador
El desfibrilador
( 2) = 0,25 ( / 2) = 0,9 no es
Adquirido al defectuoso
segundo
proveedor (A2) El desfibrilador
es defectuoso
( '
" 3 - # -
47 8 7 29
Teorema de Bayes
% $ 2
*3
BA
$ > >B
$ & ,
$ &
$ * , !P( / )"
' #
! B, G, … . , I) ,
'
T(U/VW )T(VW )
∀ 1 = 1, … , S ( M/ ) = X\
Y]^ T(U/VY )TZVY [
Ejemplo
) ! "
'
D' 0
`'-
G' 0 8
b'- 8
# (`/b)
D ` ! G b"
200
(`) = = 0,2
1000
800
(`) = = 0,8
1000
) ! D"
! " '
60
(b/`) = = 0,3
200
140
(b/`) = = 0,7
200
) ! `"
! " '
8
(b /`) = = 0,01
800
792
(b/`) = = 0,99
800
Paciente P(D/G) “) % %
*
8
800 (b /`) = = 0,01 El paciente tiene
(`) = = 0,8 800
1000 Glucosuria
Paciente no
tiene Diabetes
El paciente no
tiene Glucosuria
( , P(D/G)
( ( 3
: # 11 2
I *
2% $ 3
Test Diagnóstico
& $ ; *
4 2 3 ( $
! "
! "
I '
) $ $
4 +
# '
) je
J
" jk
*
, 4
'
' C< - D
s = P(T e / E)
& '
e = P(T k / E)
# $ $
'
, '
νe = P(E/ T e )
, '
ν = P(E/ T k )
k
# ( )
6 = 6 6 = 6 # 6
'
T(r s / t)T(t) uv
p e = P(E/ q e ) = = uv e(Bkw)(Bkv)
T(r s / t)T(t) e T(rs / t)T(t)
% '
! =" ⇒
! =" @ !
>"
( @ ! >" ⇒
! ="
@ ! >"
! ="
! ="
! ="
! ="
Ejemplo
% & 0
L=A LKA
> B
2 $
3
2% $
3
I '
E' (
'-
q e'
q k'
# 6 6 6 '
p e = P(E/ q e )
I 0 , %
(q e / ) = 0,91
(q k / ) = 0,98
( ) = 0,20
+ '
5 6 * 6
3 - - 7 2
6 6 # 6 ' p k = P( / q k )
Ejemplo:
$ &
E> @ # K?A
LHA $ &
E> @ =A
uv f,hz∗f,fB
pe = = uv e(Bkw)(Bkv) = f,hz∗f,fB ef,fg∗f,yy = 0,22
w(Bkv) f,y{∗f,yy
pk =
w(Bkv) e(Bku)v
= f,y{∗f,yy ef,Bz∗f,fB = 0,99
25 3
$
!LLA" $ $ !
BBA"
+
# $
'
Resultados Test
Test Positivo Test Negativo Total
(| e ) (| k )
Enfermos (E) }BB }BG }B
}G
Sobre la Enfermedad
Sanos (~) }GB }GG
Total }′B }′G n
'
ƒ„„
- • = ‚(| e / ~) =
ƒ„
ƒ‡‡
& - … = ‚(| k / ~†) =
ƒ‡
ƒ„„
, - ˆe = ‚(~/ | e ) =
ƒ‰„
ƒ‡‡
, - ˆk = ‚(~†/ | k ) =
ƒ‰‡
Nota: %
A
Ejemplo:
* B>>
'
( '
' ) ' " '
.| e / .| k /
& .Š/ 90 10 100
&
11 89 100
.~/
' 101 99 44
yf
5 s = Bff; L>A
hy
- e = Bff> - 172
Ejemplo:
'
$
'
Œ^^ Cf
+ . νe = P(E/ T e ) =
Œ‰^
= Ch = 0,88
Variables Aleatorias
Introducción
Lo que veremos ahora es generalizarlo para toda una población, y para esto,
realizaremos definiciones similares pero con alguna dificultad añadida.
Así, preferimos identificar los sucesos {CX, XC} con el valor numérico 1 que
representa el .
: ℝ
de modo que a cada suceso elemental e le corresponde un número real X(e).
Ejemplo
Hacemos el experimento aleatorio de lanzar dos monedas al aire.
({ }) = 1
({ }) = 2
({ }) = 0
ú { }, { } 2
( = 1) ≡ (1) = = = = 0,5
ú ! " { }, { }, { }, { } 4
Ejemplo
Sea = La variable aleatoria X
1 1 1
toma los valores {0, 1, 2} con una probabilidad { 44 , 42 , 44}. Según la anterior
definición:
6(/) = 1( 2 ≤ /
Ejemplo
Con los datos del ejemplo anterior:
“ el
!
0: 8(0) = ( ≤ 0) = ( = 0) = 1 ⁄ 4
1: 8(1) = ( ≤ 1) = ( = 0) + ( = 1) = 1 ⁄ 2
2: 8(2) = ( ≤ 1) = ( = 0) + ( = 1) + + ( = 2) = 1
Con esas condiciones, no tiene sentido hacer la suma de probabilidades en cada uno
de los valores posibles como hacíamos en el ejemplo anterior, ya que la probabilidad
de que el valor de una variable continua sea uno en concreto es 0.
Esto a veces es difícil de comprender, así que intentaremos explicarlo con un ejemplo.
Como el valor de una estatura puede ser infinito, la probabilidad de que una estatura
sea 0. Veámoslo.
La curva de densidad
dad vendr
vendrá determinada por una función que
ue denominaremos
de
.
03.02. VA y distribuciones
nes d
de Probabilidad. Escuela de Enfermería Cartagena. Curso
rso 2012-2013
2
Si recordamos conceptos
tos de matemáticas, esto se calculaba usando
ando el concepto de
integral, por lo que
>
; ≤ ≤ <= = (' ) '
?
Algunas distribucione
iones de probabilidad
03.02. VA y distribuciones
nes d
de Probabilidad. Escuela de Enfermería Cartagena. Curso
rso 2012-2013
2
El nombre de distribución normal le viene dado debido a que una gran mayoría de las
variables aleatorias continuas de la naturaleza siguen esta distribución. Durante
mucho tiempo se pensó que todas las variables aleatorias eran normales.
Se dice que una variable aleatoria sigue una distribución normal de parámetros µ y
A ) , lo que representamos del modo ↝ (µ, A ) ) si su función de densidad es:
1 E
( GEH K
F J
(') = ) I
AC2D
Nota
Estos dos parámetros µ y A ) coinciden además con la media y la varianza
respectivamente de la distribución
La región donde (') es no nula es todo ℝ, de modo que la mayor parte de la masa de
probabilidad (área comprendida entre la curva y el eje de abcisas) se encuentra
concentrado alrededor de la media, y las ramas de la curva se extienden
asintóticamente a los ejes, de modo que cualquier valor “muy alejado” de la media es
posible (aunque poco probable).
Resumiendo, podemos intuir que estamos ante una variable aleatoria normal cuando
en la medida de la variable (continua), su distribución de probabilidad:
Es unimodal y simétrica.
El cálculo de una probabilidad normal, conocida su función de densidad será por tanto:
G
1 E
( GEH K
F J
( ≤ ') = = ) I '
EP AC2D
Tipificación
−µ
Q =
A
variable tipificada de , y viene dada por:
µ = 0
A = 1
es decir: Q ↝ (0,1).
1 E
SK
(R) = )
C2D
−µ '−µ
( ≤ ') = T ≤ U = (Q ≤ R)
A A
! Si queremos calcular la probabilidad de que una variable esté entre dos valores
a y b:
( ≤ Q ≤ ) = (Q ≤ ) − (Q ≤ )
a) (Q ≤ 0,44)
b) (Q ≥ 0,44)
c) (−0,52 ≤ Q ≤ 1,21)
Veamos ahora: Supongamos que la altura de una población sigue una distribución
normal de media 168 cm y desviación típica 4 cm. Cómo obtendrías:
Para variables continuas existen otras distribuciones de probabilidad teóricas que nos
serán de utilidad en estadística inferencial. Éstas son la t de Student, la distribución χ)
(ChiDcuadrado) y la F de Snedecor. Estas distribuciones adoptan una forma diferente
dependiendo de un parámetro que se denomina grados de libertad.
Indicar que cuando los grados de libertad aumentan, esta distribución se asemeja a la
distribución normal siendo igual en el caso cP
Desayuna Habitualmente
Modalidad Frecuencia absoluta
Solo Café o Leche 24
Tostadas Aceite 7
Tostadas Mantequilla 3
Bollería 0
Solo Fruta y/o zumo 1
Bocadillos 0
Otros 12
Total 49
( ) *
- % " % + , ( .
- %
" % + ,
Sexo
Modalidad Frecuencia absoluta
Chica 29
Chico 14
Total 43
- ( .
! , (0 ! , (1 2 *
3 ,
4 1
Frecuencia
Modalidad
absoluta
Solo el Padre 16
Solo la Madre 4
Ambos 8
Ninguno 21
Total 49
- 56 2
-
7
8 -
!
Frecuencia
Modalidad
absoluta
Padre Fumador 24
Madre Fumadora 12
Ambos 8
Ninguno 21
! - 56
(;
,
-
!
5 ; < 3 4
! * 5 !
= ! 4> !
-
56 !
-
56 !
1 59 ! ? >
! 59 46
! -
! (0
! ,
1 49 ! 1
@ ! A ! 2
-
! (0 ! ,
> 59 46
! " . 2 46 ! A
? 4 3 4 1
! @ ! > !
!
/ 2 B
" -
( . 3
4 ! ,
( . ! !
3 4 ,
A 2
B * C
" *
% +
+ D4> E ! B
-
Test Ejercicio
Una vez o menos Más de una vez al mes
Sobrepeso
SI 2 6
(IMC>25)
NO 8 33
! !
F - . ! *
- C ! ! ! G
2 .
. 1 ! ! 3 .
@>H 9@H
= 56
!
B
! . B
" (
,
@ * )
@? 9@ ) * = ?=
( . <
A? ,
( . < .
@> ,
( . A? @? ,
!
" #$% & '#% (
) *$% + ,
&-
. ! / .$
0 .% 1 .$
( 2$ 0 $%1 2$ ( *$ 0
*% ( .$% ( *$ 0 3
.$%
% .% ( '%
4 5
,) ( *$
0 -
,6 5 % .$ 0 -
7 8 (
9 # 8 .
: #$%
,6 5 % : -
,6 5 %
: -
2 #.% ( *% 8
#$ 0 ( #$ 0
(* 8 #
¿) 8 ( #$ 0 -
;7 8 ( #$ 0
,) ( #$ 0 -
;7 ( #$ 0
,) ( #$ 0 -
; ( #$ 0
,
- ,< 8 -
# + (
$=($> 9
( $ * ( $ $$
,) ( -
* ) 0
5 +
? ( =#%
5
% 7
@ #%
" /
7
5
7
5
' (
!
! @
; :
$$ ( $$
/
No Afección 1 1 4 89 5
Intestinal
) (
# .$ .# ( $ :
; ( ;
A /7 .$/
(
$ ># , @ -
! " #
! " '(
) #
! " '(
)
+ , - . / .- 0 . * *
%&1 * 1 * %1 &* %(1
2 .- 3
. " 4. ! "
#
% 5 .
*6 4
*, 6 4 +78
*9 :5
*; - .
*; - .
*; )
( +&1 -
+1 ; $1 "
- . )
#
' <1
- .= ) - $1
71 - >
. )
-
? -
<1 . .
%&1 (1
. .
@
@ . .
< ; "
.= = .
.
Nº Veces
Nº Individuos
Semana
Total Hombres Mujeres Total
0 450 1200 1650
1 100 210 310
2 120 94 214
3 150 66 216
4 160 30 190
5 90 10 100
6 68 2 70
>6 50 0 50
1188 1612 2800
) $<&& *
@
@ . "
%
@ .
.
. ) #
El propósito de un estudio estadístico suele ser, como hemos venido citando, extraer
conclusiones acerca de una población.
Los primeros términos obligados a los que debemos hacer referencia, definidos en el
primer capítulo, serán los de estadístico y estimador.
Técnicas de Muestreo
Elección de la muestra
Dispersión
Naturaleza
Sesgos
{ , ,….. ,}
de tamaño n , con i = 1, . . . , k.
Se realiza en cada una de estas subpoblaciones muestreos aleatorios simples
Notar que:
, …..,
Varianza Muestral: = !
− /n
Notar que todo estadístico genera una población estadística formada por los valores
que toma para cada muestra, es decir, si tomamos como ejemplo la media muestral,
para cada muestra que tomemos en una población (supongamos que tomamos
muestras), obtendremos un valor para la media muestral en cada una de las
muestras, y por lo tanto, tendremos una
= + + ⋯+ /
!
−
& =
n−1
"= #
!
−
s =
n
)* − + )*
(= ∗- . -= ∗(
)* )* − +
Ejemplo
Ciertos investigadores se interesan por la calidad del aire en una determinada ciudad.
Uno de los indicadores de dicha calidad es el número medio de microgramos de
partículas en suspensión por metro cúbico de aire.
¿Cómo podemos estimar este parámetro y de este modo comprobar la calidad del
aire?
Una forma de obtener una muestra partículas en suspensión podría ser extraer cada
seis días, un metro cúbico de aire y a partir del mismo, calcular el número de
58 + 70 + 57 + 61 + 59
= = 61
5
Sin embargo, esta estimación la hemos realizado sobre una sola muestra, por lo que
aunque un estimador puntual se aproxime en gran medida al valor real del parámetro,
casi nunca será exactamente igual al verdadero valor del mismo.
Para tener una idea, no solo del valor aproximado del parámetro, sino también de la
precisión de la estimación, optaremos por el método de
.
Este método consiste en definir un intervalo donde aseguremos, con una probabilidad
prefijada que supondremos suficientemente alta, que en su interior se encontrará el
parámetro a estimar.
Veamos ahora cómo construir los intervalos de confianza para los parámetros más
usuales: medias y proporciones.
@ > ∈ : = 1− =
Por ejemplo, para = = 0,05, el nivel de confianza será de 0,95 (o del 95%).
@ > ∉ : ≤ =
95%)
Veamos ahora como la estimación de una cota de error es, en sí misma, la definición
de un intervalo de confianza.
Al trabajar con una muestra, no podemos obtener directamente la cota de error, pero si
nos gustaría aproximarnos a su valor. Es decir, pretendemos que en la mayoría de las
@ |$ − |<I = 1− =
@ −I<$< +I = 1− =
K+ = L − 8
KM = L + 8
! "N − O; N + O
−µ
; = &
↝S −1
)
donde S es la cuasivarianza muestral, estimador puntual de la varianza poblacional σ
Recordad que
)n
S= ∗s
)n − 1
−µ
; = ↝S −1
) −1
Y de este modo
−µ
@ X−S=; −1 < < S=; −1 Y = 1− =
) −1
(
Z [|\ − L| < ]9;*−+ ^= +− 9
)* − +
(
8_ = ]9;*W+
)* − +
( (
K+ = L − ]9;*W+ ; KM = L + ]9;*W+
)* − + )* − +
Donde el valor SV; W es percentil = el de una variable con distribución t de Student con
− 1 grados de libertad.
Para una
!:
)a − *(
Z `|\ − L| < ]9;*−+ b= +− 9
)* − + )a − +
)a − * ( )a − *
8 a = 8_ = ]9;*W+
)a − + )* − + )a − +
( )a − * ( )a − *
K+ = L − ]9;*W+ ; KM = L + ]9;*W+
)* − + )a − + )* − + )a − +
Obtener un intervalo de confianza con = = 0,05 para estimar la altura media de los
Ejercicio para clase
alumnos de la clase.
frecuencia relativa.
Una vez estimado esto, nos puede interesar el comparar la diferencia existente entre
las proporciones en distintas poblaciones. Esto lo veremos más adelante
Supongamos que tenemos una proporción en una población que denotaremos por d.
Sabemos que un estimador puntual de la proporción es la proporción muestral p.
"−d
f =
g" 1 − "
n
"−d
@ j−S=;∞ < < S=;∞ l = 1 − =
g" 1 − "
i n k
Para una :
n +−n
Z X|m − n| < ]9;∞ o Y= +− 9
p
n +−n
8_ = ]9;_ o
p
n +−n n +−n
K+ = n − ]9;_ o ; KM = n + ]9;_o
p p
Para una !
n + − n )a − *
Z X|m − n| < ]9;∞ o Y= +− 9
p )a − +
)a − * n + − n )a − *
8 a = 8_ = ]9;_ o
)a − + p )a − +
por tanto,
n + − n )a − * n + − n )a − *
K+ = n − ]9;_ o ; KM = n + ]9;_o
p )a − + p )a − +
Tamaño de muestra
]9;_ q M
*_ = [ ^
8
Donde el valor SV;_ es percentil = el de una variable con distribución t de Student con
∞ grados de libertad.
*_
*a =
* −+
+ + _a
Cuanto mayor sea la cota de error, menor será el tamaño de la muestra que
debamos tomar.
]9;_ um + − m
M
*_ = t v
8
*_
*a =
* −+
+ + _a
Cuanto mayor sea la cota de error, menor será el tamaño de la muestra que
debamos tomar. Si el tamaño de la muestra aumenta, el error disminuye
= 80.
muestra de 90, localizaremos el valor para el percentil en la fila que correspondería a
Es decir ]w,wx;_ = +, z|
Contraste de Hipótesis
Introducción
Ejemplos
" ! #
Fundamentos
!
%
!
& ' (
$ &
) * +! &
) , "
) - "
,
! .
∉ , ≤
)
' 0 . (
&
&
&
) 1
2 ∈ , ' 0 . (
H &
2 ∉ , ' 0 . (
H &
&" H
)
3
Nota
) 4 456 4 4*6 4 4456 4 44*
7 3 '
( ℎ H H
1− = - . H H
H
/ $ 0
$
/= - . H H 1 2
Realidad (Población)
H0 es cierta H0 es falsa
Correcto Error Tipo II
No rechazamos H0
La probabilidad es 1 – α La probabilidad es β
Decisión Posible
Rechazamos H0 Error Tipo I Correcto
(Aceptamos H1) La probabilidad es α La probabilidad es 1 – β
+! . α / )
.
9 ! . α
1−/ :& 2 9
. α & 1−/
.
&
3
H : 7 = 1,74
Nota
&
:H
9
:H
Ejemplo
H 2
. "
: &
H $
. :=8
. *=1
7 : 2
7
.
H : 7 = 7 = 174 <
=>
!
@ & 0 . H : 2
@ H
"
!
Nota importante
& ! )
H
! &
:A ℎ H H = & . 2
/ & )
H ) !
H
:A - . H H 1 2 =/ 2
) # &
B
$ & H
: 2 C / !
H : 2
Contraste bilateral
B : 2
H :7 = 7
H :7 ≠ 7
$ A !
& !
D
" *"BC
Población infinita
H t
: -1
=−7
H es cierta ⇔ ↝ :−1
M: − 1
) . : 0 *"BC
S−7
O PQR O =
M: − 1
E − T;VW T;VW
$ 0
T;VW
**"X
) C
Ejercicio práctico
* F1 7 ! ,5
& G 4 45
H : 7 = 174 <
H : 7 ≠ 174 <
$ # %&
D
*F4 & 9 / *4 )
OB − b O d − de
O] ^_` O = ( = = , ghg
Mc − Mfe
# ] = , h& . ,5
] ]^a = ] , h;fe = f, i
" # $ %&
' () *
$ %&
' () *
Población finita
$ t : -1
=−7
H es cierta ⇔ ↝ :−1
Mt − :
M: − 1 Mt − 1
. : . t
− T;VW
)
T;VW & 0
S−7
O PQR O =
Mt − :
M : − 1 Mt − 1
Contraste unilateral
B : 2
7≮7
H :7 = 7
H :7 > 7
7≯7
H :7 = 7
H :7 < 7
9 0 PQR
Población infinita
$ t : -1
=−7
H es cierta ⇔ ↝ :−1
M: − 1
) 0 − T;VW T;VW &
0
S−7
O PQR O =
M: − 1
Ejercicio propuesto
! 8
*F1
*F1
Población finita
$ t : -1
=−7
H es cierta ⇔ ↝ :−1
Mt − :
M: − 1 Mt − 1
) 0 − T;VW T;VW
& 0
S−7
O PQR O =
Mt − :
M: − 1 Mt − 1
Contraste bilateral
B : 2
H :π=π
H :π≠π
Población infinita
$ t ∞
π −.
H es cierta ⇔ ↝ ∞
zπ 1 − π
n
π −.
O PQR O =
zπ 1 − π
n
Población finita
$ t ∞
π −.
H es cierta ⇔ ↝ ∞
π 1 − π Mt − :
}
n Mt − 1
π −.
O PQR O =
π 1 − π Mt − :
}
n Mt − 1
Contraste unilateral
B : 2
π≮π
H :π=π
H :π>π
π≯π
H :π=π
H :π< ~
Población infinita
$ t ∞
π −.
H es cierta ⇔ ↝ ∞
zπ 1 − π
n
π −.
O PQR O =
zπ 1 − π
n
Población finita
$ t ∞
π −.
H es cierta ⇔ ↝ ∞
π 1 − π Mt − :
}
n Mt − 1
π −.
O PQR O =
π 1 − π Mt − :
}
n Mt − 1
& I 9
& J
+ , 0 .
S. ) I
!
I
PQR
. ≤ 0,05 ⇒ A H
Nota
: 2 0
H
I 0 3 I
& 8
0 I !
Resumen
"
) :H
2 & :H
2
$ # %&
PQR &
H & 3
: 2 @
PQR H &
& H
@ YPZ
PQR &
' %
t r•€ O PQR O ≤
YPZ & H
$ 0 3
: 2
H
I
7 '
H ( ' H " '7 & H ( &
! "
#
$ % &
' ( '
( )
#
* +
H : =
H : ≠
, &
- ≮
H : =
H : >
- ≯
H : =
H : <
Ejemplo
- .
)
#
) )
/ )
/ ' .( '
(
' (
01 & 2
H : =
H : >
Ejemplos
1 # - ) 3 '
( 4 ' (
# 1 5- 5
1 )
# ' 5-( '1 6
1 3 6 4 6 4 (
4 ,
& / 7
4 , '8
5 ) ( 4 ) &
5 &
4
-
# test no paramétricos Wilcoxon
o el de Mann Withney, )
Supuestos de aplicación
/
"
5 ' ( &
8 7 ' (' = (
Objetivo
1 0- 2
Contraste bilateral
Paso 1. Planteamiento
4 & )
H : =
H : ≠
- "
−
)
=
1 2
1 1
#$20 & + (
1 2
- $ 7
$ + $
$ =
+ −2
Paso 3. Conclusión
+ 9 &
- 3 3 ≤ 5 = 2; 1 + 2 −2 ⇒ H
- 3 3 > 5 = 2; 1 + 2 −2 ⇒: 7 H
Contraste unilateral
Paso 1. Planteamiento
4 & )
- ≮
H : =
H : >
- ≯
H : =
H : <
4 )
−
=
1 2
1 1
#$20 & + (
1 2
Paso 3. Conclusión
4
(− *;,- .,/ 0 *;,- .,/ 0 ) *;,- .,/ 0 & 5
+ &
- ≤ 5 = 22; 1 + 2 −2 ⇒ H
Ejemplo
4)
% +
% ; $ #
'<==( 4
'+- ( < 5
' <==( > <
# ;$ < + $ <==
; < # ?@ <
- 7 +- 0- #
) +- 2
Paso 1. Planteamiento
!
# Hipertensos HBB (S/N)
& # presión
sistólica nocturna (PSN) / #
' ( / ' (
+-
4 &
H : =
H : ≠
$ + $ 14 ∗ (9,6) + 16 ∗ (10,4)
$ = = = 107,89
+ −2 14 + 16 − 2
− 110 − 128
= = = 4,73
1 2
1 1 1 1
#$20 & + ( #107,89 & + (
1 2 14 16
Paso 3. Conclusión
5 = 2; 1 + 2 −2 = 0,05;28 = 2,05
Test de Behrens
Supuestos de aplicación
/
"
5 ' ( &
8 7 ' ≠ (
Objetivo
1 0- 2
Contraste bilateral
Paso 1. Planteamiento
H : =
H : ≠
−
=
1 2
E F1 + F2
2 2
1 2
Paso 3. Conclusión
F21 F22
2; 1 −1 + 2; 2 −1
5 = 1 2
F21 F22
+
1 2
4 &
- ≤ 5 ⇒ H
- > 5 ⇒: 7 H
: F F 7
Contraste unilateral
Paso 1. Planteamiento
- ≮
H : =
H : >
- ≯
H : =
H : <
F21 F22
22; 1 −1 + 22; 2 −1
5 = 1 2
F21 F22
+
1 2
+ &
- ≤ 5 ⇒ H
- > 5 ⇒: 7 H
Ejemplo
- 7 6 '5 5 ( A
, @ @ B
# ; B - > 5 5
$; B # ; B
- 7
5 5 0-
5 5 2
Paso 1. Planteamiento
!
# Enfermos tumorales (S/N) &
# niveles de A1AT / #
'4 (
/ ' ( 5 5 &
4 &
H : =
H : >
n
:
F = ∗$
n−1
F = ∗$
−1
27
F = ∗ (320) = 106338,45 (:</IJ)
27 − 1
18
F = ∗ (110) = 12811,76 (:</IJ)
18 − 1
−
=
1 2
E F1 + F2
2 2
1 2
626 − 340
= = 4,19
#106338,45 + 12811,76
27 18
Pasos 3. Conclusión
1 1 22
F21 F22
22; 1 −1 + 22; 2 −1
5 = 1 2
F1
2
F22
+
1 2
*;,- 0 = , ; K = 1,706
*;,/ 0 = , ; L = 1,740
4 podemos decir que los pacientes tumorales tienen más elevados los
niveles de A1AT que los pacientes no enfermos
Supuestos de aplicación
una población
- '
, (
+ -
4
/ ' ( &
Objetivo
1 0- '
, (2
Ejemplos
-
5
0< &
2
- , )
; )
, C , &
Nota
4 &
'5 , ( ,
' , , (
D % %
, %
,
- ) % #
I ,
I = − M
I
- ,
7 ' N N (
- # 7
1 M − M
2 M − M
…. … .. … .. … ….
, M, , − M,
C +
Contraste bilateral
Paso 1. Planteamiento
4 )
H : N =0
H : N ≠0
&
H : \ − 5 =0
H : \ − 5 ≠0
H : \ = 5
H : \ ≠ 5
4 # &
3I3
= $I
] −1
Paso 3. Conclusión
4 & 5 = 2; −1
- ≤ *;,0 ⇒ H
- > *;,0 ⇒: 7 H
Contraste unilateral
Paso 1. Planteamiento
- \ > 5
H :δ= \ − 5 =0
H :δ= \ − 5 >0
- \ < 5
H :δ= \ − 5 =0
H :δ= \ − 5 <0
4 # &
3I3
= $I
] −1
Paso 3. Conclusión
=
4 &
& 5 22; −1
- ≤ *;,0 ⇒ H
- > *;,0 ⇒: 7 H
Ejemplo
-
+ 7
; /
Antes 200 210 330 240 260 300 245 210 190 225
Despues 150 200 275 250 200 250 200 180 190 205
0C , 2
4 ' %
( #
H :δ= \ − 5 =0
H :δ= \ − 5 >0
Antes 200 210 330 240 260 300 245 210 190 225
Despues 150 200 275 250 200 250 200 180 190 205
Diferencia 50 10 55 -10 60 50 45 30 0 20
4 # &
3I3
= $I
] −1
I = 31
$N = 7,051
31
= = 13,19
7,051
]9
*;,0 = , ;_ = 1,833
! = 13,19 [ ≤ 0,001
Paso 3. Conclusión.
> *;,0 (
4 ) #
' 7 ' ?*F(
el tratamiento es efectivo y reduce el colesterol con un nivel de
confianza del 95% y ≤ `, ``a
- 7 #
01 # 2
- # b c 4
si las dos variables son independientes +
&
/
tabla de contingencia. 4
+
# 7 (b , cw )
xa xy ..... xz Totales
ni. n.j
e•€ =
n
4 # &
…nij − eij †
\ ‡
ƒ = „„
eij
ˆ wˆ
Paso 3. Conclusión.
# ƒ (U − 1)(v − 1)
ƒ5 = ƒ*;(\0 )(‡0 )
+ 7 &
- ƒ ≤ ƒ5 = ƒ*;(\0 )(‡0 ) ⇒ H
Ejemplo
*;; "
Grupo Socioeconómico
Superior Medio – Superior Medio – Inferior Inferior
Con Defecto 8 24 32 27
Defecto
Sin Defecto 42 121 138 108
0-
& 2
+ #
Grupo Socioeconómico
|aa = š |a. = œa
n . n.
aa =
n
91x50
= |ay = yž
500 n . n.
= œ, a ay =
n |a• = •y |až = y
91x145
Con
= a• = •`, œž až = yž, ¡
(n −e ) 500
Defecto
e = yŸ, •œ
(8 − 9,1)
=
9,1
= `, a•y
Sin |ya = žy |yy = aya |y• = a•š |yž = a`š |y. = ž`œ
Defecto ya = ž`, œ yy = aaš, Ÿa y• = a•œ, `Ÿ yž = aa`, ž•
ƒ = 0,758
4 9 # (2 – 1) × (4 − 1) =
3. / H #
= %6 ƒ , ¤;¥ = 7,81*
= 0,758 < ƒ H
Paso 3. Conclusión.
1 ƒ , ¤;¥ = 7,815 ⇒
4 )
no hay evidencia que indique la relación entre el defecto de pronunciación
de los niños de la población y su nivel socioeconómico.
xa xy Totales
( ∗ − ∗ ) ∗
ƒ =
. ∗ . ∗ . ∗ .
Paso 3. Conclusión
ƒ5 = ƒ*;
+ &
- ƒ ≤ ƒ5 = ƒ*; ⇒ H
- ƒ > ƒ5 = ƒ*; ⇒ : 7 H
Nota
- * Corrección de
Yates )
( ∗ − ∗ − 2) ∗
ƒ =
. ∗ . ∗ . ∗ .
Ejemplo
- % #
+
*; @* " 7 #
& 7 9 %
# /
Ejercicio Físico
Si No
Insuficiencia Si 200 150
Cardiaca No 20 150
0+ ) 9
7 ' ( % # @* " 2
- # , realización ejercicio
físico (S/N) y sufrir algún tipo de insuficiencia cardiaca (S/N) &
# @* "
Ejercicio Físico
Si No
Si 200 150 350
Fuma
No 20 150 170
220 300 520
Paso 3. Conclusión
ƒ5 = ƒ*; = 3,84
' ' (( E
1 #
# "
G # '' (( H
# % & 7 #
! & 7
!
# ' (
# ' (
+ 04
' ( 2
Ejemplo
-
+ # '- )
'-B ((
+ I3 '-B (J
Fumadores No Fumadores
Variable Fuma (S/N) (30) (50)
(37,5%) (62,5%)
- # I- ) J ,
7 ' (
4 9 '3
( # I3 '-B (J
4 % &
I3 J
# I ) J
- " . / #
' ( ' B
# ( 4 "
%
4 + =
-
# ' ( '
(
4 9
+
&
[ = M [ =
Contraste bilateral
H :π = π
H :π ≠ π
0C , ) 2
3[1 − [2 3
=
1 1
#[0 …1 − [0 † & + (
1 2
[ + [ +
[ = =
+ +
Paso 3. Conclusión
5 = 2;∞
- ≤ 5 = 2;∞ ⇒ H
- > 5 = 2;∞ ⇒: 7 H
Contraste unilateral
D ' ( &
- π ≮π
H :π = π
H :π > π
- π ≯π
H :π = π
H :π < π
=
)
5 22;∞
- ≤ 5 = 22;∞ ⇒ H
Ejemplo
1 %
C ' (
' ( + &
H :π = π
H :π > π
Chico Chica
Si 15 15 30
Fuma
No 5 45 50
20 60 80
15
[ = = = 0,75
20
15
[ = = = 0,25
60
+ 15 + 15 30
[ = = = = 0,375
+ 20 + 60 80
Paso 3. Conclusión
4 5 = 0,1;∞ = 2,58
< #
& 8 7
-
# ' ( ' ( #
0E % 9 # ' (
2
4 # #
' ( '
(
4 , 8
&
Ejemplos
! & 7 ' , (
% ,
! &
Tipos de estudios
Estudios transversales. 4 7 )
4
Estudios prospectivos. - 5
& )
9 4
4
#
' ) ) (
D % estudios de cohortes
)
4 & ,
#
- 7 #
) )
# )
Estudios retrospectivos 4 )
D % casos%controles
' (
' # (
)
) ,
Presencia de
Enfermedad
Si No Totales
Exposición al factor de Si |aa |ay |a.
riesgo No |ya |yy |y.
Totales |.a |.y |
+
©U7XSJ7 VRS I7 JS 7 T7U:7ISI =
! ª. & ) ª0
&
! E «
E
©(®/-. )
-- = = =
. .
©(®/-0 ) .
.
- odds
4 ,
" 9 ' !
( &
[
ODD([) =
1−[
P(E/R+ )
ODD…P(E/R )† P(E «/R+ )
+
11 22
OR = = − =
ODD(P(E/R− )) P(E/R ) 21 12
P(«
E/R )
−
4 &
' ) ( &
' ) (
5 ,
Ejemplo
- # &
7 % ,
Bajo peso
Si No Totales
Si 60 40 100
20 30 50
Fuma
No
Totales 80 70 150
60 ∗ 50
-- = = = 1,5
.
. 20 ∗ 100
/ * & ,
%
4 % ' " %
" (
Bajo peso
Si No Totales
Si 60 40 100
20 30 50
Fuma
No
Totales 80 70 150
60
ODD = 100 = 1,50
40
100
C & %
' *;F " % (
4 % ' " %
" (
Bajo peso
Si No Totales
Si 60 40 100
20 30 50
Fuma
No
Totales 80 70 150
20
ODD = 50 = 0,66
30
50
C & ,
' F " %
(
- :
Bajo peso
Si No Totales
Si 60 40 100
20 30 50
Fuma
No
Totales 80 70 150
60 ∗ 30
OR = = 2,25
20 ∗ 40
4 , %
* 7
7 , 7
%
Nota
-G % :: ) :
- 7 # una
muestra 4
' ( Test de Mc
Nemar
³fifhjkiígjlhf m
+ - Totales
|aa |ay |a.
³fifhjkiígjlhf o
+
- |ya |yy |y.
Totales |.a |.y |
4 #
´kgsµkg
+ - Totales
|aa |ay |a.
¶qjkg
+
- |ya |yy |y.
Totales |.a |.y |
+ &
H : π· . = π¸ .
H : π· . ≠ π¸ .
( − )
ƒ =
+
- < 10 < 10 E
( − − 1)
ƒ =
+
Paso 3. Conclusión
ƒ5 = ƒ*;
+ &
- ƒ ≤ ƒ5 = ƒ*; ⇒ H
- ƒ > ƒ5 = ƒ*; ⇒ : 7 H
Ejemplo
-
+ "
+ $
H : π» ¼½¾ ¿À•ÁÂ
= π» ¼½¾ Ã
¿À•ÁÂ
H : π» ¼½¾ ¿À•ÁÂ
≠ π» ¼½¾ Ã
¿À•ÁÂ
( − ) (144 − 256)
ƒ = = = 31,36
+ 144 + 256
= %6 ƒ , ¤; = 3,84
= 31,36 > ƒ H
Paso 3. Conclusión.
1 ƒ , ¤; = 3,84 ⇒ : 7
4 7 existen cambios en la
proporción de alumnos que padecen gripe a los 14 años respecto a los 12 con
p<0,001
4 & &
! residuo ilÄ
r•€ = n•€ − e•€
D 7 -
" )
4 #
" #
H : r•€ = 0
H : r•€ ≠ 0
4 # &
n•€ − e•€
r•€ = > 2;∞
ni. n.j
#e•€ &1 − ( &1 − (
n n
/ # &
1
' 7 (
! homocedásticas 7
- 7
H : =
H : ≠
4 7 &
, 7 7 ' (
-
4) 7
2
2
2
=-
1
+ -=1 7
0+ , #2
H
+ #
1 )
F
Æ=- ↝ Æ,/0
F ,,- 0
- 3 - −1 −1
# #
F
&
S
Æ = > Æ2;(
S 2 −1)/( 1 −1)
- S
Nota
: 1 7 F 8 7 $
Regresión y Correlación
Este planteamiento sirve para completar los análisis que vimos en el apartado anterior
en el que queríamos comprobar si dos cualidades estaban relacionadas. Ahora,
intentaremos establecer la .
Nota
Es muy común confundir estos problemas con una comparación de medias. Notar que
en este caso, disponemos de dos características cuantitativas. En los contrastes de
medias, disponemos de una sola característica cuantitativa.
Ejemplos
Este es un estudio muy común en ciencias de la salud y pretende contestar a
preguntas del tipo:
?” “
”
! " #
$%
& # '&
($ )
* ' ($ " + ,
1) Se toma una muestra de n individuos, anotando los valores para cada una de las
dos variables en cada uno de los individuos.
Esto sería muy útil para tener una aproximación de si estas variables están
relacionadas y de qué manera, sin embargo, necesitamos de alguna herramienta
matemática que nos confirme dicha relación, y como comentábamos antes, la
magnitud de la asociación.
Ejemplo
Supongamos que se toma una muestra de 8 individuos en una población con el fin de
determinar si existe relación entre el consumo de sal (cantidad ingerida al día) y la
tensión arterial media. A cada uno de ellos se les miden ambos parámetros
obteniéndose lo siguiente:
140
120
80
60
40
20
0
0 1 2 3 4 5 6
Ingesta diaria de sal (gr/día)
Podemos observar que se puede trazar una línea de regresión que se aproxima en
cierto modo a la tendencia que sigue la nube de puntos:
140
120
Tensión Arterial Media
100
80
60
40
20
0
0 1 2 3 4 5 6
Ingesta diaria de sal (gr/día)
En base a esto, podemos intuir que existe cierta relación entre las características en
estudio, de modo que a medida que aumenta la ingesta diaria de sal, aumenta la
tensión arterial media. Es decir, podemos intuir la relación y el sentido de la misma.
Sin embargo, debemos cuantificar esta relación.
!
"
Lineal: = +
Exponencial: =
Logarítmica
Hiperbólica: =
Logística
Parabólica
% & "
Nuestro objetivo, por tanto, será obtener una recta Y′ que se aproxime, para cada valor
de X, lo más posible a los valores de Y. Esta recta vendrá dada por:
Y′ = a + a X
Para definir la recta, lo que debemos hacer por tanto es obtener los valores de y ,
que denominaremos , que hagan mínima la diferencia entre
Y′ e Y. Éstos van a ser:
−
= "
#
# − "
= $− 1&
Ejemplo
Dado el ejemplo anterior, calcular la recta de regresión de $ (Tensión arterial media)
sobre & (consumo diario de sal).
# #
−
= " =
#
# − "
20,8 ∗ 650
2302,2 −
= 6 = 6,335
20,8 #
79,82 −
6
650 20,8
= $− 1& = − 6,335 ∗ = 86,37
6 6
Propiedades
6 Y X
'
#
0
= 12, 34 + 2, 335 ∗
' ()* ! +
5 ;;<=
¿En cuanto se incrementa la TAM (en mmHg) por cada gramo de sal ingerido
al día?
− "
N = #
# − "
N = & − N1 $
Veamos ahora como establecer la relación entre las dos características en estudio, así
como el grado de dependencia y el sentido de la misma.
Coeficiente de Determinación
% "
ST = 6 U
"
Es adimensional
% "
El resto por tanto (100% > 33.87% = 66.13%) no es explicado por la car. independiente
S = ±W6 U
Además del ,
entre las mismas.
% "
Si O > 0, las rectas de regresión son crecientes, por tanto, existe dependencia
directa. (correlación positiva)
S = − , e4
S=
S=−
ST = , ef
Llegados a este punto, ya solo nos queda ver cómo podemos determinar el valor para
el coeficiente de determinación y el coeficiente de correlación. De este modo,
estimaremos el grado de dependencia lineal o asociación entre las características y el
sentido de dicha relación. Lo haremos como lo venimos haciendo en los últimos
temas, mediante un contraste de hipótesis a partir de una muestra.
Tomamos una muestra y para los valores de la misma, obtenemos un estimador Z # del
coeficiente de determinación:
Z# = 1 N1
3#
H : O = 0 ⇒ ^"_`a`"_`"bQ
H : O ≠ 0 ⇒ d`a`"_`"bQ
6# 5 #%
Z# = 1 N1
krkmn − 2
t hij =
m1 − r#
+# %
nopq = nr; t#
3#
H : O = 0 ⇒ ^"_`a`"_`"bQ
H : O = 0 ⇒ ^"_`a`"_`"bQ
6# 5 #%
Z# = 1 N1
krkmn − 2
t hij =
m1 − r#
+# %
nopq = n#r; t#
Ejemplo
Siguiendo con nuestro ejemplo:
3# #5
H : O = 0 ⇒ z{ ` Qyn` Z`| bQó" `"nZ` | ~•€ | Q":`yn _Q ZQ _` y |
6# 5 #% #
# #
20,8 ∗ 650
2302,2 −
N = 6 = 0,147
650 #
70748 −
6
Antes hemos calculado 6 = 2, 335
Z# = 1 N1 = 0,934
Z = W0,934 = 0,967
krkmn − 2 k0,967km6 − 2
t hij = = = 7,54
m1 − r# W1 − 0,967#
+# % #
( # O # ! #
$ % '
# %
Ejercicio
También sería el caso cuando queremos analizar una muestra que ha estado
sometida a diferentes tratamientos o ha estado almacenada en diferentes condiciones.
Por tanto, es necesario definir un nuevo contraste de hipótesis que sea aplicable en
aquellas situaciones en las que el número de medias que queremos comparar sea
superior a dos. Es por ello por lo que el análisis de la varianza, ANOVA, surge como
una generalización del contraste para dos medias de la t de Student, cuando el
número de muestras a contrastar es mayor que dos.
A la variable cualitativa que define los grupos que deseamos comparar la llamamos
independiente o factor. A la variable cuantitativa en la que deseamos comparar los
grupos la llamamos dependiente.
Vamos a exponer esto con más claridad. Consideremos una variable sobre la que
actúa un factor que puede presentarse bajo (o en) un determinado número de niveles
o poblaciones Z. Estas son las modalidades de la variable cualitativa.
Para cada uno de ellos, tomaremos muestras de tamaño " , "# … "‡ en cada uno de
los grupos o modalidades de la variable cualitativa (los tamaños de muestra no tienen
porqué ser iguales) en las que obtendremos valores para la variable X.
Por tanto, para cada grupo, obtendremos los siguientes valores para la variable &:
Modalidad/Población/Grupo 1: , # ,…, ˆ
Modalidad/Población/Grupo 2: # , ## ,…, # ‰
Modalidad/Población/Grupo 3: Š , Š# ,…, Š ‹
GGGGGGGGGGGGGGG
Modalidad/Población/Grupo Z: ‡ , ‡# ,…, ‡ Œ
7 :
Contrastar la hipótesis ¿Son todas las medias iguales o hay alguna diferente?
H : • = •# = ⋯ = •‡
’“ T—
Muestra ’“ = ”“• ’“ T –“ –“
T1 #—
Población 1 , # ,…, ˆ T T1 #
" "
T2 #—
Población 2 # , ## ,…, # ‰ T# T2 #
"# "#
Ti #—
Población r ‡ , ‡# , … , ‡ Œ T• Tr #
"‡ "
’ – š
Definimos además:
› = ”T + ”TT + ⋯ + ”Tœ–œ
• = ’T ⁄ –
¡ ¢T
œ− ¡ =š−• T
¢ = £ œ− —T
Poblaciones ¢
¡
Error –−œ ¡ =›−š ¢T = £ –−œ
Total –− ›−•
Ejemplo
Se forman tres grupos de 6 alumnos y a cada uno se le aplica un método de
enseñanza (con el mismo temario). Los resultados del examen son:
Queremos comprobar si existen diferencias en los resultados del examen para cada
uno de los grupos.
3# #5
Nota que deberíamos siempre probar las condiciones de aplicabilidad. En este caso:
Independencia observaciones
Homocedasticidad
Normalidad de las observaciones
6# 5 #% #
’“ T—
’“ = ”“• ’“ T
–“ –“
38,9#£
Presencial 38,9 38,9# 6 6
26,6#£
Internet 26,6 26,6# 6 6
22,6#£
Autodidacta 22,6 22,6# 6 6
11, 1 f55, T5
› = f, 1 + 4, + ⋯ + 3, = f1e, 14
T
• = 11, —
1 = f3 , T
¤ , „;[#/ „] = 3,68
+# % #
Por tanto, !
# , (-+&
Ejercicio
Se quiere evaluar la eficacia de distintas dosis de un fármaco contra la hipertensión
arterial, comparándola con la de una dieta sin sal. Para ello se seleccionan al azar 25
hipertensos y se distribuyen aleatoriamente en 5 grupos. Al primero de ellos no se le
suministra ningún tratamiento, al segundo una dieta con un contenido pobre en sal, al
tercero una dieta sin sal, al cuarto el fármaco a una dosis determinada y al quinto el
mismo fármaco a otra dosis. Las presiones arteriales sistólicas de los 25 sujetos al
finalizar los tratamientos son:
1 2 3 4 5
Tomar una decisión sobre si existen diferencias entre una dieta sin sal y el efecto del
fármaco en la reducción de la tensión arterial
Una vez obtenida la recta de regresión (coeficientes) entre dos variables aleatorias, el
objetivo del análisis de correlación lineal será
.
Ello se puede expresar definiendo una nueva variable E que mida las diferencias entre
los auténticos valores de $ y los teóricos suministrados por la regresión, $ 0 . Es decir:
§ = $ − $′
Es fácil de intuir, que para que el modelo se ajuste en gran medida a la realidad E
debe ser una variable cuya media debe ser 0, y cuya varianza debe ser pequeña (en
comparación con la de $).
Coeficiente de Determinación
1 #
•«# = ¬P − $R
" Q
1 # 1 # 1 #
"
¬P Q − $R = ¬- " Q − ′Q ® + ¬P ′Q − $R "
Llamaremos # , Y ! # X:
1 #
¬P ′Q − $R
"
Llamaremos # , Y ./ ! # X:
1 #
¬- − ′Q ®
" Q
Notar que cuanto más próximos estén los valores de e ′ , (más ajustado es el
modelo), la varianza de la variable $ vendrá más explicada por la variable &
El Y X se definirá como la
varianza de Y explicada por X, dividido por la varianza total, es decir:
#
P ′Q − $R
O# = #
P Q − $R
El coeficiente de determinación, por tanto, sirve entonces para medir de qué modo las
diferencias entre los verdaderos valores de una variable y los de su aproximación
mediante una curva (recta en este caso) de regresión son pequeños en relación con
los de la variabilidad de la variable que intentamos aproximar.
Se dice por tanto, que esta cantidad también mide el grado de del
modelo y el de las variables.
H : • = •¯
H : • ≠ •¯
k 1 − 2k
npuv =
1 1
±y20 P + R
"1 "2
nopq = n²;"−Z
Modalidad Casos
Menos de 160 5
[160 ; 168) 16
[168 ; 176) 12
176 o más 16
Modalidad Casos
Chica 29
Chico 14
Total 43
! "
* # +
,- . # /
# ,- 0/1
& $ " " )
2
# 3 / & $
,- / " " )
4 5 6 /
&7. ! ,- )
&7 $ ,- )
&8 ,- 9 )
, :
7
3! $
Modalidad Casos
Padre Fumador 24
Madre Fumadora 12
Ninguno 21
&; $ 6 !
+ )
&7. ! . "'
)
&# $ 6
)
= # "' 6 (
/
Test Ejercicio
&7. ! 6 "
)
&# $ 6 ( "
/ )
> 7 ,- !
+
&7. ,- / /:
)2 = 4,74
! "
# " $
" $ %% " & "
= 154,6 / í
= 64,6 / í
' (
) % %* + "
( &* ,
-
& # $ ./ !
' ./ ! ..
0 $
+1
( % *% 0*%2 -
3 4 $ (
5 1
" 0 6 &*
Muestra 1 2 3 4 5 6 7 8
Nivel 7,23 7,25 7,32 7,26 7,28 7,27 7,29 7,24
'
+7 -
/ 8
( ' 9 $ (
( 4
:
Paciente 1 2 3 4 5 6 7 8 9
Días 18 21 28 20 22 15 28 21 24
Ejercicios Prácticos 6. Contraste de Hipótesis (I). Escuela Enfermería Cartagena. Curso 2012-2013
+5 ( . -
4 &.* +4
-
4 ( .9
+# (
-
4 &.* ( .&
; # 0; # +4
! ( ; #
&%2-
4 (
&.9 ( +4 &*2
( ( ; #-
+4 (
( ; #-
Ejercicios Prácticos 6. Contraste de Hipótesis (I). Escuela Enfermería Cartagena. Curso 2012-2013
!" # $ %
!" # &
!" $ % ' !"
$ ( $ )*+
, , $ #
-
. , , # #
/ 01 +
. . #
, 02 , 3
Somnífero 1
Sexo H H H H H M M M M
Antes (horas) 3,2 3,6 3,8 3,5 3,3 3,8 3,5 3,9 3,1
Después (horas) 7,1 6,2 6,5 6,8 6,7 8,1 8,2 8,8 8,7
Somnífero 2
Sexo H H H H H M M M M
Antes (horas) 3,6 3,7 3,4 3,5 3,8 3,4 3,5 3,7 3,5
Después (horas) 8,1 8,2 8,5 8,8 8,7 9,1 9,2 9,8 9,7
0 1 , $ , .
4 %
. % 0
) . , , $ -
0 5 6 . #
4 6 , $ , 0 #
$ .
0 $ (
6) # /
, -
0 5 , 0 2
$ 0
. , , $ / )*
7 . - $ (
Ejercicios Prácticos 7. Contraste de Hipótesis (II). Escuela Enfermería Cartagena. Curso 2012-2013
8 . $ ,
7 9:1 0 1
8 ; /
" # , 6 3
Paciente 1 2 3 4 5 6 7 8
Antes 2,9 2,8 3,1 3,2 2,7 3 3,3 3,2 mmol/l
Después 2,3 2,2 2,5 2,4 2,3 2,8 3 2,6 mmol/l
) .
# -
( $ % # %
4 # + ( 0
<== 0 , 4
6 + # 7
0
Sobrepeso
Éxito Si No
Si 162 263
No 38 37
)1 . , # -
< * % % '
% , # $ 6
3
Nivel de Estudios
Antibióticos Elemental Medio Superior
Si 18 8 4
No 9 15 22
)> , # $ % ,
-
. $ % $ / 6 6
, 0 . 6
; $ % #6 6 , , 6
Ejercicios Prácticos 7. Contraste de Hipótesis (II). Escuela Enfermería Cartagena. Curso 2012-2013
. . $ 68 ,
, 0
0 )* , -
0 )2 % ,
# % -
' * ( ; ;; # &
/ 6 % 6 %
0: 6 <
+ . , $ (
6; / 0
) # , , $ %
# / -
; : =' , % > 6 8=
56 ' $ $ 6# < , 3
0 )*+ % 5# $ $
> -
0 ) . 5 , $ $ -
0 ) $ $ $ .
-
0 ) , -
& $ , $ .
, . ;' 6 <' ,
0? 8= . , , 6
. % . $ , 0
0 ) . , , # % ,
, -
0 ) $ , ,
, -
Ejercicios Prácticos 7. Contraste de Hipótesis (II). Escuela Enfermería Cartagena. Curso 2012-2013
! "
# ! $%& ! '
TR en Minutos Casos
menos de 45 5
45 a 55 18
55 a 65 25
65 a 75 22
75 a 85 16
85 o más 4
% ()
!
*
% + !
, -.
% & !
!
/& 0 '
CS Origen de la fiebre
22 Infección Bacteriana
26 Infección Bacteriana
28 Infección Bacteriana
32 Infección vírica
33 Infección Bacteriana
40 Infección vírica
41 Infección Bacteriana
46 Infección vírica
52 Infección vírica
58 Infección vírica
(/
, -. *
% (/
,
.*
% () !
12 *
% ( 23 0
/& /& 40-
" , -.*
!% +
% (/ 5
# 20-.*
% & - 0 (
5 #
0 0 ,
-. " 20-.*
#% (/ . - *
2 , 34 # 0 !
! 0 !
% 6 34 # 0 33
, %
% / , -.0 (
*
7 8 ,
8 0 , 8 2 8 0
! = 154,6 / í "
= 64,6 / í
% / , -.0 (
! 8
*
! " #
$
Tiempo 7 12 17 19 22 27 30 32
Ansiedad 75 62 59 52 46 40 38 35
Peso 87 75 62 55 50 46 40 38
#
%# &
%' () ! &
%* ! & %+
&
%, ( -. &
%* /
0. &
%, ( / ! &
3 $ $
- 4 .
15* ! / 6 *7*
IMC C-C
26,1 88,2
28,2 96,1
22 75,3
24,2 78,4
27,3 88,2
31,3 100
32,3 103
25,5 80
26 83,2
29 96,1
2 8 / 15* ! /
* 7*
9 ' : 0
$
Enfermedad 1 10 9 7 9 8
Enfermedad 2 7 5 5 4
Enfermedad 3 9 12 13 11 10 9
%3 :
& = 3,89
2 0
; ! ;- '
:
/ $
Sólo F1 12 13 10 11
Sólo F2 10 9 9 8 9 7 9
F1 + F2 5 5 4 7
%5 : &
= 3,89
Ejercicios Repaso (I). Estadística Descriptiva. Escuela de Enfermería Cartagena. Curso 2012-2013
" #
! $ %
! &' ( )
! *
! +
! ,-
. +
! /
! &' ( 0 . )
! &' ( 0 12 34 )
! &' ( 0 ( )
5 6
4 6
! &# ) &#
)
! / (
7
! &+ 0 ( 328 )
! &' ( 328 )
! &9 32 )
! &9 42 : )
! &# ;
)
Ejercicios Repaso (I). Estadística Descriptiva. Escuela de Enfermería Cartagena. Curso 2012-2013
!" ! #
Ejemplo:
Característica: Número de Hermanos
Modalidades: 0, 1, 2, 3,
Introducción
Tipos de Datos
! % *
+
Grupos Sanguíneos posibles: A, B, AB, O
(
, - .
/0
1 23
" %
* .
0 + "
Número de hermanos
posibles: 0, 1, 2, 3, 4, 5,. . .
4 "
( %
*
+ $
"
!" excluyentes cada modalidad debe pertenecer a una
y sólo una de las clases.
5 ( , )
! −
Distribuciones de Frecuencias
" 6+ 5
i0ésima
" 4 5
i0ésima 7
,889
"
+
:
= + +⋯+
"
$
i0ésima
= + + ⋯+
1 = = =
2 = = + = +
… … … … …
= = + + ⋯+ = + + ⋯+
Total 1
,88 9
Ejemplo
5 -88
% * + "
% * % *
"
; <
;# $ $ < ;# <
# i0ésimas
;# $ <
;# $ =<
;> )<
Ejemplo
? + "
@ " -88
; " <
;# <
Ejemplo
$ % *
Ejemplo
AB
" 7
;> <
En resumen
. !
# ! +
Representaciones gráficas
?
$ $
+ $ $
Variables Cualitativas
Diagramas de Barras
C &
'
Diagramas de sectores
5 !
' %=D8*
; $ $<
$ $
Ejemplo:
Ejemplo
Pictogramas
!
$ "
Variables Cuantitativas
Variables Discretas. Diagrama de barras
"
# "
+
0 "
$ $ $
7 $
$ $
Ejemplo:
;5 <
;> $ $ <
Introducción
Si antes hemos visto los diferentes tipos de variable y como representar datos de una
serie de observaciones mediante diferentes formas de representación bien en forma
tabulada como gráficamente, nos dispondremos ahora a dar algunas características
numéricas que las resuman adecuadamente. Estas medidas también pueden ser
llamadas .
Los fenómenos biológicos no suelen ser constantes, por lo que será necesario que
junto a una medida que indique el valor alrededor del cual se agrupan los datos, se
asocie una medida que haga referencia a la variabilidad que refleje dicha fluctuación.
Mediana
Aplicable a
Si los datos de una muestra se ordenan de menor a mayor, de define la mediana como
aquel dato perteneciente o no a la muestra que deja tantas observaciones por debajo
como por encima de él, o dicho de otro modo, es el valor de la variable tal que el 50%
de las observaciones son menores o iguales a él.
Ejemplo
Datos: 2, 6, 2, 1, 6, 4, 5
Datos Ordenados: 1, 2, 2, 4, 5, 6, 6.
Datos Ordenados: 1, 2, 2, , 5, 6, 6
Ejemplo
Datos: 2, 1, 6, 7, 4, 5
Ordenados: 1, 2, , 6, 7
Por tanto,
4+5
= = 4,5 ℎ
2
( + 1)
Si el número de observaciones fuera impar, buscaremos la observación 2
Ejemplo
Frecuencia
Nº Hermanos Frecuencia
Acumulada
0 10 10
1 22 32
2 40 72
3 16 88
4 5 93
5 o más 3 96
Total 96
En el caso de en las que las clases vienen dadas por intervalos, la fórmula
de la mediana se complica un poco más. La forma de obtenerla sería la siguiente:
−
+ 2
!
=
Ejemplo
Se realiza un estudio para valorar el efecto del alcohol sobre los niveles de colesterol
en suero en EEUU. Una variable de interés es la cantidad de alcohol (en onzas)
consumido por sujeto y semana.
2
( , )!
#
Como el número de observaciones es impar, tomamos $
= 462. Esta
observación, si miramos en las frecuencias acumuladas se encuentra en el
intervalo
por tanto, este será el intervalo mediano y por tanto el valor de la mediana se
encontrará dentro del mismo
$ = 3,5 – 0,5 = 3
# $
$ = 372
= 201
Por tanto:
462 − 201
= 0,5 + ∗ 3 = 2,6
372
Propiedades
Media
Aplicable a
-#. +
,=
Más generalmente, se puede definir como la suma de todos sus posibles valores,
ponderada por las frecuencias de los mismos, es decir:
1
,= (+1 1 + ⋯ . ++1 1)
3
1
= 2+
.
O también:
1
1
, = 2 +4
- 4
4
4=1
En caso de que tengamos una variable continua y datos agrupados por intervalos,
debemos utilizar la marca de clase en lugar de + , ya que no disponemos de todos los
valores +
Propiedades
Ejemplo
Datos: 2, 1, 6, 4, 5
Ordenados: 1, 2, 4, 5, 6
$ 5 6 7
Por tanto, , = = 3,6 ℎ
6
Ejemplo
Vamos a ver un ejemplo de distribución asimétrica y como es más representativa de la
población la mediana que la media.
Es así como vemos que los valores extremos afectan más a la media que a la
mediana.
Moda
Propiedades
Ejercicio Práctico.
Medidas de Posición
Una medida de posición es un número que nos indica cómo se encuentra el resto de la
muestra respecto a él.
Percentiles
Los percentiles son aquellos que dividen la muestra ordenada en 100 partes iguales.
Del mismo modo, los deciles la dividen en 10 y los cuartiles en 4.
Ejemplo:
Ejemplo:
Si decimos que el percentil 10 de los varones recién nacidos es 2,700 kg, indica que
solo el 10% de los varones recién nacidos pesa menos de 2,700
Cuartiles y Deciles
Los cuartiles y los deciles son un caso particular de los percentiles y vienen dados por:
1
−
+ 100
!
83 =
#
! Mientras que en el caso de la mediana usábamos el valor de para identificar el
$
#3
intervalo mediano (nos indicaba la posición de la mediana), usaremos el valor para
99
localizar el intervalo donde se encuentra 83 (nos indica la posición del percentil k)
a) Elaborar una tabla estadística con los siguientes elementos: intervalos, marcas
de clase, frecuencias absoluta y relativa, frecuencias acumuladas absoluta y
relativa
Ejercicio práctico.
¿Por debajo de que altura están el 75% de los alumnos de primero de enfermería de
Cartagena? ¿Y del 10%? ¿Cómo se llaman estas medidas?
Medidas de dispersión
Mientras que las medidas de posición y de tendencia central nos dan valores
representativos de una muestra, los valores de dispersión nos indican como son de
representativas esas medidas.
78 y 102 Kg; 88 y 92 Kg. La media de ambas muestras es 90, pero este valor
evidentemente representa más la segunda muestra.
Rango
Una medida razonable de la variabilidad podría ser la amplitud o rango, que se obtiene
restando el valor más bajo de un conjunto de observaciones del valor más alto.
: ; = +<=> − +? #
Es fácil de calcular y sus unidades son las mismas que las de la variable.
Ejemplo:
Altura (en cm) de 5 alumnos de primero de enfermería:
Varianza
$
-#. (+ − ,)$
@ =
-#. (+ )$
@$ = − ,$
Como hemos dicho antes, si los datos nos vienen agrupados por intervalos, la marca
de clase sustituirá al valor concreto + en la fórmula.
Esta medida es siempre una cantidad positiva, con propiedades interesantes para la
realización de inferencia estadística.
Como sus unidades son las del cuadrado de la variable, para interpretar la dispersión
de la muestra, es más sencillo usar su raíz cuadrada que es la que vemos en la
siguiente sección.
@ = A@ $
Sol: % & = 5 − 3 =2
'
3+3+4+4+5
,= = 3,8 B
5
(9 + 9 + 16 + 16 + 25)
@$ = − (3,8)$ = 0,56 B $
5
Notar que como habíamos dicho antes, como la frecuencia absoluta de los valores 3 y
4 es 2, también habríamos podido calcular la media y la varianza de la siguiente
manera:
2∗3+2∗4+5
,= = 3,8 B
5
(2 ∗ 9 + 2 ∗ 16 + 25)
@$ = − (3,8)$ = 0,56 B $
5
) : @ = A0,56 = 0,748 B
Ejemplo:
Si la media de pesos de la clase es 78,6 Kg y la desviación típica es de 3,7 Kg el
intervalo de normalidad será:
Coeficiente de variación
Hemos visto que las medidas de centralización y dispersión nos dan información sobre
una muestra. Nos podemos preguntar si tiene sentido usar estas magnitudes para
comparar dos poblaciones.
Por ejemplo, si nos piden comparar la dispersión de los pesos de las poblaciones de
elefantes de dos circos diferentes, σ nos dará información útil.
¿Pero qué ocurre si lo que comparamos es la altura de unos elefantes con respecto a
su peso?
Por ejemplo, en la variable altura podemos usar como unidad de longitud el metro y en
la variable peso, el kilogramo. Comparar una desviación (con respecto a la media)
medida en metros con otra en kilogramos no tiene ningún sentido.
El problema no deriva sólo de que una de las medidas sea de longitud y la otra sea de
masa. El mismo problema se plantea si medimos cierta cantidad, por ejemplo la masa,
de dos poblaciones, pero con . Este es el caso en que comparamos
el peso en toneladas de una población de 100 elefantes con el correspondiente en
miligramos de una población de 50 hormigas.
El coeficiente de variación es lo que nos permite evitar estos problemas, pues elimina
la dimensionalidad de las variables y tiene en cuenta la proporción existente entre
media y desviación típica. Por tanto, definimos el Coeficiente de variación como la
desviación típica medida en unidades de media, o lo que es lo mismo:
@
FG =
,
Es muy útil para comparar métodos de medida. Cuanto menor sea el FG , mayor
será la precisión del método
Sólo se debe calcular para variables con todos los valores positivos.
Ejercicio práctico.
Intervalos Frecuencia
[10, 20) 1
[20, 30) 8
[30, 40) 10
Total 19
Marca de
Clase Intervalos Frecuencia
15 [10, 20) 1
25 [20, 30) 8
35 [30, 40) 10
Calcular ∗+ , ∗ (+ )$
+ Intervalos ∗+ ∗ (+ )$
15 [10, 20) 1 15 15
25 [20, 30) 8 200 5000
35 [30, 40) 10 350 12250
Calcular Totales:
+ Intervalos ∗+ ∗ (+ )$
15 [10, 20) 1 15 15
25 [20, 30) 8 200 5000
35 [30, 40) 10 350 12250
Total 19 565 17265
Media:
1
1 H
, = 2 +4 = ∗ JKJ = DL, LM
- 4
4
HI
4=1
Varianza:
4 (+4 ) HLDKJ
-4=1 2
@$ = − ,2 = − (DL, LM)D = HMI, LM
HI
Desviación Típica:
@ = AHMI, LM = HH, ND
!" #
$ %
& "
' !
()
* ) " ! +
# , ! -
/ 0
$ 1
&
&
. '3
4 * ) 1
5 ) ! 666 #
5 ! 666 6 666 #
5 ! 6 666 76 666 #
) ! 76 666 66 666 #
! 66 666 #
7 /$ 0
4 &
$ 1
Peso [50, 60) [60, 70) [70, 80) [80,90) [90, 100) [100, 110) [110, 120)
ni 8 10 16 14 10 5 2
/ ) 0
/8 9 - :6 ;6 < 0
&
=6 < /8 9 - 0
/8 9 0
>
7 , )
!?5 .6 6 .6
) 1
20 22
18 22
22 21
26 22
28 24
25 25
22 24
19 21
16 27
18 24
24 25
21 19
20 22
22 25
23 30
&
?5
Nº caries
1 4 0,08
2 4
3 16 0,16
4 7 0,14
5 5 28
6 38
7 7 45
8
Hidratos de
carbono Nº individuos
(gr/día)
100-200 10
200-300 60
300-400 18
400-500 12
! " #
$ "
% & & '()
$
# *
+
, - . . . + # $ "
(
/ 0 ( 1 23+4 # 5 243
67 1 ,') ( 1 8
67 1 ) ( 1 8
6 * 5 *
86 8
6% ,9 : 1
8
6$ # * (
1 ; 8
67 1 *
8
67 1 # # (
1 8
< 2 = "
/
280 140 200 380 220 50 150 370 425 140 120 280 360 300 240
150 80 310 210 215 360 250 440 320 290 410 190 360 240 300
& )
!