Está en la página 1de 48

!

! !

BIOESTADÍSTICA
Profesor: Jesús Esteban Hernández

A. TOLEDO
1º de medicina
2016-2017
Bioestadística! ! Arturo!Toledo!Gutiérrez!

!! TEMA%1:%CONCEPTOS%BÁSICOS%DE%ESTADÍSTICA!
!

A.% ¿Por%qué%es%necesario%saber%estadística?%
Para!actualizar!conocimientos!(los!artículos!tienen!lenguaje!estadístico).!
Para!la!investigación!clínica!y!epidemiológica.!
Para!la!evaluación!y!mejora!de!cualquier!cosa!que!se!traduce!en!calidad!asistencial.!
Para!el!análisis!crítico!de!ventas!farmacológicas,!etc.!
!
!

B.% Iteración%del%método%científico%
!
! Realización!de!la!
! Bibliografía!/!experiencia! hipótesis! Predicción!del!resultado!
! (observación!de!la! de!la!hipótesis!
! hipótesis)!
!
!
!
Diseño!del!experimento!
! Rechazo!o!aprobación!de! (por!epidemiólogos)!
! la!hipótesis!(en!cuyo!caso!
se!considera!verdad!hasta!
! que!se!demuestre!lo! Recogida!de!datos!
! contrario)! análisis!y!obtención!de!
! conclusiones!(por!
! estadistas)!

Esto!generará!nuevas!hipótesis!que!pondrán!el!proceso!de!nuevo!en!marcha.!
!

!
C.% Diferencia%entre%probabilidad,%estadística%y%epidemiología%
•! Cálculo! de! probabilidades:! ciencia! matemática! que! estudia! la! probabilidad! de! que! un!
proceso! aleatorio! ocurra.! Formula! el! espacio! probabilístico! para! analizar! las!
probabilidades!de!un!resultado!cuando!interviene!el!azar.!
!

•! Estadística:! consigue! información! sobre! fenómenos! reales! para! tratar! de! averiguar! el!
fenómeno! probabilístico.! Es! decir,! recolecta! y! analiza! dato! ara! obtener! unas!
conclusiones.!Hay!varios!tipos:!
o! Matemática,!que!elabora!teorías!y!modelos!matemáticos!que!se!puedan!ajustar!a!
la! realidad.! Es! decir,! es! un! método! para! analizar! y! comprender! la! realidad,!
también!se!llama!estadística!inferencial.!
o! Aplicada,! que! adapta! los! modelos! a! la! realidad! en! las! distintas! áreas! del!
conocimiento.! La! utilizamos! para! responder! a! preguntas! biológicas! (es! nuestra!
asignatura!en!sí).!
!

Características!de!la!estadística!
Infiere!fenómenos!(con!una!pequeña!muestra!puede!analizar!grandes!conjuntos)!
No!hace!análisis!exhaustivos!(de!todos!los!individuos)!

1!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

Resuelve! tres! tipos! de! problemas:! estimaciones! puntuales! (proporciones! medias…),!


estimación! por! intervalo! (como! la! puntual,! pero! con! un! intervalo! en! el! que! se! encuentra! la!
mayoría!de!la!población)!y!contraste!de!hipótesis.!
!
•! Epidemiología/Método! epidemiológico:! une! la! parte! teórica! y! estadística! de! cada! caso,!
con!el!fin!de!resolver!las!cuestiones.!!
!
Observaciones!
Estadísticamente!significativo!"!no!es!"!científicamente!relevante!
Estadísticamente!significativo!"!no!es!"!clínicamente!importante!
El!p!valor!no!lo!es!todo!
Sesgos!en!el!método!epidemiológico:!son!desviaciones!que!se!producidas!debido!a!errores!
en!algún!momento!del!experimento.!Pueden!llegar!a!invalidar!las!conclusiones.!

!
D.% Definiciones%
1.% Población! (universo):! conjunto! de! elementos! que! cumple! ciertas! propiedades! entre! las!
cuales!se!desea!estudiar!un!fenómeno!determinado.!Desde!el!punto!de!vista!estadístico!
la!población!es!inalcanzable.!Diferenciamos:!la!población!diana!es!aquella!de!la!que!se!
quiere!hablar!y!la!población!accesible!es!aquella!que!vas!o!puedes!manejar.!
!

2.% Muestra:! cualquier! subconjunto! de! la! población! elegido! para! ser! la! parte! directamente!
estudiada!de!la!población.!La!representatividad!depende!del!método!de!muestreo.!
!
Población!objeto!o!referencial!!(diana)!!!!!!!!!!! Estadística!inferencial!
!
!
→!
! ↓!Factores!selectivos,!económicos,!!
!!!!!!!!!!!!!!!!!!!!!!!!Sociales!y!culturles!
! Población!inferencial!!!!!!!!!!(accesible)!
! ! !!!!↓Técnicas!de!muestreo!
! !!!!!!!!!!!!!!!Muestra!
! ! !!!!↓!
!
!!!!!!!!!!!!!!Individuo!!!!→!Queremos!conocer!!!!!!!→!!!Estadística!
!
descriptiva!
! ! ! ! !!!!!!Variables!
!

3.% Individuo:! sujeto! que! posee! características/caracteres! que! son! representados! por!
variables.!
!

4.% Parámetro:! pronostico! numérico! que! reúne! cierta! información! de! la! población!
(inaccesible).!!Se!representa!con!letra!griegas:!!
!

5.% Estadístico:!es!una!función!matemática!obtenida!a!partir!de!los!datos!provenientes!de!la!
muestra,!que!nos!permite!hablar!de!los!parámetros.!
σ:!desviación!típica!poblacional! s:!desviación!típica!muestral!
p:!correlación! r:!coeficiente!de!correlación!muestral!
μ:!media!poblacional! m:!media!muestral!!
π:!proporción! p:!proporción!

2!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

!
6.% Carácter:!propiedad!o!característica!que!tienen!los!elementos!de!una!población.!Pueden!
ser:!
•! Cualitativos:!no!se!les!puede!asignar!un!valor!numérico.!Ej:!color!de!pelo.!
•! Cuantitativos:!se!les!puede!asignar!un!número.!Se!dividen!en:!
o! Discretos:! solo! puede! tomar! valores! concretos.! Entre! dos! valores! no!
existen!más!valores.!Sólo!números!naturales.!
o! Continuos:!entre!dos!posibles!valores!existen!infinitos.!ℝ.!
!
E.% Tipos%de%variables%y%escalas%de%medida%
Las! variables! es! un! sistema! para! representar! los! caracteres! (se! utilizan! para! los! seres!
humanos),!por!lo!que!el!tipo!de!variable!se!elige!según!el!tipo!de!carácter!que!representa.!
Las!variables!pueden!ser:!
•! Cualitativas:! se! les! puede! asignar! un! número,! pero! no! tiene! valor! numérico.! Ej:!
color!de!pelo.!Dentro!de!ellas!distinguimos:!
o! Nominales:!permite!realizar!operaciones!de!igualdad!y!desigualdad.!Ej:!Ser!
rubio!es!distinto!a!ser!moreno.!Se!diferencian!dos!tipos:!
#! Dicotómicas:!Solo!pueden!adoptar!dos!valores.!Ej:!Sí!o!no.!Hombre!
o!mujer.!
#! Politómicas:!Puede!tomar!más!de!dos!valores.!Ej:!Color!de!pelo.!
o! Ordinales:!puedes!establecer!relaciones!de!superioridad,!pero!sin!asignar!
un!número.!Ej:!posición!que!ocupan!los!hijos.!
!

•! Cuantitativas:!se!les!puede!asignar!un!número!y!tiene!significado.!Diferenciamos:!
o! Discretas:! sólo! puede! tomar! valores! concretos.! Entre! dos! valores! no!
existen!más!valores.!Ej:!Número!de!hijos!
o! Continuas:!entre!dos!posibles!valores!existen!infinitos."ℝ.!
!
Características!de!las!variables:!
1.! Los!posibles!valores!de!una!variable!suelen!denominarse!modalidades!(también!niveles).!
2.! Estás!modalidades!pueden!agruparse!en!clases!(intervalos).!
3.! Las! modalidades! deben! formar! un! sistema! exhaustivo! (no! podemos! olvidar! ningún!
posible!valor!de!la!variable)!y!excluyente!(nadie!puede!presentar!2!valores!simultáneos!
de!la!variable).!
!
!
Para! medir! las! variables! se! utilizan! escalas,! las! cuales! nos! permiten! asignar! números! a!
ciertas!características!que!queremos!medir!de!un!elemento.!Para!la!práctica!tendremos!en!
cuenta! que! las% bases% de% datos% sólo% deben% contener% números,! pues! lo! paquetes!
estadísticos!solo!pueden!leer!números.!
%
Para!representar!las!variables!se!utiliza!un!sistema!de!codificación.!Es!importante!registrar!
no! solo! las! respuestas! si! no! las! no! respuestas! (la! gente! que! no! sabe! o! no! contesta)! pues!
cambian!las!estadísticas.!

3!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

!
Hay!varios!tipos%de%escala:!
•! Escala%nominal:!relaciones!de!igualdad!o!desigualdad.!
•! Escala%ordinal:!relaciones!de!mayor!que!y!menor!que.!
•! Escala%de%intervalo:!operaciones!de!cálculo!con!los!intervalos!(con!los!nº).!No!tiene!
cero!absoluto!y!aunque!se!le!asigne!un!número!no!tiene!significado!relacionado!con!
la!realidad.!
•! Escala%de%razón:!Tiene!cero!absoluto!y!con!relación!con!la!realidad.!
!
En! función! de! la! escala! se! pueden! realizar! distintas! operaciones,! condiciona! el! tipo! de!
estadístico!que!vas!a!utilizar.!Relación%de%la%escala%con%su%estadístico:!
Escala!nominal:!frecuencia!(proporción)!y!moda.!
Escala!ordinal:!mediana!y!percentil.!
Escala!de!intervalo:!media!aritmética!y!desviación!típica.!
Escala!de!razón:!media!geométrica!y!media!armónica.!
!
Las!escalas!tienen!cierta!jerarquía!de!complejidad,!de!la!última!se!puede!ir!a!la!primera!pero!
no! al! revés,! es! decir,! con! la! media! geométrica! y! la! media! armónica! podemos! llegar! a! la!
frecuencia!y!la!moda,!pero!no!al!revés.!
! !

4!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

!! TEMA%2:%ESTADÍSTICA%DESCRIPTIVA!
A.% ESTADÍSTICA%DESCRIPTIVA%(MÉTODOS%NUMÉRICOS)!
Pretende! sintetizar! y! resumir! la! información! contenida! en! unos! datos.! Sus! misiones! son!
recoger,!clasificar,!representar!y!resumir!datos.!
!
B.% Frecuencias%y%tipos%de%frecuencias%
La% frecuencia% describe! cuantas! veces! aparece! un! determinado! valor! para! una! variable.!
Distinguimos!varios!tipos:!
•! Frecuencia%simple:%!frecuencia!del!grupo!del!cual!hablamos:!
o! Frecuencia% absoluta% (ni):% contabiliza! el! número! de! individuos! para! cada!
modalidad.!
o! Frecuencia%relativa%(fi):!!calcula!el!número!de!individuos!de!cada!modalidad!y!lo!
divide!por!el!total!de!individuos.!
!

•! Frecuencia%acumulada:!suma!los!valores!de!cada!modalidad.!
o! Frecuencia%absoluta%acumulada%(Ni):%se!trata!de!la!suma!de!los!valores!de!la!
frecuencia!absoluta.!
o! Frecuencia% relativa% acumulada% (Fi):! se! entiende! como! la! frecuencia! absoluta!
acumulada!dividida!por!el!total!de!individuos.!
!

•! Frecuencia%válida:!es!aquella!que!solo!tiene!en!cuenta!aquellos!elementos!de!los!que!
tenemos!datos!válidos!(no!cuenta!los!missing!data).!

Ej.:! ! ni! fi! Ni! Fi! Frecuencia!


! válida!
Solteros! 30! 0,3! 30! 0,3! 30/98!
! Viudos! 30! 0,3! 60! 0,6! 30/98!
Casados! 20! 0,2! 80! 0,8! 20/98!
!
Separados! 20! 0,2! 100! 1! 18/98!
! Total! 100! 1! ! ! !

!
%

Cómo%establecer%intervalos: %
Intervalos! de! misma! amplitud! (10f20)! (70f80):! la! marca! de! clase! es! la! media! aritmética! de! esos! límites!
(exactos!o!aparentes).!
!

Recomendaciones:%
•! El!nº!de!intervalos!deben!ser!alrededor!de!10.!!
•! Si!tenemos!más!del!10%!del!total,!de!missing!data,!la!variable!no!es!fiable.!!
•! !Es! mejor! que! el! límite! aparente! sea! igual! que! el! límite! exacto! (si! no,! se! pueden! perder! datos! que!
sean!solapantes)!!
•! Los! límites! reales! deben! coincidir! con! la! precisión! de! los! datos! originales.! Hay! frecuencias! simples!
acumuladas!y!frecuencias!relativas!acumuladas.!
•! Gráficos!pareto!(se!expresa!en!orden!decreciente!de!frecuencias)!Lo!que!queda!a!la!izquierda!es!el!
80%!de!las!respuestas!!

5!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

Descriptivos%
Media:!aritmética,!
ponderada,!geométrica! Decentiles!
Tendencia!central! y!armónica.! ! Posición→ntiles! !
!

Mediana! Percentiles!
!

Moda!
!

Desviación!media!
! Asimetría!!
Desviación!típica! !
Dispersión! !
! Forma!
Rango!o!amplitud! Curtosis!o!
!
aputnamiento!
Rango!intercuántico!
%
!

C.% Medidas%de%tendencia%central%
Moda%
Es!el!valor!que!más!veces!aparece.!La!distribución!según!esta!puede!ser:!
•! Unimodal:!tiene!un!solo!valor!más!frecuente.!
•! Bimodal:!tiene!dos!valores!que!aparecen!con!la!máxima!frecuencia.!
•! Multimodal:!Tiene!más!de!dos!valores!que!presentan!la!frecuencia!máxima.!
!
Mediana%
Puede!definirse!como!el!valor!central!del!conjunto!ordenado!de!observaciones,!es!decir,!el!
valor!que!deja!a!la!mitad!de!las!observaciones!por!debajo!y!a!la!mitad!por!encima.!
Ventaja:!no!es!demasiado!sensible!a!los!valores!extremos.!
!
Media%
•! Media% aritmética:! es! la! suma! de! todos! los! valores! (xi)! dividida! por! el! número! de!
observaciones! (n).! En! la! población! se! expresa! como! μ,! y! en! una! muestra! como! #.!
Desventaja:!es!muy!sensible!a!los!valores!extremos.!
Σ"(xi)
# =" !
*
•! Media% geométrica:! es! la! raíz! enésima! (siendo! n! el! número! de! observaciones)! del!
producto!obtenido!al!multiplicar!uno!por!otro!todos!los!valores!de!la!variable.!Es!menos!
sensible!a!los!valores!extremos.!
/
# = " (#1"×"#2× …"×"#*)!
•! Media% armónica:! se! calcula! dividiendo! el! número! de! observaciones! por! la! suma! del!
inverso!de!cada!valor.!Se!utiliza!mucho!en!farmacología.!
*
01234"456ó*384 = " !
1
Σ"( )
#3
•! Media%ponderada:!es!una!media!que!se!obtiene!al!valorar!de!distinto!modo!cada!uno!
de!los!datos,!dando!más!valor!a!unos!que!a!otros.!!
Σ"(;3"×"#3)
01234"9:*215424 = " !
Σ(;3)

6!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

D.% Medidas%de%dispersión%
Rango%o%amplitud%
Diferencia!entre!el!valor!máximo!y!el!valor!mínimo.!
Desventaja:!es!una!mala!medida!de!dispersión.!
!
Rango%intercuartílico%IQR%(o%rango%intercuartil)%
Es!una!estimación!estadística!de!la!dispersión!de!una!distribución!de!datos.!Consiste!en!la!
diferencia! entre! el! tercer! y! el! primer! cuartil:! RQ! =! Q3! f! Q1.! Mediante! esta! medida! se!
eliminan! los! valores! extremadamente! alejados.! El! rango! intercuartílico! es! altamente!
recomendable!cuando!la!medida!de!tendencia!central!utilizada!es!la!mediana!(ya!que!este!
estadístico!es!insensible!a!posibles!irregularidades!en!los!extremos).!Se!usa!para!construir!
los!diagramas!de!caja!y!bigote!(box!plots)!que!sirven!para!visualizar!la!variabilidad!de!una!
variable! y! comparar! distribuciones! de! la! misma! variablem! además! de! ubicar! valores!
extremos.!
!
Desviación%media%
Se! define! la! desviación! media! como! la! media! de! las! diferencias! en! valor! absoluto! de! los!
valores!de!la!variable!a!la!media,!es!decir,!si!tenemos!un!conjunto!de!n!observaciones,!x1,!
...,!xn,!entonces:!
Σ" #3 − # (#@ − #)?
<6 = " ""ó""> ? = !
!
* *
Varianza%%
Mide!la!dispersión!de!los!datos,!es!decir,!en!qué!medida!están!juntos!o!separados!del!valor!
central.!Tiene!la!siguiente!expresión!para!las!muestras:!
Σ"(#3 − #)?
A? = " !
*−1
En!vez!de!usar!n!como!denominador,!usamos!nf1.!Este!denominador!se!denomina!grado!
de!libertad.!
Para!la!población!se!sustituye!s2!por!σ2,!se!usa!μ!en!vez!de!x!y!se!usa!n!en!lugar!de!n!–!1.!
%

Desviación%estándar%o%desviación%típica%
Es!la!variación!esperada!con!respecto!a!la!media!aritmética.!Se!calcula!a!partir!de!la!raíz!
cuadrada! de! la! varianza! para! reducir! su! error,! pues! al! estar! esta! última! elevada! al!
cuadrado!quedaba!en!unas!unidades!distintas!a!las!de!la!media.!Por!tanto,!su!fórmula!para!
muestras!es:!!

Σ"(#3 − #)?
A= A? = !
*−1
Para!poblaciones!se!sustituye!s!por!σ,!y!n!–!1!por!n.!
!

Coeficiente%de%variación%de%Pearson%
Es!la!razón!o!cociente!entre!la!desviación!típica!y!el!valor!de!la!media!aritmética.!!
BC = " D !
#

7!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

Error%estándar%
Es! desviación! estándar! de! la! distribución,! es! decir,! mide! el! grado! de! dispersión! de! los!
parámetros,!no!de!los!individuos,!como!el!resto!de!medidas!de!dispersión.!Hay!dos!tipos!
principales:!
!! Error%estándar%de%la%media:%Sigue!la!siguiente!fórmula!
A
EE0 = " !
*
!! Error%estándar%de%la%proporción:!Presenta!esta!fórmula:!

9"(1 − 9)
EEF = " !
*
!
E.% Medidas%de%posición:%%
Cuantiles%
Son! medidas! de! posición! que! indican! qué! puesto! tiene! un! determinado! valor! de! una!
variable,! ya! que! dividen! el! conjunto! ordenado! de! los! datos! en! grupos! con! la! misma!
cantidad!de!individuos.!
%

•! Percentiles:%expresa!la!proporción!de!los!datos!que!queda!por!debajo!del!valor!que!nos!
interesa.! Así! si! decimos! que! un! niño! está! en! el! percentil! 80! de! peso! para! su! edad!
queremos!decir!que!el!80%!de!los!niños!de!su!edad!pesan!menos.!Los!peso!y!tallas!por!
edad!son!su!principal!uso.!Un!percentil!tiene!99!cortes.!
•! Tertiles:% son! los! puntos! de! la! distribución! que! dividen! esta! en! tres! iguales,! es! decir,!
hacen!2!cortes.%%
•! Cuartiles:!son!los!puntos!de!la!distribución!que!dividen!esta!en!cuatro!partes!iguales.!
Los!cuartiles!coinciden!con!los!percentiles!25,!50,!75!y!100.!Tiene!3!cortes.%
•! Deciles:! son! los! puntos! que! dividen! la! distribución! en! diez! partes! iguales.! Tiene! 9!
cortes.!
La!mediana!coincide!con!el!2º!cuartil,!el!5º!decil!y!el!50º!percentil.!
!
H"(IJK)
Se!calcula:!*º"21":521* = " !!!,!siendo!j!el!percentil!a!calcular.!
KLL
Cuantil!=!percentil!pero!en!tanto!por!1.!
!
Esto! se! utiliza! en! los! nomogramas,! que! muestran! la! posición! de! la! población.! Lo!
interesante!que!nos!marca!esta!medida,!es!que!el!sujeto!debe!seguir!la!línea!que!marca!el!
percentil,!si!no!la!siguiera!podría!mostrar!cierta!patología.!
!
!
! !
!
!
!
!
!

8!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

F.% Medidas%de%forma%
Nos!indican!qué!forma!tiene!la!distribución.!
!

Asimetría%
Expresa! lo! distante! de! la! media! que! está! cada! observación! en! unidades! de! desviación!
estándar.! Sus! valores! óptimos! en! una! función! normal! son! pequeños! o! nulos.! Las!
distribuciones!pueden!ser:!
!! Simétricas:!su!coeficiente!de!asimetría!es!igual!a!0.!!
!! Asimétricas%positivas:!presentan!una!cola!a!la!derecha,!por!lo!que!su!coeficiente!
de!asimetría!es!positivo.!
!! Asimétricas% negativas:! su! cola! izquierda! es! más! prolongada,! por! lo! que! su!
coeficiente!de!asimetría!será!negativo.!
# − 6:24 PQ 8Q − 8? − (8? − 8K )
B:1M3831*N1"21"4A361N5í4 = = Q= !
> > RSB
!
!
!
!
!
!
Curtosis%o%apuntamiento%
Indica! cómo! de! apuntada! está! una! distribución.! Para! que! la! distribución! sea! normal! no!
debe!ser!grande.!Se!dividen!en:!
!! Mesocúrticas:! Tienen! un! apuntamiento! “normal”,! ni! muy! plano! ni! demasiado!
apuntado,!por!lo!que!su!curtosis!es!k!=!0.!
!! Leptocúrticas:!Son!muy!apuntadas,!lo!que!quiere!decir!que!k!>!0.!
!! Platicúrticas:!Son!muy!aplanadas,!lo!que!se!traduce!en!un!k!<!0.!
!
G.% Otras%definiciones%
•! Proporción:% una! razón! en! la! cual! los! elementos! del! numerador! están! incluidos! en! el!
denominador.!Se!utiliza!como!estimación!de!la!probabilidad!de!un!evento.!El!rango!es!
de!0!a!1.!
!

•! Razón:!es!un!cociente!entre!una!variable!y!otra.!Por!ejemplo,!la!razón!de!masculinidad!
sería!x!hombres!por!cada!x!mujeres!(hombres!/!mujeres).!
!

•! Odd:! es! el! cociente! entre! las! veces! que! se! da! una! circunstancia! y! las! que! no! se! da!
(p.e.:!probabilidad!de!sacar!un!1!al!tirar!un!dado!entre!la!probabilidad!de!no!obtenerlo).!
!

•! Tasa:!es!una!proporción!en!la!que!incluimos!una!medida!de!tiempo!en!el!denominador!
(p.e.:!tasa!de!natalidad,!x!personas!nacidas!en!x!tiempo).!
!

•! Concepto% de% prevalencia:! Proporción! de! sujetos! que! tienen! una! determinada!
característica!en!un!momento!del!tiempo!determinado.!
•! Incidencia:!proporción!de!sujetos!que!enferman!dentro!de!un!grupo!de!sujetos!que!no!
estaba!enfermo!al!principio!de!la!observación.!

9!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

H.% Estadística%descriptiva:%métodos%gráficos.%
%

•! Gráficos%de%barras%
Sobre!un!eje!horizontal!en!el!que!se!indican!las!distintas!categorías,!se!levantan!columnas!
de! altura! proporcional! a! la! frecuencia.! Es! el! gráfico! indicado! para! variables! cualitativas!
ordinales!y!para!algunas!cuantitativas!discretas.!
!
!
!
!
!
!
!
•! Histograma%
Representación!de!la!frecuencia!que!aparecen!una!variable!en!un!grupo.!No!tiene!barras,!
no! tiene! huecos,! a! diferencia! del! gráfico! de! barras,! aquí! los! rectángulos! se! encuentran!
solapados!debido!a!que!representa!variables!cuantitativas!continuas.!

! 6
Series-1
4
! Series-2
2
Series-3
! 0
Category-1 Series-4
!
•! Gráficos%de%sectores%
Es! un! gráfico! sencillo! en! forma! de! “tarta”,! en! la! que! se! establecen! las! frecuencias! como!
una! proporción! de! un! círculo! que! sería! el! total.! Así,! la! frecuencia! es! directamente!
proporcional!al!área.!Se!usa!para!variables!cualitativas!nominales.!

! 1st-Qtr
2nd-Qtr
! 3rd-Qtr
4th-Qtr
!

•! Polígono%de%frecuencias%
Este!tipo!de!gráfico!refleja!la!frecuencia!de!cada!variable!y!las!une!con!una!línea.!Refleja!
variables!cualitativas!ordinales,!principalmente,!aunque!puede!tener!otros!usos.!

!!!!!!!

10!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

•! Gráfico%de%tallo%y%hojas%(stem%&%leaf)%
Combina!la!representación!gráfica!con!la!información!directa!proporcionada!por!las!cifras.!
Así!podemos!saber!simultáneamente!cada!dato!y!la!frecuencia!de!cierta!variable.!Ejemplo!
con!alturas:!

!
! ! ! ! ! ! →!
!
!
!
•! Gráfico%de%cajas%(boxdplot)%
Es!una!representación!que!refleja!una!gran!cantidad!de!información!descriptiva.!Se!divide!
en!la!“caja”!y!las!prolongaciones!verticales!o!“bigotes”.!Puede!tener!puntos!periféricos.!

!
!
!
!! La! caja! tiene! una! altura! determinada! por! el! rango! intercuartílico,! siendo! el! primer!
cuartil!la!base!y!el!tercer!cuartil!la!superficie.!!
!! El!bigote%superior!es!una!prolongación!de!la!caja!que!termina!en!el!valor!absoluto!
que!sea!igual!o!inferior!al!tercer!cuartil!más!1,5!veces!el!rango!intercuartílico,!siendo!
el!rango!intercuartílico!la!diferencia!entre!el!primer!y!el!tercer!cuartil.!
!! El! bigote% inferior! termina! con! el! valor! absoluto! que! sea! igual! o! superior! al! primer!
cuartil!menos!1,5!veces!el!rango!intercuartílico.!
!! Los! periféricos! u! outliers! son! aquellos! valores! que! quedan! más! allá! de! los!
extremos! de! los! bigotes.! Puede! deberse! a! un! error! o! corresponder! a! un! individuo!
con!un!valor!realmente!raro.!

11!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

•! Gráficos%cuantil%–%cuantil%(Q%–%Q%plot)%
Se!trata!de!una!distribución!que!refleja!cada!uno!de!los!datos.!Si!la!distribución!es!normal,!
estos!datos!deben!seguir!una!línea!recta!en!mi!gráfico.!Si!se!despegan!de!la!línea!es!que!
los!datos!no!siguen!una!distribución!normal.!

Los!círculos!es!donde!cae!el!dato!realmente!y!la!línea!donde!debería!caer!si!fuera!perfecta.!

•! Gráficos%de%dispersión%(scatter%–%plot)%
Es!aquel!tipo!de!gráfico!que!enfrenta!dos!variables,!generalmente!continuas,!entre!sí.!

•! Gráfico%de%Pareto!
Es!una!gráfica!para!organizar!datos!de!forma!que!estos!queden!en!orden!descendente,!de!
izquierda! a! derecha! y! separados! por! barras.! Permite! asignar! un! orden! de! prioridades.!!!!!
Las!barras!marca!la!frecuencia!absoluta!y!las!líneas!son!las!frecuencias!acumuladas.!

!
!

12!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

!! TEMA%3:%PROBABILIDAD%Y%DISTRIBUCIONES%DE%PROBABILIDAD!
A.% Conceptos%previos%
1.% Experimento% aleatorio:! es! aquel! en! el! que! no! se! puede! predecir! el! resultado,! es! un!
experimento! gobernado! por! el! azar.! Al! repetir! el! experimento! en! las! mismas!
condiciones! un! número! infinito! de! veces,! se! pueden! dar! resultados! finales! diferentes,!
pero!todos!los!resultados!posibles!se!conocen!por!anticipado.!No!se!puede!predecir!el!
resultado!de!cada!experiencia!particular.!!
!
Si! repites! n! veces! el! experimento! y! anotamos! el! número! ni! de! veces! que! aparece! un!
resultado!determinado,!en!el!cociente!de!n/ni!tiende!a!establecerse!un!valor!fijo!cuando!
n!aumenta,!siendo!este!valor!la!probabilidad!de!que!se!de!ese!resultado.!
!
2.% Espacio% muestral! (Ω):! es! el! conjunto! de! todos! los! posibles! resultados! de! un!
experimento!o!fenómeno!aleatorio.!El!espacio!muestral!puede!ser:!
•! Finito!(ej.!sexo:!hombre,!mujer).!
•! Infinito!numerable!(ej.!nº!de!hijos),!corresponde!a!los!números!naturales.!
•! Infinito!no!numerable,!variables!continuas,!corresponde!a!los!números!reales.!
!
3.% Sucesos:! cada! uno! de! los! subconjuntos! del! espacio! muestral.! Hay! muchos! tipos! de!
sucesos:!
3.1.%Suceso%elemental:!es!el!que!está!formado!por!un!solo!resultado!del!experimentom!
es!decir,!está!formado!por!un!sólo!elemento!del!espacio!muestral!(p.!e.:!al!lanzar!un!
dado! que! ocurra! el! suceso! "sacar! nº! 3"! {3}).! Es! el! mínimo! suceso! posible! e!
indivisible.!
!

3.2.%!Suceso%compuesto:!es!aquel!que!está!formado!por!varios!posibles!resultados!del!
espacio!muestral.!
!
3.3.%Suceso%seguro%o%fundamental%(Ω):!se!verifica!cuando!aparece!cualquiera!de!los!
posibles! sucesos/resultados! del! espacio! muestral! y,! por! tanto,! coincide! con! el!
espacio!muestral!(p.e.:!al!tirar!el!dado,!sacar!un!número!entre!1!y!6!{1,!2,!3,!4,!5,!
6}).!La!probabilidad!de!este!suceso!es!1.!
!
3.4.%Suceso%imposible%(Ø):!Es!aquel!suceso!que!nunca!se!cumple!cuando!se!realiza!el!
experimento.!La!probabilidad!de!este!suceso!es!0.!
!
3.5.%Suceso%complementario%(Ā):!aquel!suceso!que!se!verifica!cuando!no!se!da!A,!es!
decir,! cualquier! suceso! que! no! sea! el! nombrado! o! estudiado! (p.e.:! el! suceso!
contrario!al!suceso!par!es!el!impar).!p!(nA)!=!1!–!p!(A)!
!
3.6.%Suceso%unión%(A%U%B):!se!verifican!cualquiera!de!los!2!sucesos!que!forman!parte!
de!él.!(p.e.!A:!números!pares.!Suceso!B:!mayores!que!tres.!AUB:!{2,!4,!5,!6}).!
!

13!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

3.7.%Suceso% intersección% (A%∩%B):! se! produce! cuando! dos! o! más! sucesos! se! dan!
simultáneamente.!Es!el!suceso!formado!por!todos!los!elementos!que!son,!a!la!vez,!
de!A!y!de!B.!A!y!B!deben!ser!dos!sucesos!compatibles.!
!

!
!
!
3.8.%Sucesos% compatibles:! 2! sucesos! compatibles! son! aquellos! que! tienen! algún!
elemento! común,! es! decir,! que! pueden! suceder! simultáneamente! (p.e.:! al! lanzar!
una!moneda!y!un!dado,!que!salgan!una!cara!y!un!seis).!
!

3.9.%Sucesos% incompatibles% (o% disjuntos):! dos! sucesos! mutuamente! excluyentes!


porque! no! tienen! ningún! elemento! común,! es! decir,! que! no! pueden! suceder!
simultáneamente!(p.e.:!que!al!lanzar!una!moneda!salga!cara!y!cruz).!
!

B.% Definiciones%de%probabilidad%
La! probabilidad! se! suele! definir! como! la! proporción! de! veces! que! aparecería! cierto!
resultado!(suceso)!tras!la!realización!de!un!experimento!aleatorio!del!que!es!resultado,!si!
dicho!ensayo!se!realizase!un!número!muy!grade!de!veces!(≈∞).!
!

1.% Enfoque%frecuentista%vs.%Bayesiano%
Enfoque% frecuentista% (objetivaf! a! posteriori):! en! este! enfoque! la! probabilidad! son! los!
límites! a! los! que! tiende! la! proporción! o! frecuencia! relativa! con! la! que! sucede! un!
acontecimiento.!Según!este!concepto,!la!probabilidad!se!estima!empíricamente.%
%
Bayesiana% (subjetiva,! a! priori):! maneja! la! probabilidad! como! algo! subjetivo,! es! decir,! el!
grado!de!certeza!que!se!posee!sobre!un!asunto,!la!credibilidad!o!la!probabilidad!personal!
de!que!se!dé.%
%
2.% Definiciones%
•! Clásica%o%teórica%(Ley%de%Laplace):!esta!ley!establece!que!la!probabilidad!de!obtener!
cada!resultado!será!igual!al!cociente!entre!casos!favorables!y!casos!posibles.!!
Si! realizamos! un! experimento! aleatorio! en! el! que! hay! n! sucesos! elementales,! todos!
igualmente! probables! (equiprobables),! entonces! si! A! es! un! suceso,! la! probabilidad! de!
UVW
que!ocurra!el!suceso!es:!!!!9 T = !
UX
!

•! Empírica% (frecuentista):! la! probabilidad! de! obtener! un! determinado! suceso! A! es! el!
valor! hacia! el! cual! tiende! la! frecuencia! relativa,! cuando! el! número! de! observaciones!
IW
tiende!al!infinito:""9 T = lim !
[→] [
!

•! Axiomática:!describe!una!serie!de!condiciones!que!debe!cumplir!la!probabilidad:!
"! Primer! axioma:! el! valor! de! la! probabilidad! estará! siempre! comprendido! en! el!
intervalo![0,!1],!es!decir,!siempre!será!superior!a!0!e!inferior!a!1."""9(T) ∈ 0,1 !!

14!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

"! Segundo! axioma:! el! suceso! seguro! tiene! una! probabilidad! del! 100%,! es! decir,!
igual!a!la!unidad.!"""9 a = 1!
"! Tercer!axioma:!dos!sucesos!A!y!B!que!son!excluyentes!o!incompatibles,!que!no!
pueden! aparecer! simultáneamente,! la! probabilidad! de! que! ocurra! alguno! de!
ambos! sucesos,! p! (AUB)! será! igual! a! la! suma! de! las! probabilidades! de! que!
ocurra!cada!uno!por!separado.!!!9" Tbc = "9" T + "9" c !
!
De!los!axiomas!derivan!una!serie!de!propiedades:!!
#! La!probabilidad!del!suceso!complementario!es:!p!(nA)!=!1!–!p!(A)!
#! La!probabilidad!del!suceso!contrario!P!(Ā)!=!1!–!P(A)!
#! La!probabilidad!del!suceso!nulo/imposible:!1!–!P!(Ω)=!0!
#! Si! un! suceso! está! incluido! en! otro,! la! probabilidad! del! primero! ha! de! ser!
menor!o!igual!a!la!del!segundo.!
#! Cuando!los!sucesos!son!incompatibles:!la!probabilidad!de!su!intersección!
es!0.!
#! La!probabilidad!de!su!unión!es!la!suma!de!las!probabilidades!de!ambos:!
p(AUB)=p(A)+!p(B)!
#! Cuando! los! sucesos! son! compatibles:! la! probabilidad! de! su! intersección!
es! distinta! de! 0! y! la! probabilidad! de! su! unión! es! la! suma! de! las!
probabilidades! de! ambos! menos! la! probabilidad! de! su! intersección:!
p(AUB)=p(A)+p(B)fp(A∩B)!
!
Concepto%de%independencia!
2!sucesos!son!independientes!cuando!la!probabilidad!de!A!no!influye!que!haya!aparecido!
B.!Se!tiene!que!cumplir:!p!(AUB)=!p!(A)·p!(B)!
!

2!sucesos!compatibles!(no!disjuntos)!pueden!ser!o!no!independientes.!
2!sucesos!incompatibles!(disjuntos),!cuya!intersección!es!imposible,!son!dependientes.!
!
Probabilidad%condicionada!
P(AlB),!es!la!probabilidad!de!que!se!dé!A!una!vez!ha!salido!B.!
9(T ∩ c)
9 T|c = !
9(c)
!
Esto!es!explicado!por!el!teorema!de!Bayes!(y!el!teorema!de!la!probabilidad!total).!
!
!
!
!
!
!
!
!
!

15!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

C.% Tipos%de%variables%aleatorias%
Una!variable!aleatoria!es!una!función!cuyos!valores!son!números!reales!determinados!por!
los! elementos! del! espacio! muestral,! es! decir,! una! variable! aleatoria! es! una! variable!
matemática! cuyos! valores! posibles! son! las! descripciones! numéricas! de! todos! los!
resultados! posibles! de! un! experimento! estadístico.! Distinguimos! 2! tipos! de! variables!
aleatorias:!
1.% Discretas:!aquella!que!se!define!sobre!un!espacio!muestral!numerable,!finito!o!infinito.!
Espacio!numerable!es!aquel!cuyos!elementos!se!pueden!ordenar,!asignándoles!a!cada!
uno! un! número! de! la! serie! de! los! números! naturales! (del! 1! al! n).! Todas! las! variables!
con! un! número! finito! de! valores! y! todas! las! que! tomen! valores! en! números! enteros! o!
racionales!(fraccionarios),!son!variables!discretas.!
2.% Continuas:! es! aquella! que! se! define! sobre! un! espacio! asimilable! al! conjunto! de! los!
números!reales,!es!decir,!un!espacio!no!numerable.!
!

! f(x)→asigna!a!cada!variable!su!p! F(x)→probabilidad!acumulada!
p(x=xi)=f(xi)! H
] F(x)=p(x≤xj)= @hK M(#3)!
M #3 = 1! 15
@hK 10
Discretas!
5 5

0 0
1 2 3 1 2 3
! !
j
f(xi)≥0! F(x)=p(x≤a)!!!!! i] M # 2# !
]
Continuas! P(a≤x≤b)!
M # 2# = 1! k k j

i] M # 2# = M # 2# = M # 2# !
j i] i]

Siendo! f(x)! la! función! de! probabilidad,! función! por! la! que! a! cada! valor! de! la! variable!
aleatoria! se! le! asigna! su! valor! de! probabilidad,! y! F(x)! la! función! de! distribución! de!
probabilidad,! Probabilidad! de! obtener! un! determinado! resultado! junto! con! todos! los!
anteriores.!

A!partir!de!espacio!muestral!queremos!llegar!a!la!función!de!distribución!de!probabilidad:!

l.n. o p
a ℝ q(#)!
F.%Distribuciones%de%probabilidad%más%comunes%en%medicina.%
1.%Qué%son%
La!importancia!de!conocer!la!distribución!que!siguen!tus!datos!reside!en!el!hecho!de!que!si!
estos!encajan!con!alguna!distribución!sistematizada!el!tratamiento!de!los!datos!es!mucho!
más!sencillo.!Si!no!encajan!existen!los!llamados!métodos!no!paramétricos,!más!complejos!
pues!el!trabajo!se!realiza!utilizando!todos!los!datos.!

16!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

2.%Distribuciones%de%probabilidad%discretas%
•! Bernoulli!(r):!la!experiencia!sólo!se!ejecuta!una!vez,!con!2!posibles!resultados!0!y!
1(éxito).!
! Variable! f(x)! Probabilidad!
!
!
0! 1fπ! p(x=0)=!1fπ!
! 1! π!! P(x=1)=π!!!
!

•! Uniforme!discreta!(a,b):!experiencias!aleatorias!de!un!nº!n!de!sucesos!equiprobables.!

•! Distribución% binomialdB% (n,% p):! se! hace! con! experimentos! aleatorios,! dicotómicos,!
excluyentes,!independientes!(en!cuanto!a!los!experimentos)!y!con!reposición!(se!repite!
el! experimento! en! las! mismas! condiciones! con! la! posibilidad! de! obtener! los! mismos!
sucesos).!Con!otras!palabras,!es!un!experimento!aleatorio!en!el!que!se!contabiliza!el!nº!
de! éxitos! en! un! experimento! de! berrnoulli! repetido! n! veces.! Se! refiere! a! los!
experimentos! en! los! que! el! espacio! muestral! está! compuesto! por! 2! sucesos!
elementales,! sólo! con! 2! posibilidades,! son! sucesos! incompatibles,! mutuamente!
excluyentes.!2!parámetros!la!definen:!nº!de!ensayos!o!intentos!y!probabilidad!en!cada!
intento.!
%
Permite! modelizar! la! distribución! de! frecuencia! de! cierto! carácter! dicotómico! (en!
realidad!del!nº!de!veces!que!aparece!el!considerando!como!éxito),!observada!al!extraer!
aleatoriamente! (con! reposición)! muestras! de! tamaño! n! en! una! publicación! en! la! que!
conocemos!la!probabilidad!(π).!

Ejemplo!con!moneda→éxito!cara!
!Ω{cara,!cruz}! V.A.! f(x)! B(n,π)!
! 0fCruz!(+)! ½! 1fπ=0,5!!!!!!!!(q)!
! 1fCara!(c)! ½! Π=0,5!!!!!!!!!!!(p)!
2!lanzamientos! ! ! ! ! !
V.A.! Resultados! Probabilidad! !
0! ++! ½!·!½!=!¼!!
1! +C//C+! ½!·!½!=!¼!(cada!uno),!conjunto!½!
2! CC! ½!·!½!=!¼!
3!lanzamientos! f(x)
F(X)

V.A.! Resultados! Nº! de! formas! Probabilidad!!!!!f(x)! F(x)!


de!obtenerlo! 2
2 0,5
0! +++! 1! ½!·!½!·!½!=!⅛!→0,125! 0,125!
1
1! ++C//+C+//C++! 3! ⅛+!⅛!+⅛!=⅜!→0,375! 0,5!
2! CC+//C+C//+CC! 3! ⅛+⅛+⅛=⅜→0,375! 0,875! 0 0 0
0 1 2 3
3! CCC! 1! ½!·!½!·!½!=⅛!→0,125! 1! 0 1 2 3

Si! realizásemos! muchos! intentos! sería! imposible! calcularlo,! aquí! entra! en! juego! la!
combinatoria:!
* p Iip
c(*, r) ∙ M #@ = 9 ∙t !
# Probabilidad!de!no!éxito!
! Probabilidad!de!éxito!
* *! Maneras! posibles! de!
Nº!de!experimentos! = ! obtener!un!resultado!
# * − # ! #!

17!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

•! Distribución% de%PoissondP(λ)d(distribución! de! los! casos! raros):% es! similar! a! la!


distribución!binomial!pero!se!utiliza!cuando!el!nº!de!experimentos!es!muy!grande!y!un!
vw
éxito! (r)! es! poco! probable.! La! función! de! distribución! es:! q # = 1 iv ! ! ,! siendo! x! el!
p!
número!de!éxitos!y!λ=n·π!(≈esperaza).!
!

Ej.!Vacunas:!
x=reacciones!alérgicas!graves→1!por!cada!106!suministradas→!π=10f6!
n=3·106!
Qx
p(x=1)!→!λ=n·π=3!→!Poisson(λ=3)=ef3· !
K!

!5 ! ! ! ! Tiene!una!asimetría!positiva.!
!
4
!3 ! ! ! ! Esta!distribución!se!suele!asociar!al!tiempo!de!evolución.!
!

!2 ! ! ! ! Cuanto!+!grande!es!λ!más!se!parece!a!una!normal.!
!1
0
1 2 3 4 5 6 7 8 9 10
!

!
3.%Distribuciones%de%probabilidad%continuas%
3.1%Normal.%N(μ,%σ):!en!ella!encontramos!una!serie!de!propiedades:!
"! Simetría!
"! La!mediana,!moda!y!modal!coinciden!en!un!mismo!punto.!
"! Es!asintótica!con!respecto!al!eje!de!abscisas,!es!decir,!sus!colas!nunca!llegan!a!tocar!el!
eje!y!toman!valores!entre!+∞!y!f∞.!
"! Desde!el!centro!a!una!distancia!de!±σ!(desviación!típica)!esta!comprendida!un!área!del!
68%.!
"! El!area!total!bajo!la!curva!es!del!100%.!
"! El!punto!donde!cambia!la!curvature!es!μ.!
"! La!distribución!normal!tipificada!tiene!μ!=!0!(la!media)!y!σ=!1!(desviación!típica)!
"! En!el!intervalo!entre!μ!–!1,96!σ!y!μ!+!1,96σ!se!encuentra!el!95%!de!la!muestra.!
"! Beneficios:!muchos!procesos!biológicos!siguen!esta!distribución.!
!
!
!
!
!
!
!
!
!
Para!obtener!datos!concretos!se!traslada!la!gráfica!concreta!a!una!tabulada!(donde!#!=!0)!
z@i{
Para!trasladar!un!dato:!y3 = !,! siendo! zi! =! Valor! trasladado,! xi! =Valor! original! de! la!
|
gráfica,!μ=!Media!de!la!gráfica!no!tabulada!y!σ!=!Desviación!típica!en!gráficas!continuas.!
18!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

!
Ej:!En!una!distribución!de!tipo!normal!y!con!1!grado!de!libertad!que!representa!la!edad!de!
una!población!de!media!(μ)!75!quiero!saber!la!probabilidad!de!que!existan!individuos!de!73!
años!y!de!75.!
! ! ! Ej:!zi!=!(73!–!75)/2!=!H1! ! El!área!de!la!distribución!tabulada!!
! ! ! !!!!!zi!=!(78!–!75)/2!=!3/2!=!1,5! ! es!la!misma!que!la!original!
Por!la!tabla!oficial!y!refrendada!por!la!comunidad!sé!que!el!área!que!queda!por!encima!de!
1,5!(que!el!68!de!nuestra!grafica)!es!0,0668.!Esto!significa!que!P!(x>78)!=!0,0668!
!
3.2%Jidcuadrado.%χ2% (ν):! en! ella! se! incluye! el! concepto! de! grados! de! libertad.! Es! una!
distribución!asimétrica!positiva!que!va!desde!0!a!∞!(Es!asintótica!en!+∞).!
Es!una!suma!de!normales!tiificadas!elevadas!al!cuadrado:!
}~? = K? + ?? … I? """"La!relación!entre!jifcuadrado!y!la!normal!es!que!Z2!=!(chi)!
!

Con!los!grados!de!libertad!cambia,!cuando!aumentan!se!acerca!a!la!normal!(en!rojo!
vemos!esa!evolución)!
!
3.3%Tdstudent.%t%(ν):!distribución!tabulada.!Es!simétrica,!va!desde!f∞!a!+∞,!centrada!en!
el!0.!Conforme!ganas!en!grados!de!libertad,!va!acercándose!a!la!normal!(grado!de!
libertaad!∞).!Que!sea!igual!significa!que!el!área!que!queda!a!cada!lado!de!un!punto!
es!la!misma!en!ambas.!
Ä
Función!de!distribución:!N = Å!
w
Ç

Igual!que!antes,!los!mismos!puntos!con!distintos!grados!de!libertad!incluyen!áreas!
distintas.!Al!bajar!los!grados!de!libertad!la!aplanamos.!

3.4%F%de%Fisher.%F%(ν1,%ν2):!siempre!es!positiva,!con!dos!grados!de!libertad.!Función!de!
ÑÅ
Éx
distribución:!qÉx ÉÅ = ÑÅ %
ÉÅ

%
!
!

19!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

!! TEMA%4:%INFERENCIA%ESTADÍSTICA!
A.% Estadística%inferencial%
1.% Problemas%que%soluciona%
1.1%.%Estimación%puntual%
Una! estimación! consiste! en! apostar! por! un! valor! para! un! parámetro! poblacional,!
habitualmente!calculando!también!un!rango!de!valores!entre!los!que!puede!situarse!dicho!
parámetro!poblacional.!

1.2.%Estimación%por%intervalo%
Se! realiza! una! estimación,! calculando! para! ello! un! intervalo! de! confianza,! es! decir,! un!
conjunto!de!valores!en!el!que!con!una!determinada!certeza!se!encontrará!el!parámetro!que!
quiero!estimar.!!

1.3.%Contraste%de%hipótesis%
Prueba! estadística! que! trata! de! valorar! si! lo! que! estamos! observando! en! nuestro!
experimento!está!suficientemente!bien!explicado!por!el!azar.!!

2.% Estimador%
2.1.%¿Qué%es?%
Un!estimador!es!una!función!de!los!valores!de!una!muestra!que!se!elabora!para!indagar!
el!valor!de!un!parámetro!de!la!población!de!la!que!procede!la!muestra.!De!este!modo:!

F45á61N5: ∈ 1AN3642:5" ± 1AN42íAN38:"21"8:*N54AN1"×"EE!

Cuando! se! dispone! de! una! muestra! sólo! se! pueden! calcular! estimadores,! pero! estos!
permiten!obtener!un!valor!aproximado!de!alguna!característica!de!la!población!de!donde!se!
extrajo! dicha! muestra.! El! valor! de! esa! característica! en! la! población! es! lo! que!
denominamos! parámetro.! Buscamos! acércanos! a! la! población! (“el! todo”)! a! partir! de! una!
muestra!(“parte”).!!

! Inferencia!estadística!
POBLACIÓN!
!
MUESTRA!
! Parámetros!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!Estimadores!
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!μσρπ!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!! ! #̅ "A"à"â!
!
!
2.2.% Propiedades%de%un%estimador%
Estos!estimadores!tienen!ciertas!características!o!propiedades:!
!! Insesgado:!Cuando!el!estimador!muestral!corresponde!al!poblacional,!sin!ninguna!
desviación!sistemática.!!
!! Eficiente:!de!mínima!varianza!(poco!disperso).!
!! Suficiente:!que!utilicen!toda!la!información!del!conjunto!de!la!muestra.!
!! Robusto:!que!aunque!no!se!cumplan!las!condiciones!de!aplicación!para!poder!
calcularse,!se!puedan!calcular.!Cuanto!más!robusto!sea!más!aguanta.!
!! Consistencia:!conforme!aumento!el!tamaño!muestral!más!me!acerco!a!la!población.!

20!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

3.% Fuentes%de%error!
Por!el!hecho!de!trabajar!con!muestras!siempre!cometemos!ciertos!errores.!Diferenciamos!
dos!tipos!de!errores:!
•! Aleatorios:!amenaza!mi!precisión/fiabilidad.!Se!pueden!cuantificar.!Pueden!ser!por:!
o! Variabilidad%(biológica):!somos!distintos!por!lo!que!puede!haber!diferencias.!
o! Muestreo!
•! Sistemáticos% (sesgos):% se! desvía! sistemáticamente! de! lo! que! quiero! medir,!
amenazando!a!la!validez.!No!se!puede!identificar.!Diferenciamos%4%situaciones:!
!
!!!!!1.↑precisión!y!↑validez!
!

!!!!!2.↓precisión!(mucho!error!aleatorio)!y!↑validez!
!

!!!!!3.↑precisión!y!↓validez!
!
!!!!!4.↓precisión!y!↓validez!
!
!
Los!primeros!son!impredecibles,!simétrico,!inevitable,!aunque!estimable,!equivale!a!la!falta!
de! precisión! y! sirven! para! la! estimación! y! control! (Estadística).! Los! segundos! son!
predecibles,!asimétrico,!corregible,!equivale!a!la!falta!de!validez!y!sirve!para!prevención!y!
control!(Epidemiología).!
!
B.% Intervalo%de%confianza%
El!intervalo!de!confianza!es!un!rango!de!valores!en!el!que!con!una!determinada!certeza!se!
encuentra!el!parámetro!de!la!población!que!queremos!conocer.!Esta!confianza!es!el!área!
que!queda!entre!dos!números!menos!el!área!que!queda!fuera.!!

1.% Construcción%
La!construcción!de!un!intervalo!de!confianza!se!realiza!para!intentar!predecir!el!valor!de!un!
parámetro.! Por! ello,! se! puede! hablar! de! intervalos! de! confianza! para! la! media,! para! la!
proporción…Para!la!construcción!del!intervalo,!debemos!conocer!la!distribución!que!sigue!
la! muestra! y! el! error! estándar! propio! del! estimador,! ya! que! para! construirlo! seguimos! el!
siguiente!criterio:!
!!!!!!!! ! ! Parámetro!∈"estimador!±estadístico!de!contraste!×!EE!!!
(siendo! EE! el! error! estándar! del! estimador,! el! estimador! es! el! que! te! den! (la! media,! la! proporción…),! el!
estadístico!de!contraste!se!construye!a!partir!del!tipo!de!distribución!(normal,!binomial,!tfstudent…)).!
%

Al%hacer%un%intervalo%de%confianza%dejamos%de%hablar%de%la%muestra%y%hablamos%de%
las%medias%muestrales%de%ese%tamaño.%
%

Estos! intervalos! pueden! variar! al! modificarse! la! muestra! y! el! intervalo! que! generamos!
puede! o! no! contener! el! parámetro! (0,05%).! Todo! estimador! debe! ir! acompañado! de! su!
intervalo! de! confianza.! (Para! aumentar! la! confianza! de! que! nuestro! valor! esté! entre! los!
valores!dados,!aumentamos!nuestro!intervalo).!
!

Con!la!información!que!conocemos!podemos,!por!tanto,!construir!dos!tipos!de!intervalos:!el!
intervalo!de!confianza!de!una!media!y!el!Intervalo!de!confianza!de!una!proporción.!
21!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

2.!Interpretación%del%intervalo%de%confianza!
!

Podemos! decir! que! con! una! determinada!


confianza! (1! –! α),! el! verdadero! valor! del!
parámetro!estará!comprendido!entre!dos!valores!
que!se!generarán!al!construir!el!intervalo.!

!
! !
Hay!que!tener!en!cuenta!que!si!α!sale!negativo!se!le!puede!cambiar!el!signo!(pues!el!área!
que! deja! el! negativo! por! debajo! es! la! misma! que! la! que! deja! el! positivo! por! encima)! pero!
después!las!áreas!de!los!dos!valores!extremos!obtenidos!hay!que!restarse!lo!a!1.!
!
!
!
!
!
!
C.% Intervalo%de%confianza%para%la%media%
Siguiendo!la!fórmula!ya!conocida,!podemos!crear!un!intervalo!de!confianza!para!la!media!
sustituyendo!los!datos,!con!lo!que!quedaría!del!siguiente!modo:!
A
SB" #% = P"ã"# ± EAN42íAN38:"21"8:*N54AN1" å ? , Nå ?,~ ×"( )!
*
(siendo!ν,!en!la!tfstudent!n!–!1)!

1.%Supuestos%a%verificar%
Se!usará!la!distribución!normal!cuando!el!tamaño!muestral!n!>!30,!y!la!distribución!t!de!
student!cuando!el!tamaño!muestral!n!≤!30.!Si!no!estamos!seguros!de!cual!utilizar!podemos!
utilizar!siempre%la%tdStudent.%
A! menor! n! (menores! grados! de! libertad)! mayor! posibilidad! de! error! (intervalo! más! ancho),!
luego!el!área!del!IC!es!mayor!(mayor!Zα/2).!
%
2.%Error%estándar%de%la%media%(EEm)%
EEm!=!σ/√n! !
De!aquí!se!deduce!que!a!mayor!n!menor!EE!lo!que!implica!un!intervalo!de!mejor!calidad.!!
Este!error!estándar!sería!como!la!desviación!típica!de!las!medias!muestrales!de!la!media!
poblacional.!

22!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

D.% Intervalo%de%confianza%de%una%proporción.!
Sigue!el!mismo!esquema!ya!presentado,!por!lo!que!su!fórmula!es!la!siguiente:!
9×t
SB" #% = r ∈ 9 ± EAN42íAN38:"21"8:*N54AN1" å ? , Nå ?,~ ×"( )!
*
(Siendo!ν!=!n!–!1!y!q!=!1!–!p)!
1.%Supuestos%a%verificar%
Se!utilizará!la!distribución!normal!siempre!que!n!·!p!>!5.!Si!esta!condición!no!se!cumple,!no!
se!puede!calcular!(la!distribución!que!usará!el!intervalo!será!otra).!
Si!se!trata!de!una!muestra!grande!(n!≥!100)!la!distribución!utilizada!será!la!distribución!
normal!(Z!o!N).!Por!el!contrario!si!la!muestra!utilizada!es!pequeña!(n!<!100)!se!utiliza!la!tf
Student.!Si!no!estamos!seguros!de!cual!utilizar!podemos!utilizar!siempre!la!tfStudent.!
!
2.%Error%estándar%de%la%proporción%(EEp)%
√éè
EEp!=! ê! !
De!aquí!se!deduce!que!a!mayor!n!menor!EE!lo!que!implica!un!intervalo!de!mejor!calidad.!

E.% Contraste%de%hipótesis.%
1.%¿Qué%es%una%prueba%de%hipótesis?%
Prueba! estadística! que! nos! permite! saber! si! el! resultado! de! nuestro! experimento! es!
razonablemente!explicado!por!el!azar!o!no.!Contiene:!
%
2.%Tipos%de%pruebas%de%hipótesis%
%%%%%2.1%Pruebas%de%conformidad.%
•! Valor!teórico:!se!pregunta!si!la!muestra!habrá!salido!de!la!población!determina.!
•! Distribución!teórica:!se!pregunta!si!la!muestra!seguirá!una!distribución!normal.!

%%%%%2.2%Pruebas%de%homogeneidad.%
Se!realizan!para!dos!muestras!y!se!obtiene!un!estimador.!Se!cuestiona!si!las!dos!muestras!
son!suficientemente!semejantes!para!haber!salido!de!la!misma!población.!

%%%%%2.3%Pruebas%de%relación.%
Analiza! la! relación! que! establezco! entre! 2! variables,! es! decir,! si! varía! una! u! otra,!
preguntándose!sí!es!razonable!que!la!relación!de!mi!muestra!se!de!en!la!población.!

23!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

3.%Formulación%de%hipótesis.%
%%%%3.1%Hipótesis%nula%vs%hipótesis%alternativa%
Se!plantean!siempre!dos!hipótesis!complementarias!con!las!que!se!trabaja:!
!! Hipótesis% nula% (Ho):! sólo! el! azar! ha! gobernado! la! separación.! Se! separa! tanto! como!
dice!el!azar.!Se!puede!rechazar!o!no.!
!! Hipótesis% alternativa% (H1):% intentamos! demostrar! que! la! H0! es! falsa.! H1! se! acepta!
cuando!se!rechaza!H0.!

Si!se!rechaza!la!Ho,!se!entiende!que!el!azar!no!explica!lo!observado.!Si!no!se!rechaza,!no!
se! acepta! que! no! exista! efecto,! sino! que! se! mantiene! que! el! efecto! no! puede! ser!
demostrado.!

Ambas!se!formulan!en!términos!de!parámetros!poblacionales.!
Ej.!
Ho:!μ=130!!!!μ1=μ2!!!!!!!π1=π2!!!!!!!!σ1=σ2!!!!!!
H1:!μ≠130!!!!μ1≠μ2!!!!!!!!π1≠π2!!!!!σ1≠σ2!!!!!!
!
4.% Pruebas%de%hipótesis.%Esquema%general%de%trabajo.%
1)! Planteamos!las!hipótesis!(la!nula!y!la!alternativa)!
2)! Comparar! lo! que! yo! observo! en! mi! experimento! con! lo! que! yo! espero! si! H0! fuera!
cierto.! Para! esto! construimos! un! estadístico! de! contraste! que! relacione! lo! que! veo!
con!lo!que!explica!el!azar.!
3)! Calcular!el!pfvalor,!probabilidad!de!haber!encontrado!unas!diferencias!iguales!a!las!
halladas!o!mayores!si!la!hipótesis!nula!fuera!cierta.!
4)! Decidir!si!rechazamos!o!no!Ho.!Para!rechazarla!se!ha!establecido!por!convenio!que!
el!pfvalor!ha!de!ser!<0,05!(5%/α→nivel!de!significación,!se!decide!previamente).!Es!
decir,! se! busca! un! valor! a! partir! del! cual! no! me! creo! H0,! si! es! mayor! del! 5%! no!
rechazo,!si!es!menor!rechazo.!

Ej.!

!
!

24!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

5.% Nivel%de%significación%vs%grado%de%significación%(«p»).%
Pdvalor%
El! pfvalor! es! un! área! en! nuestra! distribución! de! probabilidad,! que! representa! la!
probabilidad!de!haber!encontrado!unas!diferencias!iguales!a!las!halladas!o!mayores!si!la!
hipótesis!nula!fuera!cierta,!por!lo!tanto,!es!una!probabilidad!condicionada!(parte!de!que!H0!
es!cierto):!!!9(23M ≥ 23Míkì |îL )!
!
¿Qué!no!es!el!pfvalor?!
"! No!mide!cómo!de!grande!es!la!diferencia!ni!la!magnitud!de!la!relación.!!
Los!resultados!pueden!estar!modificados!por!conveniencia:!
ïoïñóí
!!!!!!!!! | !si!↑n!↑σ(error)!↓efecto,!pero!también!se!puede!hacer!al!revés:!↓n!↑efecto!
I
!

"! No!establece!relaciones!de!causalidad,!sino!que!solo!mide!la!asociación!estadística.!
Ej.!IAM(infarto)→fumadores!13%!
! ST0→fumadores!47%!
Esto!no!quiere!decir!que!no!fumar!aumenta!el!riesgo!de!infarto!(preguntas!sobre!el!
momento! actual! no! sobre! antes).! También! esta! diferencia! grande! del! pfvalor!
realmente!depende!de!n.!Si!se!usa!suficiente!tamaño!muestral,!se!obtendrán!datos!
significativos,!pero!debemos!tener!en!cuenta!que!el!pfvalor!disminuirá!cuanto!mayor!
tamaño!muestral!tengamos.!Así!a!mayor!n!"!menor!EE!"!menor!I.C.!(intervalo!más!
estrecho)! "! porcentaje! total! de! probabilidad! de! acierto! más! significativo,! con! más!
fuerza!y!fiabilidad.!
!

"! No!es!la!probabilidad!de!que!la!hipótesis!nula!sea!falsa.!Como!ya!hemos!dicho!parte!de!
que!es!la!H0!es!cierta.!
!

"! No!es!la!probabilidad!de!cometer!un!falo!(mismo!motivo).!
!
Relación%IC%y%pdvalor:%
| |
9(P − Nò,IiK < # < P + NKiò,IiK )!!!
Å I Å I
Esto!mide!la!probabilidad!de!que!mi!media!muestral!
este!entre!esos!2!valores.!!
pi{
9(Nò,IiK < | < NKiò,IiK )!!!
Å I Å

#−P
9(Nå,IiK > > > NKiå,IiK )!
? ?
*
!
!
#−P #−P
9 > < Nå,IiK =9 > < NKiå,IiK = õ 2!
? ?
* *
!

9 = NIiK > Nïpú = 9 − ù4û:5 2!


9 − ù4û:5
9 = NIiK < Nïpú = 2%

25!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

Entonces:!"
9 − ù4û:5
9= Nïpú > NIiK = 2%
!
úiüj†í° å
< !!→!Rechazo!H0!→!lo!que!es!igual:!pfvalor=õ!
? ?
!

Nïpú > Nõ,*−1 !→!Rechazo!H0


2
!
%
Nivel%de%significación%(α)%
Punto!que!se!establece!a!priori!y!a!partir!del!cual!se!rechaza!la!Ho.!Normalmente!suele!ser!!!!!!!!
α! =! 0,05,! pero! puede! establecerse! cualquier! valor! que! elija! el! investigador.! El! pfvalor! se!
calcula!después!y!se!compara!con!el!nivel!de!significación.!
!
%
!
6.% Errores%en%el%contraste%de%hipótesis%
%%%%%%%%%%%%%Realidad%
! ! H0! H1!
Decisión%

! Acierto! Error!tipo!II!
H0!
(1!–!α)! β!
! Error!tipo!I! Acierto!!
H1!
α! (1!–!β)!
!
Riesgo%de%error%tipo%I:!es!el!riesgo!que!asumimos!al!rechazar!la!H0!pudiendo!ser!cierta.!
No!está!en!α,!pero!realmente!sí!pertenece!esa!media!a!la!población.!
Riesgo%de%error%tipo%II:!se!trata!del!riesgo!asumido!al!no!rechazar!la!H0!siendo!falsa.!
!
La!potencia%estadística!describe!cual!es!la!capacidad!de!un!contraste!para!rechazar!la!H0!
cuando!esta!es!falsa!(potencia!estadística!=!1!–!β).!Depende!en!gran!medida!del!tamaño!
muestral.!(es!la!probabilidad!de!cuando!existen!diferencias!encontrarlas.!!
!
En! todas! las! situaciones! de! rojo! se! puede!
cometer! el! error! de! tipo! II,! siendo! su!
probabilidad!β.!
!
!
!

Si!bajamos!α,!la!desplazamos!a!la!derecha,!es!decir,!<0.05,!
aumenta! β.! Del! mismo! modo,! al! aumentar! 1fα! baja! la!
potencia!estadística!(1fβ).!
!
!

Al! contrario,! al! ↑! α! ↑! la! potencia.! Para! detectar! diferencias!


grandes! es! más! fácil! encontrarlas.! Es! decir,! para! valores!
extremos! con! un! alfa! grande! es! fácil! saber! si! pertenece! o!
no.!!

26!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

Al!aumentar!n,!disminuye!el!error!estándar!(> *)!
%
! ! ! ! +!Estrechas!
! ! ! !!!!!!!!!α=!
! ! ! !!!!!!!!β↓!
! ! ! !!!!!1fβ↑!
!
!
!
Al!aumentar!σ,!baja!la!potencia!estadística!
! !
!
!
!
!
!
!
!
!
!
Cuanto!más!se!solapan!es!más!difícil!encontrar!errores:!
!
Fácil!discriminar→! ! ! ! ! ! ! !!!!!!!!!!!!!!!!!!!!!!!!!!!!!←Difícil! discriminar!
! ! ! !
!
Para!trucar:!↑n!↑potencia,!pudiendo!↓!el!pfvalor,!haciendo!el!efecto!menor.!
! !

27!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

!! Suplemento%T6:%Análisis%de%la%normalidad%de%una%variable%
Existen!tres!tipos!de!criterios!para!saber!si!una!variable!determinada!sigue!una!distribución!
normal:!!
!
A.%Criterios%numéricos.%
a.! La! normal! cuenta! con! simetríam! media,! mediana! y! moda! coinciden! en! un! punto! o! son!
semejantesm!centro!en!0m!curtosis!0.!
!

b.! Valores!máximos!y!mínimos:!no!existirán!valores!más!allá!de!±!3!σ.!
!

c.! Contraste! de! simetría:! se! buscan! colas! derecha! e! izquierda.! El! valor! absoluto! del!
producto!del!coeficiente!de!asimetría!dividido!entre!su!EEasimetría!debe!ser!<!2!
TD − 0
Estadístico! de! contraste! = < 2!
EEn¢
de!una!distribución!normal!
!
!

d.! Contraste! de! curtosis:! se! busca! si! es! leptocúrtica,! platicúrtica! o! mesocúrtica.! El! valor!
absoluto!del!producto!del!coeficiente!de!curtosis!entre!su!EEcurtosis!debe!ser!<!2!
%
%
B.%Criterios%gráficos.!
Histograma,!Tallo!y!hojas.!(Steam!and!Leaf),!Gráfico!de!cajas!y!bigotes.!(Box!and!whisker!
plot)!y!Gráfico!QfQ.!(QuantilefQuantile!plot).!
!
!
C.%Contrastes%de%hipótesis.!
1.!Prueba!de!KolmogorovfSmirnov!con!la!corrección!de!Lilliefors!(para!n>50).!
2.!Prueba!de!Shapiro!Wilk!(para!n!pequeñas:!30<n<50).!
!

Si!el!tamaño!muestral!es!muy!grande!con!una!pequeña!variación!de!σ!se!obtiene!un!valor!
en! el! test! significativo.! Esta! reducción! de! esta! significación! se! consigue! mediante! una!
reducción!de!n!(para!lo!que!se!utiliza!el!test!de!ShapirofWilks).!
!
!
D.% Normalización%de%una%distribución!
Si! no! sigue! una! distribución! normal! puedo! hacer! una! transformación! para! normalizar! la!
variable:!
Forma%de%la%distribución% Transformación%
Asimetría!positiva! log(# + 8)!
Asimetría!negativa! log(8 − #)!
Leptocurtosis! 1 #!
Platicurtosis! #?!
!
!
!
La!media!siempre!que!n>30!seguirá!una!distribución!normal.!

28!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

ANEXO:%INTRODUCCIÓN%A%LA%INFERENCIA%II%
A.% Test%paramétricos%y%no%paramétricos%
•! Test!paramétricos:!
Se! utilizan! en! gráficas! que! sigan! una! distribución! tipificada! o! estándar! (Z,! tfStudent,! F! de!
Fisher,!etc.)f!!Si!no!siguen!una!distribución!normal!pero!n!es!grande!(n!>!30)!entonces!se!
pueden!utilizar!estos!test.!!
Ej.!de!test!paramétricos:!ANOVA,!ANOVA!med!pop,!tfStudent!muestra!ind,!etc.!
!
•! Test!no!paramétricos!o!de!distribución!libre!
Si!no!tienes!información!sobre!la!forma!que!sigue!tu!distribución!y!n<30!no!puedes!utilizar!
los!test!paramétricos,!se!utilizan!entonces!los!no!paramétricos.!Estos!test!no!se!basan!en!la!
estimación! de! parámetros! y! no! dependen! de! la! distribución,! pues! de! ser! así! no! tendrían!
sentido.! Siempre% que% un% test% paramétrico% no% cumple% las% condiciones% para% llevarse% a%
cabo%tiene%una%alternativa%no%paramétrica.!
!
B.% Tipos%de%muestras!
Muestras%independientes:!se!consideran!muestras!independientes!a!aquellas!que!han!sido!
seleccionadas!por!separado!y!no!tiene!nada!que!ver!entre!sí.!
!
Muestras%relacionadas:!
•! Autoemparejamiento:!comparación!de!mismo!individuo!en!2!momentos!de!tiempo.!El!
contraste!tendrá!más!parecido!que!si!se!compara!con!cualquiera!de!la!población.!
Ej:!Juan!a!las!9:00!am…Juan!a!las!12:00!am!
!

•! Naturales:!gemelos.!Se!utiliza!en!estudios!genéticos.!Beneficio!para!ver!cómo!actúan!
dos!tratamientos!en!“una!misma!persona”.!
!

•! Casos%y%controles%emparejados:!se!utiliza!en!epidemiología.!Se!fuerza!el!parecido,!es!
decir,!se!buscan!variables!coincidentes!para!anular!diferencias.!
Ej.!buscamos!gente!con!la!misma!edad!y!sexo,!para!anular!ambas!influencias!y!buscar!
otras!causas:!
IAM:!♂55!♂67!♀72!♀86…!!!!!IAM:!♂55!♂67!♀72!♀86…!
!
C.% Algoritmo%de%comparación%de%variables%cualitativas%
Variables!cualitativas:!se!les!puede!asignar!un!número,!pero!no!tiene!valor!numérico.!!
"! Nominales:!permite!realizar!operaciones!de!igualdad!y!desigualdad.!Dicotómicos!y!
politómicos:!Puede!tomar!más!de!dos!valores.!
"! Ordinales:!puedes!establecer!relaciones!de!superioridad,!pero!sin!asignar!un!número.%
%
Ejemplo!con!tablas!de!contingencia:!
! NSE!(ordinal)!
!

! Sexo! ! ! Color!de!pelo!
♂! ♀! ! Rubio! Moreno! Castaño! 0! 1! 2!
Fumar!! 0! ! ! Fumar! 0! ! ! ! Fumar! 0! ! ! !
1! ! ! ! 1! ! ! ! 1! ! ! !

29!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

!! TEMA%5,%8%Y%9.%INFERENCIA%CON%PROPORCIONES%
A.!Pruebas!de!conformidad!+.!
1.!Valor!teórico!proporción.!
B.!Pruebas!de!homogeneidad!+.!
!
!!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
1.!Muestras!independientes.!!
1.1.%2%grupos%(np>5)%
®%Aproximación%mediante%estadístico%z.%
Diferencias!de!proporciones!P2fP1!
!
F? − FK − 0 F? − FK − 0
y= = ↝!
EE©ú 1 1
F·´ +
*K *?
! 0!

EEdp:!error!estándar!de!la!diferencia!de!proporciones.!
*? F? + *K FK
F= !
*K + *?
´ = 1 − F!
%
Como!tenemos!#!y!EE,!podemos!construir!un!IC:!
K K
F? − FK + yò F · ´ + !!!!!!!!!!!!!!!!!!!!! !
Å Ix IÅ

Si!rechazásemos!Ho!el!0!estaría!fuera!del!IC→!!!!!!!!│!!!!!!!!!!·0!!!!!!!!!!!│!
!
% %
%
%

30!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

1.2.%2%o%más%grupos:%Tabla%de%contingencia.%
®%Jidcuadrado%de%Pearson%(*).%%
! ! ! ! ! H0→π1=! π2=! π3! ! ! m! es! decir,! esperamos! que! la!
proporción!se!aplique!igual!a!cada!grupo:!
! ! ! ! ! !
! ! ! ! ! !
! ! ! ! ! o→observado! Ahora!cogemos!los!o!y!le!restamos!
e→esperado! e!por!lo!que,!esperamos!que!el!
!
% resultado!sea!0.!
%
De!este!modo!podemos!construir!el!estadístico!para!Jifcuadrado,!que!será!el!Jifcuadrado!
de!Pearson:!
~ ≠ ?
:@H − 1@H
}~? = !
1@H
@hK HhK
?
:@H − 1@H →es!el!residual!
à!son!los!grados!de!libertad!que!se!calculan!del!siguiente!modo:!
!
Sólo!A!es!una!celda!libra!las!demás!van!obligadas!por!
su! resultado.! Por! lo! que! esta! tabla! sólo! tendrá! un!
grado!de!libertad.!
%%
En!este!segundo!caso!A!y!B!determinan!a!los!demás.!
%
Podemos!deducir!por!tanto!una!fórmula!general:!
Æ = (M3û4A − 1)(8:ûØ6*4A − 1)!
%

%
2
La! X ! de! Pearson! no! se! puede! aplicar! cuando! eij<5% en% el% 20%% de% las% casillas.! Si! esto!
ocurre!podemos:!
!! Agrupar%categorías%
Ej:!si!al!hacer!el!estado!civil!de!una!muestra!ves!que!tienes!muy!pocos!viudos,!puedes!
cambiar! tu! categoría! por! gente! que! vive! sola.! De! esta! manera! pierdes! información!
sobre!una!categoría!concreta,!pero!ganas!información!sobre!otra!más!general.!
!

!! Corrección%de%yates%
Å
í∞± iï∞±
En! vez! de! utilizar! la! ecuación! de! Pearson! }~? = " ï∞±
",! se! utiliza! algo! similar!!!!!!!!!!!!!!!
Å
[í∞± iï∞± ]iL,¥
}~? = " !
ï∞±
%

!! Test%de%Fisher!(de!los!métodos!exactos)!
Normalmente! calculamos! un! valor! aproximado! del! p! valor,! si! la! tabla! es! de! 2! x! 2! el! test!
exacto! de! Fisher! nos! da! el! valor! exacto! del! p! valor,! mediante! el! cálculo! de! todas! las!
combinaciones!posibles!que!llevarían!al!mismo!resultado,!la!adición!de!esa!nueva!tabla!y!así!
continuamente.!
31!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

2.!Muestras!emparejadas.!!
®%Jidcuadrado%de%McNemar.%
Trat! !
b! y! c! son! los! pares! discordantes,! pues! sus! resultados!
son! diferentes! con! cada! tratamiento.! No! nos! interesan!
los!casos!en!los!que!todo!fueron!éxitos!(d)!o!fracasos!(a)!
Trat! (ambos! pares! concordantes),! puesto! que! si! c! es! más!
alta!"!el!tratamiento!2!es!mejor!y!si!b!es!más!alta!"!el!
tratamiento!1!es!mejor.!
!

b+c!→!nº!de!discordancia!(si!son!iguales!H0!no!se!rechaza)!
bfc!→!diferencia!del!efecto.!Con!este!construimos!el!estadístico!de!contraste:!
x
kiñ K (kiñ) kiñ
= µ − 8 = 9? − 9K ! ! y= /
x = !
I I kJñ kJñ
/
(kiñ)Å
X2!de!McNemar:!}K? = !!!m!siempre!se!utiliza!con!1!grado!de!libertad.!
kJñ
!
Pero!esto!de!poco!nos!sirve,!hay!que!construir!el!IC!para!saber!que!fármaco!elegir:!
1
F? − FK + yå µ + 8!
?*
%
Si!hay!poco!n!(no!hay!uno!concreto)!se!utiliza!la!corrección%por%continuidad:!
µ−8 −1 ?
!
µ+8
!
!
!
*Anexo%a%temas%anteriores:!
Para! n! grande,! la! potencia! estadística! es! grande! y! las! pequeñas! diferencias! se! vuelven!
significativas,!es!decir,!el!pfvalor<α,!por!lo!que!se!rechaza!la!H0.!
!
C.!Pruebas!de!relación!+.!
1.!Nominal!x!ordinal.!!
®%Jidcuadrado%de%tendencia%lineal.d>Solo%saber%cuándo%elegir%y%cómo%interpretar.%
Nos! indica! si! existe! una! tendencia! lineal! o! de! cambio! (crecimientofdecrecimiento)! de! una!
variable!respecto!a!otra.!En!Rstudio!se!pide:!prop.trend.test.!
Ej:!fumadores!según!la!clase!social.!!
!
En!la!primera!se!puede!pensar!que!hay!correlación!
y!en!la!segunda!no!pero!realmente!no!se!sabe!
%
%
2.! Ordinal!x!ordinal!!
Correlación%no%paramétrica%(Spearman)%d>no%veremos%este%curso.!
!

32!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

!! TEMA%6,%8%Y%9:%INFERENCIA%CON%MEDIAS%
!
! !!!!!!!!Cuantitativa!
!
!!!!!!!!!!!!!!!!!!!!Muestras!independientes! ! ! !!!!!!!!!!!!!Muestras!relaccionadas! !
!

!!!!!!!!!!!!!2!grupos!!!!!!!!!!!!!!!!!!!!!!!!!≥2!grupos! !!!!!!!!!!!!!!!!!!2!grupos!!!!!!!!!!!!!!!!!!!!!!!≥2!grupos!

! ANOVA!de!
ANOVA!o!la!alternativa!
! no!paramétrica:!test! medidas!repetidas!
KrustalfWallis! o!su!alternativa!no!
! paramétrica:!!!!!!!
Test!de!Friedman!
!
N≥30!!!!!!!!!!!!!!!!!!!N<30!
n1!y!n2≥30!!!!!!!!!!!!!!!!!n1!y!n2≥30!
Tfstudent!!!!!!!!!!!!!
¿Normalidad?! ! ¿Normalidad?!
¿variables!!!
!
homogéneas? ! ! !
?!
! Sí!!!!!!!!!!!!!!!!!!!No! Sí!!!!!!!!!!!!!!!!!!!No!
Sí!!!!!!!!!!!!!!!!!!!!No!
!
Transformar!a!normal! Transformar!a!normal!
Estadístico!
!
con!la!tf !
!
!
student,!un! Sí!!!!!!!!!!!!!!!!!!!!!No!
Sí!!!!!!!!!!!!!!!!!!!!!No!
grado!de!
!
libertdad!y!
la!cuasif! Mismo! U!de!ManfWhitney! Test!paramétrico!de!
varianza! estadístico,! (compara!distribuciones! Wilcoxon!
!
ponderada! pero!con!la! de!datos)!
! corrección! !
de!Welch!
! en!los!
grados!de!
!
varianza!!
!

33!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

Esquema%más%limpio%

%
Más!de!2!grupos!
!
Análisis!de!varianzas!(ANOVA)!
Si!no!se!cumplen!las!condiciones!de!uso!del!ANOVA!se!usa!el!test!de!Kriskal!Wallis!
%

A.%Prueba%de%conformidad%(+)%%
1.!Valor!de!referencia!(valor!teórico).!
B.%Pruebas%de%homogeneidad%(+):%Trabajando%con%2%o%más%medias.%
1.% Dos% grupos.! Contraste! y! construcción! de! IC! de! la! diferencia! (aplicación! del!
apartado!2).!
1.1!tHstudent!para!dos!muestras!independientes.!
Se!pregunta!si!la!varianza!tiene!homogeneidad:!
î∂ : >K? = >?? ! Homogeneidad!de!varianza!
îK : >K? ≠ >?? !
!
La!varianza!en!sí!no!la!conozco,!pero!si!tengo!las!varianzas!muéstrales!por!lo!que!puedo!
utilizar!2!test!para!ver!si!tienen!homogeneidad!(H0!:!S12!=!S22!y!H1:!S12!≠!S22):!
•! Test!de!Bartlet:!muy!bueno!cuando!sigue!una!distribución!normal.!
•! Prueba!de!Levenne!
!
®!Varianzas!homogéneas!
Ix iK ∙¢xÅ J(IÅ iK)∙¢ÅÅ
Utilizaremos!la!cuasivarianza!ponderada:!D∗? = !
Ix iK J(IÅ iK)
!
Estadístico:!
Para!hacer!el!IC:!
px ipÅ
Núíí†ï© = x x
!!!!!!!!,!con!σ=n1+n2f2! 1 1
ì∗ J #K − #? ± Nå,∫KJ∫?i? ªD∗? ( + )!
*1 *2 *1 *2
?

! 34!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

®!Varianzas!no!homogéneas!
Aunque!es!necesario!corregir!los!grados!de!libertad!mediante!la!corrección!de!Welch,!que!
obviamos!y!utilizaremos!como!grado!de!libertad:!n1+n2f2!

#K − #?
Nìïúj°jóï = !
AK? AK?
*1 + *2

1.2!tHstudent!para!dos!muestras!relacionadas!(datos!emparejados).!
Aquí!ya!no!se!habla!de!n1!ni!n2!porque!son!un!conjunto,!se!habla!por!tanto!de!N.!

Ej.!Exposición!a!contaminante!en!un!año:!

ID! T0! T1! T1fT0!


1! 45! 47! +2!
2! 77! 89! +12!
3! 42! 54! +12!
4! 53! 52! f1!
! …! …! …!
! ºN:! ºN1! ºN1 − N0!
! S! S’! S’fS!
!
#©@o − 0
î∂ : PΩæV = 0! NIiK = !
D©@o /√*
îK : PΩæV ≠ 0!
! !
Este!estadístico!responde!a!si!ha!habido!un!cambio!en!el!tiempo.!La!Xdif,!se!construye!con!
la!diferencia!de!medias,!pero!la!variación!no!se!puede!calcular!así.!

2.%Más%de%2%grupos.%
2.1!Muestras!independientes.!
®!Un!factor:!ANOVAfuna!vía.!
Grupos! #H ! AH ! *!
Alkins! 6,4! 8,8! 40!
Zone! 5,1! 12,5! 40!
Weight!Watchers! 5,2! 12! 40!
Vegetariana! f1,1! 9,3! 40!
#"N:N4û! 3,9! ! !
!
Se!puede!hacer!por!comparación!múltiple!pero!aumenta!el!error!de!tipo!I!(α↑),!por!lo!que!se!
construye!un!α!corregido!α’=α/c!(método!de!Bonferri).!Cuando!hay!muchos!contrastes!se!
acaba!por!no!rechazar!nada.!El!ANOVA!agrupa!todas!las!comparaciones!en!una!sola.!

35!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

îL : PK = P? = ⋯ P¡ = P!
îK : PH ≠ P!
!
Varianza:!
!
(nf1)S2=Σ(#K − #)2!
!
! Depende! de! lo! lejos! quue!
! estén! los! grupos! y! los! lejos!
! que! estén! los! sujetos! dentro!
! de! su! grupo! (componente!
! entre!grupos!e!intragrupos).!
!
!
(#K − #)2:!SCT=!SCE+SCR!
SCT:!suma!de!cuadrados!total!
SCE:!suma!de!cuadrados!entre!grupos!(factorial)!
SCR:!suma!de!cuadrados!intragrupal!(residual)!
!
! Ν!(grados! !
Datos! S2! Varianza!
de!libertad)!
¬ I±
DBƒ
SCT! (#@H − #H )? ! (√ − 1)D ? ! Nf1! ! VTOTAL!
√−1
HhK @hK
¬

(#H − #H )? !
K(grupos)f DBE
SCE! HhK f! ! VE!
1! ≈−1
La!distancia!del!grupo!como!
tantos!elementos!tengo!
¬ I±
¬
(#@H − #H )? ! DBR
SCR! HhK @hK (*H − 1)DH ? ! NfK! ! Vr!
La!distancia!de!cada!elemento!a!la! √−≈
HhK
media!que!los!engloba!
!
l∆
ANOVA!quiere!ver!que!varianza!pesa!más!por!lo!que!hace!una!relación:!!!!! ~q¬iK,Ii¬ !

Esta! distribución! F! tiene! 2! tipos! de! grados! de! libertad! uno! del! numerador! y! otro! del!
denominador.! En! esta! distribución! necesitamos! coordenadas! para! ubicar! los! puntos:! Xij! m!
siendo!j=1….k!(grupos)!y!i=elementos.!
!
↑Ve!↓Vr!=!↓pfvalor!(si!aumenta!el!área!comprendida!el!pfvalor!
será!más!bajo),!y!al!revés:!↓Ve!↑Vr!=!↑pfvalor!
!
La! tabla! de! F! aparece! en! las! columnas! los! grados! del!
numerador! y! en! las! filas! los! del! denominador! y! ya! están!
hechas!para!un!determinado!grado!de!significancia.!

36!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

(a)!Comparación!entre!grupos:!
El!ANOVA!utiliza!una!serie!de!contrastes!entre!grupos:!

(i)! Pruebas!a!priori!!
Son!kf1!contrastes!planificados!antes!del!ANOVA.!Tienen!una!serie!de!
condiciones:!
!! Si!está!bien!hecho!no!es!necesario!penalizar,!ya!que!no!se!infla!α,!
es!decir,!hablamos!de!ortogonalidad.!
!! Sólo!se!pueden!hacer!kf1!contrastes.!
!
(ii)! Pruebas!postfhoc!o!a!posteriori:!!
Sólo!se!realizan!cuando!el!ANOVA!ha!salido!significativo.!

!! Se!pueden!realizar! !contrates.!
2
!! Se!penaliza.!
Dentro!de!este!tipo!de!pruebas!se!utiliza!el!método!de!Bonferroni.!

!(b)!Método%de%Bonferroni!para!comparaciones!múltiples!
Este! método! corrige! la! inflación! de! α! de! dos! formas! (hay! que! elegir!
una):!
!! õñ(ñí°°ï @©í) = õ B"(*"º"21"8:*N54AN1A),!aunque!es!más!correcto!
x
utilizar!õñ = 1 − (1 − õ)À !
!! 9ñ = 1 − (1 − 9)ñ !
Este! método! penaliza! tanto! que! si! hay! muchos! contrastes! deja! de!
encontrar!diferencias!significantes!por!lo!que!se!han!creado!otros!que!
corrigen! esto:! Holm,! Sidat,! Tamhane,! Scheffé,! Dummet,! Student!
Newman!Kouts!(SNK),!Tukey…!
!
(b)!Obtención!e!interpretación!del!estadístico!de!contraste.!
Se! construye! un! sistema! de! pesos! para! enfrentar! las! medias,! en! el! que! uno!
llevará! un! número! contrario! a! los! otros! y! cuya! suma! de! pesos! tiene! que! ser! 0!
para! que! esté! compensado.! Para! que! se! cumpla! el! principio! de! ortogonalidad!
las! tablas! tienen! que! cumplir! otra! condición,! los! productos! verticales! sumados!
también!tienen!que!dar!cero.!Si!es!ortogonal!no!es!necesario!corregir!el!pfvalor.!

! Ej.!C!entre!μ1!y!μ2+3m!C!entre!μ2!y!μ3.!En!ambos!la!H0:!μ=μ’!

! 1! 2! 3! !
C1! f2! 1! 1! 0!
C2! 0! f1! 1! 0!
! 0! f1! 1! 0!
!
Si!es!ortogonal!no!hace!falta!corregir!el!pfvalor.!
!

37!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

Con!todo!esto!podemos!hacer!el!estadístico!de!contraste!para!cada!uno!de!los!
contrastes:!
ñ p±
N= !!!!!m!siendo!SR!la!varianza!residual!y!los!grados!de!libertad!nfk!
Å∙
ñÅ
ì« I±

!
Si!el!pfvalor!es!>0,05!el!resultado!no!es!significativo,!pero!si!es!<0,05!se!puede!
afirmar!que!hay!una!diferencia!explicable!entre!los!grupos!del!contraste.!
!
(c)!Condiciones!de!aplicación!
•! Las!observaciones!han!de!ser!independientes!entre!sí.!
•! La!distribución!de!las!variables!tiene!que!ser!normal.!Los!más!importante!es!
que!los!residuales!(distancia!entre!lo!que!observo!y!lo!que!espero)!sigan!esta!
distribución.!
•! Ha!de!haber!homogeneidad!de!varianza!(homocedasticidad).!
•! Los!grupos!tienen!que!tener!el!mismo%tamaño%muéstrales!o!al!menos!no!
muy!diferentes!(diseño!equilibrado/balanced).!

Esta!es!una!técnica!robusta,!es!decir,!aunque!no!se!cumplan!las!condiciones!de!
aplicación!se!puede!usar!sin!cometer!mucho!error.!Si!todas!las!condiciones!son!
antagónicas!(ni!normalidad,!ni!homocedasticidad!y!es!un!unbalanced),!se!utiliza!un!
test!no!paramétrico:!test!no!paramétrico!de!KruskalfWallis.!

!
®!2!o!más!factores:!ANOVA!factorial!(no!entra).!
2.2!Muestras!relacionadas!(no!entra).!
®!ANOVA!de!medidas!repetidas.!
!
!
D.% Alternativa%no%paramétrica%(saber%cuándo%aplicar).%
1.! tfstudent!para!dos!muestras!independientes→!U%ManndWhitney.!
Se!asignas!rangos,!es!decir,!se!ordenan!los!datos!de!menor!a!mayor!y!se!les!asigna!un!
rango!(posición!que!ocupe).!De!esta!forma,!se!pierde!la!influencia!de!los!valores!extremos!
que!arrastran!la!media.!
Inicio! !!!!!!!Orden!!!!!!!!!!!!Rango! !
1! ! 1!! ! 1! !
17! ! 3! ! 2,5! Si!hay!2!o!más!valores!iguales!se!hace!la!media!
25! ! 3! ! 2,5! para!que!todos!ellos!tengan!el!mismo!rango!
3! ! 17! ! 4!
!
80! ! 25! ! 5!
27! ! 27! ! 6! !
3! ! 30! ! 7!
!

38!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

El!estadístico!usando!los!rangos!sería:!
*K (*K + 1)
bK = *K *? − RK !
2 Para!facilitar!los!cálculos!lo!haremos!
*? (*? + 1) con!un!estadístico!diferente.!
b? = *K *? − R? !
2
!
Se! colocan! los! datos! en! orden! descendentes,! luego! se! comparan! los! valores! de! una!
columna! con! la! otra! para! comprobar! cuantas! veces! es! mayor! que! los! valores! de! la! otra!
(desviación:! posibilidades! de! ser! mayor! los! valores! de! la! columna! 1! con! la! columna! 2! y!
viceversa)!y!luego!se!hace!con!la!otra!variable/columna,!se!suman!los!resultados.!Si!estos!
no! coinciden! con! las! posibilidades! de! ser! mayor! se! debe! a! los! empates.! Para! observar!
estos!empates!nos!que!elegimos!una!columna!y!después!se!reparten!los!empates!entre!las!
2! a! partes! iguales.! Finalmente! calculo! una! de! las! cantidades! (U1! y! U2)! y! se! construye! el!
estadístico:!
/ /
Õx (íkìï°üj©í)i x Å (ïìúï°j©í)
Å
↝ y!!!!realmente!sólo!sigue!una!Z!cuando!el!tamaño!!
Ix IÅ (Ix JIÅ JK)/K?
!!!!!!es!razonable!ya!que!tiene!su!propia!distribución.%%
%
Las!hipótesis!que!pretende!resolver!este!estadístico!son:!
Ix IÅ
H0:!todas!las!desviaciones!son!iguales!en!los!dos!grupos,!es!decir:!bK = = b? !
?
Ix IÅ
H1:!bK ≠ ≠ b? !
?
!
!

2.! tfstudent!para!dos!muestras!relacionadas→!Wilcoxon!(rangos!con!signo).!
Se!hallan!las!diferencias,!después!se!hace!su!valor!absoluto!(│dif│)!y!se!ordenan!de!menor!
a!mayor.!Después!se!les!asigna!un!rango!(positivo!o!negativo)!dependiendo!del!signo!para!
IJK
ver!su!posición!real.!Se!suman!todas!las!posiciones!numéricas!de!los!rangos!(* ∙ ),!es!
?
decir,!la!suma!de!los!términos!de!una!sucesión!aritmética!de!distancia!1,!desde!el!1!hasta!
n,!sin!tener!en!cuenta!las!diferencias!que!valen!0.!
!
Nos!fijamos!en!el!R+!que!tomaremos!como!lo!observado!y!le!restamos!lo!esperado!(½!para!
(IJK)
R+!y!½!para!Rf),!es!decir,! RJ − * !y!lo!dividimos!por!el!error!estándar!construyendo!el!
Œ
estadístico:!

(* + 1)
RJ − * " Si!n!es!muy!pequeño!<8!parejas!se!utiliza!la!
œ= 4 ↝ y!
*(* + 1)(2* + 1)/24 distribución!original.!

39!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

!
3.! ANOVA!de!una!vía→!KruskaldWallis.!
Se! ordenan! los! datos! de! mayor! a! menor.! Se! hayan! los! rangos! medios! del! grupo!
correspondiente!(Rangmed.j).!Todos!los!rangos!de!cada!grupo!se!suman!y!se!dividen!por!el!
n! del! grupo,! esto! será! lo! observado.! Después! se! halla! el! Rango! total! medio,! se! suman!
todos!los!rangos!de!todos!los!grupos!y!se!divide!por!N,!siendo!lo!esperado.!Finalmente!se!
divide!por!el!error!estándar!para!construir!el!estadístico:!
¬
(R4*“”ï©"H − R4*“óíój†"”ï©@íì )? ?
*—" ↝ }¬iK !
HhK
√(* + 1)/12

!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
!
40!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

!! TEMA%7:%CORRELACIÓN%Y%REGRESIÓN%LINEAL!
Una! multivariante! son! varias! variables! que! se! relacionan! entre! sí.! ! ! !!!!Y!
Nosotros!sólo!analizaremos!relaciones!entre!variables!cuantitativas! !
discretas,!entre!las!que!esperamos!que!exista!una!tendencia!lineal.! ! X!
!
Para!analizar!cómo!de!relacionadas!estás!las!2!variables!se!construye!un!estadístico!que!
se!basa!en!la!covarianza,!ya!que!lo!que!se!analiza!es!como!covarían!los!valores!y!no!como!
como!concuerdan:!
(#@ − #)(’@ − ’)
àp‘ = !

!
Este!estadístico!nos!permite!calcular!el!coeficiente!de!correlación!lineal.!
!
1.% ¿Qué%es%y%para%qué%sirve%la%correlación%lineal?%
La!correlación!lineal!busca!relaciones!lineales!no!curvilíneas,!no!analiza!como!concuerdan!
los!valores!sino!como!covarían.!Solo!se!puede!asegurar!la!correlación!entre!el!máximo!y!el!
mínimo!valor!de!la!muestra,!es!decir,!sólo!en!los!datos!que!poseemos,!no!más!allá!de!la!
curva.!Que!sea!lineal!significa!que!estos%modelos%lineales%cuantifican%como%se%ajustan%
los%puntos%a%una%recta.%
!
Se!utilizan!las!gráficas!de!dispersión.!!
!
El%objetivo%de%la%correlación%no%es%estimar%X%a%partir%de%Y%si%no%buscar%la%relación%
entre%X%e%Y.%
!
Condiciones!de!uso!
Al!ser!cuantitativa!discreta!se!utiliza!el!coeficiente!de!correlación!lineal!de!Pearson!
(r).!
Debe!haber!normalidad!en!los!datos!
Deben!ser!independiente:!no!pueden!ser!autoemparejamientos!ni!estar!una!variable!
contenida!dentro!de!otra.!
!
Como!hemos!dicho,!el!cálculo!de!este!estadístico!se!basa!en!la!covarianza!mide!como!
varía!X!a!partir!de!Y.!
!
Dependiendo!del!resultado!diferenciaremos:!
•! Relación%directa:!la!covarianza!es!+,!al!aumentar!X!aumenta!Y!
•! Relación%inversa:%la!covarianza!es!–,!al!aumentar!X!disminuye!Y!
!
!
!
!
!
!

41!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

El! coeficiente! de! correlación! lineal! de! Pearson! (r)! cuantifica! la! intensidad! en! la! que! los!
puntos!se!ajustan!a!una!recta!o!lo!que!es!lo!mismo,!entre!la!relación!de!x!e!y:!
I
Dp‘ Dp‘ @hK yp@ y‘@ (#@ − #)(’@ − ’)
5= = = ,""""A31*2:"Dp‘ = !
? ?
Dp − D‘ *−1 √−1
Dz − D‘
!
R!es:!
Como!vemos!r!es!el!resultado!de!dividir!la!covarianza!entre!el!producto!de!las!varianzas!
como!la!tipificación!de!los!dos!valores!entre!nf!1.!
Es!adimensional!
Está%entre%d1%y%1%
Mide!solo!relaciones!lineales!
Es!bidireccional!(lo!que!dice!de!X!en!función!de!Y!lo!dice!de!Y!en!función!de!X)!
!
El%resultado%se%lee:!
! +!→!relación!directa,!x↑!y↑!
"! Signo!
! f!!→!relación!inversa,!x↑!y↓!
!
!
! Relación!débil!
! 0.3! !
"! Magnitud!! Relación!moderada!
! 0.7 !
! .! Relación!fuerte!
!
!
"! Significación:! sirve! para! demostrar! que! la! relación! no! es! fruto! del! azar,! si! no! que!
corresponde!a!la!población.!No!hace!falta!hacerlo!mediante!el!siguiente!contraste!de!
hipótesis,! pero! con! él! obtendremos! el! mismo! pfvalor! que! en! el! siguiente:!!!!!!!!!!
°
NIi? = ! H0:!p=0!
x÷/Å
/÷Å H1:!p≠0!
!
!
!
También!existe!una!r!transformada!o!r!Fischer!con!la!que!se!puede!calcular!lo!mismo,!pero!
con! otros! algoritmos,! con! la! ventaja! que! se! puede! hacer! un! IC! pero! un! contrate! de!
hipótesis.!
!
!
!
!
!
2.% ¿Qué%es%y%qué%busca%la%regresión%lineal?%
42!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

Modelizar! la! relación! entre! dos! variables! cualitativas! (variable! independiente/! predictora! y!
variable!dependiente/desenlace).!
!
Predecir!a!partir!de!la!variable!dependiente!la!independiente.!
Al!ser!relación!lineal!lleva!como!ecuación!la!de!una!recta!y!=!a!+!bx1.!Pero!a!esta!recta!hay!
que!añadirle!un!error!estadístico,!cuantas!más!variables!se!contemplen!menos!error!habrá!
(bx2,!bx3,!bx4…)!
!
Se!busca!la!recta!que!mejor!explique!una!gráfica.!
Para! ello! interesan! 3! valores:! y! observada! –! y! predicha,! y! predicha! –! la! media! de! y! e! y!
observada!–!la!media!de!y.!Si!la!situación!fuera!perfecta!y!observada!–!y!predicha!sería!0.!
ì◊
Aunque!esto!se!puede!abreviar!del!siguiente!modo:µp→‘ = 5 !
ìw
La! pendiente! (b)! es! la! covarianza/varianza! de! x.! Esta! pendiente! nos! da! el! coeficiente! de!
regresión!en!el!que!cuantifico!como!crece!la!variable!y!por!cada!unidad!de!la!variable!x.!
!
!
Con!b!y!r!podemos!hacer!un!contraste!de!hipótesis!y!un!IC!para!comprobar!si!existe!una!
relación!entre!X!e!Y:!
îL : ÿ = 0!(que!la!influencia!de!X!sobre!Y!sea!nula!o!que!sólo!se!explique!por!el!azar)!
îK : ÿ ≠ 0!
!
Para! hallar! el! error! de! este! estadístico! necesitamos! la! varianza! residual! (S2Res)! (nos! la!
Å
¢«∆Ÿ
darían!ellos!con!el!ANOVA!de!regresión):!!!!EEk = !
¢Uw
!
k
De!esta!forma!el!estadístico!de!la!regresión!lineal!es!el!siguiente:!NIi? = !que!nos!daría!
⁄⁄¤
el!pfvalor!para!el!contraste!de!hipótesis!anterior.!Aunque!también!se!puede!realizar!un!IC:!
SB 1 − õ : µ ± Nå,Ii? ∙ EEk !
?
!
A!la!hora!de!construir!un!modelo!de!regresión,!podemos!introducir!una!variable!cualitativa!y!
no! hacer! el! ANOVA.! En! regresión! se! puede! introducir! otra! variable! como! variable!
independiente:!
Coeficiente%de%determinación%R2:!cuanto!más!alto,!mayor!ajuste!a!la!recta.!
DB°ï °ïì@óI
R? = !
DB‹íój†
!
Este!resultado!muestra!el!porcentaje!que!explica!el!aumento!del!promedio!de!una!variable!
sobre!la!evaluación!del!promedio!de!la!otra!variable.!
!
!
!
!! TEMA%10:%INTRODUCCIÓN%AL%MUESTREO%

43!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

Con!él!pretendemos!responder!2!preguntas:!!
"! ¿A!quién!cojo?!
"! ¿Cuántos!cojo?!
!
!
Utilizan!una!unidad!de!análisis!y!unidades!de!muestreo.!Ambas!pueden!o!no!coincidir.!
Definiciones:%
!! Unidad% de% muestreo:! Elementos! que! constituyen! una! población,! que! no! están!
solapados!(cada!elemento!no!puede!pertenecer!a!dos!unidades!de!muestreo)!y!sobre!
los!que!vamos!a!realizar!el!muestreo.!
!! Unidad%de%análisis:!Unidad!de!la!población!de!la!que!se!quiere!recoger!la!información.!
!! Marco% muestral:! Listado! de! todas! las! unidades! de! muestreo! que! componen! la!
población!para!elegir!entre!ellas.!
!! Muestra:!Conjunto!representativo!de!la!población.!
!
El! objetivo! es! construir! una! muestra! que! sea! fiable! y! representativa.! Cuando! quiero!
analizan! relaciones! podemos! perder! un! poco! de! esa! representatividad.! Sin! embargo,!
cuando!queremos!describir!es!muy!importante.!
!
1.% Métodos%de%muestreo%
Diferenciamos!2!métodos!principalmente:!
•! Muestreo%probabilístico:!los!elementos!tienen!una!probabilidad!conocida!de!entar!
en! mi! muestra.! El! principal! problema! de! estos! muestreos! es! que! los! grupos!
pequeños!o!tienen!suficiente!representación.!
!
•! Muestreo% no% probabilístico:% no! conozco!que! es!lo! que! ha! determinado! que!unos!
sujetos!hayan!acabado!en!mi!muestra.!El!principal!problema!de!estos!muestreos!es!
que! tiene! importantes! sesgos! pues! no! hay! la! misma! probabilidad! de! que! salga! un!
individuo!(no!sirve!para!la!representatividad).!
!
!
1.2.% Muestreo%probabilístico%
o! Muestreo%aleatorio%simple%(M.A.S.):!todos!los!sujetos!tienen!la!misma!probabilidad!de!
entrar.!Esto!es!problemático!con!grupos!poco!numerosos.!Y!si!la!población!es!grande!y!
está!dispersa!es!difícil!recoger!información!sobre!ella!(↑coste!pues!hay!que!reconocer!
mucho!espacio).!
!
o! Muestreo% aleatorio% estratificado% (M.A.E.):! se! define! un! estrato! en! función! de! una!
variable! que! queremos! que! quede! bien! representada,! es! decir,! se! estratifican! las!
variables.! Para! ello! se! necesita! conocer! la! variable! de! estratificación! (antes! de! hacer!
selección,! voy! a! conocer! los! sujetos),! después! se! baja! a! un! nivel! más! concreto! y! se!
hacen!muestras!aleatorias!simples.!!
!

44!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

Ej.!si!tengo!una!característica!poco!frecuente!(sólo!un!sujeto)!no!entrará!en!mi!muestra!y!
no! conoceré! su! existencia.! Entonces,! hago! muestreos! aleatorios! simples! dentro! de! otros!
muestreos!para!conseguir!que!se!vea!esa!característica:!
! !!!!!!!!!!!!xxxxxxxxxx!!!xx!
! f!MAS:!xxxx!
! f!MAE:!xxxxxxxxxx!!!!xx!
!
! ! !!!!!!MAS!!!!!!!!MAS!
!
!
#! Proporcional:!la!proporción!que!suponen!los!sujetos!poco!frecuentes!representa!
la!misma!proporción!en!la!población:!
#! No%proporcional:!cuando!se!sobrerrepresenta!un!grupo!o!varios.!
!
!
!
Ejemplo!de!muestreo!estratificado:!
!
!
%!que! %!que!
Fracción! Fracción!
Nº!de! N! suponen! N! suponen! Coef.!de!
Medio! de! de!
médicos! reclutado! en! reclutado!! en! ponderación!
muestreo! muestreo!
muestra! muestra!
Urbano! 230! 20%! 46! 56.1%! 20%! 46! 40.35%! 1.39!
Semiurbano! 160! 20%! 32! 39.02%! 30%! 48! 42.1%! 0.927!
Rural! 20! 20%! 4! 4.88%! 100%! 20! 17.54%! 0.278!
!
!
!
!
Proporcional! (igual! de! No! proporcional! (da! Dar! más! y! menos! peso!
!representados!que!en!la! más!al!que!era!pequeño! según! hayan! estado! más!
!
población).! para! que! se! tenga! en! representados!(menos!peso,!
! cuenta).! menos! coeficiente)! o! menos!
! (más!coeficiente).!
!
!
!
!
!
!
!
!
!

45!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

o! Muestreo%poliepático%(conglomerado):!divide!las!unidades!de!muestreo,!tiene!etapas!
de!muestreo.!En!el!caso!que!las!unidades!muéstrales!son!más!homogéneas!que!en!la!
población,!se!cogen!más!para!que!represente!la!heterogeneidad!de!la!población.!!
%
Ej:!para!analizar!alumnos!coges!clases,!curso!y!grado.!
1º!Sujetos!muy!dispersos!
2º!No!tengo!el!listado!de!los!individuos!(alumnos,!pero!si!de!las!unidades!muéstrales!
(clases,!curso,!grado).!!
!
Ej.2:!infartos!en!hospitales!en!España:!
! 1ª!etapa:!nº!de!camas/tamaño!del!hospital!(MAE).!
! 2ª!etapa:!unidad!cardio!o!medicina!interna!(MAE).!
Si!selecciono!uno!de!los!dos!solo!es!poliepático,!
si!cojo!los!2!es!un!conglomerado.!
!
!
o! Muestreo%sistemático:!se!divide!el!tamaño!de!la!población!a!muestrear!por!el!tamaño!
muestral!deseado,!lo!que!se!le!denomina!razón%de%muestreo.!El!punto!de!inicio!debe!
ser! aleatorio! y! se! va! saltando,! así! se! analiza! todo! en! conjunto.! Pega:! si! la! razón! de!
muestre!coincide!con!cierta!periocidad!en!la!pauta!causa!error.!
!
Ej:!necesitas!25!personas!de!50!que!hay!en!la!población!accesible.!Haces!la!fracción!
de!muestreo!25/50!=!2!y!coges!un!número!al!azar!(el!27),!ordenas!a!los!individuos!por!
un! criterio! aleatorio! y! coges! al! número! 27! y! cuentas! tanto! como! te! de! la! fracción! de!
muestreo!y!coges!al!siguiente!individuo.!
!
!
1.2.% Muestreo%no%probabilístico%
El!principal!problema!de!estos!muestreos!es!que!tiene!importantes!sesgos!pues!no!hay!la!
misma! probabilidad! de! que! salga! un! individuo.! Hay! que! evitarlos! sobre! todo! si! hacemos!
descripciones.!
!
o! Voluntarios:%está!en!parte!condicionado,!ya!que!refleja!a!la!gente!voluntaria!que!suele!
tener!unas!características!diferentes!al!resto.!Ej.!ensayos!en!fase!II.%
%
o! Casos%consecutivos:%se!seleccionan!según!van!llegando!y!cumple!los!requisitos.!No!
tiene!en!cuenta!el!momento.!Ej.!todos!los!que!van!a!consulta!el!lunes.%
%
o! Conveniencia:%cojo!a!quien!me!dé!la!gana!porque!me!conviene.%
%
o! Bola% de% nieve:% en! pacientes! con! estas! características! que! conoce! a! alguien! con!
características!similares,!que!conoce!a!otro!y!ese!a!otro….%
%
%

46!
!
Bioestadística! ! Arturo!Toledo!Gutiérrez!

2.% Predeterminación%del%tamaño%muestral%
Sirve!para!decidir!cuanta!gente!cogemos!en!la!muestra.!
!
La!predeterminación!de!n!se!debe!a!un!efecto!a!detectar!y!estableciendo!α!y!β,!con!lo!que!
se! podría! demostrar! la! hipótesis! nula.! Para! esto! se! parte! de! resultados! de! estudios!
anteriores.! Normalmente! hay! varias! comparaciones! por! lo! que! se! coge! el! máximo! n!
necesitado.!
!
Luego%se%debe%conocer%de%antemano:%
!! La%magnitud%del%efecto%(que%se%saca%del%estudio%piloto%y%la%bibliografía)%
!! Fijar%los%errores%tipo%I%y%II%
!! Varianza%de%la%variable%o%p%x%q%
!! Si%se%va%hacer%un%contraste%unilateral%o%bilateral%
!! Definir%la%tolerancia%o%i%(cuanto%se%va%a%dejar%oscilar%el%parámetro).%
!
Mediante! una! fórmula! te! sale! n! como! las! que! veremos,! aunque! ambas! están! pensadas!
para!M.A.S.:!
!
En!el!caso!de!la!media:!con!α=0.05!y!una!tolerancia!o!precisión!del!±0,5%.!
å ? ? . > ?
# ± å ? . > ; """"""3 = å ? . > ? > ?
; """""""3 = å ? . ( *) ; """""""* = !
* * 3?
!
En!el!caso!de!la!proporción:!
?
9. t å ? . 9. t
9 ± å ? . ; """"""* = !
* 3?
!
Luego:!
P∂ + å ? . EE©” = Pï + fi . EE©” !
Pï − P∂ = (å ? − fi )EE©” !

2> ?
Pï − P∂ = (å ? − fi ) !
*

?
2> ?
Pï − P∂ = (å ? − fi )? !
*
!
(å ? − fi )? . 2> ?
*= ?
!
Pï − P∂
!
!
↑efecto!↓n!!!!!!!!!!!!!!↑dispersión!↑n!!!!!!!!!!↑1fβ!↑n!!!!!!!!↑α!↑n!
!
Para!estimarlo:!calculadoras!en!internet:!GRAMO!

47!
!

También podría gustarte