Está en la página 1de 20

Joaqun Toms-Sbado

Fundamentos de bioestadstica
y Departament
anlisisdedeComunicaci
datosAudiovisual
para enfermera
i de Publicitat
Escola Universitria dInfermeria i de Fisioterpia Gimbernat
Escola dInfermeria

Universitat Autnoma de Barcelona


Servei de Publicacions
Bellaterra, 2009

Primera edicin: diciembre de 2009

Edicin e impresin:
Servei de Publicacions
Universitat Autnoma de Barcelona
Edifici A. 08193 Bellaterra (Barcelona). Spain
sp@uab.cat
http://publicacions.uab.cat/
Impreso en Espaa. Printed in Spain
Depsito legal: B. 47.850-2009
ISBN 978-84-490-2616-4

Fundamentos de bioestadstica y anlisis de datos para enfermera

ndice

Trivium

Presentacin ..........................................................................................................

Tema 1. Introduccin conceptual e histrica ................................................


1.1. Estadstica. Concepto y definicin ................................................................
1.2. Concepto de bioestadstica ............................................................................
1.3. reas de la estadstica ....................................................................................
1.4. Estadstica descriptiva (deduccin) ...............................................................
1.5. Estadstica inferencial o analtica (induccin) ...............................................
1.6. Estadstica. Desarrollo histrico ....................................................................
1.6.1. John Graunt (1620-1674) .....................................................................
1.6.2. Johann Carl Friedrich Gauss (1777-1855) ...........................................
1.6.3. Jacques Quetelet (1796-1874) ..............................................................
1.6.4. Francis Galton (1822-1911) .................................................................
1.6.5. Florence Nightingale (1820-1910) .......................................................
1.6.6. William Sealey Gosset (1876-1937) ....................................................
1.6.7. Ronald Fisher (1890-1962) ..................................................................

13
13
14
14
14
14
14
15
16
16
17
18
19
19

Tema 3. Variables estadsticas y escalas de medida .......................................


3.1. Variables .........................................................................................................
3.2. Clasificacin de las variables..........................................................................
3.3. Variables cuantitativas ....................................................................................
3.3.1. Variables cuantitativas continuas..........................................................
3.3.2. Variables cuantitativas discretas...........................................................

25
25
25
25
25
26

Tema 2. Poblacin y muestra ..............................................................................


2.1. Conceptos preliminares ..................................................................................
2.2. Individuo.........................................................................................................
2.3. Universo..........................................................................................................
2.4. Poblacin ........................................................................................................
2.5. Muestra ...........................................................................................................
2.6. Muestreo .........................................................................................................
2.7. Muestreo aleatorio ..........................................................................................
2.7.1. Muestreo aleatorio simple ....................................................................
2.7.2. Muestreo aleatorio sistemtico.............................................................
2.7.3. Muestreo aleatorio estratificado ...........................................................
2.7.4. Muestreo aleatorio por conglomerados ................................................
2.8. Muestreo no aleatorio .....................................................................................
2.8.1. Muestreo no aleatorio accidental o incidental......................................
2.8.2. Muestreo no aleatorio intencionado .....................................................
2.8.3. Muestreo no aleatorio por cuotas .........................................................

21
21
21
21
21
22
22
23
23
23
23
24
24
24
24
24

Trivium

3.4.
3.5.
3.6.
3.7.
3.8.
3.9.
3.10.
3.11.
3.12.
3.13.
3.14.

aJoaqun Toms-Sbado

Variables cualitativas ......................................................................................


3.4.1. Variables cualitativas dicotmicas........................................................
3.4.2. Variables cualitativas politmicas ........................................................
Variables ordinales o cuasicuantitativas .........................................................
Variables independientes ................................................................................
Variables dependientes....................................................................................
Variables de confusin....................................................................................
Variables aleatorias y variables controladas ...................................................
Escalas de medida...........................................................................................
Escala nominal................................................................................................
Escala ordinal..................................................................................................
Escala de intervalo..........................................................................................
Escala de proporcin o razn..........................................................................

Tema 4. Clasificacin de los datos: tabulacin y representacin grfica


4.1. Tabulacin.......................................................................................................
4.2. Frecuencias y tablas de frecuencias................................................................
4.3. Tipos de frecuencias .......................................................................................
4.3.1. Frecuencias absolutas (fi) .....................................................................
4.3.2. Frecuencias relativas (hi) ......................................................................
4.3.3. Porcentajes (pi) .....................................................................................
4.3.4. Frecuencias absolutas acumuladas (Fi) ................................................
4.3.5. Frecuencias relativas acumuladas (Hi) .................................................
4.3.6. Porcentajes acumulados (Pi).................................................................
4.4. Representaciones grficas...............................................................................
4.5. Grficos: ventajas e inconvenientes................................................................
4.6. Construccin de grficos ................................................................................
4.7. Grficos vara variables cualitativas ................................................................
4.7.1. Diagrama de barras...............................................................................
4.7.2. Ciclogramas o sectores circulares ........................................................
4.7.3. Otros grficos para variables cualitativas.............................................
4.8. Grficos para variables cuantitativas continuas..............................................
4.8.1. Histogramas..........................................................................................
4.8.2. Grficos de caja (boxplot) ....................................................................
4.8.3. Polgonos de frecuencias ......................................................................
4.8.4. Curvas de frecuencias acumuladas.......................................................
Tema 5. Medidas de tendencia central ............................................................
5.1. La media aritmtica ........................................................................................
5.2. Propiedades de la media aritmtica ................................................................
5.3. Clculo de la media aritmtica .......................................................................
5.4. Clculo de la media aritmtica con los datos agrupados por frecuencias.......
5.5. Media ponderada ............................................................................................
5.6. Otras medias ...................................................................................................
5.6.1. Media geomtrica .................................................................................
5.6.2. Media cuadrtica ..................................................................................
5.6.3. Media armnica....................................................................................
5.7. La mediana......................................................................................................
5.8. Clculo de la mediana.....................................................................................
5.9. Clculo de la mediana con los datos agrupados por frecuencias....................
5.10. La moda ..........................................................................................................

26
26
26
27
27
27
27
27
28
28
28
28
29

31
31
32
32
32
32
32
33
33
33
34
34
34
35
35
37
37
38
38
38
39
40
41
41
41
42
42
43
44
44
45
46
47
47
47
48

Fundamentos de bioestadstica y anlisis de datos para enfermera

Trivium

Tema 6. Medidas de posicin: cuantiles ............................................................


6.1. Cuartiles..........................................................................................................
6.2. Deciles ............................................................................................................
6.3. Centiles o percentiles......................................................................................
6.4. Equivalencias..................................................................................................
6.5. Clculo de los cuartiles...................................................................................
6.6. Clculo de los deciles .....................................................................................
6.7. Clculo de los centiles ....................................................................................
6.8. Clculo de los cuantiles a partir de los porcentajes acumulados ....................

51
51
51
52
52
52
53
53
54

Tema 7. Medidas de dispersin ............................................................................


7.1. Amplitud o rango de la distribucin ...............................................................
7.2. Amplitud intercuartil ......................................................................................
7.3. Desviacin cuartil ...........................................................................................
7.4. Desviacin media............................................................................................
7.5. La varianza......................................................................................................
7.6. Propiedades de la varianza..............................................................................
7.7. Clculo de la varianza.....................................................................................
7.8. Clculo de la varianza con los datos agrupados por frecuencias....................
7.9. Desviacin tpica o desviacin estndar .........................................................
7.10. Propiedades de la desviacin tpica ................................................................
7.11. Coeficiente de variacin .................................................................................

55
55
55
56
56
57
57
58
59
60
60
60

Tema 9. Clculo de probabilidades ...................................................................


9.1. Experimentos y sucesos aleatorios ................................................................
9.2. Concepto de probabilidad .............................................................................
9.3. Conceptos bsicos ..........................................................................................
9.3.1. Espacio muestral ..................................................................................
9.3.2. Suceso ..................................................................................................
9.4. Propiedades de la probabilidad ......................................................................
9.5. Teoremas bsicos de la probabilidad .............................................................
9.5.1. Teorema de la probabilidad total o de la suma ....................................
9.5.2. Teorema de la probabilidad compuesta o del producto .......................

63
63
63
63
63
64
64
66
66
67

Tema 8. Medidas de forma ....................................................................................


8.1. Coeficiente de asimetra ................................................................................
8.2. Medidas de tendencia central y asimetra ......................................................
8.3. Curtosis o apuntamiento ................................................................................
8.4. Coeficiente de curtosis ...................................................................................

61
61
61
62
62

Tema 10. Distribucin de la probabilidad para variables continuas:


la distribucin normal ........................................................................................
10.1. La ley normal .................................................................................................
10.2. La curva normal tipificada .............................................................................
10.3. Aplicaciones de la curva normal ....................................................................

69
69
70
70

Tema 11. Distribucin de la probabilidad para variables discretas:


la distribucin binomial .....................................................................................
11.1. La ley binomial ..............................................................................................
11.2. Definicin de distribucin binomial ..............................................................
11.3. Aproximacin de la distribucin binomial a la distribucin normal .............

77
77
77
78

Trivium

aJoaqun Toms-Sbado

Tema 12. Introduccin a la estadstica inferencial ....................................


12.1. La inferencia estadstica ..............................................................................
12.2. Estimacin puntual e intervalos de confianza .............................................
12.3. Pruebas estadsticas inferenciales ................................................................
12.4. Contrastes de hiptesis y significacin........................................................
12.5. Hiptesis nula ..............................................................................................
12.6. Hiptesis alternativa ....................................................................................
12.7. Nivel de significacin ..................................................................................
12.8. El p-valor .....................................................................................................
12.9. Tipos de errores ...........................................................................................
12.10. Regin crtica y regin de aceptacin..........................................................
12.11. Contrastes de hiptesis bilaterales ...............................................................
12.12. Contrastes de hiptesis unilaterales .............................................................
12.13. Intervalo de confianza para una media ........................................................
12.14. Uso de intervalos de confianza para verificar hiptesis ..............................
12.15. Pruebas de contraste de hiptesis paramtricas y no paramtricas..............

Tema 13. Pruebas paramtricas ........................................................................


13.1. Prueba t de Student ......................................................................................
13.1.1. Prueba t de Student para una muestra..............................................
13.1.2. Prueba t de Student para dos muestras relacionadas
(datos apareados) .............................................................................
13.1.3. Prueba t de Student para muestras independientes ..........................
13.2. Anlisis de la varianza de un factor (ANOVA) ...........................................
13.3. ANOVA de medidas repetidas .....................................................................
13.4. Coeficiente de correlacin de Pearson.........................................................

Tema 14. Pruebas no paramtricas ...................................................................


14.1. Prueba de Kolmogorov-Smirnov para comprobar la normalidad................
14.2. Prueba ji cuadrado de Pearson (2) .............................................................
14.3. El coeficiente Phi.........................................................................................
14.4. Prueba V de Cramer.....................................................................................
14.5. Prueba para dos muestras independientes: la prueba U de Mann-Whitney.
14.6. Prueba para dos muestras relacionadas: la prueba de Wilcoxon ................
14.7. Prueba para tres o ms muestras independientes: el ANOVA
de Kruskall-Wallis .......................................................................................
14.8. Prueba para tres o ms muestras relacionadas: la prueba de Friedman.......
14.9. Coeficiente de concordancia W de Kendall.................................................
14.10. Coeficiente de correlacin de Spearman .....................................................

81
81
81
81
82
82
82
82
83
83
84
84
84
85
86
86
89
89
89

90
91
92
93
94

97
97
97
99
99
99
100
101
102
103
104

Preguntas verdadero-falso ............................................................................. 105


Preguntas de opcin mltiple .......................................................................... 121

Bibliografa ......................................................................................................... 145

Fundamentos de bioestadstica y anlisis de datos para enfermera

Presentacin

Trivium

La presentacin de este libro supone para m una gran satisfaccin, principalmente porque me ofrece la posibilidad de compartir todo lo que ha rodeado su origen. Es por esto
que quiero dirigirme especialmente a los estudiantes de la Escuela Universitaria de Enfermera Gimbernat, para hacerles partcipes de su backstage.
El libro que tenis en las manos nace de la inquietud del profesor Toms-Sbado por
ir ms all de la docencia cotidiana. En l encontramos la suma de varios factores que
hacen de este manual una herramienta imprescindible no slo para nuestros estudiantes,
sino para todo aquel que quiera introducirse de una forma sencilla en esta rea de conocimiento. Estos factores no son otros que los aos de experiencia docente enfocada hacia
las necesidades reales de los estudiantes en una materia ciertamente complicada en los
inicios de sus estudios, la motivacin personal por la mejora continua y por seguir ofreciendo refuerzo en el proceso de aprendizaje y, muy especialmente, la ilusin por el trabajo bien hecho.
La aparicin de un libro es siempre una buena noticia para todos, pero, en este caso,
especialmente para los estudiantes, puesto que, sin duda, este libro ser una gua de referencia y de apoyo metodolgico en su proceso de aprendizaje.
Quisiera hacer un ltimo agradecimiento, muy sinceramente, al profesor TomsSbado, por su implicacin en la mejora continua de nuestra institucin

Montserrat Antonn
Coordinadora de Titulacin
Escuela Universitaria de Enfermera Gimbernat

Perseveranter omnia
consequitur

Fundamentos de bioestadstica y anlisis de datos para enfermera

Tema 1. Introduccin conceptual e histrica

1.1. Estadstica. Concepto y definicin

Trivium

13

La estadstica puede definirse como la disciplina cientfica dedicada al tratamiento de la


informacin que contiene series de datos que proceden de la observacin de fenmenos
colectivos (demogrficos, econmicos, sanitarios, etc.), en los que intervienen factores
de variacin que hacen necesario formular modelos probabilsticos para poder llegar a
conclusiones o predicciones bajo un determinado nivel de probabilidad. En general, los
procedimientos estadsticos se aplican a la recopilacin, organizacin, presentacin, anlisis e interpretacin de datos numricos con el fin de realizar una toma de decisin ms
efectiva.
Segn esto, el objetivo de la estadstica es reunir una informacin cuantitativa concerniente a individuos, grupos, series de hechos, etc., y deducir, gracias al anlisis de
estos datos, unos significados precisos o unas previsiones para el futuro.
En definitiva, la estadstica es un mtodo de anlisis cuantitativo de los colectivos
que permite interpretar informacin cuya propiedad fundamental es la variabilidad de los
datos. As, la estadstica facilita el estudio de una caracterstica del colectivo que puede
expresarse numricamente, bien porque es medible por naturaleza, bien porque de alguna
manera puede expresarse numricamente. Para su aplicacin, la estadstica se basa en la
teora de probabilidades y en el clculo infinitesimal.
El profesor y economista alemn Godofredo Achenwall (1719-1772), docente de la
Universidad de Gttingen, introdujo en 1749 el trmino estadstica (statistik) para denominar a lo que hasta entonces se conoca como aritmtica poltica. La palabra deriva de
staat, que significa estado o gobierno, y Achenwall la aplic al conocimiento profundo de la situacin respectiva y comparativa de cada estado, de modo que estructur
los mtodos estadsticos orientados a investigar, medir y comparar las riquezas de las naciones. Achenwall es autor de obras sobre la historia de los estados europeos, basadas en
derecho y economa poltica, tales como Elementos de estadstica de los principales
estados de Europa y Principios de economa poltica.
Gracias a las investigaciones realizadas en Alemania, John Sinclair (1754-1835) fue
el primero en introducir el trmino estadstica en Inglaterra, con su trabajo Statistical
Account of Scotland. Sin embargo, mientras en Alemania la estadstica se vena utilizando bsicamente como instrumento para medir la fortaleza del Estado, Sinclair propona su utilizacin como generadora de informacin interna para encontrar carencias
y proponer mejoras para el pas.
A comienzos del siglo xix, el trmino estadstica adopt un significado ms general, orientado a la obtencin, clasificacin y tratamiento de cualquier conjunto de datos
colectivos cuantitativos.

14

Trivium

1.2. Concepto de bioestadstica

aJoaqun Toms-Sbado

Se denomina bioestadstica la aplicacin particular de la estadstica a las ciencias biolgicas y de la salud. Es decir, la obtencin y el anlisis de datos biolgicos o de salud
mediante la utilizacin de mtodos estadsticos. Por ejemplo, la bioestadstica se puede
usar para ayudar a comprender las posibles causas de un cncer o con qu frecuencia se
presenta una enfermedad en un determinado grupo de personas. En algunos mbitos
tambin se denomina biometra

1.3. reas de la estadstica

La estadstica ofrece mtodos para analizar series de datos de modo descriptivo o inferencial. Segn esto, podemos distinguir entre estadstica descriptiva y estadstica inferencial.

1.4. Estadstica descriptiva (deduccin)

La estadstica descriptiva pretende describir, analizar y representar las caractersticas


que existen en un conjunto de datos, obtenidos a partir de una poblacin o de una muestra. Comprende la tabulacin, la presentacin y la descripcin de los datos empricos, a
fin de hacerlos ms manejables y comprenderlos e interpretarlos mejor.
Cuando un valor se ha obtenido a partir de una muestra, hablamos de estadstico,
mientras que un parmetro es un valor obtenido a partir de una poblacin. As, la media
de estancias hospitalarias en todos los hospitales de Espaa es un parmetro, mientras
que la media de estancias hospitalarias en una muestra de hospitales espaoles es un
estadstico.
Generalmente, los estadsticos se simbolizan con letras latinas (x, S) y los parmetros, con letras griegas (, ).

1.5. Estadstica inferencial o analtica (induccin)

La estadstica inferencial o analtica es la que, apoyndose en el clculo de probabilidades y a partir de los datos obtenidos de una muestra, trata de sacar conclusiones acerca
de las caractersticas de una poblacin.

1.6. Estadstica. Desarrollo histrico

Puede afirmarse que el uso de los procedimientos estadsticos es tan antiguo como la
humanidad. En efecto, desde que se constituyeron las primeras sociedades humanas, fue
necesario desarrollar algn tipo de sistema, como representaciones grficas o smbolos
de distinta ndole en pieles, rocas, trozos de madera o paredes de cuevas, para contar el
nmero de personas, animales, alimentos o enseres.
A partir del anlisis del material arqueolgico se sabe que 3.000 aos aC se usaban
en Babilonia tablas de arcilla donde se recopilaban datos sobre la produccin agrcola

Fundamentos de bioestadstica y anlisis de datos para enfermera

Trivium

15

y resultados de actividades comerciales. Por la misma poca, los antiguos egipcios, adems de recopilar datos relativos a la poblacin y la riqueza del pas, desarrollaron sofisticados sistemas de clculo y medida, obligados por la necesidad de redistribucin de las
tierras despus de las peridicas inundaciones provocadas por el Nilo.
Aunque se conoce que los chinos y los griegos realizaban, hace ms de cuarenta
siglos, censos de poblaciones con fines tributarios, sociales y militares, fue durante el Imperio romano cuando se utilizaron con mayor rigor todos los recursos de la estadstica para
recoger una gran cantidad de datos sobre la poblacin, la superficie y la renta de todos
los territorios bajo su control. Los romanos efectuaban cada cinco aos un censo de
poblacin que inclua nacimientos, defunciones y matrimonios, adems del recuento de
ganado y de las riquezas de las tierras conquistadas. Se da la circunstancia de que el
nacimiento de Cristo se produjo precisamente en uno de estos empadronamientos peridicos que se realizaban en todo el territorio bajo la autoridad imperial.
Durante la edad media, la estadstica, al igual que la mayora de las ciencias, sufri
una considerable regresin, tanto en su uso como en su desarrollo. No obstante, se tienen noticias de algunos censos minuciosos realizados en Europa, como los ordenados
por Pipino el Breve y Carlomagno en los aos 758 y 762, respectivamente. Tambin, en
Inglaterra, el rey Guillermo I encarg en 1086 la realizacin de un censo sobre datos de
propiedad, extensin y valor de todas las tierras de su reino, que fueron recopilados en
el Domesday book o Libro del gran catastro, considerado como el primer compendio estadstico de Inglaterra.
La revolucin, a nivel de pensamiento, que supuso el Renacimiento, permiti sentar las bases para el advenimiento de la ciencia moderna. Hombres como Leonardo da
Vinci, Nicols Coprnico, Galileo, Neper, William Harvey, Francis Bacon y Ren Descartes, hicieron grandes aportaciones al mtodo cientfico, de manera que, cuando se
crearon los estados nacionales y surgi con fuerza el comercio internacional, exista ya
un mtodo aplicable a los datos econmicos. Paralelamente, la estadstica empez a
adquirir una importancia creciente en la tarea de recopilar de manera sistemtica datos
demogrficos, sociales y econmicos para los nuevos estados europeos.
Desde entonces hasta nuestros das, han sido muchos los cientficos e investigadores que, desde distintas disciplinas, han aportado su contribucin al desarrollo de la estadstica. Evidentemente, no es posible hacer aqu una relacin exhaustiva de sus nombres y su obra, de manera que expondremos nicamente y a grandes rasgos los aspectos
relevantes de aquellos personajes cuyas aportaciones son consideradas ms significativas y ms influyentes en los mtodos estadsticos contemporneos.
1.6.1. John Graunt (1620-1674)

Demgrafo y economista ingls. Demostr la uniformidad y, por tanto, las posibilidades


de pronstico de los fenmenos biolgicos, sentando las bases de la estadstica cientfica. A partir del anlisis del censo de fallecimientos de Londres observ que haba un mayor
nmero de nacimientos masculinos, una alta tasa de mortalidad en los primeros aos de
vida, una mayor tasa de mortalidad en los ambientes urbanos con respecto a los rurales
y una influencia de la estacin del ao en el nmero de fallecimientos. Graunt estableci
una clasificacin de las causas de muerte de acuerdo con los conocimientos de la poca.
Este primer estudio epidemiolgico, publicado bajo el ttulo de London bills of mortality,
estim una mortalidad en nios nacidos vivos, menores de seis aos, del 36 %. Asimismo,
elabor la primera tabla de vida que se conoce y que especifica las probabilidades de
morir y vivir durante el curso de la vida. Graunt es considerado unnimemente el primer
demgrafo, el fundador de la bioestadstica y el precursor de la epidemiologa.

16

Trivium

1.6.2. Johann Carl Friedrich Gauss (1777-1855)

aJoaqun Toms-Sbado

Matemtico, astrnomo y fsico alemn que contribuy significativamente en muchos


campos, incluida la teora de los nmeros, el anlisis matemtico, la estadstica, la geometra diferencial, la geodesia, el magnetismo y la ptica. Considerado el prncipe de
las matemticas y el matemtico ms grande desde la antigedad, Gauss ha tenido
una influencia notable en muchos campos de la ciencia y es considerado uno de los matemticos que ms influencia ha tenido alrededor de la historia.
Gauss fue un prodigio. Existen muchas ancdotas acerca de su asombrosa precocidad siendo apenas un nio, e hizo sus primeros grandes descubrimientos cuando era un
adolescente. Complet su Disquisitiones Arithmeticae a los veintin aos (1798), aunque
esta obra no fue publicada hasta 1801. Es un trabajo que fue fundamental para que la teora de los nmeros se consolidara y que ha moldeado esta rea hasta los das presentes.
Las principales aportaciones de Gauss a la estadstica fueron en la teora de la estimacin: el mtodo de los mnimos cuadrados y, como consecuencia, el llamado modelo
lineal de Gauss. Estudi tambin la teora de los errores y dedujo la curva normal de la
probabilidad, conocida como curva de Gauss, que todava se usa en los clculos estadsticos. Fue bien entrado el siglo xix cuando la ley normal, as bautizada por Galton, obtuvo
una aceptacin universal, siendo reconocida como la ley de los errores por excelencia.
Gauss aproxim el problema de la estimacin estadstica con espritu emprico, recalcando la cuestin de la estimacin no slo de las probabilidades, sino tambin de otros
parmetros cuantitativos. Descubri que, para este propsito, el mtodo apropiado era
el de la mxima verosimilitud, aunque trat de justificar el mtodo por el principio de
la probabilidad. Adems, perfeccion el ajuste sistemtico de las frmulas de regresin
simple y regresin mltiple por el mtodo de los mnimos cuadrados.
1.6.3. Jacques Quetelet (1796-1874)

Estadstico y astrnomo belga. Reconocido como uno de los padres de la estadstica


moderna y fundador de la ciencia social cuantitativa moderna, fue el primero en aplicar
la estadstica y la teora de la probabilidad a los fenmenos sociales.
Segn Quetelet, la teora estadstica y la investigacin pueden utilizarse para determinar si existe una regularidad en las acciones humanas, lo que permitira formular leyes
sociales tan fiables como las que rigen los movimientos de los cuerpos celestes. A partir de esta idea, desarroll el concepto de hombre medio, como modelo social que permite expresar las diferencias entre los individuos en trminos de desviacin de la norma.
Este modelo llev a Quetelet a formular su teora de la oscilacin, segn la cual, conforme aumentan los contactos sociales y las relaciones interraciales, las diferencias entre
los hombres disminuyen en intensidad gracias a un proceso social y cultural de oscilacin que dar lugar a un equilibrio cada vez mayor y, finalmente, al equilibrio y a la paz
universales.
Tambin alcanzaron gran difusin los trabajos de Quetelet donde aplicaba la estadstica a la criminologa. En su obra Fsica social defendi la idea de que el delito es un
fenmeno social, producido por hechos sociales que son detectables y determinables
estadsticamente, de manera que el ndice de delitos se puede calcular con anticipacin.
En este sentido, formul sus famosas leyes trmicas, resumidas en tres puntos: 1) en
invierno se cometen mayor nmero de delitos contra la propiedad que en verano, debido
a las mayores dificultades que se presentan para vivir; 2) los delitos contra las personas
son ms abundantes en verano, ya que el calor excita las pasiones humanas, los das son

Fundamentos de bioestadstica y anlisis de datos para enfermera

Trivium

17

ms largos y la temperatura alta hace a las personas ms irritables; y 3) los delitos sexuales se presentan con mayor frecuencia en primavera, poca en la que se produce el apareamiento en los animales, cuya fuerza instintiva tambin afecta al hombre.
1.6.4. Francis Galton (1822-1911)

Puede considerarse que las teoras evolucionistas son las que proporcionaron el impulso
definitivo a la ciencia estadstica en general y a la bioestadstica en particular. La evolucin de la inteligencia humana presentaba un gran inters para Sir Francis Galton,
quien, influido por el nfasis en las diferencias individuales de la teora evolucionista de
su primo Charles Darwin, se dedic plenamente a su estudio y a su medida. Galton
public en 1869 Hereditary genius: An inquiry into its laws and consequences, donde
llev a cabo un estudio de la genealoga de las familias de cientficos famosos (incluyendo la suya). En este trabajo, Galton planteaba varias cuestiones que an hoy continan siendo debatidas. Una de ellas es la referente a la naturaleza de la inteligencia, que
Galton identifica con una habilidad natural y considera de naturaleza innata. El conjunto
de la obra asume abiertamente la visin cientfica popular acorde con la filosofa y la poltica de la Inglaterra de finales del siglo xix, donde puede ser aplicada la teora evolucionista, segn la cual los hombres blancos instruidos de la clase media inglesa estaban en
lo ms alto del rbol evolutivo humano. La teora jerrquica daba un estatus evolutivo
inferior a las razas de las colonias, a los irlandeses y a la clase obrera inglesa, hecho que
serva como justificacin para el mantenimiento de la posicin social de la clase dominante.
La pasin por la medida que Galton desarroll a lo largo de toda su vida resulta paradigmtica. Es ampliamente conocido su empeo en contar y medir cualquier cosa que
pareciera presentar algn aspecto de regularidad. Entre otras muchas cosas, midi el
grado de aburrimiento en las conferencias cientficas, trat de determinar el pas donde
se encontraban las mujeres ms hermosas, fue el primero en proponer las huellas dactilares como procedimiento de identificacin, quiso medir y predecir el tiempo, inventando el mapa del tiempo y trminos como altas y bajas presiones, etc. Galton pensaba
que las diferencias individuales entre las personas deban ser medidas y clasificadas, y
se dedic con pasin a esta actividad.
En 1883, Galton estableci su laboratorio antropomtrico en la South Kensington Exhibition y posteriormente en el South Kensington Museum. Previo pago de tres peniques,
las personas asistentes podan obtener una evaluacin de una serie de medidas fsicas y
de sus facultades sensoriales, perceptivas y motoras. En su laboratorio antropomtrico
evalu a ms de 17.000 personas a lo largo de ocho aos de trabajo, consiguiendo acumular una ingente cantidad de datos. Para proceder a su anlisis, Galton se dedic activamente al desarrollo de procedimientos estadsticos.
Galton introdujo el anlisis estadstico como aspecto fundamental de la toma de decisiones en las cuestiones planteadas por la evaluacin psicolgica. Entre otras contribuciones, propuso la utilizacin de la curva normal, que ya Quetelet haba aplicado a datos
biolgicos y sociales, como modelo de la distribucin de las puntuaciones de los tests.
Tambin introdujo el concepto de mediana como medida de tendencia central, considerndola ms fiable que la media, al no estar afectada por las puntuaciones extremas. En
colaboracin con su colega y amigo Karl Pearson (1857-1936), desarroll el concepto
de regresin a la media y el coeficiente de correlacin producto-momento para el anlisis de estos datos. Posteriormente, Pearson continu el desarrollo del concepto matemtico de correlacin, agregando los coeficientes parcial y mltiple de correlacin, la
prueba de bondad de ajuste y la prueba ji cuadrado al repertorio de tcnicas disponibles.

18

Trivium

aJoaqun Toms-Sbado

Otro de sus colaboradores, Charles Spearman (1863-1945), un antiguo oficial del ejrcito reconvertido en estadstico, desarroll despus procedimientos para el anlisis de matrices de correlacin ms complejas, estableciendo los fundamentos del anlisis factorial.
Tambin fue Spearman quien sent las bases de la teora de la puntuacin verdadera, el
error de medida y de la fiabilidad, asociados al proceso de medicin.
1.6.5. Florence Nightingale (1820-1910)

En un trabajo de estadstica dirigido a estudiantes de enfermera, no poda faltar una


referencia a la figura ms emblemtica de la historia de la profesin. No obstante, puesto
que la vida y la obra de Florence Nightingale es, en general, estudiada y analizada en otras
materias del plan de estudios, nos limitaremos aqu a resear su trabajo en un campo
quizs menos conocido por los estudiantes: su notable aportacin como experta estadstica y pionera de la epidemiologa.
Desde muy joven, Florence Nightingale se mostr interesada por el estudio de las
matemticas, especialmente por la estadstica, un campo en el que su padre, que trabajaba en el entonces incipiente campo de la epidemiologa, era un experto.
Nightingale hizo un amplio uso de los anlisis estadsticos en la compilacin, el anlisis y la presentacin de estadsticas de la atencin mdica y la salud pblica. Tambin
fue pionera en el uso de los grficos en la presentacin de los informes estadsticos; en
este sentido, ide su diagrama de rea polar, o coxcomb, para proporcionar una informacin grfica de las cifras de mortalidad durante la guerra de Crimea. Desarroll tcnicas innovadoras de anlisis estadstico (como el ploteo de incidencias de muerte
prevenible entre los militares durante la guerra), con lo cual mostr, finalmente, cmo
un fenmeno social poda ser medido objetivamente y analizado matemticamente. Tambin desarroll una frmula modelo de estadstica hospitalaria para que los hospitales recolectaran y generaran datos y estadsticas consistentes.
Su inters estuvo siempre dirigido al uso de los mtodos estadsticos al servicio de
las condiciones de vida y la salud de los ciudadanos. Denunci las condiciones de salubridad de los hospitales britnicos, aportando datos que demostraban que entre los enfermos ingresados en hospitales haba una tasa de mortalidad del 90 %, mientras que esta
tasa descenda al 60 % cuando el enfermo permaneca en su casa. Usando sus estadsticas, ilustr la necesidad de una reforma sanitaria en todos los hospitales militares, consiguiendo que se crease la Royal Commission on the Health of the Army.
En las etapas posteriores de su vida hizo un amplio estudio estadstico en el que
aplic los mtodos de la sanidad pblica a las zonas rurales de la India y fue la figura
principal de la introduccin de mejoras en la atencin mdica y el servicio de salud
pblica en este pas.
Florence Nightingale es todava una referencia importante en la estadstica actual.
Considerada como una innovadora en la aplicacin del mtodo epidemiolgico para su
uso en las estadsticas de salud pblica, estableci tambin los fundamentos del anlisis de datos en relacin con la gestin de la calidad y las auditoras de los cuidados
de la salud. Su ingente labor y sus aportaciones al desarrollo de las tcnicas estadsticas en el mbito de la salud hicieron que en 1858 fuera invitada a ingresar en la Royal
Statistical Society, siendo la primera mujer que form parte de esta prestigiosa asociacin. En 1874 fue tambin nombrada miembro honoraria de la American Statistical
Society.

Fundamentos de bioestadstica y anlisis de datos para enfermera

1.6.6. William Sealey Gosset (1876-1937)

Trivium

19

Estadstico y qumico ingls. Trabaj gran parte de su vida como qumico de la fbrica
de cerveza Guinness, llegando a ser director de la factora de la marca en Londres. Ms
conocido por Student, seudnimo con el que firmaba sus trabajos, al parecer debido a la
prohibicin expresa de la empresa que sus empleados publicaran cualquier tipo de informacin.
Gossett es uno de los estadsticos con ms influencia en los mtodos actuales. Especialmente conocidos son sus trabajos sobre la forma de la distribucin t y el t-test (conocido como prueba t de Student), para muestras pequeas, una de las pruebas de contraste de hiptesis ms utilizadas en la prctica, que desarroll mientras trabajaba en la
aplicacin de tcnicas de control de calidad en la fabricacin de cerveza.
Curiosamente, mantuvo una cordial relacin de amistad y colaboracin tanto con
Pearson como con Fisher, a pesar de que estos dos ltimos se profesaban mutuamente
una notable aversin.
1.6.7. Ronald Fisher (1890-1962)

Estadstico, bilogo evolutivo y genetista ingls. A l se deben los fundamentos de la estadstica actual y muchos de los mtodos de inferencia en las pruebas de contraste de hiptesis. Se considera que Student y Fisher iniciaron una nueva era en el estudio de las distribuciones muestrales.
Fisher sent las bases del diseo de experimentos, con lo que la estadstica se incorpor plenamente a la investigacin cientfica. Introdujo el anlisis de la varianza, de la
covarianza y otras pruebas no paramtricas. Asimismo, fue uno de los principales impulsores de la gentica de poblaciones, armonizando la metodologa biomtrica con la gentica mendeliana.

Fundamentos de bioestadstica y anlisis de datos para enfermera

Tema 2. Poblacin y muestra

Trivium

21

2.1. Conceptos preliminares

La estadstica obtiene y estudia datos sobre diferentes individuos, que no tienen que ser
necesariamente personas, hombres o mujeres. El conjunto de todos los individuos posibles constituye el universo.
En general, no interesan los datos de todos los individuos, de todo un universo, sino
que se estudian poblaciones. An as, obtener y analizar los datos de toda una poblacin
suele ser imposible, por lo que, en la prctica, suele seleccionarse una muestra de individuos de la poblacin; nicamente en estos individuos estudiaremos los datos que nos
interesan.

2.2. Individuo

Es cada elemento que lleva asociada una medida, un nmero de orden o una caracterstica predeterminada.

2.3. Universo

Es el conjunto, finito o infinito, de todos los posibles individuos que cumplen ciertas
propiedades.

2.4. Poblacin

Es el conjunto de todos los individuos que cumplen ciertas propiedades y de quienes


deseamos estudiar ciertos datos. Podemos entender que una poblacin abarca todo el
conjunto de elementos de los cuales podemos obtener informacin, entendiendo que
todos ellos han de poder ser identificados. La poblacin deber ser definida sobre la base
de las caractersticas que la delimitan, que la identifican y que permiten la posterior
seleccin de unos elementos que se puedan entender como representativos (muestra).
Hay que distinguir entre poblacin diana o poblacin objetivo (aquella poblacin a
la que se desea extrapolar los resultados del estudio) y poblacin accesible (aquella
poblacin cuyos individuos son directamente accesibles al investigador para seleccionar la muestra).
Asimismo, una poblacin puede ser finita (por ejemplo, todos los enfermos de los
hospitales de Catalua o los estudiantes de enfermera de Espaa) o infinita (los posibles resultados de sucesivas tiradas de una moneda o el conjunto de los nmeros pares).

22

Trivium

aJoaqun Toms-Sbado

2.5. Muestra

Una muestra es una porcin de algo. Si deseamos preguntar a un conjunto de cinco mil
personas su opinin sobre un determinado fenmeno, tenemos dos opciones: efectuar las
preguntas persona por persona o efectuar las preguntas solamente a una muestra de estas
personas, es decir, a un grupo de elementos representativos de ese conjunto.
Evidentemente, si se examina toda la poblacin, mediante un censo, podemos conocer exactamente cul es la distribucin de la variable o las variables de inters en esta
poblacin. Sin embargo, en la mayora de las ocasiones los censos resultan inviables,
caros y lentos, adems de innecesarios. La alternativa al censo es estimar la distribucin
de la variable en una parte representativa de la poblacin, es decir, en una muestra, lo
que tiene la ventaja de ser ms rpido y ms barato, y si la muestra se ha elegido correctamente, permite obtener una informacin que aporta una estimacin razonable de la
situacin de la variable en la poblacin.
As, la muestra es una parte o un subconjunto de la poblacin en el que se observa
el fenmeno a estudiar y de donde sacaremos unas conclusiones generalizables a toda
la poblacin. En general, se considera que una muestra es grande cuando el nmero de
individuos seleccionados es igual o superior a 30, y una muestra es pequea cuando los
individuos son menos de 30.
Para que una muestra sea representativa de la poblacin, deber cumplir unas condiciones bsicas:
Han de delimitarse y definirse claramente las caractersticas que conforman la totalidad de la poblacin.
Ha de haber garantas de que cada elemento de la poblacin tiene las mismas posibilidades de figurar en la muestra. En consecuencia, deber utilizarse el procedimiento de muestreo adecuado.
La muestra deber tener el tamao adecuado para poder extrapolar los resultados
obtenidos al conjunto de la poblacin con garantas de fiabilidad.

2.6. Muestreo

El muestreo es el mtodo o procedimiento destinado a obtener una muestra adecuada


que reproduzca las caractersticas bsicas de la poblacin. Existen diferentes criterios de
clasificacin de los procedimientos de muestreo, aunque, en general, pueden dividirse
en dos grandes grupos: mtodos aleatorios o probabilsticos y mtodos no aleatorios o
no probabilsticos.
Tipos de muestreo

Aleatorio (probabilstico o al azar) No aleatorio (no probabilstico o no al azar)

Simple
Sistemtico
Estratificado
Proporcional
No proporcional
Por conglomerados

Accidental
Intencionado
Por cuotas

Fundamentos de bioestadstica y anlisis de datos para enfermera

2.7. Muestreo aleatorio

Trivium

23

El muestreo aleatorio, probabilstico o muestreo al azar, parte de una igualdad absoluta de todos los elementos de la poblacin para ser seleccionados, de manera que
conocemos la probabilidad que tiene un elemento de ser incluido en la muestra. As,
los resultados obtenidos en esta muestra sern estadsticamente inferibles de toda la
poblacin, siempre que el tamao sea el adecuado y en funcin del nivel de confianza
que hayamos establecido previamente.
2.7.1. Muestreo aleatorio simple

Es el mtodo conceptualmente ms sencillo. Bsicamente, consiste en elegir al azar de


una lista todos los individuos que formarn parte de la muestra. Para llevar a cabo un muestreo aleatorio simple se siguen los siguientes pasos:

1. Se confecciona la lista de todos los elementos de la poblacin, asignndoles nmeros consecutivos de 1 a N, siendo N el total de elementos de la poblacin. Esto supone
que estn claramente definidas cules son las unidades de base de la muestra, es decir,
si se trata de individuos, grupos, familias, etc. Esta unidad de base ha de ser la misma
en toda la muestra; no se puede seleccionar un individuo, luego una familia, etc.
2. Se decide el tamao deseado de la muestra. Llamaremos n al nmero de elementos
de la muestra. Para conocer el tamao de la muestra existen tablas ya elaboradas y
pruebas estadsticas que la determinan en funcin del tamao de la poblacin, del tipo
de variables a estudiar y del nivel de confianza deseado.
3. Se extraen al azar los n elementos que sean necesarios para completar el tamao de
muestra requerido. Para esta extraccin se pueden utilizar distintos mtodos, como
tablas de nmeros aleatorios, sistemas de lotera o cualquier otro sistema que se
ajuste a las leyes del azar.
En la prctica, a menos que se trate de poblaciones pequeas o de estructura muy simple, es difcil aplicar este tipo de muestreo de forma eficaz.

2.7.2. Muestreo aleatorio sistemtico

Es una variable sencilla del muestreo aleatorio simple, que parte tambin de la lista total
de la poblacin, pero, en lugar de extraer n nmeros aleatorios, slo se extrae uno y, a
partir de ah, se van seleccionando los dems elementos a intervalos fijos (5, 10, 15...),
siendo el tamao de este intervalo el resultado de dividir el tamao de la poblacin entre
el tamao de la muestra.
2.7.3. Muestreo aleatorio estratificado

En ocasiones, especialmente cuando las poblaciones son muy grandes, interesa dividir
stas en subpoblaciones o estratos en virtud de determinadas caractersticas (edad, sexo,
estado civil), de manera que al dividir a esta poblacin no homognea en dos o ms
estratos, conseguimos que se convierta en homognea en cada estrato o subgrupo. A
continuacin se eligen en cada estrato las personas que formarn la muestra por el mtodo
aleatorio simple. Este sistema tiene la ventaja de que permite mayor profundizacin y

24

Trivium

aJoaqun Toms-Sbado

mayor precisin en el anlisis de cada estrato. Adems, permite que en cada estrato se
puedan utilizar diferentes sistemas para la seleccin de los sujetos.
El muestreo estratificado puede ser proporcional o no proporcional. En el muestreo
proporcional, el tamao de la muestra en cada estrato es proporcional al nmero de individuos que existen en los estratos con relacin al total de la poblacin. En el muestreo
estratificado no proporcional, a cada estrato le corresponde igual nmero de elementos
muestrales.
2.7.4. Muestreo aleatorio por conglomerados

En los mtodos anteriores, se seleccionan directamente los elementos de la poblacin,


es decir, las unidades muestrales son los elementos de la poblacin (individuos). En el
muestreo por conglomerados, la unidad muestral es un grupo de elementos de la poblacin que forman una unidad, a la que llamamos conglomerado (bloques de viviendas,
municipios, hospitales). Este procedimiento consiste en seleccionar aleatoriamente
los conglomerados necesarios para alcanzar el tamao de la muestra, que quedar compuesta por todos los elementos pertenecientes a los conglomerados elegidos.

2.8. Muestreo no aleatorio

En el muestreo no aleatorio o no probabilstico los sujetos se seleccionan siguiendo


determinados criterios, de manera que no todos los elementos de la poblacin tienen la
misma probabilidad de figurar en la muestra. Este tipo de muestreo slo es justificable
en determinados casos, por ejemplo, en estudios exploratorios, donde un muestreo aleatorio puede resultar difcil o excesivamente costoso.
2.8.1. Muestreo no aleatorio accidental o incidental

Se basa en el empleo para la muestra de aquellos sujetos a los que se tiene fcil acceso,
con los que puede contarse ms fcilmente o con mayor comodidad. Un caso particular
que puede incluirse en esta categora es el de los sujetos voluntarios.
2.8.2. Muestreo no aleatorio intencionado

Se caracteriza por la inclusin deliberada en la muestra de aquellos elementos cuyas caractersticas son similares a las de la poblacin elegida, en un esfuerzo por obtener muestras
supuestamente representativas. Es decir, el investigador selecciona los elementos que a
su juicio son representativos, lo que exige un conocimiento previo de la poblacin que
se investiga. Este tipo de muestreo es frecuentemente utilizado en estudios cualitativos.
2.8.3. Muestreo no aleatorio por cuotas

Es un tipo de muestreo semejante al muestreo aleatorio estratificado, pero sin tener su


caracterstica de aleatoriedad. Tambin aqu se divide a la poblacin en estratos o subpoblaciones homogneas y dentro de cada estrato se fija una cuota o nmero de individuos, que son seleccionados de forma accidental.

Fundamentos de bioestadstica y anlisis de datos para enfermera

Trivium

Tema 3. Variables estadsticas y escalas de medida

25

3.1. Variables

Una variable es una caracterstica, una propiedad o un atributo de una persona o un


objeto, susceptible de asumir diferentes valores (que pueden medirse) en los diferentes
sujetos. El concepto de variable se opone al de constante, que sera aquel atributo que
nicamente puede tomar un valor para todos los sujetos.

3.2. Clasificacin de las variables

Existen diferentes clasificaciones de las variables, en funcin del criterio utilizado:


Criterio de medida
Cuantitativas
Continuas
Discretas
Cualitativas
Dicotmicas
Politmicas
Ordinales

Criteri de mesura

Criterio metodolgico

Criterio de control

Dependientes

Controladas

Independientes
De confusin

Aleatorias

3.3. Variables cuantitativas

Son las que pueden medirse numricamente, es decir, que pueden cuantificarse mediante
valores con significado matemtico a partir de unas determinadas unidades de medida.
Las variables cuantitativas, a su vez, pueden ser continuas o discretas.
3.3.1. Variables cuantitativas continuas

Son aquellas en las cuales, entre dos valores consecutivos dados, podemos encontrar
infinitos valores. La dificultad para encontrar todos estos valores intermedios se deber
nicamente a las limitaciones del instrumento de medida. Son ejemplos de variables
cuantitativas continuas:
el peso de una persona en Kg

También podría gustarte