Está en la página 1de 120

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Tapa

ATE CDP Santa Fe | 1

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

Retiro de Tapa

2 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Portadilla

ATE CDP Santa Fe | 3

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

ndice General
Referencias de conos y estilos ...................................................6
Marco institucional:
Asociacin Trabajadores del Estado ............................................8
Universidad Nacional del Litoral ..................................................10
Esquema de contenidos .............................................................12
1. Presentacin ........................................................................14
2. Objetivos ..............................................................................15
3. Unidad 1: Estadstica. Conceptos Generales .......................16
3.1 Estadstica .........................................................................16
3.2 Estadstica Descriptiva .......................................................16
3.3 Estadstica inferencial................. .........................................17
3.4 Poblacin ............................................................................17
3.5 Muestra ..............................................................................18
3.6 Tcnicas de muestreo .........................................................18
3.7 Fuentes de obtencin de datos .............................................20
3.8 Sistemas de recoleccin de datos ........................................20
3.9 Unidad de observacin .........................................................21
3.10 Variable ............................................................................21
3.8 Sistemas de recoleccin de datos ........................................20
Actividad de autoevaluacin ......................................................22
4. Unidad 2: Organizacin y presentacin de datos .................23
4.1 Series simples y de frecuencia .............................................23
4.2 Tablas estadsticas .............................................................34
4.3 Grficos ..............................................................................40
Actividad de Autoevaluacin ......................................................57
5. Unidad 3: Cifras absolutas y relativas ...................................60
5.1 Clasificacin de las Tasas ...................................................61
5.2 Tasas especiales de mortalidad ..............................................63
5.3 Consideraciones generales ...................................................68
Actividad de Autoevaluacin ......................................................69
6. Unidad 4: Medidas de posicin y dispersin .......................70
6.1 Medidas de Posicin............................................................70
6.2 Medidas de Dispersin ........................................................81

4 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

6.3 Madidas de Asimetra y Curtosis ..........................................87


6.4 Diagrama de Caja o Box Plot ...............................................87
Actividad de Autoevaluacin .......................................................91
7. Unidad 5: Regresin y Correlacin lineal simple....................92
7.1 Anlisis de correlacin .........................................................92
7.2 Anlisis de Regresin ..........................................................98
Actividad de Autoevaluacin .......................................................104
8. Unidad 6: Series Cronolgicas ............................................106
8.1 Concepto ...........................................................................106
8.2 Componentes ...................................................................106
8.3 Modelos .............................................................................107
8.4 Estudio de la tendencia .....................................................109
Actividad de Autoevaluacin .....................................................117
Bibliografa ..............................................................................118

ATE CDP Santa Fe | 5

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

Referencia de conos y estilos


Antes de introducirnos en el desarrollo de la materia, veremos qu
significan los conos y estilos grficos incluidos en la plantilla de materiales impresos. stos fueron diseados para sistematizar el uso
de los recursos educativos de los materiales y ordenar la lectura de
los estudiantes, ya que funcionarn como un sistema de seales
interno de los contenidos. Comprender sus utilidades especficas nos
ayudar a reconocerlos en el transcurso de la lectura del material y a
la vez reconocer qu tipo de textos se ordenan con ellos.

conos
Objetivos:
Incluyen las finalidades generales y especficas del docente, para la
unidad o materia que desarrolla (tanto respecto de las aptitudes a
adquirir por parte de los estudiantes, como del proceso de enseanza-aprendizaje).

Lecturas
Este apartado incluye los textos que el docente considere necesarios
para complementar el desarrollo principal de contenidos. Las lecturas
podrn ser fundamentales (esenciales para la resolucin de las
actividades de la materia) o complementarias (simplemente para
profundizar o ampliar alguno de los temas desarrollados).

Actividades
Son las ejercitaciones propuestas por el docente para evaluar el aprendizaje, las habilidades cognitivas adquiridas y, en otras ocasiones,
para que el mismo alumno se autoevale.

Enlaces
Este cono es de uso habitual en la plantilla de clase que aparece en
la plataforma educativa de ATE Virtual (www.campusvirtuales.com.ar/
ate) y conduce a sitios o pginas web recomendadas por el docente,

6 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

que complementan o profundizan los contenidos principales. En la


plantilla impresa nos sugerir igualmente sitios web para visitar, pero
que deberemos luego localizar en Internet.

Glosario
En la plantilla de cuadernillos impresos, encontraremos este cono
en la columna de la derecha a la altura en que la precisin terminolgica
lo requiera y acompaando el significado o la acepcin completa. Es
la forma ms adecuada para que el glosario sea oportuno y facilite la
lectura del material por parte del estudiante.
En la plantilla de clase publicada en el campus ATE Virtual, este
cono conduce a una pgina que contiene un breve diccionario de
trminos esenciales seleccionados por el docente, que precisan los
alcances de los conceptos vertidos en el material.

Multimedia
Este cono indica los materiales audiovisuales (CDs, videos, presentaciones en formatos Flash o Power Point...) que -a sugerencia del
docente- acompaan el material de estudio. Podremos encontrarlo
tanto en el men de la plantilla de clases publicada en el sitio ATE
Virtual como en la columna derecha de los cuadernillos impresos.

ATE CDP Santa Fe | 7

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

Marco Institucional
Asociacin Trabajadores del Estado
La Asociacin Trabajadores del Estado, adherida a la CTA (Central
de Trabajadores Argentinos), es un sindicato que agrupa a trabajadores pblicos dependientes del Estado nacional, provincial y municipal. Cuenta con ms de 12.000 afiliados en la Provincia de Santa Fe
en sectores como Educacin, Salud, Accin Social, Administracin
Central, CONICET, SENASA, entre otros. ATE Santa Fe es una de
las instituciones gremiales del pas que ha innovado al incorporar a
su poltica gremial la Capacitacin y Formacin. Cuenta tambin con
una importante estructura de servicios para sus afiliados y la comunidad: Mutual, Cine Auditorio, Videoteca, Departamento Jurdico, entre
otros.
Ante la profunda crisis del Estado frente a las polticas neoliberales,
determinantes de la ruptura de los modelos de representacin poltica
y del desplazamiento de las responsabilidades que ste debe asumir
en lo relativo a educacin, salud, derechos laborales, entre otros,
afrontamos nuestro compromiso histrico desde otro horizonte, que

ATE Santa Fe es una de las


instituciones gremiales del
pas que ha innovado al
incorporar a su poltica
gremial la Capacitacin y
Formacin. Cuenta tambin
con una importante estructura de servicios para sus
afiliados y la comunidad:
Mutual, Cine Auditorio,
Videoteca, Departamento
Jurdico, entre otros.

defiende profundamente los derechos de los sujetos y, fundamentalmente, de los trabajadores. ATE ha generado y sigue crando nuevos
espacios para el fortalecimiento de redes interinstitucionales con diferentes sectores de la sociedad civil y con organizaciones gubernamentales, ONGs, Movimientos de Desocupados, Organismos de
Derechos Humanos, dndole especial importancia a las instituciones
vinculadas al mundo del conocimiento acadmico (Universidades,
Institutos de investigaciones, etc.). Los objetivos propuestos tienden
a la apertura de los espacios pblicos y a lograr una mejor insercin
de la sociedad en su conjunto en el mundo de trabajo y de la cultura.
Desde hace 15 aos, ATE incorpora la formacin como un eje central
de su poltica, bajo la consigna Por la democratizacin del conocimiento1 y con el cometido de articular los saberes acadmicos
con los conocimientos adquiridos por los trabajadores en su prctica
cotidiana. Para afrontar este desafo, se trabaj en forma conjunta
con Universidades Pblicas, Institutos y Escuelas de formacin provinciales y nacionales y Organizaciones de la Sociedad Civil. Entre
las principales podemos mencionar a la Universidad Nacional del Litoral y UNL Virtual (sistema de educacin a distancia), la Universidad

8 | ATE CDP Santa Fe

Esta consigna identific la


poltica de capacitacin de ATE
desde 1991 y sintetiza la intencin
de facilitar el acceso de toda la
sociedad a los saberes y herramientas ms actuales, por encima
de cualquier limitacin
discriminatoria.

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Nacional de Entre Ros (UNER), la Universidad Nacional de Rosario


(UNR), el Centro Regional de Investigacin y Desarrollo (CERIDE CONICET), el Canal Educativo S TV de Santa Fe, QPlus (diseo y
desarrollo de plataformas educativas), la Universidad Virtual de
Quilmes), el Movimiento Los Sin Techo, Sindicatos, Centros de Accin Familiar, Agrupaciones de trabajadores desocupados y trabajadores de planes sociales, entre otros.
Actualmente ATE ofrece ms de 180 cursos presenciales y a distancia (en las modalidades tradicional e Internet), incluyendo el
Programa de Formacin del Centro Multimedial de Educacin a
Distancia de UNL Virtual (CEMED) que incluye tecnicaturas, licenciaturas, programas de formacin profesional, posgrados y cursos de
extensin.

Haciendo historia
Desde el ao 1990 ATE inici una experiencia de Capacitacin No
Formal, a partir de la cual en el ao 1991 se constituye un rea de
Capacitacin Laboral. Educacin (con los Encuentros Provinciales) y
Salud (con las Jornadas de Salud Laboral y Polticas Sanitarias) fueron las reas en las que se trabaj con mayor intensidad y en donde
contamos con el aporte de docentes e investigadores de prestigio
internacional. En 1995 se incorpora la informtica en forma regular y
va amplindose hasta convertirse en uno de las especialidades centrales de nuestra propuesta. En el ao 1999 se institucionaliza el rea
de Capacitacin Laboral y Profesional, en articulacin con instituciones acadmicas que acreditan la formacin en diversos campos del
conocimiento. Se inauguran centros de formacin en localides del
interior provincial (Rosario, San Javier, Rafaela y Reconquista, entre
los primeros), comienzan a dictarse cursos satelitales en nuestra sede
(en el marco del acuerdo con Telepuerto del Litoral) y se ofrecen por
primera vez ms de 100 cursos en distintas reas de formacin.
Ya en el ao 2000 se diversifican una serie de proyectos educativos
en la modalidad a distancia, los que pueden verse reafirmados a nivel
institucional a partir del surgimiento de dos sistemas de capacitacin
a distancia: Aula Hogar Televisin Educativa y el Campus ATE Vir-

NOTA
La apuesta por la educacin a
distancia por medios tradicionales
(correo postal), por TV, mediante
conferencias satelitales e Internet, ha
ido cobrando fuerza y se profundizaron las experiencias de formacin e
investigacin en este sector, como un
modo de democratizar los nuevos
saberes por encima de las distancias
geogrficas.

tual, hacia 2002.


ATE es actualmente una de las ms importantes organizaciones
gremiales del pas, que genera investigacin y desarrollo en articulacin con universidades y con centros tecnolgicos vinculados al sector productivo y a la sociedad en general.

ATE CDP Santa Fe | 9

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

Universidad Nacional del Litoral


La Universidad Nacional del Litoral brinda educacin a toda la ciudadana conjugando una forma de gobierno democrtica y una gestin gil y moderna, adaptndose a las exigencias del contexto.
La Facultad de Bioqumica y Ciencias Biolgicas de la UNL, en su
funcionamiento, articula el accionar de diversas entidades e instituciones dedicadas al desarrollo de actividades tanto acadmicas como
docentes, de investigacin, de servicios a terceros y transferencia de
tecnologa.
A fines de 1990 por Resolucin del Consejo Superior de la UNL N
228/90 se dispuso que la Escuela Superior de Sanidad Dr. Ramn Carrillo pase a depender de la Facultad de Bioqumica y Ciencias Biolgicas. Esta Escuela tiene sus orgenes en la primera Escuela de Sanidad del pas, creada el 7 de diciembre de 1946. A partir
de 1973 es que toma la actual denominacin.
La Escuela Superior de Sanidad Dr. Ramn Carrillo instrumenta a
partir del ao 1992 la carrera de grado universitario de Licenciatura
en Administracin de Salud (Res. CS N 276/92) de modalidad presencial, otorgando la posibilidad a aquellos alumnos que cursen el
Primer Ciclo del Plan de Estudios, el otorgamiento del ttulo de Tcnico Universitario en Administracin de Salud. Los objetivos de las
asignaturas que conforman el nivel tcnico establecido, forman parte
integrante de la Res. CD N 108/95, emanada por el Consejo Directivo
de la FBCB.
A partir de los primeros egresados, se comienzan a satisfacer las
expectativas generadas con la creacin de esta carrera, y la matriculacin de la misma mantuvo un crecimiento gradual en los
ltimos 5 aos, teniendo un aumento de un 20% por perodo
acadmico.
Los primeros Licenciados en Administracin de Salud (aproximadamente 20 graduados) y los Tcnicos Universitarios en Administracin
de Salud (aproximadamente 80) ingresan gradual y progresivamente
en el mbito de los Ministerios, Organismos Pblicos Prestadores y
Financiadores de Servicios de Salud, al igual que un nmero significativo es absorbido por Organizaciones Privadas como Sanatorios,

10 | ATE CDP Santa Fe

La Universidad Nacional del


Litoral brinda educacin
a toda la ciudadana conjugando una forma de gobierno
democrtica y una gestin
gil y moderna, adaptndose
a las exigencias del contexto.

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Clnicas, Centros de Salud Especializados, Empresas de Medicina


Prepaga, de Seguros, Obras Sociales, ONG, o Consultoras entre otros.
Algunos graduados se distribuyeron en diferentes lugares del pas,
intentado ingresar con un perfil diferencial al mercado laboral especializado, cubriendo de esta manera demandas distintas en puestos de
organizaciones enmarcadas en el sistema de salud.
Como se puede inferir, esta carrera ha tenido un importante desarrollo que se incrementa velozmente en los ltimos aos y se constituye en una oferta educativa que convoca a una significativa franja
de estudiantes y pretende formar un perfil de graduado avocado a la
problemtica de la calidad de vida de los individuos y la adecuacin
de los sistemas y modelos a sus necesidades de salud.
En el marco del modelo pedaggico innovador de la UNL se ha
llevado a cabo un convenio con la Asociacin Trabajadores del
Estado, Consejo Directivo Provincial Santa Fe, orientado, en primer lugar, a establecer un mecanismo de colaboracin en las
actividades de capacitacin, preparacin y dictado de cursos,
seminarios, tareas de difusin, investigacin y transferencia. Por

Esta carrera ha tenido un


importante desarrollo que se
incrementa velozmente en los
ltimos aos y se constituye
en una oferta educativa que
convoca a una significativa
franja de estudiantes y pretende formar un perfil de
graduado avocado a la problemtica de la calidad de
vida de los individuos y la
adecuacin de los sistemas y
modelos a sus necesidades
de salud.

otra parte, el acuerdo apunta al diseo, la implementacin y gestin


de carreras de pregrado, grado, posgrado y cursos de actualizacin y
perfeccionamiento en forma conjunta. Fruto de este convenio se hace
un Acuerdo Especfico, desde la Escuela Superior de Sanidad Dr.
Ramn Carrillo (FBCB), que pretende integrar las potencialidades de
Internet con herramientas audiovisuales y materiales tradicionales de
enseanza, orientadas al desarrollo de la Tecnicatura Universitaria en
Administracin en Salud, en la modalidad a Distancia.

ATE CDP Santa Fe | 11

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

Esquema de contenidos

12 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Estadstica Metodolgica

ATE CDP Santa Fe | 13

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

1. Presentacin
Esta asignatura se inserta en el segundo cuatrimestre de la currcula
de la carrera Tecnicatura en Administracin de Salud, dictada, segn la modalidad a Distancia, por la Facultad de Bioqumica y Ciencias Biolgicas de la Universidad Nacional del Litoral y la Asociacin
Trabajadores del Estado (CDP Santa Fe).
Mi nombre es Olga vila y les doy la bienvenida a este nuevo mdulo. Tendr la oportunidad de compartir con ustedes el desarrollo de la
materia Estadstica Metodolgica nuevamente a travs del entorno
virtual de ATE. Los invito a participar en la plataforma para conocernos y compartir las dudas que durante el dictado puedan surgir.
Esta materia tiene como objetivos fundamentales proponer la metodologa estadstica adecuada para acercarse al conocimiento de la
realidad. Para ello ser indispensable lograr conocimientos bsicos y
conceptos fundamentales que permitan una cabal comprensin de la
Estadstica Metodolgica.
A tal efecto se pretende que los estudiantes al finalizar el cursado de
la asignatura tengan la capacidad para identificar y diferenciar distintos tipos de variables, seleccionar tablas y grficos de acuerdo a la
naturaleza de las mismas.
Deben lograr transformar los datos en informacin de utilidad para los
diferentes problemas que se les presentan a lo largo de la currcula y
de su vida profesional. Se enfatiza que se les presentan a lo largo de
la cuadrcula y de su vida profesional. Se enfatiza en la elaboracin
de los distintos indicadores en el rea de salud, como as tambin en
el estudio de las diferentes medidas de resumen de datos.
Finalmente se analizan desde el punto de vista descriptivo los conceptos bsicos de regresin lineal simple y series cronolgicas y sus
principales aplicaciones en el rea de salud. Esta asignatura constituye la base para la resolucin de problemas que estn ntimamente
relacionados con otras reas de la carrera.
Un aspecto que no se debe dejar de considerar es que en la actualidad existen programas de computacin que ayudan en la presentacin y resolucin de problemas estadsticos concretos.

14 | ATE CDP Santa Fe

Ing. Olga Beatriz vila


- Master of Science in Statistics: otorgado por Virginia Polytechnic
Institute and State University,
Blacksburg, Virginia, USA. Ao
1992.
- Doctor of Philosophy in Forest
Biometrics: otorgado por Virginia
Polytechnic Institute and State
University, Blacksburg, Virginia,
USA. Ao 1993.
Fue profesional en el Instituto Provincial de Estadstica y Censos,
Santa Fe, Argentina. Aos 1994,
1995 y 1996.
Se desempe como oordinadora
tcnica de las actividades vinculadas con la elaboracin del perfil
socio-econmico de los alumnos
ingresantes 1996 de la UNSE,
Agosto-Diciembre de 1996.
Es docente de las ctedras de Estadstica Metodolgica en la Facultad de Ingeniera Qumica (UNL) y
la Escuela de Sanidad Dr. Ramn
Carrillo (UNL). Realiz numerosas
publicaciones.

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Se muestran a lo largo de la asignatura salidas de paquetes de programas de planillas de clculo y estadsticos. Tampoco se debe dejar
de mencionar que algunos clculos sencillos se pueden realizar simplemente con una calculadora. Lo importante es que el alumno comprenda el fundamento terico involucrado en los conceptos ms all
de los clculos.
Olga Beatriz vila

ATE CDP Santa Fe | 15

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

2. Objetivos
Capacidad para proponer la metodologa estadstica adecuada para
acercarse al conocimiento de la realidad.
Conocimientos bsicos y conceptos indispensables para lograr una
cabal comprensin de la Estadstica metodolgica.
Capacidad para identificar y diferenciar distintos tipos de variables.
Capacidad para seleccionar los tipos de tablas y grficos a utilizar
de acuerdo a la naturaleza de las variables que involucre el problema
en estudio.
Habilidad en el manejo de los datos.
Capacidad para transformar datos en informacin.
Conocimiento y utilizacin de distintos indicadores en el rea de
salud.
Habilidad en la eleccin, interpretacin y manejo de las diferentes
medidas de posicin y dispersin.
Conceptos bsicos de regresin lineal simple y sus aplicaciones en
el rea de Salud.
Conceptos bsicos de series cronolgicas y sus aplicaciones en el
rea de Salud.
Interpretacin de salidas sencillas de software.

16 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

3. Unidad 1: Estadstica
Conceptos Generales
3.1 Estadstica
Concepto
La Estadstica es la disciplina que se ocupa de la recoleccin de
datos referidos a un fenmeno o hecho en particular, su ordenamiento, presentacin y resumen para su anlisis e interpretacin y posterior enunciado de conclusiones. En esta definicin se distinguen diferentes etapas de trabajo, a saber:
Recoleccin de datos, cuyo objetivo es reunir informacin proveniente de mediciones, conteos u observaciones efectuadas sobre
el material en estudio.
Procesamiento de los datos, que incluye el ordenamiento de los
mismos en tablas estadsticas, representacin mediante grficos y
su resumen a travs del clculo de promedios, porcentajes, tasas,
ndices, etc.
A travs de lo que se obtiene en la etapa anterior se realiza el
anlisis e interpretacin del fenmeno que se estudia.
Finalmente se realiza el enunciado de conclusiones. Si stas se
refieren solamente a los datos obtenidos se trata de la Estadstica
Descriptiva. En cambio, si las conclusiones hacen referencia a un
grupo mayor, del cual los datos obtenidos constituyen slo una parte, entonces se tiene la Estadstica Inferencial.
En el rea de Salud, el mtodo estadstico constituye una herramienta fundamental que posibilita el desarrollo del Sistema Estadstico de
Salud, que resulta de gran utilidad en los niveles de planificacin,
evaluacin y decisin local, regional, nacional e internacional.
La Estadstica puede dividirse de acuerdo a lo expresado anteriormente en dos grandes reas: la Estadstica Descriptiva y la Estadstica Inferencial, cuyas definiciones se darn a continuacin.

3.2 Estadstica Descriptiva


Trata esta parte de la Estadstica del resumen y descripcin de los
datos. Dicho resumen puede ser a travs de tablas, grficos, medi-

ATE CDP Santa Fe | 17

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

das de resumen. El anlisis solamente se refiere a los datos recolectados, no se realiza inferencia alguna o generalizacin acerca del
grupo mayor del cual provienen esos datos.

3.3 Estadstica Inferencial


Esta parte de la Estadstica se refiere a la rama de la Estadstica que
trata de los procesos inferenciales, es decir, su objetivo es obtener a
partir de los datos recolectados conclusiones del grupo mayor de datos del cual stos provienen. Su base es la teora de Probabilidades y
comprende como grandes reas la teora de estimacin y test o pruebas de hiptesis.

3.4 Poblacin
Es el conjunto de valores posibles de la caracterstica observable en
los individuos u objetos en los cuales el investigador est interesado.
Si bien es cierto que la palabra "poblacin" se utiliza en el lenguaje
cotidiano para referirse a personas, en estadstica se utiliza en un
sentido ms amplio.
Por ejemplo si se tiene inters en la presin sangunea de pacientes
internados en un sanatorio particular en un momento dado, la poblacin estar constituida por los valores de presin sangunea de esos
pacientes de inters.
Una poblacin puede ser finita o infinita. Si una poblacin de valores
consiste de un nmero fijo de esos valores, se dice que la poblacin
es finita. Se la puede definir entonces como aquella que puede ser
listada fsicamente, aun en aquellos casos en que la poblacin sea
muy grande y a veces impracticable este listado. Un ejemplo de este
tipo lo constituye todos los nios de 12 a 14 aos de una cierta provincia en un momento dado. Por el contrario, si una poblacin consiste en una sucesin infinita de valores entonces se trata de una poblacin infinita. Es decir, es aquella que en la prctica no puede ser
fsicamente listada. En este caso, por ejemplo, se pueden tener el
nmero de llamadas que llegan al conmutador de un hospital durante
una semana o el tiempo de vida de una lmpara de luz que se ha
encendido hasta el trmino de su duracin.

18 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

3.5 Muestra
Constituye un subgrupo de la poblacin, elegido siguiendo ciertos criterios de seleccin. Si la poblacin se considera el todo, una muestra
es una parte de ese todo. La muestra es el elemento bsico sobre el
cual se fundamenta la posterior inferencia acerca de la poblacin de
donde se la ha tomado. Por ello es fundamental que la muestra sea
representativa de la poblacin.

3.6 Tcnicas de muestreo


Se entiende por diseo o tcnica de muestreo el plan que se llevar a
cabo para escoger la muestra, de tal forma que la muestra sea representativa.
En la recoleccin de los datos que van a constituir la muestra se
deben tener en cuenta dos aspectos:
1) Un mismo dato puede darse o no, tantas veces como sea posible
en la muestra; de esta manera se origina lo que se denomina muestreo
con repeticin o muestreo sin repeticin.
2) El muestreo puede ser no probabilstico o probabilstico.
Muestreo con repeticin: Cada unidad que forma parte de la muestra, una vez analizada, se retorna a la poblacin. Por lo tanto puede
ser elegida nuevamente para integrar la muestra.
Muestreo sin repeticin: Cada unidad que forma parte de la muestra, una vez analizada, no se retorna a la poblacin.
Muestreo no probabilstico: frecuentemente se efectan procedimientos de seleccin de la muestra basados en la experiencia personal que tenga el investigador (muestreo intencional, por criterio). En
otros casos se recoge informacin de personas o familias en nmero
proporcional al de las que cumplen determinadas condiciones en la
poblacin y el investigador puede elegirlas a su criterio dentro de grupos establecidos de sexo, edad, y ciertos niveles socioeconmicos
(muestreo por cuotas). stos son algunos de los procedimientos de
muestreo no probabilstico ms utilizados.
Muestreo probabilstico: se caracteriza porque de antemano puede
calcularse la probabilidad de obtener cada una de las muestras que

ATE CDP Santa Fe | 19

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

sea posible seleccionar. Este tipo de muestreo permite efectuar


inferencias de la poblacin de la cual se obtuvo la muestra.
Muestreo aleatorio simple: es un mtodo por medio del cual se
seleccionan n unidades de una poblacin de N elementos de manera tal que cada una de las muestras posibles tengan la misma oportunidad de ser seleccionadas. En este tipo de muestreo se debe
tener conocimiento de todas las observaciones que componen la
poblacin, identificarlas y luego, por algn procedimiento de seleccin aleatoria (tablas o generacin de nmeros aleatorios), se extraen aquellos elementos de la poblacin que van a constituir la
muestra. La principal desventaja de este procedimiento es que exige la identificacin de la poblacin completa, lo cual en el caso de
poblaciones grandes puede ser impracticable.
Muestreo sistemtico: consiste en particionar la poblacin en n
(tamao de la muestra) grupos de tamao m. Del primer grupo se
elige al azar un elemento, por ejemplo el elemento numerado con k.
Del segundo se toma el elemento con el nmero k + m, y as sucesivamente hasta completar la muestra. Como ventaja se asegura la
representacin de toda la poblacin. La muestra sistemtica es menos representativa que la muestra aleatoria simple en situaciones
en que existe periodicidad oculta en la poblacin, la cual es un
movimiento cclico o peridico de los datos con la longitud del ciclo
con aproximacin al valor m, tamao de cada grupo.
Muestreo estratificado: consiste en particionar la poblacin en
subpoblaciones al agrupar en ellas los elementos ms parecidos
entre s. Cada subpoblacin se denomina estrato. Los estratos entre ellos deben ser lo ms heterogneos posible para lograr los
mejores resultados. En cada estrato se lleva a cabo un muestreo
aleatorio simple para recoger la muestra. La muestra global se obtiene al combinar las submuestras de todos los estratos. El reparto
del tamao de la muestra en los distintos estratos se llama afijacin.
Cuando la muestra se reparte por partes iguales en los estratos la
afijacin se dice igual o uniforme. Si se hace proporcional al nmero
de elementos de cada estrato, tenemos entonces la afijacin proporcional. Si se hace proporcional al nmero de elementos y a la
varianza o variabilidad de cada estrato, se tiene la afijacin ptima.
Muestreo por conglomerados: es un tipo de muestreo
probabilstico donde cada unidad de la poblacin tiene una probabilidad de ser seleccionada, aunque no necesariamente la misma.
Este muestreo es un esquema en el cual se eligen los individuos
por grupos llamados conglomerados. Los conglomerados estn for-

20 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

mados por unidades lo ms diferentes posibles, mientras que los


conglomerados son lo ms parecidos entre ellos. Es decir, este
esquema es exactamente opuesto al muestreo estratificado donde
los mejores resultados se obtienen cuando los estratos son lo ms
parecidos dentro de ellos y lo ms diferentes entre ellos.

3.7 Fuentes de obtencin de datos


La fuente de obtencin de datos puede ya existir o en otros casos
puede ser necesaria su creacin por el grupo responsable de la investigacin. Esto significa que la informacin a utilizar puede ya ser existente o bien es necesario crear una fuente propia. Las fuentes se
pueden clasificar en primarias y secundarias, oficiales y privadas.
Fuentes primarias: se denomina fuente primaria si quien publica
los datos es quien ha recogido o supervisado la recoleccin de los
mismos.
Fuentes secundarias: se denomina fuente secundaria si quien publica los datos no ha participado en la recoleccin o supervisin de
los mismos.
Fuentes oficiales o privadas: las fuentes sern oficiales o privadas segn el responsable de su recoleccin y/o supervisin sea un
organismo oficial o privado.
Son fuentes oficiales los organismos nacionales, provinciales, municipales, etc. que producen la informacin.
Una fuente privada est constituida por un grupo de gente que pertenece a una institucin privada como por ejemplo clnica, sanatorio,
etc.

3.8 Sistemas de recoleccin de datos


Hay diversos mtodos que se pueden utilizar para obtener los datos
necesarios para una investigacin. Se puede: disear un experimento, llevar a cabo registros o bien realizarse censos o encuestas.
Uno de los mtodos mencionados es la experimentacin. Los diseos experimentales son de mucha utilidad en la obtencin de datos.
No obstante, hacen uso de procedimientos estadsticos ms avanza-

ATE CDP Santa Fe | 21

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

dos que los que se presentan en este mdulo.


El registro de datos supone una anotacin continua, permanente y
obligatoria de datos. Por ejemplo en las oficinas de registros civiles
donde se consideran datos sobre nacimientos, defunciones y dems
hechos vitales que formarn parte de la obtencin de cifras relativas
muy tiles en el rea de Salud y que sern tratadas en una prxima
Unidad.
Se mencionan tambin los censos y encuestas segn se realicen en
la poblacin total o en una muestra. stos suponen la recoleccin de
datos en un perodo establecido de tiempo. En estos casos no se
ejerce control sobre el comportamiento de las personas que se investigan. Simplemente se les hacen preguntas acerca de distintos aspectos o caractersticas que se estudian.

3.9 Unidad de observacin


Persona, animal o elemento que ser observado, medido o enumerado en relacin con la o las caractersticas en estudio. Es la unidad
mnima de observacin o individuos que componen la poblacin. Por
ejemplo, si el objetivo es determinar el mejor tratamiento para un paciente cardaco, la unidad de observacin ser el "paciente cardaco", pero si el objetivo es estudiar caractersticas de la vivienda, la
unidad de observacin es en este caso la "vivienda".

3.10 Variable
Es toda caracterstica que toma diferentes valores en distintas personas, animales, lugares o cosas.
Las variables se pueden clasificar de la siguiente manera:

Clasificacin de una variable

22 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Variable cualitativa
Es la que se refiere a clasificacin, atributo o cualidad que no puede
expresarse numricamente. Se estudian por enumeracin o recuento
de las unidades observadas que presentan dicha cualidad o caracterstica. Por ejemplo, sexo, estado civil, nacionalidad, etc.

Variable cuantitativa
Es aquella que puede expresarse numricamente, es decir, asume
valores acompaados de una unidad de medida. Este tipo de variable
se clasifica en: continua o discreta.

Variable cuantitativa contina


Es aquella que tericamente puede tomar cualquier valor dentro de un
intervalo. Por ejemplo, la estatura, el peso de una persona, etc. Provienen de mediciones.

Variable cuantitativa discreta


Es aquella que toma solamente ciertos valores dentro de un intervalo,
por ejemplo, nmero de cuartos por hogar, nmero de hijos por familia, etc. Provienen de conteos.

Autoevaluacin
1. En los siguientes casos establecer la unidad de observacin, variable o caracterstica en estudio y tipo de caracterstica:
a. En los habitantes de una ciudad se pregunt el ingreso por habitante.
b. En los hogares de una determinada ciudad en 1985 se registr la
cantidad de hijos por hogar.
c. Se encuestaron establecimientos industriales de Santa Fe en 1996
para determinar la cantidad de personal ocupado.
d. En los pacientes de un hospital se registro peso, sexo y estatura
de los pacientes.

ATE CDP Santa Fe | 23

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

4. Unidad 2: Organizacin y
presentacin de datos
Una vez que los datos han sido recolectados se procede a su presentacin. Esta presentacin debe ofrecer informacin en forma simple y
concreta, de manera que el investigador pueda observar en una primera etapa exploratoria el comportamiento del fenmeno en estudio.
Las distintas formas de presentacin de los datos son: textual,
semitabular, tabular y grfica, siendo estas dos ltimas las ms importantes.
Presentacin textual: Este tipo de presentacin se puede llevar a
cabo cuando se manejan pocas cifras y se las puede incluir dentro
del texto.
Presentacin semitabular: consiste en dejar dentro del texto un
espacio para la presentacin de los datos. No es recomendable pues
puede dar lugar a confusiones o interpretaciones incorrectas. No es
comn su utilizacin.
Presentacin tabular: Consiste en la presentacin de los datos a
travs de tablas. Son muy utilizadas para la presentacin resumida
de datos. Suelen acompaar a los grficos.
Presentacin grfica: Consiste como su nombre lo indica en la
presentacin de los datos a travs de grficos. La presencia actualmente de numerosos softwares, no solamente estadsticos sino simples planillas de clculos, ha facilitado en gran medida este tipo de
presentacin de los datos.

4.1 Series simples y de frecuencias


Una serie simple de datos est constituida por los datos tal cual
fueron obtenidos de la observacin, medicin o conteo. Por ejemplo,
suponga el siguiente caso donde se estudia el diagnstico de los
pacientes que ingresan en una clnica de salud mental en un perodo
determinado. Los posibles diagnsticos son: retardo mental (R), sndrome cerebral orgnico (S), psicosis (P), neurosis (N) y trastornos
de personalidad (T).

24 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

La serie simple que se obtiene de 10 observaciones es:


xi (diagnstico): R, R, S, N, N, T, P, P, T, T
En este caso el subndice i vara de 1 a 10 indicando el orden
correspondiente al valor de la variable como se fue obteniendo dicho
valor. Es decir, la primera observacin es x1 = R, la segunda x2 = R y
as sucesivamente hasta la ltima observacin que corresponde a
x10 = T. En este caso decimos que se tienen n =10 observaciones,
En general, en una serie simple, el subndice i vara de 1 a n,
indicando n la cantidad de valores que puede tomar la variable en
estudio, es decir, de manera general, se tiene:

Sin embargo, cuando se tienen series simples numerosas, generalmente con "n" grande, de treinta o ms valores, es difcil trabajar con
ellas. En estos casos conviene obtener lo que se conoce como una
serie de frecuencias a partir de la serie simple.
Las series de frecuencias se obtienen agrupando valores dentro de
grupos que se denominan clases. El nmero de veces que se presentan valores de la variable dentro de una clase recibe el nombre de
frecuencia. Se la denota con la letra f .
En las variables cualitativas las clases suelen estar dadas directamente por los valores de la variable.
Ejemplo:
Se estudia el caso de los pacientes que ingresan en una clnica de
salud mental. Suponga que se observaron 100 pacientes y se obtuvieron los siguientes datos. (Figura 1)
La primera columna en esta tabla corresponde a las clases, es decir
los diagnsticos, la segunda columna indica la frecuencia, o sea el
nmero de pacientes que presentan los distintos diagnsticos. Por
ejemplo, el diagnstico Neurosis se presenta en 20 de los 100 pacientes observados.

ATE CDP Santa Fe | 25

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

Figura 1

En el caso de variables cuantitativas discretas, tambin generalmente las clases estn dadas por los valores que puede tomar la
variable. Se considera el siguiente ejemplo:
Ejemplo:
Se estudia el nmero de hijos en 90 familias de un determinado barrio
de la ciudad y se encuentran los siguientes valores: (Figura 2)
Figura 2

90
Nuevamente la primera columna indica los valores que puede tomar
la variable, en este caso Nmero de hijos y la segunda columna la
frecuencia, es decir el nmero de familias que presentan el valor de la
variable indicado en la primera columna. Por ejemplo, para este caso
en particular se puede decir que de las 90 familias observadas, 23 de
ellas tenan 3 hijos.
26 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Para el caso de las variables cuantitativas continuas la obtencin


de la serie de frecuencias a partir de una serie simple de datos exige
un mayor trabajo. A continuacin se explica este caso.
Se siguen los siguientes pasos:
1. Se ordenan los datos de manera creciente. Se determinan el menor
y el mayor valor de la serie.
2. Se calcula el rango. ste se define como el valor mximo menos
el valor mnimo de la variable.

3. Se determina el nmero de clases. En este caso suelen utilizarse


frmulas que ayudan a establecer este nmero. Una de ellas es la
frmula de Sturges, que se define de la siguiente manera:
donde k es el nmero de clases o intervalos
de clase, llamado de esta manera por tratarse de una variable cuantitativa continua; n es el nmero de valores en el conjunto de datos
estudiados y log10 es el logaritmo base 10. La respuesta que se obtiene al aplicar esta frmula no es definitiva, solamente se la debe considerar como una gua orientadora. El nmero de clases se puede
incrementar o disminuir por conveniencia o para lograr una presentacin ms clara de los datos. Por ejemplo, si se tuvieran 250 datos, la
frmula de Sturges sugiere la siguiente cantidad de intervalos de clase:

clases. No obstante se

podran formar 8 10 clases segn conveniencia o presentacin de


los datos. En general se aconsejan entre 5 y 10 clases.
4. A continuacin se debe establecer la dimensin, mdulo o amplitud del intervalo de clase. Generalmente se sugiere igual amplitud
para todas las clases cuando esto sea posible. sta se determina
mediante el cociente entre el rango o amplitud total de la serie completa de datos y el valor

obtenido en el paso anterior. Esto es:

ATE CDP Santa Fe | 27

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

Donde

indica la amplitud de la clase. Cuando se realiza este co-

ciente generalmente se obtiene una dimensin que no es la ms apropiado para su uso y nuevamente se utiliza el sentido comn para
elegir la amplitud o mdulo del intervalo de clase, normalmente cercana al valor obtenido al cociente antes presentado.
Se considera ahora un ejemplo para ilustrar estos pasos o etapas
para la obtencin de una serie de frecuencias a partir de una serie
simple de datos de una variable cuantitativa continua.
Este ejemplo es extrado de Bioestadstica: Base para el anlisis de
las ciencias de la salud de W. Daniel.
Ejemplo:
La siguiente tabla muestra los pesos en onzas de los tumores malignos extirpados del abdomen de 57 pacientes. (Figura 3)
Figura 3

Se aplican los pasos indicados anteriormente.

28 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

1. Se ordenan los datos de manera creciente: (Figura 4)


Figura 4

2. Se calcula el rango:

3. Se aplica la frmula de Sturges:

4. Ahora al dividir la amplitud de la serie o rango entre 7 para tener una


idea de la amplitud o dimensin de cada clase, se obtiene:

Se observa, tal cual lo antes mencionado, que para este caso en


particular un intervalo de clase de amplitud 10 sera mucho ms conveniente. Se pueden entonces construir los intervalos de clase de la
siguiente manera: (Figura 5)
5. A continuacin se procede a ubicar los diferentes valores de la
serie en las distintas clases formadas.

ATE CDP Santa Fe | 29

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

Figura 5

Se deben hacer algunas consideraciones al construir estos intervalos


de clase:
Como los valores mnimos y mximos del conjunto de datos son 12
y 79 onzas respectivamente, las clases se deben construir de manera que estos datos estn contenidos en las clases formadas.
El lmite superior de una clase coincide con el lmite inferior de la
siguiente clase. Esto es as porque al tratarse de una variable continua, de esta forma se expresa la continuidad de la variable. No obstante, en el momento de la tabulacin se debe decidir dnde ubicar
aquellos valores que coinciden con el lmite. Para ello, puede resultar
conveniente primero formar una tabla con lmites ficticios de clase
como la siguiente: (Figura 6)
Figura 6

De esta forma resulta ms fcil ubicar los valores que coinciden con
los lmites.
Una vez que estos valores estn ubicados, para la presentacin de la
tabla se vuelve al formato anterior, que asegura la presentacin de la
variable como una variable continua.

30 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Ahora ya se puede entonces construir la tabla de frecuencias, como


se denomina a la presentacin de una serie de frecuencias a travs
de una tabla.
DISTRIBUCIN DE FRECUENCIAS DE LOS PESOS (ONZAS) DE
TUMORES MALIGNOS RETIRADOS DEL ABDOMEN DE 57 PACIENTES

Se definen algunos conceptos adicionales:


Lmite inferior y superior de una clase: son los lmites de cada
clase. Cada clase tiene un lmite inferior y un lmite superior. Por
ejemplo, la primera clase en el ejemplo anterior tiene como lmite
inferior 10 y como lmite superior 20 onzas respectivamente.
Marca de clase o punto medio de clase: se define como la semisuma de los lmites inferior y superior de cada clase. Se lo denota
como xi Esto es :

Por ejemplo, a continuacin se reproduce la tabla anterior con el agregado de las marcas de clase. La marca o punto medio de la primera
clase se obtiene como:

ATE CDP Santa Fe | 31

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

DISTRIBUCIN DE FRECUENCIAS DE LOS PESOS (ONZAS) DE


TUMORES MALIGNOS RETIRADOS DEL ABDOMEN DE 57 PACIENTES

El significado o interpretacin del punto medio de clase es el siguiente: al no conocer los valores individuales en una serie de frecuencias,
los datos que se ubican en una clase determinada se consideran iguales
al valor del punto medio o marca de clase. Por ejemplo, los 10 valores
de la tercera clase en el ejemplo anterior se pueden considerar todos
iguales en promedio a 35 onzas.
El subndice i en una serie de frecuencias vara de 1 hasta la
ltima clase, en este caso en particular i vara de 1 a 7 porque son
7 las clases establecidas.
En algunas circunstancias se pueden dar clases abiertas, y clases
con distinta amplitud, mdulo o dimensin. El primer caso es aqul
donde la primera y ltima clase pueden no especificar los lmites inferior o superior respectivamente. Por ejemplo: (Figura 7)
Se observa que la primera y ltima clase tienen extremos abiertos
El otro aspecto mencionado es cuando se tienen intervalos con diferente amplitud o dimensin.
Este tipo se series se denomina plurimodular, cuando las clases
presentan distinta amplitud o mdulo. En tanto, cuando las series

32 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

tienen clases con la misma amplitud o mdulo (lo ms aconsejable),


se denominan monomodular.
Figura 7
Ejemplo:
EDAD DE PACIENTES QUE INGRESAN EN UNA SALA DE EMERGENCIA

4.1.1 Frecuencias especiales


Frecuencias relativas (fr): se obtienen dividiendo cada frecuencia
(tambin denominada frecuencia absoluta) por el total de observaciones (n). Esto es:

Este tipo de frecuencias es de utilidad para establecer la importancia


relativa de cada clase.
Frecuencias relativas porcentuales: se obtienen multiplicando las
anteriores por 100. O sea:

ATE CDP Santa Fe | 33

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

Al multiplicarlas por 100, se obtienen porcentajes, con lo cual su interpretacin es ms sencilla que las frecuencias relativas.
Frecuencias acumuladas (fa): se obtienen sumando a cada frecuencia de clase, la inmediata anterior y establecen el nmero de
observaciones que presentan valores menores o iguales a uno determinado.
Frecuencias acumuladas porcentuales: se obtienen e interpretan
en forma similar a las frecuencias acumuladas absolutas, pero a partir de las frecuencias relativas porcentuales.
A continuacin se presenta el ejemplo de los pesos de tumores antes
mencionado con el clculo adicional de estas frecuencias especiales.
DISTRIBUCIN DE FRECUENCIAS DE LOS PESOS (ONZAS) DE
TUMORES MALIGNOS RETIRADOS DEL ABDOMEN DE 57 PACIENTES

Consideraciones generales:
La suma de las frecuencias relativas es 1.
La suma de las frecuencias relativas porcentuales es 100.
El ltimo valor en la columna de las frecuencias acumuladas es el
valor total de la cantidad de datos considerado.
El ltimo valor en la columna de las frecuencias acumuladas porcentuales es 100, ya que hasta all se han acumulado el 100 % de los
datos.

34 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

4.2 Tablas estadsticas


Las tablas tienen como objetivo presentar en forma resumida los datos estadsticos. En toda tabla deben considerarse los siguientes elementos:
Ttulo
Tabla propiamente dicha
Notas aclaratorias
Fuente

Ttulo
El ttulo debe ser completo y lo ms conciso posible. Debe responder
las siguientes preguntas:
QU?, CMO?, DNDE?, CUNDO?
- QU? Qu estudia, o sea, qu se investiga, es decir, unidades de
estudio. Por ejemplo defunciones.
- CMO? Cmo se estudia, es decir, de acuerdo a qu caractersticas
o qu variables se utilizan para estudiar las unidades de observacin.
Por ejemplo sexo.
- DNDE? A qu lugar se refieren los datos. Por ejemplo Argentina.
- CUNDO? Es decir, la poca o perodo al que se hace referencia.
Por ejemplo Ao 1999.
Por ejemplo, entonces, un ttulo posible sera: Defunciones segn
sexo. Argentina. Ao 1999.
El ttulo debe ser breve, lo ms conciso posible, aunque no debe
sacrificarse la claridad a la precisin.

Tabla propiamente dicha


En este caso se consideran la matriz y el cuerpo de la tabla. La
matriz comprende la columna matriz y el encabezamiento de columnas.
ATE CDP Santa Fe | 35

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

En la columna matriz (columna izquierda), se indica la clasificacin


de los datos correspondientes a cada fila. El encabezamiento de columnas comprende los ttulos de cada columna.

El cuerpo de la tabla incluye la totalidad de las frecuencias correspondientes a la interseccin de filas y columnas, incluyendo los totales.

Nota Aclaratoria
Si se necesitan, se deben agregar notas que aclaran algn aspecto
de la tabla. Si esas aclaraciones se refieren a la tabla completa, se
colocan en la parte superior. Si se refieren solamente a alguna parte
36 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

en particular, generalmente se coloca una aclaracin en la parte inferior de la tabla. Ejemplos: a) Notas aclaratorias en la parte superior.
(Figura 8)
Figura 8
DEFUNCIONES POR ACCIDENTES, POR GRUPOS DE EDAD.
ARGENTINA. AO 2004
(Se excluyen 10 defunciones cuya edad se desconoce)

Fuente: Datos ficticios


b) Notas aclaratorias en la parte inferior.
CONSULTAS EN LA PROVINCIA DE SANTA FE. AOS 1999-2004

(a) Se produjo un grave desastre hdrico en la provincia


Fuente: Datos ficticios

Fuente
Este aspecto ya fue desarrollada ampliamente en la Unidad 1. Se
dice que la fuente siempre debe estar presente por dos aspectos:
ATE CDP Santa Fe | 37

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

primero, permite establecer de dnde provienen los datos y segundo,


si la persona que trabaja con los datos presentados en la tabla necesita mayor informacin puede recurrir a la fuente mencionada en la
misma.

4.2.1 Consideraciones generales


Uso de porcentajes
En algunas situaciones se acostumbra poner una columna extra en
un cuadro que indica la distribucin porcentual de los casos, lo cual
facilita las comparaciones. Por ejemplo, el siguiente cuadro.
Ejemplo:
DEFUNCIONES POR ACCIDENTES SEGN CAUSAS. ARGENTINA. AO 2004

Ubicacin de los totales


Los totales brindan informacin acerca de la magnitud del fenmeno
que se est estudiando. Los mismos deben ubicarse en las partes
ms destacadas de la tabla. Pueden ubicarse como primera fila o
columna o ltima fila o columna segn como quiera realizarse la lectura de estos totales.

NOTA
Clculo de los porcentajes
En la tercera columna se colocan los
valores de los porcentajes que
representan cada causa. Por ejemplo,
en la tercera causa, Cadas accidentales, el porcentaje se obtiene de la
siguiente manera:

Ordenamiento segn diferentes criterios


- Alfabtico: En este, caso si la variable de clasificacin es cualitativa, por ejemplo Departamentos de una Provincia, se sugiere un
orden alfabtico para ordenar la variable.

38 | ATE CDP Santa Fe

De la misma manera se procede con


las restantes causas.

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

- Cronolgico: Cuando hay una variable como "Aos", se respeta el


orden cronolgico de la variable.
- Magnitud de la frecuencia: Este caso se presenta cuando una
variable de clasificacin admite como adecuada el ordenamiento de
la misma de acuerdo a la magnitud de la frecuencia. Esto puede
ayudar a visualizar la importancia de cada valor de la variable de
clasificacin. Por ejemplo si se considera la variable "Diagnstico"
y se tiene como frecuencia la cantidad de pacientes que ingresan
de acuerdo a un determinado diagnstico, entonces se puede
visualizar en la tabla la magnitud de los ingresos de acuerdo a los
diferentes diagnsticos.
- Magnitud de la variable: En el caso de variables cuantitativas, se
respeta el ordenamiento de la misma segn su magnitud.
Tablas segn criterios de clasificacin
- Tablas a un criterio o de una entrada: En este tipo de tablas las
unidades de observacin se clasifican de acuerdo a una sola variable.
Ejemplo:
PACIENTES SEGN EDAD EN EL ESTABLECIMIENTO X. AO
2001

Fuente: Datos ficticios

ATE CDP Santa Fe | 39

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

- Tablas a dos criterios o de doble entrada: En este tipo de tablas


las unidades de observacin se clasifican de acuerdo a dos variables.
Ejemplo:
PACIENTES SEGN EDAD Y SEXO EN EL ESTABLECIMIENTO
X. AO 2001

Fuente: Datos ficticios

- Tablas a tres criterios o de triple entrada: En este tipo de tablas


las unidades de observacin se clasifican de acuerdo a tres variables.
Ejemplo (Figura 9)

4.2.2 Recomendaciones para la construccin de una tabla


Las tablas se complican a medida que se agregan variables, por lo
tanto es preferible varias tablas sencillas a una complicada, con muchas variables de clasificacin que complican su lectura.
Deben llevar siempre ttulo.
Deben tener siempre la fuente de los datos.
Se deben incluir los totales.
En caso de expresar los datos en porcentajes, es recomendable
indicar los totales de los cuales esos porcentajes provienen. Es preferible siempre que sea posible indicar los valores absolutos con los
cuales se calculan los porcentajes.
40 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Figura 9
PACIENTES SEGN EDAD Y SEXO EN EL ESTABLECIMIENTO
X. AOS 2000 Y 2001

Fuente: Datos ficticios

4.3 Grficos
Las grficos tienen como objetivo presentar de manera grfica los
datos estadsticos. En todo grfico deben considerarse los siguientes elementos:
Ttulo
Grfico propiamente dicho
Notas aclaratorias
Fuente
Las consideraciones con respecto a ttulo, notas aclaratorias y fuente
son similares a las ya mencionadas en el tema Tablas estadsticas. Por ello, solamente se trabajaran los aspectos relacionados
con el Grfico propiamente dicho.
Los grficos dan una idea mucho ms sinttica que las tablas estadsticas. De acuerdo a la finalidad y al pblico al cual va dirigido se
van a tener distintos tipos de grficos. De la misma forma segn la
variable en estudio se podrn utilizar diferentes grficos.

ATE CDP Santa Fe | 41

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

4.3.1 Principales grficos


Existe una gran variedad de grficos. A continuacin se considerarn
los siguientes:
1. Grfico de Barras
a. Simples
b. Dobles (triples o mltiples)
c. Compuestas (o subdivididas)
2. Grfico de sectores circulares
3. Grfico lineal
4. Grfico de Bastones
5. Histogramas
6. Polgonos de frecuencias
7. Diagrama de tallo y hojas (stem and leaf)
8. Diagrama de caja (box-plot)
9. Grficos de dispersin
10. Grficos semilogartmicos
11. Grfico polar
12. Pictogramas
13. Mapas estadsticos

Grfico de Barras
Es aquel en el cual el fenmeno que se estudia queda representado
por una serie de barras, las cuales se pueden dibujar de manera horizontal o vertical. Las barras deben tener el mismo ancho y la separacin entre barras no debe ser mayor que el ancho de las mismas. Las
barras se dibujan una para cada valor o cualidad de la variable, con
alturas que dependen de la magnitud que alcanza la variable. Se utilizan para representar variables cualitativas como as tambin cuantitativas discretas o a veces continuas (como tiempo en aos). Se
deben tener en cuenta los siguientes aspectos al construir las barras:
Si los datos que se representan no estn en alguna secuencia,
que deba conservarse, las barras deben ordenarse de tal manera
que las mismas queden de mayor a menor, con lo cual se mejora la
esttica del grfico y se favorece su visualizacin.
La escala de la frecuencia debe comenzar siempre en 0, y nunca
debe interrumpirse, pues de esta forma se da lugar a interpretaciones errneas del fenmeno que se estudia.

42 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

De acuerdo a la leyenda, esto es, a lo que representa cada barra,


las mismas sern representadas de manera horizontal o vertical.
Los nombres siempre deben ir escritos de manera horizontal.
Se tienen distintos tipos de barras: simples, dobles o mltiples y compuestas o subdivididas.
a) Barras simples: se aplica cuando se estudia un fenmeno de acuerdo a las categoras de una variable o caracterstica.
Se considera el siguiente ejemplo:
VACUNACIONES PRACTICADAS EL NODO DE SALUD I. SANTA
FE. AO 2004

Fuente: Datos ficticios


b) Barras dobles (triples o mltiples): se aplica cuando se estudia
un fenmeno de acuerdo a ms de un criterio de clasificacin y hace

ATE CDP Santa Fe | 43

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

posible comparaciones simultneas. Se considera el siguiente ejemplo modificado (extrado de Fayad Camel, Estadsticas Mdicas y
de Salud Pblica).
DEFUNCIONES POR ACCIDENTES, POR CAUSAS Y SEXO. PAS
XX. AO XXXX

Fuente: Datos ficticios

c) Barras compuestas: las aplicaciones de este tipo de barras son


similares a las del grfico anterior. En ste se construye una barra
para cada valor de una de las variables consideradas (en este ejem-

44 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

plo, causa de accidente) y para cada valor de esa variable se subdivide la barra en tantos valores como tiene la otra variable considerada
(en este ejemplo, sexo). Es decir, se puede observar la magnitud con
la cual contribuye cada valor de una de las variables para cada valor
de la otra variable considerada. Para el ejemplo tratado en particular,
se desea enfatizar para cada causa de accidente considerada la magnitud de la variable sexo.

Fuente: Datos ficticios

Grfico de sectores circulares


Este tipo de grficos, tambin conocidos como grficos de tortas,
son muy utilizados por su fcil interpretacin. Se aplican especialmente para variables de tipo cualitativas y tambin se pueden utilizar
para representar series de tiempo, no muy numerosas, aunque en
este caso no son muy comunes.
Para su construccin, el total de observaciones se iguala a la medida
de la circunferencia, o sea 360 , para luego distribuir los grados, proporcionalmente a cada uno de los valores o cualidades que toma la

ATE CDP Santa Fe | 45

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

variable considerada, segn la magnitud de sus frecuencias.


De esta manera se obtienen los diferentes ngulos que corresponden
a cada magnitud y se unen los extremos de los arcos con el centro
del crculo, de manera que quedan definidos los sectores circulares
que representan a cada modalidad y que se colorean o diferencian
indicndose en las referencias o leyendas lo que representa cada
color o trazado.
Se considera el siguiente ejemplo:

Fuente: Datos ficticios

Construccin del grfico

46 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Fuente: Datos ficticios

Grfico lineal
Este tipo de grfico se aplica especialmente para representar las series de tiempo o series cronolgicas. Para su elaboracin se utiliza un
sistema de ejes coordenados donde el eje x o de las abscisas representa la variable tiempo y el eje y o de las ordenadas representa la
frecuencia del fenmeno en estudio. De esta forma se marcan los
puntos representativos de las observaciones y se unen con lneas
rectas obtenindose el grfico lineal. En este tipo de grficos se pueden representar varias series que se indican ya sea con distintos
colores o distintos tipos de trazados para su diferenciacin, y esto se
indica en las referencias o leyendas.
Este tipo de grficos tambin se puede utilizar para estudiar la relacin funcional entre dos variables, la cual puede ser de tipo lineal,
parablica, etc.
Se considera el siguiente ejemplo, especficamente cuando se utiliza
este tipo de grfico para representar una serie de tiempo o serie
cronolgica. (Figura 10)

ATE CDP Santa Fe | 47

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

Figura 10

Fuente: Datos ficticios

Grfico de bastones
Este tipo de grficos se utiliza cuando se trabaja con variables cuantitativas discretas. La representacin se realiza en un sistema de
ejes cartesianos. En el eje horizontal (eje de las abscisas) se representan los valores de la variable en estudio y en el eje vertical (eje de
las ordenadas) se representa la frecuencia. Cada par de valores se
representa a travs de un punto. Los bastones se obtienen levantando las perpendiculares a partir de los distintos valores de la variable
en estudio y definiendo las alturas de los mismos de acuerdo a las
frecuencias que presentan esos valores de la variable en coincidencia con los puntos representativos de cada par de valores.
Se presenta el siguiente ejemplo para ilustrar este tipo de grficos.
(Figura 11)

48 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Figura 11

Fuente: Datos ficticios

Histogramas
Este tipo de grfico se utiliza para representar una distribucin de
frecuencias (o serie de frecuencias). Consiste en una serie de rectngulos (uno para cada clase) con bases adyacentes y cuyo ancho es

ATE CDP Santa Fe | 49

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

igual al ancho o amplitud de clase y cuya altura est dada por la


frecuencia correspondiente de cada clase.
Se muestra a continuacin el ejemplo tratado de los pesos de tumores malignos. Se debe observar que en este caso en particular se
trata de una serie con la misma amplitud de clase para todas las
clases. Es importante entonces deducir la principal propiedad de este
tipo de grficos: la superficie del histograma es proporcional a la frecuencia total o suma de frecuencias.

Fuente: Bioestadstica de W. Daniel

Sin embargo, se debe observar que a veces, por diversas razones,


las series de frecuencias presentan diferente amplitud de clase. Para
construir de manera correcta un histograma, en este caso se debe
colocar como altura de cada clase la razn de: frecuencia /amplitud
de clase para respetar la caracterstica principal mencionada de este
tipo de grfico.

50 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Polgono de frecuencias
Constituye otra forma de representar una serie de frecuencias. Lo
mismo que en el histograma, las ordenadas se utilizan para las frecuencias y las abscisas para la variable de clasificacin. Su principal
ventaja consiste en que ellos muestran con mayor claridad la forma
de la distribucin de una serie de frecuencias y permiten dibujar en el
mismo sistema de ejes, dos o ms polgonos correspondientes a
series diferentes que tengan similar posicin sobre el eje de las x, lo
cual no se podra realizar con los histogramas. Para su construccin
se procede de la siguiente forma: se marcan los puntos medios de
clase de los diferentes intervalos de clase en el eje de las x, y su
respectiva frecuencia en el eje y, luego se unen los puntos con lneas
rectas. El polgono puede construirse a partir del histograma correspondiente, uniendo los puntos medios de las partes superiores de los
rectngulos. Algunos autores, aconsejan cerrar el polgono (para mantener la proporcionalidad superficie-frecuencia, sealada para el
histograma) uniendo el primer punto con la marca de clase inmediata
inferior y el ltimo punto con la marca de clase inmediata superior.
A continuacin se muestra el polgono para los pesos de los tumores
(salida modificada del software statgraphics).

Fuente: Bioestadstica de W. Daniel

ATE CDP Santa Fe | 51

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

Diagrama de tallo y hojas


Es un sistema grfico muy til para representar conjuntos de datos
cuantitativos relativamente pequeos. Presenta una fuerte similitud
con el histograma y tiene el mismo propsito. Proporciona informacin respecto a la variacin del conjunto de datos, muestra la ubicacin de la mayor concentracin de mediciones y revela la presencia o
ausencia de simetra. Una ventaja del diagrama de tallo y hojas sobre
el histograma es que preserva la informacin de las mediciones individuales. Esta informacin se pierde cuando las mediciones son asignadas a los intervalos de clase del histograma. Para construirlo se
divide cada medicin en dos partes. La primera se llama tallo, y la
segunda parte se llama hojas. El tallo se forma con uno o ms dgitos
iniciales de la medicin, y las hojas se forman con los restantes
dgitos. Todos los nmeros se muestran en un solo despliegue, los
tallos forman una columna ordenada de menor a mayor. Los renglones del despliegue contienen las hojas ordenadas a la derecha de sus
respectivos tallos y representan los distintos valores de las mediciones.
El siguiente ejemplo muestra el conjunto de pesos de tumores malignos ya utilizados en el histograma para observar el diagrama de tallo
y hojas
(Salida de computadora modificada del software SPSS)

PESOS
Frecuencia Tallo & Hojas
5.00 1 . 22269
19.00 2 . 1223334455577778888
10.00 3 . 0011226688
13.00 4 . 2223334567999
4.00 5 . 0117
4.00 6 . 3589
2.00 7 . 49
Ancho del tallo: 10
Cada hoja: 1 caso

52 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Se observa en esta salida una primera columna (Frecuencia) que indica la frecuencia o cantidad de observaciones en cada tallo; la segunda (Tallo), es el primer dgito de cada observacin y la tercera (Hoja),
corresponde al segundo dgito de la observacin considerada. Por
ejemplo, en el primer tallo se tienen las observaciones: 12,12,12,16 y
19.

Diagramas de caja (box plot)


Su explicacin se realiza en la Unidad 4 ya que se necesitan desarrollar primero conceptos relacionados con las medidas de resumen.

Grficos de dispersin
Este tipo de grficos se utiliza principalmente cuando se realizan estudios de correlacin y regresin (se ver en la Unidad 5). Los puntos
se grafican en un sistema de coordenadas ortogonales asignando los
valores de la variable que se denomina independiente (x) al eje horizontal o de las abscisas y los valores de la variable que se denomina
dependiente (y) al eje vertical. El patrn que se obtiene mediante los
puntos graficados en el diagrama de dispersin generalmente sugieren la naturaleza bsica y la fuerza de la relacin entre estas dos
variables (que son particularmente variables de tipo cuantitativa).
Para construir este grfico cada punto es la interseccin de dos lneas imaginarias que pasan por los correspondientes valores de este
punto.
Ejemplo:
Se llev a cabo un experimento para estudiar el efecto de cierto medicamento para disminuir la frecuencia cardiaca en adultos. La variable independiente (x) es la dosis en miligramos del medicamento, y la
variable dependiente (y) es la diferencia entre la frecuencia cardiaca
ms baja despus de la administracin del medicamento y un control
antes de administrarlo. Se reunieron los siguientes datos: (Figura 12)

ATE CDP Santa Fe | 53

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

Figura 12

El diagrama de dispersin de estos datos se muestra a continuacin:

Fuente: Datos ficticios

54 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Grficos semilogartmicos
Si se desea representar en el mismo grfico dos series cuyas cantidades son muy diferentes, como por ejemplo las variaciones en el
nmero de glbulos rojos y de glbulos blancos, o los casos y muertes de ciertas enfermedades, la escala aritmtica no lo permitira. En
estas situaciones conviene utilizar la escala logartmica para el eje
de las ordenadas (eje y). Se considera el siguiente ejemplo modificado (extrado de Fayad Camel, Estadsticas Mdicas y de Salud Pblica).

Fuente: Datos Ficticios

ATE CDP Santa Fe | 55

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

Grfico polar o en espiral


Es un grfico de coordenadas polares. Sirve para representar la relacin entre dos variables cuantitativas, especialmente cuando una de
ellas es cronolgica y a intervalos iguales. El valor de x est dado por
un ngulo y el de y por la distancia desde el origen, sobre la lnea que
marca este ngulo. Son grficos muy efectivos para mostrar evolucin de fenmenos a lo largo de un ao por ejemplo.
Se tiene el siguiente ejemplo donde se considera la evolucin de los
casos de una determinada enfermedad a lo largo de los meses de un
ao dado. Para la construccin del grfico, entonces, para cada valor
de la variable mes le corresponde un ngulo de 30 . Sobre cada una
las lneas que delimitan los ngulos se marca en escala el valor correspondiente de los casos de la enfermedad considerada.

56 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Fuente: Datos ficticios

Pictogramas o grficos de figuras


Este tipo de grficos son apropiados para publicaciones de divulgacin popular. Son de fcil interpretacin. Consisten en dibujos esquemticos y relacionados con el fenmeno que se va a representar.
Cada figura es equivalente a una cantidad determinada, preferentemente entera, de unidades de la variable que se representa y el nmero de unidades y su tamao es proporcional a la magnitud a representar. Solamente deben utilizarse para situaciones muy particulares
ya que cuando se representa (como sucede la mayora de las veces)
cantidades que no son exactas, este tipo de grfico no es aconsejable.

ATE CDP Santa Fe | 57

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

Se considera el siguiente ejemplo:


CANTIDAD DE AMBULANCIAS EN CINCO CIUDADES IMPORTANTES DE LA PROVINCIA. AO 2003

Fuente: Datos ficticios

Mapas estadsticos
En este tipo de grficos interesa indicar la intensidad con la cual se
presenta un fenmeno en una regin geogrfica dada. Mediante diferentes rayados o colores se puede expresar la magnitud del fenmeno como as tambin su ubicacin.

Autoevaluacin
1. Los siguientes datos corresponden al color de 80 ratones empleados en un experimento.

58 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

a. Diga cul es la unidad de observacin.


b. Cul es la variable o caracterstica estudiada. Qu tipo de variable es?
c. Represente grficamente mediante un grfico de barras.
2. Los siguientes datos corresponden a la poblacin de Santa Fe en
miles de habitantes.

Fuente: IPEC

- Represente los datos mediante un grfico lineal.


3. Los datos que figuran a continuacin corresponden a ventas de
productos farmacuticos en USA en el ao 1996 en millones de dlares. Represente los datos mediante un grfico de sectores circulares
(en porcentajes).

Fuente: OMS

4. Se estudiaron 640 hogares y se observ nmero de cuartos por


hogar. Se observ que 140 hogares tenan 1 cuarto por hogar; 220 , 2

ATE CDP Santa Fe | 59

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

cuartos por hogar; 170, 3 cuartos por hogar y 80 hogares tenan 4


cuartos por hogar.
a. Represente los datos mediante una tabla.
b. Indique unidad de observacin.
c. Diga cul es la variable en estudio y tipo de variable.
d. Represente los datos grficamente mediante un grfico de bastones.
5. Los siguientes datos corresponden a edades de 36 pacientes en
aos. Construir una tabla de frecuencias utilizando como lmite inferior de la primera clase 20 aos y amplitud de clase en todas las
clases igual a 4 aos. Calcule media, mediana, modo, rango, desviacin estndar, variancia y coeficiente de variacin. Represente grficamente mediante un histograma y polgono de frecuencias.
39, 21, 35, 42, 25, 28, 33, 29, 40,
26, 43, 41, 37, 35, 45, 42, 26, 25,
33, 32, 35, 38, 24, 41, 25, 28, 30,
27, 30, 35, 37, 40, 32, 33, 37, 38

60 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

5. Unidad 3: Cifras absolutas y


relativas
En el sector Salud es muy importante contar con informacin
sobre las cifras absolutas de los eventos o fenmenos con los
cuales se trabaja para lograr una adecuada planificacin del rea.
Cifras absolutas tales como poblacin por sexo y edad, nacidos vivos, defunciones generales, defunciones infantiles, cantidad de consultas en un hospital que se producen en un perodo determinado,
son de vital importancia conocer a la hora de planificar y tomar decisiones. No obstante estos valores absolutos son necesarios conocer, resultan de gran utilidad una serie de cifras relativas muy utilizadas en el rea de Salud. En este ltimo caso se destacan las conocidas como tasas que se estudiaran a continuacin. Tambin se vern
razones y proporciones. En cada uno de los casos se darn las definiciones y ejemplos.

a) Tasa
An cuando hay algunas excepciones, este trmino se utiliza por lo
general para referirse a aquellos clculos que implican la probabilidad
de ocurrencia de algn evento. Una tasa se expresa en la forma:

Donde: la a frecuencia con la cual se ha presentado un evento


durante algn perodo especificado.
a+b: El nmero de personas expuestas al riesgo del evento durante el
mismo perodo.
k: Algn nmero como 10, 100, 1000, 10000 100000. Su propsito
es evitar resultados que comprendan nmeros muy pequeos que
pueden surgir en el clculo de las tasas, y facilitar la comprensin de
las mismas. Se lo puede considerar como un factor de ampliacin o
multiplicador.

b) Razones
Una razn es una fraccin de la forma:

ATE CDP Santa Fe | 61

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

Donde k es como se ha definido en el caso de una tasa y tanto c


como d se refieren a la frecuencia de ocurrencia de algn evento o
artculo. Este tipo de indicador relaciona ya sea dos categoras distintas de un mismo fenmeno, por ejemplo nacidos vivos femeninos y
nacidos vivos masculinos; o bien dos fenmenos distintos en un mismo lugar y tiempo, por ejemplo, nmero de habitantes y superficie en
kilmetros cuadrados.
En el caso de una razn, contrario de la tasa, el numerador no es una
parte componente del denominador. Por ejemplo puede hablarse de la
razn de personas-mdicos o personas-camas en el hospital de cierta rea geogrfica. Los valores de k que se utilizan con mayor frecuencia en las razones son 1 y 100.

c) Proporciones
Esta cifra relativa relaciona una parte con el total al cual esa parte
pertenece. Si se multiplica por 100 se obtiene el porcentaje.
Ejemplo:

5.1 Clasificacin de las Tasas


Dentro de las tasas se consideran las tasas de mortalidad, morbilidad
y fecundidad.

a) Tasas de mortalidad
Las tasas de mortalidad expresan la frecuencia relativa de ocurrencia
de muerte en algn intervalo especfico en una poblacin en particular. El denominador de una tasa de mortalidad se conoce como poblacin en riesgo. El numerador representa slo aquellas muertes que
ocurrieron en la poblacin, especificada por el denominador. Estas
tasas pueden ser:
Tasa bruta de mortalidad: Es aquella en la cual el denominador
incluye el total poblacional del rea en estudio.
Tasa especfica de mortalidad: Es aquella en la cual el denominador incluye slo un subgrupo de la poblacin (por ejemplo subgrupos
de edad, sexo, estado civil, etc.).
62 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Adems, para ambos tipos de tasas se pueden calcular tasas de


mortalidad general o mortalidad por causa determinada:

Algunos ejemplos:

Supongamos que los clculos den como resultado el valor 8.5, este
valor se lee como 8.5 defunciones por mil habitantes y se denota
como 8,5

Supongamos que los clculos den como resultado el valor 8.5 y que
la causa fueran muertes por tumores, entonces este valor se lee como
8.5 defunciones debido a tumores por cien mil habitantes.

ATE CDP Santa Fe | 63

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

5.2 Tasas especiales de mortalidad


Tasa de mortalidad infantil: este indicador relaciona el nmero de
defunciones de menores de 1 ao con los nacidos vivos de la regin
y perodo considerado. De acuerdo a la definicin de tasa, en el denominador debe figurar la poblacin expuesta al riesgo, en este caso es
la de menores de 1 ao. El motivo de usar los nacidos vivos en el
denominador reside en el desconocimiento del nmero exacto de
menores de 1 ao salvo en los aos censales y la consecuente necesidad de recurrir a estimaciones para los aos intercensales. Es ms
factible contar con el nmero de nacidos vivos en el perodo considerado y por ello se utiliza este denominador.

Tasa de mortalidad materna: este indicador expresa el riesgo de


morir que tiene una mujer por causas relacionadas con la maternidad (embarazo, parto, puerperio). Se obtiene relacionando las
defunciones femeninas por causa materna y los nacidos vivos.
De la misma forma que en el caso de mortalidad infantil, si bien el
denominador no coincide exactamente con la poblacin expuesta al
riesgo, se usa convencionalmente para el clculo de esta tasa a
nivel mundial por ser mucho ms factible la determinacin de los
nacidos vivos que la poblacin expuesta al riesgo.

64 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Por ejemplo:
Defunciones maternas: 25
Nacidos vivos: 65000

Este resultado se lee como 38.5 defunciones maternas por cada


100000 nacidos vivos.
Tasa de mortalidad neonatal: esta tasa se define como:

Tasa de mortalidad fetal: esta tase se define como:

La muerte fetal se define como la muerte antes de la expulsin completa de su madre de un producto de la gestacin, independientemente de la duracin del embarazo. La OMS recomend clasificarla como
Precoz (menos de 20 semanas de gestacin desde la ltima menstruacin), Intermedia (de 20 a 28 semanas) y Tarda (28 semanas
completas o ms). Existen problemas asociados con el uso e interpretacin de esta tasa. Hay variaciones entre las diferentes regiones
que informan con respecto a la duracin de la gestacin.
Tasa de mortalidad perinatal: esta tasa se calcula como:

ATE CDP Santa Fe | 65

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

El resultado de esta tasa indica el nmero de fetos muertos con el


peso de por lo menos 500 grs.; ms el nmero de muertos menores
de una semana.
Otros indicadores de mortalidad:
Tasa de letalidad: este indicador mide el riesgo de morir entre
enfermos de una causa determinada. Se define como:

Tasa de mortalidad hospitalaria: este indicador se define como:

Donde: egresos hospitalarios se define como: altas + defunciones.


Si se observa la definicin de esta tasa, ella constituye en realidad
un porcentaje, por estar el numerador incluido en el denominador y
multiplicarse la fraccin por 100.

b) Tasas de morbilidad
Estas tasas miden los riesgos de enfermedad. Existen dos tasas o
formas de establecer la morbilidad:
Tasa de incidencia: considera solamente los casos que comenzaron en el perodo de estudio. Se define como:

Tasa de prevalencia: aunque se la menciona como tasa, la tasa


de prevalencia es en realidad una razn, ya que se calcula a partir
de la siguiente relacin:

66 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

En estos dos tipos de tasas, incidencia y prevalencia, el valor de k


depende de la magnitud del numerador. Se utiliza una base de 1000
cuando resulta conveniente, pero puede utilizarse 100 para las enfermedades ms comunes, y 10000 100000 para aquellas que son
menos comunes o ms raras. La tasa de incidencia es til para determinar la necesidad de medidas preventivas. Es una medida muy importante tanto para las enfermedades crnicas como para las agudas. La tasa de prevalencia es esencialmente til en el estudio de las
enfermedades crnicas, pero puede calcularse tambin para las enfermedades agudas.
Dentro del anlisis de las tasas de morbilidad se debe considerar una
tasa especial:
Tasa de ataque secundario: sta mide la ocurrencia de una enfermedad contagiosa entre personas susceptibles que se han expuesto
a un caso primario, y se define como:

Esta tasa se utiliza para estimar la propagacin de la infeccin y se


aplica por lo general a grupos cerrados como clases en una escuela,
donde puede esperarse que todos los miembros estuvieron expuestos.
c) Tasas de fecundidad: El trmino fecundidad se utiliza para referirse a la capacidad de concebir, contrario al acto real de dar a luz, para
el cual se utiliza el trmino fertilidad. Se utilizan los siguientes
indicadores:

ATE CDP Santa Fe | 67

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

Algunas razones especiales


a) Razn de mortalidad fetal: esta razn se define como:

Donde k se toma como 100 1000.


b) Razn de causas de defuncin: este ndice se utiliza para estimar la importancia relativa de una causa determinada de defuncin.
No obstante, debe utilizarse con precaucin al comparar dos comunidades. Una razn de causa de defuncin mayor en una comunidad
que en otra puede deberse a que la primera comunidad tiene una baja
mortalidad debida a otras causas. Esta razn se define como:

c) Razn de mortalidad proporcional: se ha sugerido este ndice


como una medida nica para comparar las condiciones sanitarias
globales de diferentes comunidades. Se define como:

68 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Segn la OPS en regiones con buenas condiciones de Salud los valores de esta razn son superiores al 60 % 70 %.
d) Razn de muertes-casos: esta razn es til para determinar qu
tanto xito est teniendo un programa de tratamiento para cierta enfermedad. Se define como:

El perodo de tiempo que se considera es arbitrario y depende de la


naturaleza de la enfermedad y puede abarcar varios aos para una
enfermedad endmica.
e) Razn de inmadurez: esta razn se define como:

5.3 Consideraciones generales


Algunas de las condiciones generales a tener en cuenta en el uso y
construccin de una cifra relativa son las siguientes:
En el denominador de una tasa se ubica la cantidad poblacional
expuesta al riesgo del evento o fenmeno que se considera en el
numerador.
Dado que la informacin muchas veces necesaria para la construccin de una tasa se refiere a la poblacin total, cuyo dato solamente
se tiene en los aos censales, se deben hacer estimaciones para los
perodos intercensales.
La poblacin considerada en el denominador de muchas tasas, cambia su magnitud a lo largo de un ao, por ello se considera la poblacin a mitad del perodo de referencia, por lo general si es anual, se
toma al 30 de junio.
Se debe tener especial cuidado en que exista concordancia entre el
numerador y denominador de una tasa en lo que se refiere a la natura-

ATE CDP Santa Fe | 69

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

leza del hecho, rea geogrfica, perodo de tiempo, etc.


Se debe utilizar el factor de ampliacin apropiado para hacer ms
entendibles los resultados.
En lo posible acompaar las cifras relativas de las correspondientes
magnitudes absolutas que las originan.

Autoevaluacin
1. En base a la siguiente informacin calcular e interpretar los cuatro
tipos de tasas de mortalidad mencionados para un cierto lugar y perodo determinado.
Poblacin total: 3435768
Poblacin del grupo 30-40 aos: 245364
Defunciones totales: 33854
Defunciones por accidentes: 2645
Defunciones totales del grupo 30-40 aos: 1563
Defunciones por accidentes del grupo 30-40 aos: 257
2. Calcular e interpretar la importancia relativa de las muertes por
cncer en cierto lugar y perodo dado con los siguientes datos:
Defunciones totales: 268536
Defunciones por cncer: 25874
3. Calcular el porcentaje de muertes por accidentes discriminados por
sexo para la siguiente informacin:

4. Calcular una razn que relacione los siguientes conceptos.


a. Cantidad de mdicos por 1000 habitantes.
b. Cantidad de habitantes por mdicos.
c. Cantidad de camas por 1000 habitantes.

70 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

6. Unidad 4: Medidas de posicin y


dispersin
El objetivo de la Estadstica Descriptiva, como se estableciera en la
Unidad 1, es presentar de manera resumida la informacin contenida
en un conjunto de datos. Esta finalidad se logra presentando los datos en tablas, grficos, como se describiera en la Unidad 2. Otra
manera de resumir los datos es mediante medidas que proporcionan
alguna informacin sobre diferentes aspectos y caractersticas de la
serie de datos. Estas medidas descriptivas se denominan en general
medidas de resumen y se pueden calcular a partir de los datos de una
muestra o de los datos de una poblacin. Para distinguirlas entre s
se tienen las siguientes definiciones:
1. Una medida descriptiva calculada a partir de los datos de una muestra se llama estadstica.
2. Una medida descriptiva calculada a partir de los datos de una po-

Otra manera de resumir los


datos es mediante medidas
que proporcionan alguna
informacin sobre diferentes
aspectos y caractersticas de
la serie de datos. Estas
medidas descriptivas se
denominan en general medidas de resumen y se pueden
calcular a partir de los datos
de una muestra o de los
datos de una poblacin.

blacin se llama parmetro.


Adems, se pueden considerar diferentes tipos de medidas de resumen. Entre ellas se tienen:
De posicin: si la informacin que proveen se refiere a la ubicacin
(en el eje de las x) del conjunto de datos y en particular si indican el
lugar donde se encuentra el centro de la serie, reciben el nombre de
medidas de tendencia central.
De variabilidad o dispersin: es el caso en el que se trata de
proporcionar una idea acerca de la distribucin de los datos.
De asimetra.
De kurtosis: se refiere al grado de concentracin de los valores
centrales.

6.1 Medidas de Posicin


Dentro de ellas se encuentran las medidas de tendencia central que
se denominan as porque indican la ubicacin del centro del conjunto
de datos. De acuerdo al criterio usado para determinar el centro, las
tres medidas de tendencia central de uso ms frecuente son: la me-

ATE CDP Santa Fe | 71

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

dia aritmtica, la mediana y el modo. A continuacin se desarrollarn


el concepto, caractersticas y forma de clculo de cada una de ellas.

Media Aritmtica
Es la medida de tendencia central ms conocida. La mayora de la
gente tiene en mente esta medida cuando se habla de promedio. Se
obtiene sumando todos los valores en una poblacin o muestra y se
divide entre el nmero de valores sumados.
Para una poblacin se la define como:

donde el smbolo

significa que todos los valores para la variable

se suman desde el primero hasta el ltimo. Este smbolo se conoce


como signo de sumatoria. Los valores de la variable se representan
como:
xi donde el subndice i vara de 1 a N, cantidad de datos de la
poblacin. Para el caso de una muestra se expresa de la siguiente
forma:

En este caso se tiene:


xi donde el subndice i vara de 1 a n, cantidad de datos de la
muestra.
Ejemplo:
Se tiene disponible una muestra que se compone de 10 (n =10) edades de pacientes que ingresan a una sala de emergencia.

72 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Entonces:

La media aritmtica tiene las siguientes propiedades:


Es nica. Para un conjunto de datos hay una y slo una media
aritmtica.
Simplicidad. El clculo y comprensin de la media aritmtica son
sencillos.
La suma de los desvos es cero. Si se designa con la letra d a las
diferencias entre cada valor y la media, se define el desvo como:

Se puede demostrar que:


Es sensible a los valores extremos. Como todos los valores del
conjunto de datos se consideran en el clculo de la media, sta resulta muy afectada por los valores extremos que influyen sobre la misma y que en algunos casos pueden distorsionarla y por lo tanto no
resulta una medida apropiada de tendencia central.

Clculo para una serie de frecuencias


Su frmula de clculo en series de frecuencias es:

ATE CDP Santa Fe | 73

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

Donde:

En este caso el subndice i vara de 1 a k, donde k indica la


cantidad de clases de la serie de frecuencias.
Ejemplo:
El siguiente ejemplo ser desarrollado para el clculo de todas las
medidas (posicin y dispersin) a lo largo de esta Unidad.
Considere la siguiente tabla de frecuencias que muestra estaturas en
metros de 100 pacientes que ingresaron a una sala de emergencia en
un perodo determinado.

La primera columna indica las clases, la segunda, los intervalos de


clase, la tercera, el punto medio o marca de clase, la cuarta columna
indica la frecuencia, la quinta es una columna adicional necesaria
para el clculo de la media y la sexta columna es la columna de las
frecuencias acumuladas que se utilizarn para el clculo de la mediana. En este caso el valor de la media se calcula entonces como:

74 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Mediana
Es aquel valor que divide al conjunto de datos ordenado en dos
partes iguales, de forma tal que el nmero de valores mayor o igual
a la mediana es igual al nmero de valores menores o iguales a sta.
Si el nmero de valores es impar, la mediana es el valor medio. Cuando el nmero de valores en el conjunto de datos es par, entonces la
mediana corresponde a la media aritmtica de los dos valores centrales. A continuacin se ejemplifican estas dos situaciones que se pueden dar para series simples de datos.
Ejemplo (n impar):
Calcular la mediana en la siguiente serie de datos que corresponde a
edades de 7 pacientes:

Es aquel valor que divide al


conjunto de datos ordenado
en dos partes iguales, de
forma tal que el nmero de
valores mayor o igual a la
mediana es igual al nmero
de valores menores o iguales
a sta. Si el nmero de
valores es impar, la mediana
es el valor medio. Cuando el
nmero de valores en el
conjunto de datos es par,
entonces la mediana corresponde a la media aritmtica
de los dos valores centrales.

xi : 23 , 12 , 14 , 21 , 7, 32 , 24
En primer trmino se ordenan los datos de la serie:
7, 12, 14, 21, 23, 24, 32
Entonces la mediana que se denota (

o Mna o Md) va a ser igual

en este caso a 21 aos:


Md = 21aos
Ejemplo (n par):
Calcular la mediana en la siguiente serie de datos que corresponde a
edades de 6 pacientes:
xi : 23 , 12 , 14 , 22 , 7, 26
En primer trmino se ordenan los datos de la serie:
7, 12, 14, 22, 23, 26
Entonces la mediana en este caso va a ser la media aritmtica entre
los dos valores centrales (14 y 22 ):

ATE CDP Santa Fe | 75

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

Clculo para una serie de frecuencias


Para obtener la mediana en una serie de frecuencia primero se debe
ubicar la clase que contiene la mediana. Para ello se procede de la
siguiente manera: se establece el valor de:

y aquella clase cuya frecuencia acumulada supera este valor constituye la clase de la mediana. Teniendo esto en cuenta se aplica la
siguiente frmula de clculo para series de frecuencias (no se realizar la deduccin de esta frmula):

Donde:
= Lmite inferior de la clase que contiene la mediana.
= frecuencia acumulada hasta la clase anterior a la que contiene
la mediana.
= frecuencia de la clase que contiene la mediana.
a: amplitud de clase.
Ejemplo:
Utilizando el mismo ejemplo que se us para el clculo de la media
para series de frecuencias, primero se ubica la clase de la Mediana,
esto es:

entonces se observa la columna de las frecuencias acumuladas y se


busca aquella clase que supere el valor 50. Esto corresponde a la
cuarta clase. Y ahora teniendo presente que sa es la clase que contiene la Mediana, se aplica la frmula y se procede de la siguiente
manera.

76 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Modo
Es aquel valor que ocurre con mayor frecuencia. Si todos los valores
son diferentes, se dice que la serie no tiene modo. Por otro lado,
puede ocurrir que haya ms de un modo. El modo se puede utilizar
para describir datos cualitativos. Por ejemplo, supongamos una serie
de pacientes de una clnica de salud mental que reciben los siguientes diagnsticos: retardo mental, sndrome cerebral orgnico, psicosis, neurosis y trastornos de personalidad. Aquel diagnstico que
ocurriera con mayor frecuencia en el grupo de pacientes se denominara diagnstico modal.
Ejemplo:
Calcular el modo en la siguiente serie de datos que corresponde a
edades de 9 pacientes:
xi : 23 , 12 , 14 , 21 , 7, 32 , 24, 21, 21
En este caso el Modo (que se denota como Mo o

) sera 21 aos.

Mo = 21 aos

Clculo para una serie de frecuencias


Para su clculo en series de frecuencia primero se debe ubicar la
clase modal. La clase modal se define como aquella clase con mayor
frecuencia. Una vez obtenida la clase modal o la clase que contiene
el modo se aplica la siguiente frmula de clculo en series de frecuencias (su deduccin no se realizar):

Donde:
= Lmite inferior de la clase que contiene el modo.

ATE CDP Santa Fe | 77

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

= diferencia entre la frecuencia de la clase modal y la frecuencia


de la clase anterior a la que contiene el modo.
= diferencia entre la frecuencia de la clase modal y la frecuencia
de la clase posterior a la que contiene el modo.
a: amplitud de clase.
Ejemplo:
Utilizando el mismo ejemplo ya tratado, se ubica primero la clase
modal o aquella clase que contiene el modo. Para ello se observa la
columna de las frecuencias y aquella con la mayor frecuencia es la
clase modal. En este caso se trata de la cuarta clase. Se aplica
entonces la frmula y se obtiene lo siguiente:

Otras medidas de Posicin


Otras medidas de posicin pero no necesariamente de tendencia central
lo constituyen los cuartiles, deciles y percentiles.
Los cuartiles son tres valores:
Q1: primer cuartil, Q2: segundo cuartil, Q3: tercer cuartil,
Estos valores dividen al conjunto de datos, despus de haber sido
ordenados de forma creciente, en 4 partes iguales de manera tal que:
Por debajo de Q1 se encuentra el 25 % de los datos y por arriba del
mismo el 75 % de la serie.
Por debajo de Q2 se encuentra el 50 % de los datos y por arriba del
mismo el otro 50 % de la serie. Es decir Q2 coincide con la mediana.
Q3 deja por debajo del mismo el 75 % de los datos y por arriba de l
queda el 25 % de la serie.
Cuando se quieren calcular los cuartiles para los datos no agrupados,
se utilizan las siguientes frmulas:
sima observacin ordenada
sima observacin ordenada
sima observacin ordenada

78 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Ejemplo:
A continuacin se presentan las edades de 25 pacientes que ingresan en una sala de espera a una determinada hora:
4, 24, 35, 2, 8, 17, 19, 7, 12, 33, 14, 37, 7, 14, 18, 31, 28, 18, 6, 36,
41, 9, 7, 27, 30
Primero se deben ordenar los datos de manera creciente:
2, 4, 6, 7, 7, 7, 8, 9, 12, 14, 14, 17, 18, 18, 19, 24, 27, 28, 30, 31, 33,
35, 36, 37, 41
A continuacin se aplican las frmulas establecidas previamente.
obervacin ordenada
obervacin ordenada
obervacin ordenada
De acuerdo con estos resultados se obtendran los siguientes valores
para los cuartiles:

Como se notar, cuando la ubicacin del cuartil no corresponde a un


valor exacto, se procede, al igual que en el caso de la mediana, a
realizar el promedio entre los dos valores entre los cuales se encontrara el respectivo cuartil.
Por ejemplo, para el primer cuartil en el caso considerado, como la
ubicacin es la 6.5 observacin ordenada, se toma el promedio entre
la sexta y sptima observacin.
De la misma manera se procede para el tercer cuartil, en este caso se
considera el promedio entre la decimonovena y vigsima observacin.

ATE CDP Santa Fe | 79

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

Clculo para una serie de frecuencias


En series de frecuencias la frmula de clculo es similar a la de la
mediana. Para establecer la clase donde se ubica el primer cuartil
deber utilizarse la frmula:

Para ubicar el segundo cuartil se utiliza:

lo cual coincide con la utilizada para ubicar la clase de la mediana.


Para ubicar la clase donde se encuentra el tercer cuartil se proceder
entonces al clculo de:

Una vez establecida la clase donde se encuentra el isimo cuartil (i =


1,2,3) entonces se aplica la siguiente frmula de clculo:

Donde:
i = 1,2,3
= lmite inferior de la clase que contiene el isimo cuartil.
= frecuencia acumulada hasta la clase anterior a la que contiene el isimo cuartil.
= frecuencia de la clase que contiene el isimo cuartil.
a = amplitud de clase.
80 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Los deciles son nueve valores y dividen a la serie de datos en 10


partes iguales. Se los denota como:
D1, D2, D3, D4, D5, D6, D7, D8, D9
En este caso se interpreta de la siguiente manera:
D1 deja por debajo de l el 10 % de los datos y por encima el 90 % de
la serie y as sucesivamente con los siguientes deciles.
De esta forma el D5 coincide con la mediana. Tanto los deciles como
percentiles se utilizan comnmente con series agrupadas o de frecuencias. Por ello se proceder directamente a considerar las frmulas de clculo utilizadas en dichas series.
Clculo para una serie de frecuencias
Para ubicar la clase donde se encuentra el isimo decil (i=1,2,...9) se
procede de manera similar a la explicada para los cuartiles. En general, se aplicar entonces la siguiente frmula:

donde i=1,2,3,...9
Una vez establecida la clase que contiene el isimo decil se aplica la
siguiente frmula de clculo:

El significado de los trminos es similar al de la frmula para la determinacin de los cuartiles en series de frecuencias.
Los percentiles son 99 y dividen a la serie de datos en 100 partes
iguales. Se los denota como Pi, con i = 1,2,3,,,,,99
La interpretacin es la misma que la de los deciles. Para el P1, por
ejemplo, se interpreta que por debajo del mismo se encuentra el 1 %
de los datos y por encima el 99 % de la serie. En este caso el P50
coincide con la mediana.

ATE CDP Santa Fe | 81

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

Clculo para una serie de frecuencias


Para ubicar la clase donde se encuentra el isimo percentil (i=1,2,...99)
se procede de manera similar a la explicada para los deciles. En
general se aplicar entonces la siguiente frmula:

donde i=1,2,3,...99
Una vez establecida la clase que contiene el isimo percentil se aplica la siguiente frmula de clculo:

El significado de los trminos es similar al de la frmula para la determinacin de los cuartiles y deciles en series de frecuencias.

6.2 Medidas de Dispersin


La dispersin de un conjunto de observaciones se refiere a la variabilidad que muestran estos valores. La magnitud de la dispersin es
pequea cuando los valores, aunque diferentes, son cercanos entre
s. Si los valores estn ampliamente esparcidos, la dispersin es
mayor. Como medidas de dispersin se tienen: la amplitud o rango, la
varianza y la desviacin estndar. stas se conocen como medidas
de variabilidad absoluta. Como medida de variabilidad relativa se tiene el coeficiente de variacin. A continuacin se explican estas medidas.

Rango o amplitud
Esta medida de variacin se define como la diferencia entre el valor
ms grande y el valor ms pequeo de una serie de datos. Se la
denota con la letra R.

82 | ATE CDP Santa Fe

La dispersin de un conjunto
de observaciones se refiere a
la variabilidad que muestran
estos valores. La magnitud
de la dispersin es pequea
cuando los valores, aunque
diferentes, son cercanos
entre s. Si los valores estn
ampliamente esparcidos, la
dispersin es mayor.

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Su utilidad es limitada ya que solamente depende de los valores extremos y se pueden tener dos series de datos con el mismo rango
pero diferente variabilidad ya que en el centro de la serie los datos se
comportan de diferente manera.
Esta situacin no es evidenciada por el rango. Su ventaja reside en la
simplicidad de su clculo.
Ejemplo:
Se tiene disponible una muestra que se compone de 10 (n =10) edades de pacientes que ingresan a una sala de emergencia:
12 , 28 , 74 , 15 , 3 , 16 , 7 , 58 , 8 , 45
Los datos ordenados son: 3 , 7 , 8 , 12 , 15 , 16 , 28 , 45 , 58 , 74
Por lo tanto el rango est dado por:

Clculo para una serie de frecuencias

Ejemplo:
Utilizando el ejemplo ya considerado de las estaturas de pacientes se
tiene:

Varianza
Cuando los valores de un grupo de datos se encuentran ubicados
cerca de la media, la dispersin es menor que cuando estn ms
dispersos. Esta idea permite considerar una medida de dispersin
que tenga en cuenta la variabilidad alrededor de la media. Esta medida se conoce como varianza o variancia. Para calcularla se resta la
media de cada uno de los valores individuales y estas diferencias se
elevan al cuadrado y se suman.

ATE CDP Santa Fe | 83

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

Luego esta suma se divide por la cantidad de datos. Se hace la distincin segn se calcule la variancia en la poblacin o en la muestra (de
manera similar a como se procedi con la media aritmtica).
En la poblacin se tiene:

En la muestra este clculo se realiza de la siguiente manera:

El denominador en este caso es (n-1) y no n como se podra pensar.


La razn de este denominador no est al alcance de este mdulo,
solamente se dice que de esta manera S2 calculado en la muestra
estima mejor al verdadero valor de la poblacin.

84 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Ejemplo: Se considera el mismo ejemplo donde se calcul la media


Se recuerda que en el mismo se obtuvo

. Se construye

la siguiente tabla con las columnas auxiliares necesarias para el clculo de la varianza.
Entonces:

Clculo para una serie de frecuencias

Donde:
: punto medio o marca de clase.
: media aritmtica.
: frecuencia de la clase i.
: suma de todas las frecuencias. Total de datos.
Ejemplo:
Para poder calcular la varianza (y posteriormente) la desviacin
estndar, se agregarn columnas a la tabla del ejemplo de series de
frecuencias utilizado para el clculo de las medidas de tendencia central anteriormente presentada.

Se recuerda que el valor de la media aritmtica ya obtenido fue de


1.477. Al aplicar entonces la frmula utilizando los clculos interme-

ATE CDP Santa Fe | 85

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

dios que se observan en la tabla se tiene:

Para la primera fila de esta tabla se tendran los siguientes clculos


que se repiten para las restantes filas:

Desviacin estndar
Es solamente la raz cuadrada de la variancia con lo cual las unidades vuelven a ser las originales. Para una serie simple de clculos se
tiene:

Ejemplo:
Para la serie simple ya trabajada para el clculo de la variancia se
tiene:

Se observa que las unidades en las que se expresa la desviacin


estndar son las unidades originales de la variable (aos, en este
caso en particular).

Clculo para una serie de frecuencias

86 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Para la serie de frecuencias considerada la desviacin estndar estar dada por:

Coeficiente de variacin
Se denota como C.V. La desviacin estndar es til como medida de
dispersin, pero cuando se quiere comparar la dispersin de dos conjuntos de datos, la comparacin de las dos desviaciones estndar
puede dar resultados equivocados. Esto ocurre si las dos variables
involucradas tienen medidas en diferentes unidades (por ejemplo si
se comparan estatura y peso) o si utilizando las mismas unidades de
medicin, las dos medias pueden ser diferentes (por ejemplo si se
comparan pesos de nios y de adultos). En estos casos se necesita

Se denota como C.V. La


desviacin estndar es til
como medida de dispersin,
pero cuando se quiere comparar la dispersin de dos
conjuntos de datos, la comparacin de las dos desviaciones estndar puede dar
resultados equivocados.

de una medida que expresa la desviacin estndar como porcentaje


de la media. La frmula es como sigue:

Se observa que la desviacin estndar y la media se expresan en las


mismas unidades y por lo tanto se obtiene una medida adimensional
que al multiplicarla por cien nos da la medida en porcentaje.
Veamos el siguiente ejemplo:

Si se comparan las desviaciones estndar de las dos muestras referida a los pesos, parecera indicar que presentan ambas muestras la
misma variabilidad.

ATE CDP Santa Fe | 87

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

Pero si se calculan los C.V. para ambas muestras se obtiene:

Si se observan los valores obtenidos, entonces la conclusin es diferente. La muestra I presenta menor variabilidad que la muestra II.
Ejemplo:
Si se calcula el valor del C.V. para el ejemplo de serie de frecuencias
considerado en esta Unidad se tiene el siguiente valor:

6.3 Medidas de Asimetra y Curtosis


Adems de las medidas de posicin y de variabilidad, en el anlisis
descriptivo de los datos se pueden utilizar otras medidas para observar la distribucin de los mismos. Estas medidas son el coeficiente
de sesgo y el coeficiente de curtosis. Solamente se dirn de estas
medidas que la primera mide si se trata de una distribucin simtrica
o sesgado y la segunda es una magnitud que indica el grado de concentracin de los valores centrales.

6.4 Diagrama de Caja o Box Plot


Un grfico muy til es el diagrama de caja o Box Plot que se encuentra dentro de lo que se denomina anlisis exploratorio de los
datos (ya mencionado en la Unidad 2). Su explicacin se deja hasta
esta Unidad ya que se necesitan de los conceptos de las medidas de
resumen desarrolladas en esta Unidad, para su construccin.
Para la construccin de esta grfica se utilizan los cuartiles de un
conjunto de datos siguiendo los pasos que se establecen a continuacin:
Representar a la variable en estudio sobre el eje de las x (la caja
puede ser horizontal o vertical).

88 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Dibujar una caja de manera que el extremo inferior o izquierdo corresponda al primer cuartil y el extremo superior o derecho corresponda al tercer cuartil.
En el centro ubicar la mediana o segundo cuartil.
Dibujar lneas desde los extremos de la caja hasta los puntos que
coincidan con el menor y mayor valor de los datos respectivamente
que no superen los cercos interiores (que se definen a continuacin).
Estos valores se denominan valores adyacentes
Calcular lo que se conoce como step o paso, esto es:

donde

constituye el desvo intercuartilar (utilizado tam-

bin como medida de variabilidad).


Luego se ubican los que se denominan cercos interiores inferiores y superiores (o izquierdos o derechos si la caja es horizontal) que
se obtienen al realizar el primer cuartil menos una vez el Paso y el
tercer cuartil ms una vez el Paso. Esto es:
Cerco interior inferior o izquierdo =
Cerco interior superior o derecho =
Luego se ubican los que se denominan cercos exteriores inferiores y superiores que se obtienen al realizar el primer cuartil menos
dos veces el Paso y el tercer cuartil ms dos veces el Paso. Esto es:
Cerco exterior inferior o izquierdo =
Cerco exterior superior o derecho =
Aquellas observaciones del conjunto de datos que se encuentran
entre los cercos interiores y los cercos exteriores constituyen los
outliers suaves o extremos suaves. (Se los simboliza con crculos
vacos generalmente).
Aquellas observaciones del conjunto de datos que se encuentran
ms all de los cercos exteriores constituyen los outliers graves o
extremos graves. (Se los simboliza con crculos rellenos generalmente).

ATE CDP Santa Fe | 89

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

Ejemplo:
Los siguientes datos corresponden a los pesos en onzas de los tumores malignos extirpados del abdomen de 57 pacientes (este ejemplo
ya fue trabajado en la Unidad 2).
Los datos ya fueron ordenados de manera creciente.
12

12

12

16

19

21

22

22

23

23

23

24

24

25

25

25

27

27

27

27

28

28

28

28

30

30

31

31

32

32

36

36

38

38

42

42

42

43

43

43

44

45

46

47

49

49

49

50

51

51

57

63

65

68

69

74

79

A continuacin se obtienen los valores de los cuartiles, paso y cercos:


observacin ordenada.

observacin ordenada.

observacin ordenada.

El desvo intercuartilar es:

y el Paso necesario para construir los cercos est dado por:

De manera que los cercos interiores y exteriores van a estar dados


por:
Cerco interior inferior o izquierdo =

90 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Cerco interior superior o derecho =

Cerco exterior inferior o izquierdo =

Cerco exterior superior o derecho =

De acuerdo con los valores obtenidos, los valores adyacentes (es


decir aquellos valores del conjunto de datos que no superan los cercos interiores) son 12 y 74 respectivamente. Solamente se presenta
un valor extremo suave en la parte superior del conjunto de datos.
Este valor es el dato igual a 79 que se encuentra entre el cerco interno y el cerco externo superior.

Representacin grfica

Se puede observar el diagrama de caja (construido con el software


SPSS) para la variable peso estudiada donde aparece indicado el
nico extremo, el valor 79.

ATE CDP Santa Fe | 91

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

Autoevaluacin
1. En la siguiente serie calcule media, mediana y modo:
6 , 3, 8, 2, 14, 10, 9
2. Los siguientes productos fueron clasificados como defectuosos
(D) o no defectuosos (N):
D, D, D, N, N, N, D, D, D, D, N
Calcule la medida de posicin ms apropiada. Por qu eligi esa
medida?
3. En la siguiente serie calcule la medida de posicin ms apropiada.
Por qu?
9, 8, 5, 3, 10, 284
4. En la siguiente serie de frecuencias calcule media, mediana y modo.

92 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

7. Unidad 5: Regresin y Correlacin


lineal simple
En muchas ocasiones surge la necesidad de estudiar la relacin que
existe entre dos variables. Por ejemplo, puede interesar la relacin
entre peso y estatura, presin sangunea y edad, etc. La naturaleza e
intensidad de relaciones entre variables como las descriptas anteriormente son estudiadas por medio de los anlisis de regresin y correlacin. El anlisis de regresin es til para estudiar la forma probable
de las relaciones entre las variables, y su objetivo final es predecir o
estimar el valor de una variable que corresponde al valor dado de otra
variable.
El anlisis de correlacin, por otro lado, estudia la intensidad de la
relacin entre variables. En este caso se est interesado en el grado
de correlacin entre las variables. Ambos anlisis estn muy relacio-

En muchas ocasiones surge


la necesidad de estudiar la
relacin que existe entre dos
variables. Por ejemplo, puede
interesar la relacin entre
peso y estatura, presin
sangunea y edad, etc. La
naturaleza e intensidad de
relaciones entre variables
como las descriptas anteriormente son estudiadas por
medio de los anlisis de
regresin y correlacin.

nados.

7.1 Anlisis de correlacin


En este caso el objetivo es nicamente obtener una medida de la
intensidad de la relacin entre dos variables. El coeficiente utilizado
para indicar esta intensidad es el coeficiente de correlacin lineal de
Pearson.
Antes de desarrollar este coeficiente se va a desarrollar el concepto
de covarianza que est muy relacionado con el mismo.

Covarianza
sta representa una medida de variabilidad conjunta entre dos variables. Anteriormente se desarroll el concepto de varianza como medida de variabilidad de una sola variable. La covarianza (o covariancia)
se define como:

ATE CDP Santa Fe | 93

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

Donde:

Si el resultado es positivo indica que al aumentar el valor de una


variable tambin aumenta el de la otra o al disminuir el de una, disminuye el de la otra. Por el contrario, si la covarianza es negativa indica
comportamientos opuestos de las variables estudiadas.
Ejemplo:
Supongamos el siguiente caso donde se considera el puntaje de una
prueba al inicio (x) y al finalizar un curso (y).

Se puede utilizar una frmula de clculo alternativa para obtener la


covarianza. La misma se define como:

94 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Donde:

Los clculos son los siguientes:

Ahora veamos cmo se define el coeficiente de correlacin.

ATE CDP Santa Fe | 95

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

Coeficiente de correlacin lineal de Pearson (r):


Como se estableci previamente, este coeficiente se utiliza para indicar el grado de relacin lineal que existe entre las variables x e y.
Se lo define como:.

Donde:
: covarianza entre x e y.
: desviacin estndar de x.
: desviacin estndar de y.
O como frmula de clculo se lo puede definir de la siguiente manera:

Las sumatorias en la frmula anterior se realizan sobre las n observaciones. Los valores de este coeficiente se encuentran entre -1 y 1,
esto es:

La interpretacin de estos valores es la siguiente:


Si r = 1, indica que entre x e y existe una relacin lineal positiva
perfecta. Esto es, x e y se hallan formando una recta ascendente.
Si r = -1, indica que entre x e y existe una relacin lineal negativa
perfecta. Esto es, x e y se hallan formando una recta descendente.
Si r = 0, indica que entre x e y no existe una relacin lineal.
Por lo tanto, a medida que el valor del coeficiente se acerca a 1,
indica que ambas variables estn fuertemente correlacionadas y de
manera positiva, o sea que ambas variables varan en el mismo sentido, al aumentar una aumenta la otra o al disminuir una disminuye la
otra.

96 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Cuando el coeficiente se acerca a -1 indica que ambas variables estn fuertemente correlacionadas y de manera negativa, o sea que
ambas variables varan en sentido opuesto, al aumentar una disminuye la otra. Por otro lado, si el valor de r es prximo a 0, indica ausencia de correlacin lineal entre ambas variables, puede existir otro tipo
de relacin entre las mismas (por ejemplo curvilnea).
Para el estudio de la relacin entre dos variables es importante comenzar con un diagrama de dispersin de los datos que permita observar la posible relacin entre las variables.

La observacin de la distribucin de los puntos en el grfico es de


gran ayuda para establecer la naturaleza de la correlacin.

ATE CDP Santa Fe | 97

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

Por ello es aconsejable en este tipo de estudios realizar en primer


trmino grficos de dispersin. Ejemplo: Se obtuvieron lecturas de la
presin sangunea mediante dos mtodos distintos en 10 pacientes
con hipertensin arterial. Las lecturas sistlicas obtenidas mediante
los dos mtodos se muestran en la siguiente tabla: (ejemplo modificado de Bioestadstica: Base para el anlisis de ciencias de la salud de W. Daniel).

Se realiza un grfico de dispersin de los datos.

Representacin grfica

98 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Se observa a travs de este grfico una fuerte correlacin positiva. A


continuacin se realizan los clculos intermedios para la obtencin
del coeficiente de correlacin lineal de Pearson.

Este valor indica una buena correlacin positiva, lo cual se puede


observar ya en el grfico de dispersin. Existen en anlisis estadsticos ms avanzados, maneras de probar (a travs de pruebas de hiptesis) la significacin de este coeficiente.

7.2 Anlisis de Regresin


El objetivo de este tipo de anlisis es describir la forma o naturaleza
de la relacin entre dos variables mediante una ecuacin matemtica. Para poder desarrollar este tipo de anlisis se siguen los siguientes pasos.
Tomar una muestra de n observaciones en las que se consideran
dos variables, una variable x independiente, considerada libre de error,
es decir, una variable fijada de antemano, y una variable y, variable
dependiente, considerada variable aleatoria, o sea una de las posibles respuestas de la variable y a la variable x. Se tienen entonces un
conjunto de n pares de la forma (x,y).
Realizar un diagrama de dispersin de las variables (x,y) en un sistema de coordenadas cartesianas (ya visto en unidades anteriores).

ATE CDP Santa Fe | 99

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

En base al diagrama anterior, y si se considera apropiado un modelo


de recta, encontrar la ecuacin de la recta que mejor ajuste (o represente) a todos los puntos del diagrama. A travs de esta ecuacin es
posible predecir el valor de y para un determinado valor de x.

Modelo lineal de regresin


Cuando se trata de estimar se parte de la propuesta de un modelo
para la poblacin. A partir de este modelo supuesto y mediante anlisis estadsticos apropiados se estiman los parmetros de este modelo. En el anlisis de dos variables interesa un modelo particular, en
este caso la recta de regresin de la poblacin. Esta recta, que se
refiere a la poblacin, no puede ser conocida y por tanto, debe ser
estimada con base en los datos muestrales y se obtiene la recta de
regresin estimada. Para dar validez a las conclusiones acerca de la
citada recta, se deben establecer ciertos supuestos. Entre los de
mayor relevancia y los que particularmente en este mdulo se van a
necesitar (para inferencias en regresin se necesitan de procedimientos estadsticos ms avanzados y de supuestos adicionales) se establecen los siguientes:
1. Los valores de la variable independiente x se toman previamente y
de manera arbitraria; se considera que tales valores estn libres de
errores y se la considera una variable determinstica, esto significa
que su valor est prefijado de antemano en la experiencia. La variable
dependiente y se considera de naturaleza aleatoria y su valor es slo
una respuesta de las tantas que pueden corresponder a un mismo
valor de x.
2. Se supone que en la realidad entre x e y existe una verdadera
relacin dada por la ecuacin:

donde

ordenada al origen, o sea el punto donde la recta corta al eje

vertical (eje de las ordenadas, de las y).


pendiente, representa el cambio en la variable y por unidad de
cambio de la variable x.
error aleatorio determinado por la diferencia entre yi y el valor
esperado de y como variable aleatoria determinada para la x en particular. No se agregarn otros supuestos sobre estos errores que son
necesarios cuando se realiza un anlisis inferencial en regresin.
100 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Los parmetros poblacionales

deben ser estimados para

obtener la recta de regresin ajustada expresada de la siguiente manera:

donde (

) es el valor ajustado o estimado para un cierto valor de x y

los valores a y b son los estimadores o valores que estiman a los


parmetros poblacionales y que se calculan con los datos muestrales.
Es decir a y b constituyen la ordenada al origen y pendiente en la
recta de regresin estimada. Una pendiente positiva (b positiva) indica una relacin lineal directa, esto es, ambas variables varan en el
mismo sentido, o sea, al aumentar una aumenta la otra o al disminuir
una disminuye la otra. Una pendiente negativa (b negativa) indica una
relacin lineal inversa, o sea, ambas variables se comportan en sentidos opuestos, es decir, al aumentar una disminuye la otra. Como se
ve, existe una relacin entre este coeficiente (b) y el coeficiente de
correlacin lineal de Pearson. Se puede demostrar que:

Donde:

b : pendiente de la recta de regresin.


r : coeficiente de correlacin lineal de Parson.
Sx : desviacin estndar de las x.
Sy : desviacin estndar de las y.

Estimacin de la recta de regresin por el mtodo de mnimos


cuadrados
El mtodo de estimacin de los valores de a y b en la ecuacin de
una recta ms utilizado es el mtodo de mnimos cuadrados que minimiza la suma de los cuadrados de la diferencia entre los valores
observados (yi) y los valores estimados (

), es decir, se busca mi-

nimizar la siguiente expresin:

ATE CDP Santa Fe | 101

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

El mtodo de mnimos cuadrados minimiza esta expresin y reemplazando el valor de

por a + bx en la expresin anterior surge el

siguiente sistema de dos ecuaciones normales con dos incgnitas:

Resolviendo este sistema de dos ecuaciones con dos incgnitas se


obtienen las siguientes expresiones para la ordenada al origen y la
pendiente:

Donde:

y media aritmtica de las y


x media aritmtica de las x
Se observa que estas expresiones quedan determinadas por valores
muestrales solamente.
Una vez obtenida la recta de ajuste y si se verifica que ste es un
buen ajuste (en Anlisis de Regresin ms avanzada se estudia este
aspecto) se puede utilizar esta ecuacin para estimar un valor de y
dado un valor de x.
Ejemplo:
Se llev a cabo un experimento para estudiar el efecto de cierto medicamento para disminuir la frecuencia cardiaca en adultos.
La variable independiente es la dosis en miligramos del medicamento, y la variable dependiente es la diferencia entre la frecuencia cardiaca
ms baja despus de la administracin del medicamento y un control
antes de administrarlo. Se reunieron los datos presentados en la figura 13.

102 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Figura 13

El diagrama de dispersin de estos datos se muestra a continuacin:

Se observa en este diagrama la relacin lineal entre las variables


consideradas. Para obtener la recta de mnimos cuadrados se realizan los siguientes clculos intermedios para las ecuaciones normales (figura 14).

ATE CDP Santa Fe | 103

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

Figura 14

De esta forma se obtienen los siguientes valores para a y b.

La ecuacin de regresin ajustada que describe la relacin entre las


variables x e y se expresa entonces de la siguiente manera:

Si se desea obtener el valor de

para un valor dado de x se reempla-

za en la ecuacin de la recta obtenida dicho valor de x. Por ejemplo


para = 1.4, el correspondiente valor de

se obtiene como:

De esta misma forma se pueden obtener los valores estimados para


todos los valores de x estudiados y uniendo estos puntos se obtiene
la recta estimada.

104 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

La representacin grfica de los valores observados (grfico de dispersin) y la recta ajustada se muestra a continuacin:

Autoevaluacin
Figura 15

ATE CDP Santa Fe | 105

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

1. Se compararon dos mtodos para medir el volumen de sangre


expelida por cada ventrculo en 10 animales de laboratorio,
obtenindose los siguientes resultados (figura 15).
a. Elaborar un diagrama de dispersin.
b. Calcular el coeficiente de correlacin de Pearson.

a. Elaborar un diagrama de dispersin.


b. Obtener la ecuacin de regresin ajustada.
c. Graficar la recta de regresin.
d. Calcular el costo por comida cuando el nmero de comidas servidas es 72 (x = 72).

106 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

8. Unidad 6: Series Cronlogicas


8.1 Concepto
Una serie cronolgica o serie de tiempo se define como una sucesin
de observaciones de un fenmeno que es variable con el tiempo.
Se pueden encontrar diversos ejemplos de series de tiempo o series
cronolgicas. Especficamente en el rea de salud se tiene: evolucin de los distintos indicadores (tasas de mortalidad, morbilidad, etc.)
a lo largo de un perodo especfico en un rea dada. Se encuentran
ejemplos en otras reas como indicadores econmicos, como el producto nacional bruto, ndices de costo de vida, etc., evolucin de las
temperaturas, registros de lluvias de una determinada regin, etc. Si
la serie muestra algn tipo de tendencia durante un tiempo prolongado en el pasado, parece razonable suponer que a travs de su estudio
se pueda inferir lo que puede suceder en el futuro.
En esta unidad solamente se realizar un estudio descriptivo de series de tiempo.

8.2 Componentes
Una serie de tiempo se considera como la resultante de cuatro componentes. El anlisis de los mismos se puede realizar en forma conjunta o cada uno por separado. Adems, una serie puede presentar
todos o slo algunos de los componentes. Estos componentes son:
1. Tendencia a largo plazo o variacin secular.
2. Variacin o efecto estacional.
3. Variacin o efecto cclico.
4. Variacin o efecto irregular.
Tendencia a largo plazo o variacin secular (T): Se refiere al
movimiento suave y regular de una serie que refleja un crecimiento o
un estancamiento continuo o una declinacin en un perodo de tiempo
muy prolongado. Conviene para su estudio considerar un perodo suficientemente prolongado.
Variacin o efecto estacional (E): El uso del trmino estacional
tiene en este caso una connotacin amplia. Por variaciones

ATE CDP Santa Fe | 107

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

estacionales se entiende las variaciones peridicas, que vuelven con


cierta regularidad durante un perodo de tiempo especfico de un ao
o menos. Pueden abarcar doce meses pero tambin hace referencia
a variaciones diurnas, semanales, etc. no pudiendo superar el perodo de un ao.
Variacin o efecto cclico (C): Estos movimientos se caracterizan
por ser recurrentes ascendentes y descendentes que a diferencia del
efecto anterior se extienden por perodos superiores a un ao, por lo
general de 2 ms aos.
Variacin o efecto irregular (I): Estos movimientos son aleatorios,
o bien se deben a fuerzas como la guerra, los terremotos, inundaciones, en general catstrofes naturales. stos no son recurrentes y por
lo tanto son impredecibles. Sin embargo, cuando se estudia una serie
se los puede identificar perfectamente.
Las siguientes grficas muestran estas componentes (Grfica extrada de Estadstica para Administradores de R.Levin & D. Rubin). La
grfica a) muestra la tendencia secular en una serie temporal o de
tiempo creciente. La grfica b) muestra la variacin cclica con un
patrn tpico por encima y debajo de la lnea de tendencia. La grfica
c) muestra la variacin estacional y, finalmente, la grfica d) ilustra la
variacin irregular. En el eje de las abcisas donde va el tiempo se
denota en estas grficas con la letra x (figura 16).

8.3 Modelos
Existen dos modelos de series de tiempo que se aceptan generalmente como buenas representaciones de la realidad. Ellos son: el
modelo aditivo y el modelo multiplicativo.
El modelo aditivo supone que el valor de la serie de tiempo est compuesto por la suma de los cuatro componentes:

Y=T+E+C+I

108 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Figura 16

En el modelo multiplicativo, en cambio, se tiene el producto de estos


cuatro componentes:

Y=TxExCxI

En ambos casos Y representa el valor original de la variable observada.

ATE CDP Santa Fe | 109

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

8.4 Estudio de la tendencia


De los cuatro componentes antes mencionados solamente se har
un estudio exhaustivo de la tendencia. Para ello mencionaremos algunos mtodos dejando constancia que el ms importante es el Mtodo de mnimos cuadrados ya estudiado en la Unidad de Regresin y
Correlacin.

Mtodo grfico
ste es un mtodo rudimentario que no sirve para proyecciones pero
puede resultar til como primera aproximacin para ver el comportamiento de la serie. Consiste en dibujar a mano alzada una curva que
siga una ley general y que compense los desvos respecto de los
valores observados.

Mtodo de los semipromedios


Consiste en dividir a la serie de datos en dos grupos iguales y en
cada grupo calcular el promedio que corresponde a los valores centrales de la serie. De esta forma se tienen dos puntos con los cuales
se traza la recta de tendencia.
Ejemplo:
SERIE CON N (CANTIDAD DE AOS) IMPAR

En este caso con n =7 aos, se descarta el valor central y se calculan los promedios para los dos grupos que se forman.

110 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

El primer grupo est constituido por los aos 2000, 2001 y 2002 y el
segundo grupo, por los aos 2004, 2005 y 2006. De esta manera se
tienen los siguientes clculos:
Primer grupo

Segundo grupo

La recta de tendencia en este caso se construye uniendo los puntos


(2001,3) y (2005,6).
SERIE CON N (CANTIDAD DE AOS) PAR

En este caso con n =6 aos, se calculan los promedios para los dos
grupos que se forman. El primer grupo est constituido por los aos
2000, 2001 y 2002, y el segundo grupo, por los aos 2003, 2004 y
2005. De esta manera se tienen los siguientes clculos:
Primer grupo

Segundo grupo
La recta de tendencia en este caso se construye uniendo los puntos
(2001,3) y (2004,6).
Representacin grfica
Si se representa grficamente este ltimo ejemplo se tiene lo siguiente: (Figura 17)

ATE CDP Santa Fe | 111

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

Figura 17

Mtodo de los promedios mviles


Sirve para suavizar una serie. Es bastante subjetivo. La suavizacin de la serie que se obtiene depende de la longitud del perodo
seleccionado para la construccin de los promedios. Para eliminar
las fluctuaciones cclicas, el perodo seleccionado debe ser un valor
entero que corresponda (o sea un mltiplo) de la longitud promedio
estimada de un ciclo en la serie. Los promedios mviles con un nmero par de trminos son ms difciles de construir que los de un
nmero impar de trminos. Los promedios mviles para un perodo
seleccionado de longitud l consisten en una serie de medias aritmticas calculadas sobre el tiempo en forma tal que cada media se calcula para una sucesin de valores observados que tienen esa longitud
particular l.
Se mostrar a continuacin cmo se construyen los promedios mviles para una serie de datos (n = 7, cantidad de aos y L =3, longitud
para el clculo de los promedios).

112 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Ejemplo:

Cmo se calcularon los promedios mviles de orden 3 en este ejemplo en particular:

ATE CDP Santa Fe | 113

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

Representacin grfica

Mtodo de mnimos cuadrados


Este mtodo ya se estudi en la Unidad de Regresin y Correlacin.
Si se simboliza como

a los valores observados y como t a los

valores ajustados (se utiliza el subndice t para indicar que depende


del tiempo) se busca minimizar la siguiente expresin:

La funcin de ajuste puede ser una recta, una parbola, etc., debindose seleccionar la que sea ms apropiada de acuerdo a diferentes
criterios que existen y que se estudian en Estadstica ms avanzada.
En esta unidad veremos solamente el ajuste a una lnea recta.
Ajuste a recta: Si a travs de un diagrama de dispersin se comprueba que una recta es apropiada para el ajuste a una serie de puntos se
aplica el siguiente procedimiento.
La ecuacin de la recta de ajuste se simboliza en este caso como:

114 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

donde:
valor ajustado o estimado.
t: variable independiente tiempo.
a: ordenada al origen (valor de

cuando t = 0).

b: pendiente de la recta o sea el cambio en el valor de

por unidad

de tiempo.
Para que resulte ms sencillo el clculo de los valores de a y b en la
ecuacin de la recta se realiza un cambio de origen en la variable t
que representa el tiempo. Ello se realiza de la siguiente forma:
Para una serie con n (nmero de aos considerado) impar se resta
a cada valor de t el valor central de la serie.
Para una serie con n (nmero de aos considerado) par lo que se
resta es el promedio de los centrales y se multiplica por un medio. Se
da un ejemplo de cada caso a continuacin.
n impar (5) n par (6)

En ambos casos resulta

, lo cual va a facilitar la resolucin

de las ecuaciones normales.


De acuerdo a lo visto en la Unidad de Regresin y Correlacin donde
se tena el siguiente sistema de ecuaciones normales:

ATE CDP Santa Fe | 115

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

para el caso de una serie cronolgica se convierten en el siguiente


sistema donde se reemplaza la x por

como variable independiente

ya transformada de acuerdo a lo visto en el prrafo anterior y la


representa el valor observado de la variable en el tiempo

que en este caso, como la

, se reduce a :

lo cual permite resolver fcilmente los valores de a (ordenada al origen) y b (pendiente) como:

Ejemplo:

Los datos originales (aos y valores de y) se observan en las dos


primeras columnas. En la tercera columna se muestran los valores
transformados de tiempo. Las siguientes dos columnas son adicionales para facilitar el clculo de la ordenada al origen y pendiente en la
ecuacin de la recta y finalmente la ltima columna muestra los valores estimados con la ecuacin de la recta obtenida.

116 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Los distintos clculos son como se muestran a continuacin:

y entonces la ecuacin
por

donde ahora se reemplaza t

se convierte en:

y en este caso en particular se tiene:

Para el clculo de los valores estimados se procede de la siguiente


forma: por ejemplo para el ao 2000 se tiene:

El estudio de las otras componentes de una serie (variaciones


estacionales, cclicas e irregulares) se tratan en reas de Estadstica
ms avanzadas.
A continuacin se realiza la representacin grfica de los datos observados y de la recta estimada de este ejemplo.
Representacin grfica

ATE CDP Santa Fe | 117

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

Una vez obtenida la recta de ajuste, y es en eso en donde este mtodo se prefiere con respecto a los mencionados anteriormente, se pueden efectuar predicciones. Por ejemplo, para predecir el nmero de
casos para el ao 2007, se procede de la siguiente forma:

Es decir, en base a esto podemos concluir que para el ao 2007 se


estiman 7.87 casos.

Autoevaluacin
1. En base a los siguientes datos aplicar los distintos mtodos presentados (semipromedios, promedios mviles de orden 3 y mnimos
cuadrados) para estudiar la tendencia.

2. Para el ejercicio anterior efectuar una prediccin para el ao 2007.

118 | ATE CDP Santa Fe

Estadstica Metodolgica | Tecnicatura en Estadsticas de Salud

Bibliografa
Chao, Lincoln, Estadstica para las Ciencias Administrativas,
Ed. McGraw-Hill, 1993.
Daniel, Wayne, Bioestadstica: Base para el anlisis de las ciencias de la salud, Ed. Uteha, 1998.
Fayad Camel, V., Estadsticas mdicas y de salud pblica, Ed.
Universidad de los Andes, 1966.
Facultad de Medicina, Universidad Nacional de Tucumn, Ctedra
de Bioestadstica.
Levin R. & D. Rubin, Estadstica para Administradores, Ed.
Prentice Hall, 1996.

ATE CDP Santa Fe | 119

Tecnicatura en Estadsticas de Salud | Estadstica Metodolgica

Contratapa

120 | ATE CDP Santa Fe

También podría gustarte