Documentos de Académico
Documentos de Profesional
Documentos de Cultura
UNIDAD 2
Índice
Capítulo IV: ................................................................................................................................. 4
Nociones básicas de estadística ................................................................................................. 4
Definición ................................................................................................................................ 4
La estadística y las estadísticas ............................................................................................... 4
Un poco de historia ................................................................................................................ 5
Los campos de aplicación ....................................................................................................... 6
Áreas de la Estadística ............................................................................................................ 6
La Estadística descriptiva ............................................................................................................ 7
Conceptos preliminares .......................................................................................................... 7
Población ................................................................................................................................ 7
Muestra .................................................................................................................................. 7
Individuo, unidad de observación o unidad estadística ......................................................... 8
Variable ................................................................................................................................... 8
Datos ....................................................................................................................................... 8
Variables ..................................................................................................................................... 9
Clasificación de las variables .................................................................................................. 9
Variables cualitativas ........................................................................................................ 10
Variables cuantitativas ..................................................................................................... 10
Nivel de medición de las variables ....................................................................................... 11
Nivel nominal .................................................................................................................... 11
Nivel ordinal...................................................................................................................... 11
Nivel de intervalo.............................................................................................................. 12
Nivel de razón ................................................................................................................... 12
Relación entre variables ................................................................................................... 12
Organización de los datos......................................................................................................... 13
Tablas de frecuencias ........................................................................................................... 15
Frecuencia......................................................................................................................... 15
Distribución de frecuencias .............................................................................................. 16
1
Nociones Básicas de Estadística
UNIDAD 2
2
Nociones Básicas de Estadística
UNIDAD 2
3
Nociones Básicas de Estadística
UNIDAD 2
Capítulo IV:
Nociones básicas de estadística
Definición
La estadística es comúnmente considerada como una colección de hechos numéricos
expresados en términos de una relación sumisa, y que han sido recopilados a partir de otros
datos numéricos.
Kendall y Buckland (citados por Gini V. Glas / Julian C. Stanley, 1980) definen la estadística
como un valor resumido, calculado, como base en una muestra de observaciones que
generalmente, aunque no por necesidad, se considera como una estimación de parámetro
de determinada población; es decir, una función de valores de muestra.
"La estadística es una técnica especial apta para el estudio cuantitativo de los fenómenos de
masa o colectivos, cuya mediación requiere una masa de observaciones de otros fenómenos
más simples llamados individuales o particulares" (Gini, 1953).
Murray R. Spiegel, (1991) dice: "La estadística estudia los métodos científicos para recoger,
organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar
decisiones razonables basadas en tal análisis.
4
Nociones Básicas de Estadística
UNIDAD 2
Un poco de historia
No existe un acuerdo explícito sobre el origen de la palabra estadística, pero aún así
se mencionan tres orígenes posibles.
Es el origen que más han aceptado los entendidos, status, vocablo en latín
cuyo significado es estado en el sentido estrictamente político, ya que en la antigüedad lso
gobiernos la utilizaban para recolectar datos.
5
Nociones Básicas de Estadística
UNIDAD 2
Áreas de la Estadística
Estadística descriptiva
Es una de las ramas de la estadística que recolecta, caracteriza y presenta un conjunto de
datos, obteniendo un resumen de los mismos y una visión general del fenómeno que se está
observando. Se construyen tablas y gráficos que permiten simplificar la complejidad de los
datos.
Estadística inferencial
Es una técnica mediante la cual se obtienen generalizaciones o se toman decisiones en base
a una información parcial (muestras), utiliza resultados obtenidos mediante la estadística
descriptiva y tiene un sustento muy importante en el cálculo de probabilidades. Permite a
partir del estudio de una muestra de la población, inferir lo que ocurre en la totalidad de esa
población.
6
Nociones Básicas de Estadística
UNIDAD 2
La Estadística descriptiva
Conceptos preliminares
Antes de avanzar en el estudio de los métodos de la estadística, es necesario definir algunos
conceptos preliminares.
Población
Es el conjunto de individuos, animales u objetos que son de interés o estudio estadístico y de
los cuales queremos obtener un resultado. La especificación no es trivial, porque es
imprescindible que no haya ambigüedad respecto a quienes pertenecen o no a ese conjunto,
para lo cual deben estar claramente definidos los criterios de inclusión y exclusión, en los que
se debe establecer la ubicación espacial y temporal.
Por ejemplo, si el interés es el estudio del “hábito de fumar” de los “niños entre 10 y 14 años” de
“Tucumán”, en el año “2014”, la población es "todos los niños de Tucumán entre 10 y 14 años en
2014". Si el interés es evaluar diferentes tratamientos de la diabetes, la población es "todos los
diabéticos".
Tamaño de la población:
Es el número de individuos que la componen. Su cardinal se denomina con N.
Población finita:
Es aquella en la que el número de individuos que la componen puede contarse en forma
física.
Población infinita:
Es aquella en la que el número de individuos no es posible de enumerar en forma física.
Parámetro:
Es una medida de resumen que se calcula para describir una característica de toda la
población.
Muestra
Si la población a estudiar es muy grande, es decir que contiene un número de individuos que
hace imposible analizarlos en su totalidad, entonces, en lugar de observar a todos los
elementos de esa población, se realiza una selección de un subconjunto de ella ,y se usa la
información de este subconjunto para conocer algo sobre la población. Este subconjunto se
denomina muestra y deberá ser “representativa” de la población de origen en el sentido de
tratar de reproducir lo más idénticamente posible las características de la población de la
7
Nociones Básicas de Estadística
UNIDAD 2
Tamaño muestral
Es el número de elementos que se seleccionan, siempre es menor que el de la población y se
lo denomina con n.
Muestreo
Es el conjunto de técnicas para obtener estas muestras y el procedimiento que reúne los
datos que se desean estudiar, obteniéndolos en una proporción reducida, y representativa
de la población.
Estadístico
Magnitud correspondiente a una muestra aleatoria extraída de la población. Es una medida
de resumen que se calcula para describir una característica de una muestra de la población.
Variable
Característica observada en los individuos de una población, susceptible de ser medida.
Propiedades, rasgos o cualidades que poseen las unidades de observación.
Para el ejemplo anterior, las variables observadas en las unidades de observación pueden ser:
el hábito de fumar y la edad de los niños de Tucumán entre 10 y 14 años.
Datos
Valores observados o medidos en una variable, en el ejemplo del hábito de fumar en niños
de Tucumán entre 10 y 14 años, los datos para las variables son las edades de los niños y las
observaciones del hábito de fumar para cada niño.
8
Nociones Básicas de Estadística
UNIDAD 2
Variables
Definir las variables permitirá dar respuestas a lo que se quiera estudiar.
Establecer el tipo de variable a estudiar y la forma en que serán medidas, es un aspecto clave
de cualquier estudio.
Una inadecuada identificación de las variables puede dar lugar a sesgos importantes que
afectarán la validez del estudio.
Las variables pueden definirse como:
“Aquellos atributos o características de los eventos, de las personas o de los grupos de estudio
que cambian de una situación a otra o de un tiempo a otro y que por lo tanto, pueden tomar
diversos valores. Para su estudio es necesario medirlas en el objeto investigado y es en el
marco del problema y de las hipótesis planteadas donde adquieren carácter de variables.”
Una vez identificadas las variables el investigador debe definirlas de manera operativa,
especificando el método y la escala con las cuales se llevará a cabo su medición.
Medir:
Consiste en asignar un número o una calificación a alguna propiedad específica de un
individuo, una población o un evento, usando ciertas reglas.
Solo puede medirse lo que antes se ha concebido teóricamente.
9
Nociones Básicas de Estadística
UNIDAD 2
Variables cualitativas
Son aquellas que son expresadas en forma de cualidades o atributos y no pueden medirse en
escala numérica, aunque si puede contarse el número de individuos pertenecientes a cada
una de sus categorías o modalidades.
Nominales:
Datos correspondientes a una variable cualitativa que se agrupan sin ninguna jerarquía de
una categoría o modalidad sobre otra.
Por ejemplo: Estado civil, etnia, religión, etc.
Ordinales:
Las categorías o modalidades que adopta la variable cualitativa poseen un orden entre ellas.
En ellas existe un orden jerárquico, pero no puede obtenerse valoración numérica lógica
entre las categorías.
Según el número de categorías o modalidades que contemple una variable cualitativa puede
ser:
Variables cuantitativas
Son aquellas que se pueden medir, expresar y cuantificar en forma numérica.
Continuas:
Son aquellas variables cuantitativas para las que entre dos valores cualquiera que adopten
existen infinitos valores posibles de asumir por la variable, es decir que la escala de medición
es el conjunto de los números reales.
Por ejemplo: Peso, talla, tensión arterial, glucemia, edad, etc.
Discretas:
Son aquellas variables cuantitativas que al medirlas solo pueden tomar valores numéricos
enteros, no existen valores intermedios entre dos valores ENTEROS consecutivos cualquiera
Por ejemplo: Número de hijos, Nº de cigarrillos que fuma por día, etc.
10
Nociones Básicas de Estadística
UNIDAD 2
Nivel nominal
Si dos o más valores de una variable sólo permiten percibir las diferencias o semejanzas de
las unidades estadísticas que se miden, su nivel de medición es nominal. Tales valores son
como etiquetas que identifican a las unidades estadísticas y las hacen iguales o diferentes
entre sí. Es el nivel más simple de observación, clasifica a los individuos en categorías
designadas con un nombre o código.
Si se asignan números a estos valores cualitativos (modalidades), con estos no se pueden
realizar operaciones aritméticas. Sólo son válidas las relaciones de igualdad (=) y no igualdad
(≠). Por ejemplo, la variable área de residencia asigna a las unidades de observación dos
valores: “urbana” y “rural”, en tal caso con los valores de esta variable las personas se
encuentran en una misma modalidad o en modalidades diferentes, si se le asignara 1 a la
modalidad “urbana” y 2 a la modalidad “rural”, solo puede decirse que el símbolo 1 es
diferente al símbolo 2, no se puede decir que 1 es menor que 2 o que dos es mayor que 1
Las variables estadísticas: "estado civil", "religión", entre otras, tienen modalidades que son
de nivel nominal.
Nivel ordinal
El nivel de medición de una variable es ordinal cuando los valores que adopta se pueden
ordenar en forma ascendente (o descendente), pero no es posible determinar diferencias
entre los valores de los datos, o tales diferencias carecen de significado. En una escala
ordinal los valores o modalidades reflejan el orden de las unidades estadísticas. Si se asignan
números a tales modalidades, con estos, no se pueden realizar operaciones aritméticas. Sólo
son válidas las relaciones de igualdad (=), de no igualdad (≠) y de orden (≤). Este nivel se
utiliza de manera nominal pero para jerarquizar las modalidades que adopte la variable. El
nivel de medición ordinal puede observarse por ejemplo en el “estatus socioeconómico”,
variable cualitativa; que puede adoptar las modalidades bajo, medio y alto;
En el caso de este tipo de variables, en ocasiones, pueden medirse en escalas numéricas,
como por ejemplo, puntuar el dolor en una escala de 1 a 5. Debemos evitar sin embargo
realizar operaciones matemáticas con estas cantidades. ¡Un dolor de intensidad 4 no duele
el doble que otro de intensidad 2!
11
Nociones Básicas de Estadística
UNIDAD 2
Nivel de intervalo
Este nivel de medición permite clasificar y ordenar a los individuos, posee todas las
características del nivel ordinal, y además, permite cuantificar la diferencia entre dos clases.
y el valor cero no representa ausencia de una característica, es lo que puede decirse un
“cero relativo”. El ejemplo clásico es la temperatura: cero grado no indica ausencia de
temperatura. 10° no indica la mitad de frío de 20°, pero sí me indica 10 grados menos de
temperatura. Por lo tanto vemos que el cero es relativo o convencional. En este nivel se
pueden hacer comparaciones por diferencia entre los valores que adopte la variable.
Con los valores de esta escala son válidas las relaciones de igualdad, de no igualdad y de
orden.
Nivel de razón
Es similar al nivel de intervalo pero además existe un cero absoluto o natural, es decir hay
ausencia real de la propiedad. Es el mayor nivel de medición, todas las operaciones son
válidas y permite mayor número de técnicas y precisión.
Por ejemplo, “ingresos”, “edad”, “nivel de glucosa”, son comparables por cociente (doble,
mitad). Alguien que gana $12.000 de sueldo, gana el doble que otro que gana $6.000 y por
supuesto, también puedo decir que gana $6.000 menos.
Un aspecto interesante a destacar es que estos niveles forman ellos mismos una escala
"acumulada". Por ejemplo el nivel ordinal posee todas las propiedades del nivel nominal más
aquellas que le son propias. El nivel de intervalo posee todas las propiedades de los dos
anteriores más las propias y de la misma forma el nivel de razón también posee las
propiedades de los otros tres, siendo el nivel más elevado donde el cero es absoluto y son
posibles todas las operaciones. Cada una de estos niveles puede descender a sus niveles de
menor grado, lo que a veces nos vemos obligados a hacer, sabiendo que se pierde
información, según las técnicas estadísticas de que dispongamos o que utilicemos.
Independientes: Es una característica estable en función de la cual varían los valores de otras
variables. En estudios experimentales es la variable que manipula el investigador.
Dependientes: también llamadas de resultado o efecto, son aquellas características que
varían en función de los cambios experimentados por la variable independiente. Es el factor
que es observado y medido para determinar el efecto de la variable independiente.
12
Nociones Básicas de Estadística
UNIDAD 2
En un estudio las variables son los eventos o características que se van a observar en las
personas, lugares o tiempos, susceptibles de ser descriptas o medidas en alguna escala, que
varía o puede hacerlo en alguna dimensión
Lo que se tiene como información de una variable en una muestra es un número n de datos,
es decir, de valores o anotaciones sobre que modalidad (cualitativas) o qué valor
(cuantitativas), tiene cada elemento de la muestra; a este conjunto de datos se le llama
distribución y excepto cuando el tamaño n de la muestra sea demasiado pequeño, se debe
resumir para que la lectura de los resultados sea comprensible.
La organización y el resumen de la información son dos procesos distintos y los mismos se
desarrollan por separado.
La organización de los datos hace referencia al arreglo de ellos en un formato lógico para su
interpretación.
El resumen de la información implica la condensación de varias mediciones en una forma
compacta, ya sea gráfica o numéricamente.
82 95 92 62 85 92
82 95 70 85 84 95
91 82 94 76 88 91
87 80 68 58 76 85
110 60 75 88 64 74
13
Nociones Básicas de Estadística
UNIDAD 2
Podemos observar que estos datos organizados de este modo no aportan mayor información
acerca del comportamiento de la variable observada. Pero si estos datos los ordenamos de
menor a mayor.
58 70 80 85 88 94
60 74 82 85 91 95
62 75 82 85 91 95
64 76 82 87 92 95
68 76 84 88 92 110
La información que proporciona, comienza a ser más interesante porque podemos concluir
que:
El peso más bajo es 58 kg.
El más alto 110 kg.
Hay un vacío entre los 65 kg. y los 110 kg., es decir que hay una cierta continuidad desde el
peso más bajo (58 Kg.) y los 95 kg, y el 110 se encuentra un poco más alejado del grupo de
datos.
Arreglo de tallo y hojas: es una técnica que resume de manera simultánea los datos en forma
numérica y presenta una ilustración gráfica de la distribución.
Se trata de organizar los datos numéricos en dos columnas divididas por una línea vertical.
La primera de las columnas, denominada tallo, corresponderá a las decenas, centenas o
unidades superiores que representan el grupo de datos y en la segunda, llamada hojas, irán
las correspondientes unidades. Para construir el correspondiente arreglo de tallo y hojas.
para el peso en kilogramos de las 30 personas que se mencionan anteriormente pensaremos
en cada uno de los datos separando las decenas y centenas de las unidades, colocando en la
primera columna las centenas y decenas, en este ejemplo de 5 a 11, estos números
representarán el tallo y luego en la siguiente columna se listan las unidades, que
representarán las hojas, de manera ordenada, de cada uno de los datos registrados y
correspondientes con su respectiva decena.
Tallo Hojas
5 8
6 0248
7 04566
8 02224555788
9 11224555
10
11 0
14
Nociones Básicas de Estadística
UNIDAD 2
Al mismo tiempo que se ordenan los datos en forma ascendente, también se puede
visualizar como es el comportamiento de los mismos, puede observarse que entre los 80 y
los 90 kg. se concentran la mayor parte de las mediciones obtenidas y se ve claramente el
vacío que se produce entre los 95 y los 110 kg.
Para entenderle un poco más, hemos de decir que el segundo renglón que dice:
6 | 0 2 4 8 quiere decir que entre la lista de datos se encuentran los valores 60, 62,64 y 68.
En realidad una representación de tronco y hojas presenta la misma información que la lista
original de datos, pero de una manera mucho más compacta (especialmente si la lista de
datos es más grande) y manejable.
Sin embargo, información más compleja resulta un poco más difícil de manejar, por lo que en
ocasiones conviene redondear los datos, ignorar sus partes decimales o utilizar las centenas u
otras posiciones de los números para las troncos. En cada uno de esos casos conviene hacer
alguna anotación, o poner una nota, a fin que los lectores puedan identificar las
adecuaciones realizadas y así poder interpretar lo que se quiere transmitir.
Tablas de frecuencias
El primer paso para realizar el resumen de datos es siempre el recuento de las repeticiones
de un mismo valor o modalidad; ello nos conduce al concepto fundamental de frecuencia.
Frecuencia
Es el número de veces que se repite una misma observación.
Una frecuencia puede expresarse en dos formas: en términos absolutos o en términos
relativos.
15
Nociones Básicas de Estadística
UNIDAD 2
Las frecuencias son aplicables a cualquier tipo de variables y de ahí su importancia, además
pese a ser muy simples introducen a conceptos importantes como el de proporción y son
base para la construcción de cualquier resumen de datos.
Distribución de frecuencias
Según los datos que muestre puede clasificarse en:
16
Nociones Básicas de Estadística
UNIDAD 2
También pueden ser utilizadas las distribuciones de frecuencias simples para describir
ordenadamente datos cualitativos, en este caso las xi son las modalidades o categorías que
asume la variable cualitativa.
Por ejemplo
Distribución de frecuencia del estado civil de empleados del
Hospital “Estrella de Mar” - Ciudad Sueño del Mar - Enero 2014
17
Nociones Básicas de Estadística
UNIDAD 2
Intervalo de clase
Llamamos intervalo de clase a cada uno de los intervalos contiguos en que pueden agruparse
los valores que adopta una variable cuantitativa, cuando se trabaja con gran cantidad de
valores.
Los intervalos se definen para tener una idea más concreta de la realidad.
Siempre que se agrupa una variable por intervalos se produce una pérdida de información,
pues lo que se tiene en cuenta es la pertenencia o no de cada dato al intervalo y no su valor
exacto; se considera que la distribución dentro del intervalo es homogénea.
Los intervalos de clase seleccionados, al igual que las categorías de una variable cualitativa
deben ser: exhaustivos y mutuamente excluyentes. (Ver pág. 9).
No existe un criterio claro de cuál debe ser el número de intervalos que debemos escoger, se
suele fijar entre 5 y 15, de tal manera que cada clase contenga al menos 5 valores distintos.
Entre los criterios para decidir el número de intervalos (k) destacamos:
Regla de Sturges: k debe ser el número entero mayor más próximo a k=1+3,322*log n,
Regla de Norcliffe: k debe ser aproximadamente igual a la raíz cuadrada positiva del número
de datos (N).
Amplitud del intervalo de clase (ai): es el cociente entre el rango (R) y el número de intervalos
(k). Si este cociente no es entero, entonces debe redondearse al entero superior.
Límites de clase: todo intervalo de clase tiene dos límites uno inferior y otro superior.
Límite inferior: es el valor más pequeño que pueden tomar los datos que se encuentran en
un intervalo.
Límite superior: es el valor más grande que pueden tomar los datos que se encuentran en un
intervalo.
Es necesario definir con claridad los límites de estos grupos o intervalos de clase, de modo
que sepamos bien a que intervalo pertenece una observación individual.
Por ejemplo: para la variable edad.
18
Nociones Básicas de Estadística
UNIDAD 2
A B
0-4 0-5
5-9 5-10
10-14 10-15
15-19 15-20
20-24 20-25
También podemos mencionar otro elemento de los intervalos que son los límites reales (LR),
en realidad cada intervalo de clase tiene dos límites reales, el límite real inferior (LRI) y el
límite real superior (LRS), la particularidad de estos límites reales consiste en que el LRS de
una clase es igual al LRI de la siguiente, estos se calculan como la semisuma de los límites de
clase superior e inferior de intervalos contiguos.
En el ejemplo (A) anterior:
Los límites reales del segundo intervalo son LRI = 4+5/2= 4,5 LRS= 9+10/2=9,5
Marca de clase: es el punto medio de un intervalo de clase ( c )
Se obtiene como cálculo de la semisuma de los extremos del intervalo
L Ls
c i
2
Donde Li es el límite inferior del intervalo y Ls es el límite superior del mismo intervalo
Una vez que hemos preparado los datos recién estaremos en condiciones de comenzar a
confeccionar la tabla de frecuencias para datos agrupados.
Calcular el Rango de los datos, localizando el valor mínimo y máximo que adoptan los
datos de la distribución, y efectuando la diferencia entre ellos.
19
Nociones Básicas de Estadística
UNIDAD 2
rango ( R)
ai
N º de int ervalos de clase (k )
Una vez realizado el cálculo del R* se plantea una diferencia por exceso del tipo
R* - R, si el resultado de esa diferencia es par se divide en dos y el valor obtenido se resta al
valor mínimo de la distribución y se suma al valor máximo de la misma
Min-R*/2
Max + R*/2
20
Nociones Básicas de Estadística
UNIDAD 2
Estos valores obtenidos de los cálculos pueden ser orientativos, por lo cual si
atendiéramos a estas sugerencias obtendríamos:
184-205
206-227
228-249
250-271
272-293
294-315
316-337
Luego una vez que hemos establecido los intervalos de clase ya estamos en condiciones
de construir la distribución de frecuencias de la siguiente forma:
21
Nociones Básicas de Estadística
UNIDAD 2
D1 Nota: Los años 1995 y 1996, no registran datos de asegurados eventuales del campo en general.
(1) Comprende: seguro individual y colectivo, continuación voluntaria, trabajadores independientes y no
D2 especificados, estudiantes.-
(2) Comprende: eventuales del campo no distribuidos por actividad económica hasta 2003
D3 ND: cifra no disponible
Fuente: Compañía Z- Memoria estadística – Ciudad Soñada
D4
22
Nociones Básicas de Estadística
UNIDAD 2
A. Título
Describe el contenido haciendo referencia a algunos aspectos como:
Expresar el nombre de las variables, indicadores o categorías observadas.
Indicar el espacio territorial donde se produjeron los datos.
Indicar la fecha o período de tiempo al que se refieren los datos estadísticos.
Indicar la referencia de la unidad de medidas adoptadas.
D1.-Nota
Información general sobre definiciones o referencias técnicas o metodológicas de los datos
presentados.
D2.- Llamada
Información específica referida a algún elemento de la tabla
D4.- Fuente
Indica la procedencia de la información
23
Nociones Básicas de Estadística
UNIDAD 2
Tipos de tablas
Se pueden tener distintos tipos de tablas según se presenten datos clasificados de acuerdo
con una o más características, las cuales pueden tener a su vez diferente naturaleza.
Observemos:
Son aquellas en las que se presentan los datos clasificados de acuerdo con una única
característica o variable.
Esta característica mencionada puede ser de diferente naturaleza o medida en distinta
escala, por lo que tendremos:
CUADRO 1. Distribución de los residentes de pediatría encuestados, por hospital. Argentina 2014
24
Nociones Básicas de Estadística
UNIDAD 2
Distribución por sustancias y/o sus metabolitos encontradas en los fallecidos por reacción
aguda a sustancias psicoactivas – Ciudad Sueño del Mar - 2014
Hijos Empleados %
0 60 20,0
1 50 16,7
2 80 26,6
3 50 16,7
4 30 10,0
5 15 5,0
6 8 2,7
7 6 2,0
8 1 0,3
Total 300 100,0
Fuente: SIE – Hospital Estrella de Mar – Ciudad Sueño del Mar
25
Nociones Básicas de Estadística
UNIDAD 2
Distribución por grupos de edad de los fallecidos por reacción aguda a sustancias psicoactivas –
Hospital Estrella de Mar – Ciudad Sueño del Mar – 2014
26
Nociones Básicas de Estadística
UNIDAD 2
Tabla Nº 4: Recién Nacidos según peso al nacer. Instituto de Maternidad e Infancia. Ciudad
Sueño del Mar. Año 2014
Peso al nacer Nº %
Menos de 500 91 1
500-999 92 1
1000-1499 152 1
1500-1999 274 3
2000-2499 601 5
2500 y más 9958 89
Total 11168 100
Fuente: SIE - Instituto de Maternidad e Infancia – Ciudad Sueño del Mar -2015
27
Nociones Básicas de Estadística
UNIDAD 2
(71,3%)
(28,7%)
Total 1.859 124 104 208 498 327 262 118 218
28
Nociones Básicas de Estadística
UNIDAD 2
C. Casos especiales
C.1. Cronológicas - Series de Tiempo
Definición
Aplicación
La teoría y análisis de las series de tiempo pueden ser aplicados a múltiples campos,
pudiendo afirmarse que todo hecho representable cuantitativamente y que sucede a lo largo
de un período de tiempo puede estudiarse como una serie de tiempo: podemos mencionar
como ejemplo:
Temperatura ambiente, temperatura de pacientes, electrocardiogramas-movimiento
demográfico- accidentes de trabajo- cantidad de pasajeros transportados- series
29
Nociones Básicas de Estadística
UNIDAD 2
Es muy usual que en Epidemiología se analice la distribución de una variable en relación con
otra, buscando generalmente un patrón que indique la relación existente o no, entre ellas.
Este análisis suele ser clave en la identificación de las posibles causas de los problemas de
salud, y también de factores que, aun cuando no puedan ser finalmente considerados
causales, resulten estar asociados a estos daños y constituyan importantes elementos
prácticos para la identificación de grupos con mayores riesgos de padecer el mencionado
daño. El estudio de la influencia de una variable (variable independiente) sobre la forma en
que se modifica otra (variable dependiente) es conocido como análisis bivariado.
Las tablas de contingencia (tablas de doble entrada) son una herramienta fundamental para
este tipo de análisis. En su expresión más elemental, las tablas tienen solo 2 filas y 2
columnas (tablas de 2x2), donde las filas identifican la exposición a la variable en estudio y
las columnas la presencia o no del efecto (daño-enfermedad)
30
Nociones Básicas de Estadística
UNIDAD 2
Para examinar este problema, un primer paso puede ser calcular la frecuencia relativa de
cada celda, Sin embargo, el análisis de la relación entre las variables estudiadas es más
directo cuando se computan medidas de asociación. Estas medidas, basadas en la
comparación entre las frecuencias del daño en diferentes grupos (expuestos y no expuestos),
pueden realizarse a través de razones.
Ecografía (+) 25 5
Ecografía(-) 16 4
Fuente: Servicio de Ginecología – Hospital de Maternidad e Infancia – Ciudad Sueño del Mar
Gráficos
En estadística denominamos gráficos a aquellas imágenes que combinando la utilización de
elementos como sombreado, colores, puntos, líneas, símbolos, números, texto y un sistema
de referencia (coordenadas), permiten presentar información.
Los gráficos sirven para sustituir las tablas como herramienta para el análisis de datos.
Las gráficas son una herramienta poderosa y eficaz para comunicar visualmente diversos
tipos de información numérica de manera que facilite tanto la comprensión de conjuntos de
datos complejos, como evidenciar relaciones, patrones y tendencias.
Propósitos de un gráfico
Representar la realidad.
No generar realidades inexistentes fuera de la propia imagen.
Permitir una rápida impresión visual de la información que resume.
Para que los propósitos enunciados puedan cumplirse, los gráficos deben:
Ser auto explicativos.
Ser sencillos.
Justificarse.
Contener la cantidad de información suficiente.
Inducir a pensar en el contenido y no en la apariencia.
Favorecer la comparación.
Ser adecuados para el soporte al que van a ser destinados
31
Nociones Básicas de Estadística
UNIDAD 2
Título:
Describe el contenido de la información presentada, en relación con los siguientes aspectos:
características del fenómeno bajo estudio, nombre de las variables observadas, espacio
territorial al que se refieren los datos, momento, fecha o período en el que ocurren y una
magnitud constante que es adoptada como referencia (unidad de medida).
32
Nociones Básicas de Estadística
UNIDAD 2
Pie de gráfica
Se utiliza para realizar aclaraciones referentes al contenido conceptual, técnico o
metodológico general del gráfico y está compuesto por:
Eje vertical: se llama eje de ordenadas, corrientemente conocido como eje de las “y”, y sobre
él se representan las frecuencias que pueden expresarse en cifras absolutas o relativas (%).
La escala se inicia en 0 y hasta la máxima frecuencia.
33
Nociones Básicas de Estadística
UNIDAD 2
35
40
30 35
30
25
25
20
Nº
%
20
15
15
10
10
5 5
0
0
Si las frecuencias son muy diferentes de 0 se hace un corte a una distancia pequeña del
origen del eje iniciando la graduación del mismo con un valor cercano al menor observado.
Igual sucede cuando las observaciones están muy concentradas entre cierto rango de
valores.
Eje horizontal: es llamado de abscisas o eje de las “x” y en él se coloca la escala (valores o
categorías de una variable).
En el eje de ordenadas se debe indicar si se mide en números absolutos o en porcentajes.
En el eje de las abscisas se indica cada una de las categorías o modalidades que adopta la
variable observada.
Gráficos de áreas
Consisten en la presentación de un área en forma circular (pay) o rectangular (barra
seccionada), que corresponde al valor total de una categoría, la cual es segmentada, en los
valores de las clases en que se distribuye la categoría, de acuerdo con determinada variable.
La diferenciación de las secciones y su correspondencia con las clases requiere el uso de lo
que en este documento denominamos simbología (colores y leyenda). Para este tipo de
gráfico se presentan dos modalidades: circular o rectangular.
Gráficos radiales
Sistema de ejes radiales, con origen común en cero y escalas estandarizadas. En cada eje se
representan los valores de una variable distinta, que básicamente sean comparables entre sí.
Cartogramas
Sistema basado en la utilización de mapas territoriales, para referenciar cada uno de los
valores de una variable en las diferentes unidades territoriales o también para representar
valores de un indicador de movimiento o flujo entre unidades territoriales distintas.
34
Nociones Básicas de Estadística
UNIDAD 2
Tipos de gráficos
Los gráficos al igual que las tablas pueden ser seleccionados según la naturaleza de los datos
que se deseen analizar y/o presentar, como también del número de variables que se
involucren en el análisis. En el siguiente cuadro se indica cual será la forma de tabular los
datos más adecuados como así también el tipo de gráficos que pueden seleccionarse según
se observen una o dos variables.
Proporción Áreas
Porcentaje
Simples y acumulados
Cuantitativa continua Frecuencia Histograma
Proporción Polígono de frecuencias
Simples y acumuladas
Cualitativa + cualitativa Frecuencia Barras
Proporción Barras 100%
porcentaje Barras segmentadas
2 variables
Gráficos de barras
Los datos clasificados en escala cualitativa y cuantitativa discreta se representan en el gráfico
de barras o columnas; son rectángulos de igual base, sobre el eje en que se represente la /s
variable/s observada/s , en tanto que la altura del rectángulo indica la magnitud o frecuencia
de cada grupo. Cuando el gráfico presenta varias barras, las mismas deben ordenarse de
menor a mayor o inversamente. El orden depende del objetivo.
Las barras pueden representarse tanto en forma horizontal como vertical. Una norma para
determinar la orientación de las barras es que éstas se tracen verticalmente, si ello no impide
escribir debajo de las mismas la leyenda correspondiente a cada una, caso contrario se
representarán horizontalmente.
35
Nociones Básicas de Estadística
UNIDAD 2
La leyenda explicativa no debe ser escrita en los extremos finales de las barras ni dentro de
ellas, pues esto dificultaría la comparación. El ancho de las barras, debe ser mayor que los
espacios dejados entre ellas.
Cuando se grafica más de una categoría existen diferentes variedades de presentación.
36
Nociones Básicas de Estadística
UNIDAD 2
37
Nociones Básicas de Estadística
UNIDAD 2
38
Nociones Básicas de Estadística
UNIDAD 2
Gráficos de puntos
Es un tipo de representación que suele utilizarse para sustituir a la gráfica de barras, si se
pretende representar una sola variable. El diagrama de puntos es una representación de
datos útil para muestras pequeñas, hasta (digamos) unas 20 observaciones (Douglas C.
Montgomery, 2009).
Si en cambio se necesita representar y/o analizar la relación de dos variables cuantitativas, el
gráfico de puntos del que estaremos hablando es un gráfico de correlación, en el que cada
uno de los puntos se ubica según un par de coordenadas que le corresponden. En este tipo
de gráficos los dos ejes representan las escalas, a diferencia de los casos anteriores que solo
el eje de abscisas estaba graduado con su escala.
Gráficos de correlación
Dadas dos variables cuantitativas X y Y tomadas sobre el mismo elemento de la población, el
diagrama de dispersión o correlación es simplemente un gráfico de puntos, de coordenadas
(x,y) , donde en el eje x (la abscisa) se grafica la variable independiente, y en el otro eje, y (la
ordenada) se grafica la variable dependiente.
39
Nociones Básicas de Estadística
UNIDAD 2
Ambos ejes representan las escalas a diferencia de los casos anteriores en que solo la abscisa
estaba graduada con la escala.
Aquí cada individuo está representado por un punto determinado por las perpendiculares
levantadas en los ejes en los valores correspondientes.
Es importante resaltar que los puntos de un gráfico de correlación no se unen.
NOTA:
Si las variables están correlacionadas, el gráfico mostraría algún nivel de correlación
(tendencia) entre las dos variables. Si no hay ninguna correlación, el gráfico presentaría una
figura sin forma, una nube de puntos dispersos en el gráfico.
Ejemplo:
Gráficos de líneas
En estos gráficos los valores se representan con puntos, los que se unen con líneas para
facilitar la visualización de la variación de una variable continua. Se utilizan generalmente
cuando se desean representar series de tiempo.
40
Nociones Básicas de Estadística
UNIDAD 2
41
Nociones Básicas de Estadística
UNIDAD 2
Gráfico semilogarítmico
En este tipo de gráficos, en el eje de las ordenadas se utiliza una escala logarítmica y en el
eje de las abscisas una escala aritmética.
Si se examina el papel semilogarítmico podrá notarse que la distancia entre las marcas no es
uniforme, va decreciendo de 1 a 10. Además la distancia entre 1 y 10, es la misma que entre
10 y 100 o entre 100 y 1.000.
Recordemos:
Log 1 = 0
Log 10 = 1
Log 100 = 2
Log 1.000 = 3
42
Nociones Básicas de Estadística
UNIDAD 2
Sin embargo, este tipo de gráfico es especialmente útil cuando se examinan series de datos
en un período de tiempo y estamos más interesados en los cambios relativos (tasas) que en
los valores absolutos.
Las ventajas del gráfico semilogarítmico son:
a) Una línea recta indica una tasa que se ha mantenido constante en el tiempo (-.-.-.-.-)
b) La pendiente de la línea indica la tasa de incremento o de decrecimiento (________)
c) Dos o más líneas paralelas indican idénticas tasas de incremento o decrecimiento.
43
Nociones Básicas de Estadística
UNIDAD 2
44
Nociones Básicas de Estadística
UNIDAD 2
Histograma
El histograma es el más conocido de los gráficos para resumir un conjunto de datos
numéricos y pretende responder a las mismas preguntas que un gráfico de tallo-hojas. Una
ventaja del gráfico de tallo-hojas es que retiene los valores de las observaciones, sin
embargo, esta característica puede ser una desventaja al momento de tratar gran cantidad
de datos. Construir manualmente un histograma es más laborioso que construir un gráfico
de tallo-hojas, pero la mayoría de los paquetes estadísticos producen histogramas
Para construir un histograma es necesario previamente construir una tabla de frecuencias.
Debido a la forma de obtención de esas alturas, el eje de las frecuencias debe rotularse
como número de individuos por unidad de medida de la variable en cuestión, por ejemplo:
'defunciones por año de edad'; 'número de individuos por kg de peso´; etc.
45
Nociones Básicas de Estadística
UNIDAD 2
Polígono de frecuencias
46
Nociones Básicas de Estadística
UNIDAD 2
47
Nociones Básicas de Estadística
UNIDAD 2
Mapas
pirámides de población
pictogramas
48
Nociones Básicas de Estadística
UNIDAD 2
Ejemplos:
Cuando deseamos representar la composición de una población por sexo y edad usamos la
pirámide de población que permite la comparación de cada grupo de edad para ambos sexos.
La Pirámide se construye sobre dos ejes perpendiculares. A la izquierda del eje vertical se
representan los datos correspondientes a la población masculina y a la derecha los
correspondientes a la femenina. Es un histograma confeccionado a partir de barras
horizontales donde la altura de cada una de ellas expresará la cantidad de individuos que
pertenecen a un grupo de edad específico y según si encuentren a la derecha o la izquierda
del eje central serán se sexo masculino o femenino
En el eje vertical se marcan los distintos grupos de edades, en forma creciente hacia arriba, y
sobre el horizontal figuran las escalas de frecuencia, una para los varones y otra para las
mujeres; haciendo coincidir el cero con la intersección de los dos ejes resultan una serie de
rectángulos horizontales que van disminuyendo su longitud a medida que correspondan a
edades avanzadas.
49
Nociones Básicas de Estadística
UNIDAD 2
En ciertas ocasiones se desean presentar datos en forma simple y agradable, por ejemplo,
para representar la producción se utilizan dibujos de bolsas de distintos tamaños, etc., estos
gráficos son llamados Pictogramas.
1970 323.350
1980 434.160
1991 532.845
2001 564.056
2010 618.989
50
Fuente: Instituto Nacional de Estadísticas y
Censos.
Nociones Básicas de Estadística
UNIDAD 2
Resumen de los gráficos comúnmente utilizados para representar los diferentes tipos de
datos:
NATURALEZA DE LA
TIPO DE DATOS TIPO DE DIAGRAMA
VARIABLE
Barras Segmentadas
Barras Simples
CUALITATIVA
Área
Pictogramas
Histograma
CUANTITATIVA Polígono de frecuencia
CONTINUA Gráfico de correlación
(caso doble entrada)
De forma:
· No uso de la identificación.
· No aparición de título o títulos extremadamente extensos.
· Títulos que no responden a las preguntas básicas.
51
Nociones Básicas de Estadística
UNIDAD 2
De contenido:
Uso de gráficos inadecuados dada la naturaleza de lo que se representa.
Omisión de la leyenda donde se han usado claves o símbolos.
No respetar alguna de las reglas establecidas para la construcción del gráfico en
particular.
Por ejemplo, barras unidas cuando se trabaja con variable cualitativa o discreta.
52
Nociones Básicas de Estadística
UNIDAD 2
Evitar en una gráfica la inclusión de distintas líneas de datos que impliquen la intersección en
varios puntos y esto dificulte su consulta.
53
Nociones Básicas de Estadística
UNIDAD 2
Bibliografía
Armijo R.R. Epidemiología básica en Atención primaria de salud. Madrid: Díaz de Santos;
1993.
Rothman K.J. Epidemiología Moderna. Madrid: Ediciones Días de Santos; 1987.
Kelsey JL., Thompson WD., Evans AS. Methods in Observational Epidemiology. New York:
Oxford University Press; 1986. [Amazon]
Hennekens CH., Buring JE. Epidemiology in Medicine Boston: Litte, Brown and Company;
1987.
Sackett DL., Haynes RB., Guyatt GH., Tugwell P. Epidemiología clínica. Ciencia básica para
la medicina clínica. 2ª ed. Madrid: Editorial Médica Panamericana; 1994.
Fletcher RH., Fletcher SW., Wagner EH. Epidemiología clínica. 2ª ed. Barcelona: Masson-
Williams & Wilkins; 1998.
Kleinbaum DG., Kupper LL., Morggenstern H. Epidemiologic Research. Principles and
Quantitative Methods. Belmont, California: John Wiley & Sons; 1982.
Miettinem OS. Theoretical Epidemiology. New York: Jhon Wiley & Sons; 1985.
Rothman KJ. (ed). Causal Inference. Chesnut Hill: Epidemiology Resources Inc; 1988.
Susser M. Conceptos y estrategias en epidemiología. El pensamiento causal en ciencias
de la salud. México: Biblioteca de la Salud; 1991.
Pita Fernandez, S.; Unidad de Epidemiología Clínica y Bioestadística. Complexo
Hospitalario Juan Canalejo. A Coruña.
Pita Fernández, S. Epidemiología. Conceptos básicos. En: Tratado de Epidemiología
Clínica. Madrid; DuPont Pharma, S.A.; Unidad de Epidemiología Clínica, Departamento de
Medicina y Psiquiatría. Universidad de Alicante: 1995. p. 25-47. (Actualizado
28/02/2001).
Diseño de estudios Epidemiológicos, Mauricio Hernandez-Avila Ph.D., Centro de
Investigación en Salud Poblacional, Instituto Nacional de Salud Pública (INSP), México.
Francisco Garrido Latorre, M en C, Centro de Investigación en Sistemas de Salud, INSP,
México.; Sergio Lopez Moreno, MC, Centro de Investigación en Sistemas de Salud, INSP,
México. Salud Pública de México / vol.42, no.2, marzo-abril de 2000.
Presentación de datos estadísticos en cuadros y gráficos- Instituto Nacional de Estadística
y Geografía (México); 2011.
Pértega Díaz S., Pita Fernández S. Representación gráfica en el Análisis de Datos. Unidad
de Epidemiología Clínica y Bioestadística. Complexo Hospitalario Juan Canalejo. A
Coruña. Actualización 02/04/2001.
Referencias : Walker AM. Observation and inference. An introduction to the methods of
epidemiology. Chestnut Hill, MA: Epidemiology Resources Inc, 1991.
Kelsey JL, Thompson WD, Evans AS. Methods in observational epidemiology. Nueva York:
Oxford University Press, 1986.
Kleinbaum DG, Kupper LL, Morgenstern H. Epidemiologic research. Principles and
quantitative methods. Belmont, CA: Lifetime Learning Publications, 1982.
54
Nociones Básicas de Estadística
UNIDAD 2
Rothman KJ, Greenland S. Modern epidemiology. 2a. edition. East Washington Square,
PA: Lippincott-Raven Publishers, 1998.
Miettinnen OS. Theoretical epidemiology. Principles of occurrence research medicine.
Nueva York: A Wiley Medical Publication, 1985.
Cocco P, Blair A, Congia P, Saba G, Ecca AR, Palmas C. Long-term health effects of the
occupational exposure to DDT. A preliminary report. Ann NY Acad Sci 1997;837:246-256.
Hunter DJ. Hankinson SE. Laden F. Colditz GA. Manson JE. Willett WC et al.
Plasmaorganochlorine levels and the risk of breast cancer [see comments]. N Engl J Med
1997;337(18):1253-1258.
Romieu I, Hernández M, Lazcano E, Weber JP, Dewali E. Breast cancer, lactation history
and serum organochlorines. Am J Epidemiol 2000. En prensa.
Wang XQ. Gao PY. Lin YZ. Chen CM. Studies on hexachlorocyclohexane and DDT contents
in human cerumen and their relationships to cancer mortality. Biomed Environ Sci
1988;1(2):138-151.
55
Nociones Básicas de Estadística
UNIDAD 2
Capítulo V:
Medición de los eventos de salud
Introducción
La Epidemiología tiene como uno de sus objetivos primordiales, el estudio de la
distribución y los determinantes de los diferentes eventos de salud. La cuantificación y la
medida de los eventos de interés, son elementos fundamentales para formular y probar
hipótesis, así como para permitir la comparación de las frecuencias de los mismos entre
diferentes poblaciones o entre personas, con o sin una exposición o característica dentro de
una población determinada.
La medida más elemental de frecuencia de un evento en general, es el número de personas
que lo padecen o lo presentan (por ejemplo, el número de pacientes con hipertensión
arterial, el número de personas fallecidas por accidentes de tránsito o el número de
pacientes con algún tipo de cáncer en los que se ha registrado una recidiva). Sin embargo,
dicha medida por sí sola carece de utilidad para determinar la importancia de un problema
de salud determinado, pues debe referirse siempre al tamaño de la población de donde
provienen los casos, y al periodo de tiempo en el cual estos fueron identificados. Para este
propósito, en epidemiología suele trabajarse con diferentes tipos de expresiones
fraccionarias que permiten cuantificar correctamente la magnitud de un determinado
evento.
La información que se maneja en Epidemiología frecuentemente está constituida por cifras
absolutas: número de afectados por determinada enfermedad, número de muertes, total de
individuos expuestos a riesgo, etc.
Pero a pesar de la utilidad de estas cifras, que ya llamamos anteriormente frecuencias
absolutas (número de repeticiones de una misma observación en números absolutos);
generalmente es necesario disponer de medidas de resumen, que permitan cuantificar
correctamente la relevancia de un determinada evento epidemiológico.
Cuando se hace el recuento del número de veces que se presenta un hecho en una
población, como por ejemplo: 20 casos de tétanos, 10 personas intoxicadas, 400 muertos
por tumores; los números obtenidos se denominan "cifras absolutas" o también "frecuencias
absolutas".
56
Nociones Básicas de Estadística
UNIDAD 2
Algunas veces las cifras absolutas son suficientes para analizar un problema, por ejemplo:
6 casos de poliomielitis
1 caso de viruela
Debido a que en estas patologías no se espera ningún caso, por lo tanto, cualquier número
adquiere importancia y permite un análisis sobre el problema.
Pero...
¿Qué pasa si se dice que en una provincia(A) se notificaron 8 .183 casos de diarrea
durante el año 2015?
¿Es éste un número de casos alto o bajo?
Para contestar la pregunta se deben hacer comparaciones con otra u otras provincias o con
la ocurrencia de casos de diarrea en la misma provincia pero en años distintos.
En el mismo año en otra provincia (B) se notificaron 14.754 casos de diarrea.
Ahora se tiene un punto de referencia. Pero, ¿son suficientes estas dos cifras absolutas para
sacar conclusiones?
Provincia A : 8.183 casos
Provincia B :14.754 casos
¿Es correcto decir que en la provincia A el problema causado por las diarreas es menor que
en la provincia B?
Absolutamente NO
Es necesario conocer el número de habitantes y relacionar los casos con la población de las
provincias.
La población varía día a día; será necesario utilizar un dato promedio para el período de
tiempo estudiado. Para esto se estima la población en el punto medio del período.
Siguiendo con el ejemplo, los datos de población estimados a mitad del año x para ambas
provincias son:
Provincia A: 280.500 habitantes
Provincia B: 2.304.000 habitantes
Se debe relacionar el número de casos y la población de la siguiente manera:
Ahora sí, los resultados de estos dos cocientes permitirán comparar la magnitud del
problema en uno y otro lugar. Pero los resultados de estas divisiones son:
57
Nociones Básicas de Estadística
UNIDAD 2
Estos números son difíciles de manejar para descubrir el problema y sacar conclusiones.
Mucho mejor será ponerse de acuerdo y multiplicar el resultado por un factor de
amplificación.
En este caso se multiplicará por 100.000 y el resultado expresará el número de casos que
ocurrieron cada 100.000 habitantes.
Entonces se tendrá:
Ahora es posible realizar un análisis correcto. El problema causado por diarrea es mucho más
importante en la Provincia A que en la Provincia B.
Los resultados obtenidos no son cifras absolutas. Han surgido de relacionar un número con
otro, razón por la cual reciben el nombre genérico de cifras relativas, y específicamente por
la forma en que se han calculado, se denominan Tasas.
Medidas de resumen:
58
Nociones Básicas de Estadística
UNIDAD 2
Supongamos que de 400 alumnos de una universidad, 300 tienen ojos oscuros y el resto
tienen ojos claros, empleando el concepto de razón se tiene:
Si a esta razón la multiplicamos por 100 el nuevo número obtenido se denomina INDICE.
59
Nociones Básicas de Estadística
UNIDAD 2
Nota Importante:
Cuando la razón se calcula entre la probabilidad de que ocurra un evento y la
probabilidad que este no ocurra, entonces la razón recibe el nombre de odds.
Proporción
Los valores que pueden adoptar las proporciones pueden variar entre 0 y 1 debido a que el
numerador siempre está incluido en el denominador, por lo tanto es un número menor o a
lo sumo igual a él. Las proporciones suelen expresarse en términos de porcentajes, los que
se obtienen al multiplicar el resultado del cociente 100, por lo que corrientemente se lo
denomina porcentaje.
Continuando el ejemplo anterior, ahora intentemos determinar la proporción de alumnos
con ojos oscuros, en la población de estudiantes de la universidad.
En términos de porcentaje
Nota
El porcentaje nos permite analizar el aporte; peso específico o importancia de
una categoría sobre el total al que pertenece.
60
Nociones Básicas de Estadística
UNIDAD 2
Si se está observando una variable dicotómica, entonces pueden utilizarse tanto razones
como proporciones; en el caso de variables politómicas, se utilizarán solo proporciones.
Tasa
Siempre que sea necesario medir el riesgo de ocurrencia de un fenómeno, en determinada
población se dispone de una medida sumamente valiosa: las tasas.
El concepto de tasa es similar al de proporción, con la diferencia de que las tasas llevan
incorporado el concepto del tiempo.
Las tasas consideran todos los casos de un evento de salud ocurridos en una población en un
lugar y período determinado.
Dado que las tasas incorporan el concepto de tiempo y lugar, es decir que numerador y
denominador deben estar referidos al mismo tiempo y lugar de ocurrencia, se pueden hacer
pronósticos en base a las mismas que hayan sido calculadas en períodos inmediatamente
anteriores.
K=100,1.000,10.000,100.000
61
Nociones Básicas de Estadística
UNIDAD 2
Debido a que las tasas son proporciones, el numerador está incluido en el denominador; por
lo tanto es menor que él; como consecuencia ese cociente será menor que 1, por eso suele
multiplicarse por un factor de ampliación para que la relación mencionada adquiera
significado
Advertencia:
Excepcionalmente algunas tasas no son proporciones por cómo se
construyen y esto se debe generalmente a la imposibilidad de obtener el
denominador adecuado. Este concepto será ampliado más adelante con los
ejemplos concretos de esta situación.
La elección de las cifras que se utilizan para analizar un conjunto de datos, depende del
análisis que se desea realizar de ellos.
Para analizar la siguiente información:
Sexo Nº Muertes
Mujeres 21
Hombres 51
Total 72
Interpretación: por cada muerte en accidentes de tránsito de conductores del sexo femenino
en la Ciudad X, en el año 2012 murieron más de 2 varones.
62
Nociones Básicas de Estadística
UNIDAD 2
Observemos que tanto los resultados del porcentaje (proporción) y de la razón muestran que
son más frecuentes las muertes por accidentes de tránsito de conductores del sexo
masculino que las del sexo femenino.
¿Esto significa que los hombres tienen mayor riesgo de morir por accidentes de tránsito que
las mujeres?
NO
Para establecer el riesgo que corren tanto hombres como mujeres y compararlos, habría que
relacionar las muertes con la población expuesta bajo riesgo.
Deberíamos considerar para esta estimación de riesgo la población expuesta, que en este
caso serían los conductores de sexo femenino y masculino.
En tal caso se deberían calcular las siguientes tasas:
Expresar el resultado con – por lo menos – un decimal para no confundirlas con las cifras
absolutas.
El valor de la cifra relativa muestra la magnitud de la relación que existe entre los datos
que intervienen en el cálculo.
La publicación de toda cifra relativa debe ir acompañado de por lo menos una de las
frecuencias absolutas con que fue calculada.
No deben calcularse cifras relativas cuando el denominador es un número muy pequeño,
porque las mismas pueden volverse inestables.
Regla aproximada: no se calculan cifras relativas cuando el denominador es menor de 20.
En Salud Pública las tasas se expresan por 100,1.000, 10.000 ó 100.000 según la
magnitud de la relación entre el numerador y el denominador.
El uso de estos factores de amplificación ha determinado la utilización de cada uno de
ellos para las principales tasas.
63
Nociones Básicas de Estadística
UNIDAD 2
Mortalidad
64
Nociones Básicas de Estadística
UNIDAD 2
Las tasas obtenidas de esa forma adoptan su nombre según la fracción poblacional que se
reporte.
Son tasas de mortalidad específica.
65
Nociones Básicas de Estadística
UNIDAD 2
La tasa de mortalidad materna por su construcción es una razón, pero esta se utiliza para
medir el riesgo de morir por complicaciones del embarazo, parto o puerperio.
En este caso el denominador tampoco es el exacto ya que muchos nacidos vivos del año
anterior estuvieron expuestos al riesgo de morir con menos de un año durante el período
estudiado.
En realidad a pesar que llamamos tasas a aquellas que tienen a nacidos vivos en el
denominador, por su construcción son Razones.
66
Nociones Básicas de Estadística
UNIDAD 2
Mortalidad Proporcional
Si hiciéramos el mismo cálculo para los varones la suma dará el 100% de las muertes en el
área y tiempo establecidos.
Este es un indicador de uso muy difundido, que prescinde del dato de población, siendo por
su construcción un simple porcentaje.
67
Nociones Básicas de Estadística
UNIDAD 2
La Tasa de Letalidad
Natalidad
68
Nociones Básicas de Estadística
UNIDAD 2
Influyen sobre la natalidad factores tales como la composición por edad (cuanto más joven
es la población mayor es la tasa de natalidad), el nivel socio-económico (a menor nivel
mayor tasa de natalidad) y la fecundidad propiamente dicha, con los que se puede evaluar
en forma indirecta el mayor riesgo de una población. En general las altas tasas de natalidad
se acompañan de otros factores de riesgo.
La tasa bruta de natalidad sola, no debe usarse para comparar el nivel de fecundidad de dos
poblaciones, por cuanto no toma en cuenta las diferencias en la estructura de las mismas,
especialmente con respecto a la composición por edad de la población.
La natalidad es el factor de mayor peso en la conformación de la estructura poblacional.
Cuanto mayor sea la natalidad, tanto mayor será la proporción de los grupos etarios jóvenes,
característica de países con escaso grado de desarrollo. De no cambiar los patrones
culturales al llegar estos grupos a la edad reproductiva, continuarán o acentuarán el
fenómeno descripto. Este factor se mide por la Tasa de Natalidad:
Morbilidad
69
Nociones Básicas de Estadística
UNIDAD 2
Prevalencia
Se expresa como casos por 100 o 1000 habitantes y es frecuente expresarla en términos de
porcentajes.
Prevalencia de punto
Se emplea para determinar la prevalencia de un evento en la población en un momento en
el tiempo, sin contemplar cuando se ha originado. En este caso la medición se realiza en un
período de tiempo corto.
Prevalencia de período
Determina la cantidad de casos existentes durante un período.
Resuelve el problema de la aparición de nuevos casos mientras se está ejecutando el
estudio.
70
Nociones Básicas de Estadística
UNIDAD 2
Numerador: Todos los casos existentes (incluyendo los casos nuevos diagnosticados durante
el estudio).
Incidencia
71
Nociones Básicas de Estadística
UNIDAD 2
Incidencia
una medida basada en el número de individuos en
riesgo.
ES
el riesgo medio de los miembros de una población de
sufrir un evento en un período dado.
Acumulada
la probabilidad de que un individuo desarrolle el
evento en estudio por lo que también se lo denomina
EXPRESA
riesgo.
Por ser una proporción la Incidencia Acumulada toma valores mayores que 0 y menores que
1 y es adimensional.
Las cifras obtenidas al calcular la incidencia acumulada proporcionan una medida
sumamente útil para comparar los diferentes riesgos de las distintas poblaciones.
Proporciona una estimación de la probabilidad o riesgo de que un individuo libre de una
determinada enfermedad la desarrolle dentro de un período especificado de tiempo, lo que
implica asumir que la población entera expuesta a riesgo al principio del estudio es seguida
durante todo el período de tiempo para observar si se desarrollaba la enfermedad objeto del
estudio, pero lo que en realidad sucede es que las personas objeto de la investigación
ingresan al estudio en diferentes momentos en el tiempo, el seguimiento de los mismos no
es uniforme, y por otra parte algunos abandonan el estudio y solo proporcionan seguimiento
durante un periodo limitado de tiempo.
72
Nociones Básicas de Estadística
UNIDAD 2
En síntesis:
73
Nociones Básicas de Estadística
UNIDAD 2
INCIDENCIA PREVALENCIA
74
Nociones Básicas de Estadística
UNIDAD 2
Aumenta Disminuye
Inmigración de personas
Inmigración de casos
sanas
Emigración de personas
Emigración de casos
sanas
75
Nociones Básicas de Estadística
UNIDAD 2
Caldero de Prevalencia
Restablecimiento
Incidencia
MuerteP =
P I=xI dx d
Muerte
Tasas de Ataque
76
Nociones Básicas de Estadística
UNIDAD 2
Se conoce como tasa de ataque al cociente entre el número de casos y la población expuesta
a riesgo:
Medidas de asociación
Son indicadores epidemiológicos que evalúan la fuerza con la que una determinada
enfermedad o evento de salud (que se presume como efecto) se asocia con un determinado
factor (que se presume como su causa)
Epidemiológicamente:
Estadísticamente:
Las medidas de asociación más sólidas se calculan utilizando la incidencia, con el fin de medir
la influencia que pueden tener los factores de riesgo sobre la ocurrencia del evento.
77
Nociones Básicas de Estadística
UNIDAD 2
Entre las medidas de asociación encontramos al Riesgo Relativo (RR) y se calcula como una
razón:
El riesgo relativo, expresa el riesgo de un grupo que tiene un factor de riesgo o exposición,
en comparación con el riesgo de un grupo de referencia sin ese factor.
Mide la fortaleza de una asociación entre un factor de riesgo o exposición y cierto resultado
final, cuantifica la importancia de la asociación entre ellos.
Es un indicador que responde a la pregunta ¿Cuánto riesgo tienen aquellos sujetos
expuestos a un factor en relación con aquellos que no lo están?, nos indicará cuanto más
probable es que ocurra el suceso en el grupo expuesto al factor de riesgo frente al grupo no
expuesto.
El RR puede utilizarse solo en aquellos estudios en los que puede medirse la incidencia, por
lo que NO es apropiado como medida de asociación en los estudios que no arrojan datos de
casos nuevos (por ejemplo: casos y controles, transversales, etc.); pues por las características
de estos de diseño, no se puede conocer las tasas de incidencia del resultado.
Por ejemplo:
Un grupo de investigadores estudia el efecto de una nueva droga para el tratamiento
del Infarto Agudo de Miocardio, participaron del estudio 1740 pacientes, de los cuales 150
murieron. Del total de los participantes, 725 fueron tratados con la nueva droga, y de
aquellos que no recibieron el nuevo tratamiento murieron 80 pacientes.
No, con un RR>1 los tratados con la droga tendrían 1,23 veces el riesgo de morir que
aquellos que no han recibido el nuevo tratamiento.
78
Nociones Básicas de Estadística
UNIDAD 2
Actualmente el concepto de incidencia es tan amplio que CASOS NUEVOS pueden referirse a
enfermedad o muerte.
En síntesis:
Las medidas de resumen para datos cualitativos más frecuentemente utilizadas son: las
razones, las proporciones y las tasas
Cada uno de ellas tiene diferente interpretación. Los más refinados son las tasas, pues
expresan el riesgo de ocurrencia del evento consignado en su numerador.
Se debe tener cuidado con el cálculo de las tasas para poblaciones pequeñas, porque
suelen ser inestables.
Las tasas pueden dividirse en generales y específicas.
En el ámbito sanitario, las tasas más usadas son las de natalidad, mortalidad y
morbilidad.
Las medidas de asociación más sólidas son aquellas que se calculan utilizando los datos
de incidencia, como el Riesgo Relativo.
NUMERADOR DENOMINADOR
Por OBSERVACIONES
AREA TASA DE (Número de ) (Poblaci6n)
M Población
Personas que
A NUPCIALIDAD estimada a 1.000
se casan
T mitad del período
E NATALIDAD Población
Nacidos vivos
R estimada a 1.000
en un año
N mitad del período
O
Defunción fetal: muerte del
producto de la concepción que
I MORTALIDAD Defunciones ocurre antes de su expulsión o
Número de nacidos vivos 1.000
N FETAL Fetales extracción completa del cuerpo de
F la madre, independientemente de
A la duración del embarazo
N
Defunciones
T
fetales de menos
I TEMPRANA Número de nacidos vivos 1.000
de 20 semanas de
L
gestación
79
Nociones Básicas de Estadística
UNIDAD 2
Defunciones
fetales de 20 a 27
INTERMEDIA Número de nacidos vivos 1.000
semanas de
gestación
Defunciones
TARDIA (o fetales de más de
Número de nacidos vivos 1.000
Mortinatalidad) 27 semanas de
gestación
Suma de:
Los ingleses usan como
defunciones
numerador la suma de la
MORTALIDAD fetales tardías
Número de nacidos vivos 1.000 mortalidad de la primera semana
PERINATAL más defunciones
y como denominador el número
de menores de 7
total de nacidos (vivos o muerto)
días de vida
MORTALIDAD Muertos menores
Número de nacidos vivos 1.000
INFANTIL de 1 año
Defunciones de Tiene valor la relación porcentual
MORTALIDAD
menores de 28 Número de nacidos vivos 1.000 que la mortalidad neonatal guarda
NEONATAL
días con la mortalidad infantil
Defunciones de
MORTALIDAD Refleja mejor el peso de los
niños de 11 meses Número de nacidos vivos 1.000
INFANTIL TARDIA factores ambientales
y 28 días.
Muerte materna: aquella por
MORTALIDAD
Muertes maternas Números de nacidos vivos 1.000 complicaciones del embarazo,
MATERNA
parto o puerperio
80
Nociones Básicas de Estadística
UNIDAD 2
Casos nuevos en la
1.000
unidad de tiempo Población estimada a mitad
INCIDENCIA 10.000
(1 año del período
M 100.000
habitualmente)
O
Número total de 100
R
casos existentes en Población estimada para el 1.000
B PREVALENCIA
un período o fecha mismo período o fecha 10.000
I
determinada 100.000
L
Usada en epidemias o
I Total de casos de 100
ATAQUE Población expuesta a riesgo episodios de breve
D un brote localizado 1.000
duración
A
D Usada en epidemias. El
ATAQUE Número de casos Población expuesta al 100 denominador puede
SECUNDARIO secundarios riesgo (contactos) 1.000 circunscribirse a contactos
susceptibles.
81
Nociones Básicas de Estadística
UNIDAD 2
Habitualmente interesa conocer un parámetro, pero por la dificultad que conlleva estudiar a
TODA la población, se tiende a calcular un estimador sobre una muestra, y confiar en que
sean próximos, si es representativa de la población.
Cuando se ha reunido un conjunto de datos clasificados en escala cuantitativa, es necesario
condensarlos para que aparezcan claramente las características principales de dicho
conjunto. En lugar de trabajar con toda la tabla de frecuencias, los estadísticos o parámetros
resumen los valores que separan a los datos en grupos significativos.
Si se comparan dos o más variables, la condensación es aún más necesaria.
Para resumir datos clasificados en escala cuantitativa se dispone de varios parámetros,
estadísticos o medidas en general:
De posición
De dispersión
De forma
Medidas de posición
Las medidas de posición nos aportan la información de dónde se encuentran los datos, pero
no nos permite saber cómo se distribuyen.
82
Nociones Básicas de Estadística
UNIDAD 2
Propiedades
Es el centro de gravedad de los datos
Puede hallarse en todo conjunto de datos
Incluye a todos los valores de la distribución
Cada conjunto de valores tiene una sola media
La cantidad de datos a evaluar no la afecta
Es un concepto familiar e intuitivamente claro
Es conveniente cuando los datos se distribuyen simétricamente con
respecto a ese valor
Puede malinterpretarse si los datos no forman un conjunto homogéneo
Es muy sensible a valores extremos
No puede calcularse si la distribución tiene clases abiertas
Cálculo:
Media para datos sin agrupar
x
n= tamaño de la muestra
x1 x2 ........ xn i
∑= sumatoria
X i 1
n n xi =cada uno de los valores que toma
Por ejemplo: si se desea calcular la media la variable observada
aritmética de las siguientes mediciones de
Mantoux:
5, 10, 0, 0, 2, 3 mm
5 10 0 0 2 3 20
X 3,3mm.
6 6
83
Nociones Básicas de Estadística
UNIDAD 2
x f x 2 f 2 ........ x n f n x i fi
X 1 1 i 1 n tamaño de la muestra
n n ∑= sumatoria
xi =cada uno de los valores que toma
la variable observada
fi= número de veces que se presenta
cada valor de la variable
RESULTADO DE LA REACCION DE MANTOUX CON PPD 20 UT 2 MESES DESPUÉS DE APLICADA LA VACUNA BCG -
ESTUDIANTES SECUNDARIOS - CIUDAD X - AÑO X
14 2 14 x 2= 28
15 4 15 x 4= 60
16 7 16 x 7= 112
17 4 17 x 4 = 68
18 7 18 x 7= 126
19 6 19 x 6= 114
20 12 20 x 12 = 240
21 5 21 x 5= 105
22 1 22 x 1 = 22
23 - -
24 2 24 x 2= 48
25 - -
26 - -
27 1 27
Total 51 950
950
X 18,6mm
51
84
Nociones Básicas de Estadística
UNIDAD 2
Los valores que toma la variable observada pueden ser demasiados como para
mencionarlos uno a uno, por lo que en tales casos puede recurrirse a agruparlos en
intervalos.
Si tenemos los datos agrupados en intervalos el procedimiento varía en algunos aspectos:
n tamaño de la muestra
∑= sumatoria
n
Nota: la marca de clase se obtiene como semi suma de los extremos del intervalo
L Li
X s
2
Mediana
Es el valor que está ubicado en el centro de la distribución, es decir, el valor que supera a la
mitad de los de la muestra y se ve superado por la otra mitad.
Se calcula buscando el valor de la muestra que ocupa el lugar (n+1)/2, con los datos
ordenados.
No busca el valor central del recorrido de la variable según la cantidad de observaciones,
sino que busca determinar el valor que tiene aquella observación que divide la cantidad de
observaciones en dos mitades iguales. Por lo tanto es necesario atender a la ordenación de
85
Nociones Básicas de Estadística
UNIDAD 2
los datos y debido a ello, este cálculo depende de la posición relativa de los valores
obtenidos.
Es necesario, antes que nada, ordenar los valores y se denota por Me.
Propiedades
La mediana es única para cada conjunto de datos.
No se ve afectada por los valores extremos (muy grandes o muy
pequeños).
Puede obtenerse para datos cualitativos ordinales y cuantitativos.
Puede utilizarse cuando la distribución de frecuencias tiene clases
abiertas, a menos que la mediana caiga en una clase abierta.
Cálculo
Mediana para datos sin agrupar
La mediana es el valor del dato central si hay un número impar de observaciones o el valor
de la semisuma de los valores de los dos datos centrales si se tiene un número par de datos.
Ejemplo
Calcular la mediana de las siguientes mediciones de Mantoux:
14 16 17 18 19 20 21 24
14 16 17 18 19 20 21 27
15 16 17 18 20 20 21
15 16 18 19 20 20 21
15 16 18 19 20 20 21
15 16 18 19 20 20 22
16 17 18 19 20 20 24
Me == 19
Me 19 mm
mm
86
Nociones Básicas de Estadística
UNIDAD 2
x 50 x 50
Aplicando (2) Me
( ) ( 1) x 25 x 26 18 19
2 2
18,5mm.
2 2 2
87
Nociones Básicas de Estadística
UNIDAD 2
RESULTADO DE LA REACCION DE MANTOUX CON PPD 20 UT 2 MESES DESPUÉS DE APLICADA LA VACUNA BCG -
ESTUDIANTES SECUNDARIOS - CIUDAD X - AÑO X
TAMAÑO DE LA REACCION Nº DE % %
DE MANTOUX DESPUES EXAMINADOS Frecuencia Frecuencia
DE LA VACUNACION EN (Frecuencia relativa relativa
mm absoluta) acumulada
xi Fi
14 2 2/51*100= 3,9 3,9
15 4 4/51*100=7,8 11,7
16 7 7/51*100=13,7 25,4
17 4 4/51*100=7,8 33,2
18 7 7/51*100=13,7 46,9
Me = 19
UNIDAD 2
Ejemplo
TAMAÑO DE LA REACCION DE Nº DE EXAMINADOS Fi(a) % %
MANTOUX DESPUES DE LA (Frecuencia absoluta) Frecuencia Frecuencia
VACUNACION EN mm Fi relativa relativa
xi acumulada
14-15 6 6 11,8 11,8
16-17 11 17 21,5 33,3
18-19 13 30 25,5 58,8
20-21 17 47 33,3 92,1
22-23 1 48 1,96 94,06
24-25 2 50 3,92 97,98
26-27 1 51 1,96 100,0
Total 51 100,0
51
17
Me 2 1 18 18,65mm
13
Moda
Es aquel valor de la variable que más se repite, es decir aquel valor de la variable (que
puede ser o no un único valor) con mayor frecuencia.
89
Nociones Básicas de Estadística
UNIDAD 2
Propiedades:
Es la medida de tendencia central más fácil de calcular.
No se ve afectada por valores extremos.
Puede utilizarse cuando los intervalos de clase sean abiertos.
Su interpretación tiene sentido en variables con pocas categorías o valores.
Es la medida que se relaciona con la frecuencia con que se presentan los datos
con mayor incidencia, con lo que se considera la posibilidad de que exista más de
una moda para un conjunto de datos.
Puede observarse en variables cuantitativas y cualitativas.
Si un conjunto de datos contiene dos categorías adyacentes con la misma
frecuencia común (mayor que cualquier otra), la moda es el promedio del valor
de las dos.
Según el número de valores más frecuentes que tenga una distribución es:
Unimodal: aquella en la que hay una categoría que tiene mayor frecuencia que
todo el resto de ellas.
Bimodal: cuando 2 categorías no adyacentes de la variable observada tienen igual
y la mayor frecuencia.
Amodal: es cuando todas las categorías tienen la misma frecuencia.
Nota: Conjuntos muy numerosos que presenten un polígono de frecuencias con dos
lomos, aun cuando las frecuencia de cada uno de los picos no sean exactamente
iguales pueden denominarse bimodales (distorsiones de la definición permitidas), en
este caso podrán distinguirse entre moda mayor y moda menor.
En este ejemplo la moda se corresponde con el valor A, ya que es el que presenta mayor
frecuencia.
90
Nociones Básicas de Estadística
UNIDAD 2
Se observa que la moda es 34 años, ya que es la edad que más se repite. Hay 10 mujeres que
tienen 34 años.
24-26 4
27-29 5
30-32 10
33-35 13
36-38 8
40
35 33
X 34 M o 34
2
Es importante observar si la distribución presenta 1 ó más modas. Si posee una sola moda se
la denomina unimodal, y si tiene dos es bimodal y en su defecto será multimodal.
91
Nociones Básicas de Estadística
UNIDAD 2
Medidas: Modo Me X
Representación gráfica: curva sesgada
a la derecha.
El parámetro más adecuado para
representar la distribución es la
mediana ya que se encuentra entre el
Modo y el promedio y no se encuentra
influenciada por valores extremos.
El Modo se encuentra en el punto mas
alto de la distribución.
92
Nociones Básicas de Estadística
UNIDAD 2
Medidas: X Me Mo
Representación gráfica: curva sesgada
a la izquierda.
El parámetro más adecuado para
representar la distribución es la
mediana ya que se encuentra entre el
Modo y el promedio y no se encuentra
influenciada por valores extremos.
Cuantiles
Son aquellos valores de la variable que dividen a la distribución en partes, de tal manera que
cada una de las partes tiene el mismo número de frecuencias, entre los cuantiles más
conocidos se encuentran:
Deciles( Di)
Son las nueve partes iguales en las que se divide una distribución ordenada de menor a
mayor, conteniendo cada una de ellas el 10 % de la distribución. Se los identifica como Di por
ejemplo D5, D9
93
Nociones Básicas de Estadística
UNIDAD 2
Cuartiles (Qi)
Son los valores de la variable que dividen al conjunto de datos (ordenados de menor a
mayor) en cuatro partes iguales, (25% por cada una de las partes), dejando por debajo de
ellos determinados porcentajes. Se los identifica con Q1, Q2, Q3 de manera tal que Q1 = P25,
Q2 = P50= Me y Q3 = P75
Cálculo
Sea Lq ó L p la posición del cuartil o percentil deseado
p q
Lp n Lq n
100 4 n = nº de datos
p= percentil
q = cuartil
Lq ó L p indican la posición del p-ésimo percentil y del q-ésimo cuartil, luego una vez
establecida la posición del parámetro ocurre:
Por ejemplo:
94
Nociones Básicas de Estadística
UNIDAD 2
95
Nociones Básicas de Estadística
UNIDAD 2
Observemos que en ambos casos los valores del promedio y la moda en los dos grupos son
iguales, pero las calificaciones obtenidas no los son, es por eso que para describir
adecuadamente una distribución de datos, no basta con conocer las medidas de posición
central, sino es necesario conocer en qué medida cada dato de la misma se aleja del punto
central que se ha calculado.
Para establecer estos valores utilizamos las medidas de dispersión.
Rango
Tal y como se expuso en el anteriormente, el rango es la distancia entre el mayor y el menor
de los valores que adquiere la variable. Se lo indica con R.
Desventajas:
No utiliza todas las observaciones.
Esta afectado por observaciones extremas (máximo y mínimo valor que asume la
variable).
No tiende a disminuir a medida que aumenta el número de observaciones.
Continuando con el ejemplo de los alumnos del curso dictado en la Facultad de la Ciudad
Sueño del Mar
96
Nociones Básicas de Estadística
UNIDAD 2
Rango Intercuartílico
Es la distancia entre el tercer y el primer cuartil.
Ri Q3 Q1
Es una medida similar al rango pero elimina las observaciones extremas inferiores y
superiores, por lo tanto no es tan sensible a esos valores extremos.
Varianza
Se la define como la media de los cuadrados de las diferencias entre cada valor de la variable
en estudio y la media de la distribución de datos de la misma. y se la indica con S2, (en
publicaciones científicas puede encontrársela como VAR).
Mide el promedio de las distancias (al cuadrado) de las observaciones con respecto de la
media.
Es sensible a los valores extremos (alejados de la media).
Sus unidades son diferentes a las unidades de la variable del conjunto original de datos, son
el cuadrado de las unidades de la variable, por ejemplo si se está observando la variable que
mide el tiempo de espera de una persona en minutos, las unidades de la varianza están
dadas en minutos al cuadrado (min2) ¿Qué es un minuto al cuadrado?, esto provoca que su
interpretación sea difícil.
Es una expresión de gran belleza “natural” ya que contiene la información geométrica
relevante de muchas situaciones donde la energía interna de un sistema depende de la
posición de sus partículas.
Se calcula:
n
S2 i 1 X= media o promedio
N N = total de datos de la muestra
en estudio
Varianza para datos no agrupados
Se limita a aplicar la fórmula anterior:
Calcular la media de la distribución
Aplicar la fórmula
Su unidad de medida es el cuadrado de las unidades de medida en que se midió la
variable
UNIDAD 2
Debido a las dificultades para su comprensión, cuando se la relaciona con los datos que se
están observando, para comprender la variación del conjunto de datos, se calcula desviación
estándar.
En el intervalo , por
lo menos se encuentra el por ciento de las
observaciones, donde es el promedio, kes una constante y DE es el valor del desvío
estándar.
98
Nociones Básicas de Estadística
UNIDAD 2
Usos
Se utilizan en inferencia estadística.
Para el cálculo del tamaño de la muestra.
Coeficiente de variación
El coeficiente de variación de un conjunto de datos muestrales o poblacionales, expresado
en términos de porcentaje, describe el desvío estándar relativo a la media, este se indica con
CV.
Por Ejemplo:
Si se observan la talla y el peso de 40 individuos pertenecientes a una muestra de la
población de estudiantes universitarios de la Ciudad Sueño del Mar y se obtiene las
siguientes medidas.
99
Nociones Básicas de Estadística
UNIDAD 2
Medidas de forma
Medidas de asimetría
La simetría de una distribución de frecuencias refiere al grado en que valores que toma la
variable, equidistantes a un valor que se considere centro de la distribución, poseen
frecuencias similares.
Es un concepto más intuitivo a nivel visual, especialmente, si se observa una representación
gráfica (diagrama de barras, histograma…) de la distribución de frecuencias. Ésta será
simétrica si la mitad izquierda de la distribución es la imagen especular de la mitad derecha.
Para saber si una distribución de frecuencias es simétrica hay que precisar con respecto a
qué: media, mediana o modo?
Para las variables cuantitativas continuas es con respecto a la mediana, ya que esta divide a
la distribución en dos partes iguales, en cambio para las variables discretas la medida de
referencia será el promedio.- Parecería que existe una arbitrariedad en los conceptos
anteriores, pero en realidad no hay tal, pues si una variable es continua, coinciden ambos
100
Nociones Básicas de Estadística
UNIDAD 2
criterios de simetría (con respecto a la media y a la mediana). Es más, se tiene que media y
mediana coinciden para distribuciones continuas simétricas. Por otro lado, en el caso de
variables discretas, la distribución es simétrica si el lado derecho del diagrama se obtiene por
imagen especular desde la media. En este caso coincide la media con la mediana si el
número de observaciones es impar.
IMPORTANTE:
Cuando realizamos un estudio descriptivo es altamente improbable que la distribución
de frecuencias sea totalmente simétrica. En la práctica diremos que la distribución de
frecuencias es simétrica si lo es de un modo aproximado.
moda =
media =
mediana
(o los
valores
son muy
cercanos
entre
sí).-
Una distribución es asimétrica cuando tiene algún tipo de sesgo
Moda ≠ Mediana ≠ Media
Tipos de asimetría
La asimetría de un conjunto de datos puede ser, positiva o negativa:
Asimetría Positiva: Tiene sesgo a la derecha y las medidas de posición central se relacionan
de manera que: Moda < mediana < media
101
Nociones Básicas de Estadística
UNIDAD 2
Asimetría Negativa: Tiene sesgo a la izquierda y las medidas de posición central se relacionan
de manera que: Moda> mediana > media
Existen Índices estadísticos que permiten cuantificar el nivel de asimetría de una variable
cuantitativa o cualitativa ordinal.
Cabe destacar que para variables cualitativas nominales no tiene sentido el plantear este
tipo de índices, dado que no existe un orden intrínseco a los valores de la variable.
102
Nociones Básicas de Estadística
UNIDAD 2
Distribución platicúrtica (apuntamiento negativo): indica que en las colas hay más casos
acumulados que en las colas de una distribución normal.
Curva de Gauss
103
Nociones Básicas de Estadística
UNIDAD 2
En síntesis:
Las medidas de resumen para variables cuantitativas suelen dividirse en: de posición, de
dispersión y de forma; resultando conveniente no utilizar las primeras de forma aislada, sino
acompañadas de alguna medida de la dispersión.
Cuando las distribuciones son asimétricas o hay intervalos abiertos, se prefiere el cálculo de
la mediana al de la media.
104
Nociones Básicas de Estadística
UNIDAD 2
Bibliografía
Pardo, A. y Ruiz, M. A. (2002). SPSS: Guía para el análisis de datos. Madrid: McGraw-Hill.
105