Está en la página 1de 172

APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A.

Buccé Bravo

Justificación: Los siguientes apuntes sobre Bioestadística en el área


Descriptiva han sido elaborados con el fin de que los estudiantes de la carrera
Enfermería de la Facultad de Medicina de la Universidad de Los Andes,
adquieran los conocimientos básicos que a futuro en el ejercicio de su
profesión como Licenciadas(os) en Enfermería les permitan en una forma clara
y sencilla:

Aplicarlos para establecer las estrategias necesarias en el área primaria de la


prevención de las enfermedades tanto en los campos de las comunidades, las
familias y los individuos (adultos e infantes).

Objetivo General.

1. Las(os) alumnas(os) estarán en la capacidad de poner en práctica los


principios del método de la Bioestadística en el análisis de los procesos del
área de las Ciencias de la Salud, específicamente en el campo de la
Enfermería.
2. Comprender la aplicabilidad del Método Estadístico en el área de las
Ciencias de la salud.
3. Aplicar los diferentes pasos que involucran el uso del Método Estadístico

Objetivos Específicos.

1. Conocerlas diferentes etapas del método de la bioestadística.


2. Definir los términos fundamentales utilizados en la bioestadística,
clasificación, variables.
3. Explicar los conceptos de Universo, Población y muestra.
4. Comprender las relaciones entre el Método Científico y el Método
Estadístico
5. Clasificar y utilizar las diferentes medidas de Tendencia y Dispersión
6. Analizar e Interpretar las diferentes resultados obtenidos mediante cuadros
comparativos.
7. Analizar e Interpretar las diferentes representaciones gráficas.
8. Aplicar el concepto y la técnica de estudio de la bioestadística.

1
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Tema 01.
La Investigación Científica y La Estadística
La Estadística y Su Importancia

Conceptos clave: el método científico, razonamiento deductivo e inductivo,


estadística, bioestadística, censo, encuesta, método estadístico, software

Contenidos

Introducción
Algunos conceptos básicos y descripción
Estadística
Bioestadística
Universo
Individuos
Población
Muestra
Variables
Tipos de variables
 Cualitativas
 Cuantitativas
 Unidimensionales
 Bidimensionales
 Pluridimensionales
 Dependientes
 Independientes
 Asociadas
Clasificación de la estadística
Estadística deductiva o descriptiva
Estadística inductiva o inferencial
Método científico y el método estadístico
¿Para qué sirve la Estadística?
El Censo de Población
La Encuesta
Estadística y Computación

2
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Introducción: Tradicionalmente, la formación de los profesionales en las


ciencias de la salud se ha caracterizado por un escaso interés en las áreas
metodológicas, especialmente en la estadística, lo que ha conducido a una
deficiente preparación en este campo y a considerar a la estadística como un
conjunto de números, fórmulas y cálculos matemáticos. En realidad, se trata de
un método de razonamiento que permite estudiar el comportamiento de
ciertas características en una población, por lo que es instrumento
necesario para los profesionales y estudiantes de estas ciencias. Cuando se
hace una historia clínica, se realiza un examen físico o solicita análisis de
laboratorio, evaluaciones radiográficas u otros estudios, el profesional de la
salud está recogiendo información (datos) que le permiten tomar la decisión
sobre las acciones a tomar, este tipo de razonamiento de lo general a lo
especifico se llama razonamiento deductivo o descriptivo (basado
generalmente en la “experiencia” del profesional), pero cuando no tenemos
esta “experiencia” sino que nos basamos de lo individual a lo general estamos
en presencia del llamado razonamiento inductivo o inferencial.

En este tema se proporcionan las definiciones e ideas básicas inherentes a la


Estadística y una visión global de la utilidad e importancia de ésta.

La Estadística deriva su nombre del hecho de haber sido aplicada


en primera instancia a la recolección de datos que permitieran la
administración de las naciones, para propósitos militares, número y riquezas
de sus pobladores.

La palabra Estadística tiene en el presente dos significados diferentes. En


plural, esta relacionado a número y en singular, es el método utilizado en la
manipulación de los datos numéricos anteriores, es decir, es el método de
recolectar, elaborar, analizar y obtener conclusiones de datos numéricos.

La Estadística de hoy proporciona a los investigadores nuevos


conocimientos, en particular para el investigador en el campo de la Biología,
a partir de 1925 con la publicación del libro "Los métodos estadísticos para
los trabajadores de la investigación" de Fisher. No solamente en estudios
científicos está presente la Estadística sino que ésta aparece prácticamente en
la vida cotidiana: Cuando decidimos salir con un paraguas por que creemos
que va ha llover, cuando decimos que en la sala de pediatría del IHULA se
atiende un promedio de 25 niños por día, cuando se informa en la prensa
local que cerca de 2.350.800 personas marcharon en la concentración de
Caracas por la solicitud de la libertad y la democracia . En todos estos
3
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

ejemplos, están reflejados, aunque no en una forma rigurosa, conceptos y


métodos propios de la Estadística, muchos de los cuales van a ser
considerados posteriormente.

En las últimas décadas la estadística ha alcanzado un alto grado de desarrollo,


hasta el punto de incursionar en la totalidad de las ciencias; inclusive, en la
lingüística se aplican técnicas estadísticas para esclarecer la paternidad de un
escrito o los caracteres más relevantes de un idioma.

La estadística es una ciencia auxiliar para todas las ramas del saber; su utilidad
se entiende mejor si tenemos en cuenta que los quehaceres y decisiones
diarias embargan cierto grado de incertidumbre... y la Estadística ayuda en la
incertidumbre, trabaja con ella y nos orienta para tomar las decisiones con un
determinado grado de confianza.

Los críticos de la estadística afirman que a través de ella es posible probar


cualquier cosa, lo cual es un concepto profano que se deriva de la ignorancia
en este campo y de lo polifacético de los métodos estadísticos. Sin embargo
muchos "investigadores" tendenciosos han cometido abusos con la estadística,
elaborando "investigaciones" de intención, teniendo previamente los resultados
que les interesan mostrar a personas ingenuas y desconocedoras de los
hechos. Otros, por ignorancia o negligencia, abusan de la estadística utilizando
modelos inapropiados o razonamientos ilógicos y erróneos que conducen al
rotundo fracaso de sus investigaciones.

Lincoln L. Chao hace referencia a uno de los más estruendosos fracasos,


debido a los abusos en la toma de una muestra:

Se trata del error cometido por la Literary Digest que, en sus pronósticos para
las elecciones presidenciales en EE.UU. para 1936, afirmó que Franklin D.
Roosvelt obtendría 161 votos electorales y Alfred Landon, 370. La realidad
mostró a Roosvelt con 523 votos y a Landon con 8 solamente.

El error se debió a que la muestra fue tomada telefónicamente a partir de la


lista de suscriptores de la Digest y, en 1936, las personas que se daban el lujo
de tener teléfonos y suscripciones a revistas no configuraban una muestra
representativa de los votantes de EE.UU. y, por ende, no podía hacerse un
pronóstico confiable con tan sesgada información.

En cualquier análisis estadístico, la primera aproximación a los datos se realiza


mediante la obtención de los estadísticos descriptivos de las variables
4
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

implicadas, así como distintos gráficos. Los estadísticos y los gráficos usados
dependen de la naturaleza de las variables que, de un modo general, se
pueden clasificar en cualitativas y cuantitativas. Una de las personas que
contribuyeron en gran medida a la difusión de la estadística descriptiva fue la
enfermera inglesa Florence Nightingale (1820-1910), que durante la guerra
de Crimea recogió de forma sistemática información sobre los pacientes,
mejorando notablemente el sistema sanitario en hospitales. Florence
Nightingale fue la precursora de la presentación gráfica de resultados.

Florence Nightingale

Cuando se le da una solución estadística a un problema, se desarrolla una


secuencia de eventos como se muestra en la siguiente figura:

En la figura anterior se pueden detectar los eventos :

5
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

1.- La situación bajo investigación se define cuidadosa y completamente.

2.- Se recolecta una muestra de la población siguiendo un procedimiento


establecido e idóneo.

3.- Los datos de la muestra se convierten en información útil (esta información


útil, numérica o gráfica, se denomina estadísticas de la muestra).

4.- Se aplican las teorías de inferencia estadística a la información de la


muestra para obtener conclusiones sobre la población muestreada (estas
conclusiones o respuestas se denominan inferencias).

Algunos Conceptos Básicos y Descripción

Estadística: Antes de intentar una definición de Estadística, vamos a


puntualizar el hecho de que ésta trata o se interesa solamente en fenómenos o
situaciones donde está presente la incertidumbre (duda, conocimiento no
seguro y no claro de algunas cosas) en cuánto a lo que va a suceder. Es decir,
que no se puede predecir con seguridad total lo que va a ocurrir bajo ciertas
condiciones, aunque existan experiencias anteriores al respecto y aunque se
controlen al máximo y traten de reproducirse exactamente las mismas
condiciones.

En cualquier situación de la vida diaria esta presente la Estadística, siempre


que se necesite recabar información sobre un problema, ordenar y procesar
esa información y finalmente analizar la misma y obtener conclusiones,
recurrirá a la Estadística.

Definir la estadística es una tarea difícil porque tendríamos que definir cada
una de las técnicas que se emplean en los diferentes campos en los que
interviene. Sin embargo, diremos, en forma general, que la estadística es un
conjunto de técnicas que, partiendo de la observación de fenómenos, permiten
al investigador obtener conclusiones útiles sobre ellos.

A continuación se presentaran algunas definiciones de la Estadística:

"La Estadística es la ciencia, pura y aplicada, que crea, desarrolla y aplica


técnicas de modo que pueda evacuarse la incertidumbre de inferencia
inductiva." STEELL/TORRIE

6
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

"La Estadística es un conjunto de conocimientos y métodos que se utilizan en


la recolección, presentación y análisis de información relativa a un fenómeno
o hecho determinado y que le permite tomar al investigador decisiones en
situaciones donde este presente la incertidumbre." J. M. ARMAS G

La Estadística fue definida en 1981 por Schwartz como "Un método de


razonamiento que permite interpretar un tipo de datos muy particular que nos
ofrecen fundamentalmente las ciencias de la vida y cuyo carácter esencial es
la variabilidad".

Otra definición sería, la Estadística es un campo del estudio relacionado con:

a. La recopilación, organización y resumen de los datos.


b. La obtención de inferencias (sacar una consecuencia de una cosa)
acerca de un conjunto de datos cuando sólo se observa parte de ellos.

Proceso
Métodos Estadísticos
Datos Información

El objetivo de la Estadística es generalizar o inferir a una población los


resultados provenientes de una muestra. Estas inferencias van
acompañadas de una cuantificación de error o incertidumbre bajo la cual se
realiza.

Bioestadística: Las consideraciones ya expuestas bastarían para explicar las


relaciones existentes entre la Estadística y las Ciencias de la Salud (Medicina,
Nutrición y Enfermería), ciencias éstas caracterizadas por los complejos y
variables de los fenómenos que se estudian.

Para estos profesionales el Método Estadístico es un instrumento


invalorable a pesar de que a menudo se desconoce su gran utilidad, ya que
este método permite dotarlo de criterios suficientes para leer y evaluar
críticamente los datos presentados en la literatura médica, cada vez más
basados en pruebas estadísticas. A este Investigador que trata de probar una
hipótesis de trabajo o que pretende simplemente extraer ciertas deducciones
de las observaciones realizadas, la Estadística le ayudar a decidir sobre el
7
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

número de pacientes que debe estudiar para que sus conclusiones tengan
validez, a recoger adecuadamente los datos pertinentes, a resumir y analizar
convenientemente el material reunido y a presentar a otros el fruto de sus
investigaciones.

El Estudiante por su parte, sólo podrá evaluar objetivamente la evidencia que


otros investigadores le presentan, si es capaz de comprender el alcance y
limitaciones de los datos numéricos que han servido de base a las
conclusiones del estudio, y esa capacitación requiere de un mínimo de
conocimientos estadísticos.

En Medicina, la Estadística es el instrumento que se utiliza para estimar (con


un error conocido) el comportamiento general de una población frente a un
factor determinado, o el comportamiento de una enfermedad en una población
determinada.

Teniendo ya claro su importancia en el campo de las Ciencias de la salud


podemos definir Bioestadística como "Las Herramientas de la Estadística que
son aplicadas a datos que se obtienen de las Ciencias Biológicas y de la
Medicina".

Universo: Se denomina Universo estadístico a un conjunto finito o infinito


de seres vivos, elementos o cosas, sobre los cuales están definidas
características o variables que interesan analizar. (personas, fábricas, familias
ríos, etc.)

Individuos: Cualquier elemento que porte información sobre el fenómeno que


se estudia. Así, si estudiamos la altura de los niños de una clase, cada alumno
es un individuo; si estudiamos el precio de la vivienda, cada vivienda es un
individuo. El individuo es la unidad mínima que se estudia. En medicina
habitualmente es el paciente y en el caso de personas sanas se denomina
sujeto o persona. También pueden estudiarse otros como: animales de
experimentación, datos de laboratorio, exámenes, etc. (en estos casos se
denomina observación).

Población: Se llama Población Estadística a la colección de todas las


posibles mediciones que pueden hacerse a una característica común en
estudio de un conjunto de individuos, sujetos. Conjunto de elementos de la
misma especie que se pretende estudiar en una investigación científica y de la
cual se obtiene una muestra. Al igual que el universo, una población estadística
puede ser finita (cuando tiene un determinado “N” de elementos) o infinita.
8
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

(población de estaturas, de enfermedades, de opiniones, etc.) Las poblaciones


pueden ser clasificadas básicamente como sigue:

 Población General o Madre: población real que se pretende estudiar y


a la cual se extenderán las conclusiones de la muestra perteneciente a la
misma.
 Población Hipotética: conjunto formado por todas las poblaciones, en
las que se podría efectuar la investigación llevada a cabo en la población
actual de estudio.
 Población Estándar: población patrón, que sirve de base para
comparaciones con otras poblaciones.

Muestra: La muestra es una parte o porción de una población de tamaño


“n”. En consecuencia de una misma población pueden seleccionarse
diferentes muestras. La muestra es el grupo de pacientes u observaciones que
se estudiará, la cual debe haberse elegido al azar (Aleatorio) y ser
representativa de la población a la cual pertenece, esto quiere decir: sin
sesgos. En general la muestra es toda parte representativa de un conjunto,
población o universo, cuyas características debe reproducir en pequeño lo más
exacto posible. A partir del análisis de la muestra, obtenida correctamente y al
azar, se pueden hallar conclusiones que sean extrapolables a la población de
origen. Para elegir la muestra debe apelarse a un determinado método de
muestreo. Existen varios métodos de muestreo de acuerdo al objetivo que se
quiera llegar con la muestra. El método habitual es el de muestreo al azar o
aleatorio, pero también puede hacerse en determinados casos un muestreo
controlado para evitar la incorporación de factores no deseables en la muestra

Variables: Al realizar un estudio epidemiológico, las características que se


miden constituyen las Variables, y los Datos se definen como los distintos
valores en diferentes personas, lugares o cosas que toma una característica
a ser estudiada. La Variable es una característica o propiedad determinada del
individuo, sea medible o no. Esta propiedad hace que las personas de un grupo
puedan diferir de las de otro grupo en la muestra o población de estudio.

Tipos De Variable: Las variables, se clasifican de acuerdo a sus


correspondientes escalas de medida en:

Variables Cualitativas: Denominadas también categóricas, nominales o


atributos son aquellas cuyas características pueden ser no medibles, es decir
que presentan modalidades no cuantitativas (por ejemplo: nacionalidad, color

9
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

de la piel, sexo). Aunque, en este caso, no puede lograrse su medición en el


sentido habitual del término, puede contarse el número de personas, lugares o
cosas que pertenecen a las diferentes categorías. Estas variables pueden
clasificarse como Dicotómicas: Son aquellas que solo permiten dos
clasificaciones o categorías (sexo, estado de salud) y Politómicas, que son
aquellas que permiten más de dos clasificaciones o categorías (tipos de
familias: nuclear, extensa y extensa compuesta, y tipos de carne: corte de
primera, de segunda y de tercera). También se clasifican en:

Variables Categóricas Dicotómicas: son las que tienen dos valores fijos y
excluyentes entre si como la evolución, presencia o ausencia de una
enfermedad o característica en la muestra.

Variables Categóricas Nominales: son variables cualitativas que no permiten


establecer un orden, por ejemplo la raza, que puede ser blanca, negra,
caucásica, etc., o los grupos sanguíneos A, B, AB o 0. También son
excluyentes entre si, o sea que cada paciente pertenece a una u otra categoría
pero no a dos al mismo tiempo.

Variables Categóricas Ordinales: estas si permiten establecer un orden


determinado, por ejemplo los grupos de cierta patología son I a IV, un paciente
del grupo II tiene menor probabilidad de mortalidad en UCI que el del grupo IV.
La clasificación de la Disnea en grados ( I a IV) es otro ejemplo. También son
excluyentes entre sí.

Variables Cuantitativas: Es aquella cuya escala de medida es de intervalos,


proporcional o absoluta, en otras palabras son aquellas susceptibles de
medición. Estas se clasifican en Discretas, que son aquellas que no pueden
tomar valores fraccionados en un intervalo dado y sé caracteriza por saltos o
interrupciones en los valores que ésta puede tomar, sólo pueden tomar valores
enteros (1, 2, 8, -4, etc.). Por ejemplo: número de hermanos (puede ser 1, 2,
3....,etc, pero, por ejemplo, nunca podrá ser 3,45). y Continuas, son aquellas
que pueden tomar infinitos valores en un intervalo dado y se caracteriza por no
poseer los saltos o interrupciones del caso anterior es decir pueden tomar
cualquier valor real dentro de un intervalo. (Por ejemplo, la velocidad de un
vehículo puede ser 80,3 km/h, 94,57 km/h., las cifras del colesterol,
hematocrito, transporte de oxigeno, altura, peso, frecuencia cardiaca o
respiratoria, dosis de un medicamento).

10
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Debido a las limitaciones de los instrumentos de medición con que se cuenta,


las variables que son esencialmente continuas, suelen tratarse como si fueran
discretas.

Las Variables también se pueden clasificar en:

Variables Unidimensionales: sólo recogen información sobre una


característica (por ejemplo: edad de los alumnos de una clase).

Variables Bidimensionales: recogen información sobre dos características de


la población (por ejemplo: edad y altura de los alumnos de una clase).

Variables Pluridimensionales: recogen información sobre tres o más


características (por ejemplo: edad, altura y peso de los alumnos de una clase).

Además de lo expuesto anteriormente, existe otra forma de clasificar a las


variables que es también de suma importancia en estadística: en dependientes,
independientes y asociadas.

Variable Dependiente: es la variable motivo de nuestro interés, cuyos valores


dependen de otras variables que pueden influir en ella. También se la llama
variable de respuesta. Por ejemplo la sobrevida, respuesta al tratamiento,
evolución, etc.

Variable Independiente: es la que modifica de una u otra manera a la variable


dependiente, llamándose también según el caso factor de riesgo, factor
predictivo, etc.

Variable Asociada: se denomina así a aquella variable independiente que no


modifica por su sola presencia a la variable dependiente, pero que al
combinarse con otra variable, si influye notoriamente a la anterior.

Clasificación De La Estadística: La estadística se divide en dos grandes


ramas de estudio que son: La estadística descriptiva, la cual se encarga de la
recolección, clasificación y descripción de datos muestrales o poblacionales,
para su interpretación y análisis, que es de la que nos ocuparemos en este
curso; y la estadística matemática o inferencial, que desarrolla modelos
teóricos que se ajusten a una determinada realidad con cierto grado de
confianza.

Estas dos ramas no son independientes; por el contrario, son complementarias

11
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

y entre ambas dan la suficiente ilustración sobre una posible realidad futura,
con el fin de que quien tenga poder de decisión, tome las medidas necesarias
para transformar ese futuro o para mantener las condiciones existentes.

Método Científico y El Método Estadístico: El método estadístico, parte de la


observación de un fenómeno, y como no puede siempre mantener las mismas
condiciones predeterminadas o a voluntad del investigador, deja que actúen
libremente, pero se registran las diferentes observaciones y se analizan sus
variaciones.

Para el planeamiento de una investigación, por norma general, se siguen las


siguientes etapas:

Planteamiento Del Problema: Al abordar una investigación se debe tener bien


definido qué se va a investigar y por qué se pretende estudiar algo. Es decir, se
debe establecer una delimitación clara, concreta e inteligible sobre el o los
fenómenos que se pretenden estudiar, para lo cual se deben tener en cuenta,
entre otras cosas, la revisión bibliográfica del tema, para ver su accesibilidad y
consultar los resultados obtenidos por investigaciones similares, someter
nuestras proposiciones básicas a un análisis lógico; es decir, se debe hacer
una ubicación histórica y teórica del problema.

Fijación De Los Objetivos: Luego de tener claro lo que se pretende


investigar, Debemos presupuestar hasta dónde queremos llegar; en otras
palabras, debemos fijar cuales son nuestras metas y objetivos. Estos deben
plantearse de tal forma que no haya lugar a confusiones o ambigüedades y
debe, además, establecerse diferenciación entre lo de corto, mediano y largo
plazo, así como entre los objetivos generales y los específicos.

Formulación De Las Hipótesis: Una hipótesis es ante todo, una explicación


provisional de los hechos objeto de estudio, y su formulación depende del
conocimiento que el investigador posea sobre la población investigada. Una
hipótesis estadística debe ser susceptible de docimar, esto es, debe poderse
probar para su aceptación o rechazo.

Una hipótesis que se formula acerca de un parámetro (media, proporción,


varianza, etc.), con el propósito de rechazarla, se llama Hipótesis de Nulidad y
se representa por Ho; a su hipótesis contraria se le llama Hipótesis Alternativa
(H1).

12
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Definición De La Unidad De Observación y De La Unidad De Medida:


La Unidad de Observación, entendida como cada uno de los elementos
constituyentes de la población estudiada, debe definirse previamente,
resaltando todas sus características; pues, al fin de cuentas, es a ellas a las
que se les hará la medición.

La unidad de observación puede estar constituida por uno o varios individuos u


objetos y denominarse respectivamente simple o compleja.

El criterio sobre la unidad de medición debe ser previamente definido y


unificado por todo el equipo de investigación. Si se trata de medidas de
longitud, volumen, peso, etc., debe establecerse bajo qué unidad se tomarán
las observaciones ya sea en metros, pulgadas, libras, kilogramos, etc.

Asociado a la unidad de medida, deben establecerse los criterios sobre las


condiciones en las cuales se ha de efectuar la toma de la información.

Determinación De La Población y De La Muestra: Estadísticamente, la


población se define como un conjunto de individuos o de objetos que poseen
una o varias características comunes. No se refiere esta definición únicamente
a los seres vivientes; una población puede estar constituida por los habitantes
de un país o por los peces de un estanque, así como por los establecimientos
comerciales de un barrio o las unidades de vivienda de una ciudad.

Existen desde el punto de vista de su manejabilidad poblaciones finitas e


infinitas. Aquí el término infinito no está siendo tomado con el rigor semántico
de la palabra; por ejemplo, los peces dentro de un estanque son un conjunto
finito; sin embargo, en términos estadísticos, puede ser considerado como
infinito.

Muestra es un subconjunto de la población a la cual se le efectúa la medición


con el fin de estudiar las propiedades del conjunto del cual es obtenida.

En la práctica, estudiar todos y cada uno de los elementos que conforman la


población no es aconsejable, ya sea por la poca disponibilidad de recursos, por
la homogeneidad de sus elementos, porque a veces es necesario destruir lo
que se está midiendo, por ser demasiado grande el número de sus
componentes o no se pueden controlar; por eso se recurre al análisis de los
elementos de una muestra con el fin de hacer inferencias respecto al total de la
población. Existen diversos métodos para calcular el tamaño de la muestra y
13
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

también para tomar los elementos que la conforman, pero no es el objetivo de


este curso estudiarlos. Diremos solamente que la muestra debe ser
representativa de la población y sus elementos escogidos al azar para
asegurar la objetividad de la investigación.

La Recolección: Una de las etapas más importantes de la investigación es la


recolección de la información, la cual ha de partir, a menos que se tenga
experiencia con muestras análogas, de una o varias muestras piloto en las
cuales se pondrán a prueba los cuestionarios y se obtendrá una aproximación
de la variabilidad de la población, con el fin de calcular el tamaño exacto de la
muestra que conduzca a una estimación de los parámetros con la precisión
establecida.

El establecimiento de las fuentes y cauces de información, así como la


cantidad y complejidad de las preguntas, de acuerdo con los objetivos de la
investigación son decisiones que se han de tomar teniendo en cuenta la
disponibilidad de los recursos financieros, humanos y de tiempo y las
limitaciones que se tengan en la zona geográfica, el grado de desarrollo, la
ausencia de técnica, etc.

Es, entonces, descubrir dónde está la información y cómo y a qué "costo" se


puede conseguir; es determinar si la encuesta se debe aplicar por teléfono, por
correo, o si se necesitan agentes directos que recojan la información;
establecer su número óptimo y preparar su entrenamiento adecuado.

Critica, Clasificación y Ordenación: Después de haber reunido toda la


información pertinente, se necesita la depuración de los datos recogidos. Para
hacer la crítica de una información, es fundamental el conocimiento de la
población por parte de quien depura para poder detectar falsedades en las
respuestas, incomprensión a las preguntas, respuestas al margen, amén de
todas las posibles causas de nulidad de una pregunta o nulidad de todo un
cuestionario.

Separado el material de "desecho" con la información depurada se procede a


establecer las clasificaciones respectivas y con la ayuda de hojas de trabajo,
en las que se establecen los cruces necesarios entre las preguntas, se ordenan
las respuestas y se preparan los modelos de tabulación de las diferentes
variables que intervienen en la investigación.

El avance tecnológico y la popularización de los computadores hacen que

14
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

estas tareas, manualmente dispendiosas, puedan ser realizadas en corto


tiempo.

La Tabulación: Una tabla es un resumen de información respecto a una o


más variables, que ofrece claridad al lector sobre lo que se pretende describir;
para su fácil interpretación una tabla debe tener por lo menos: Un titulo
adecuado el cual debe ser claro y conciso. La Tabla propiamente dicha con los
correspondientes subtítulos internos y la cuantificación de los diferentes ítems
de las variables, y las notas de pie de cuadro que hagan claridad sobre
situaciones especiales de la tabla, u otorguen los créditos a la fuente de la
información.

La Presentación: Una información estadística adquiere más claridad cuando


se presenta en la forma adecuada. Los cuadros, tablas y gráficos facilitan el
análisis, pero se debe tener cuidado con las variables que se van a presentar y
la forma de hacerlo. No es aconsejable saturar un informe con tablas y gráficos
redundantes que, antes que claridad, crean confusión. Además la elección de
determinada tabla o gráfico para mostrar los resultados, debe hacerse no sólo
en función de las variables que relaciona, sino del lector a quien va dirigido el
informe.

El Análisis: La técnica estadística ofrece métodos y procedimientos objetivos


que convierten las especulaciones de primera mano en aseveraciones cuya
confiabilidad puede ser evaluada y ofrecer una premisa medible en la toma de
una decisión.

Es el análisis donde se cristaliza la investigación. Esta es la fase de la


determinación de los parámetros y estadísticos muestrales para las
estimaciones e inferencias respecto a la población, el ajuste de modelos y las
pruebas de las hipótesis planteadas, con el fin de establecer y redactar las
conclusiones definitivas.

Publicación: Toda conclusión es digna de ser comunicada a un auditorio. Es


más, hay otros estudiosos del mismo problema a quienes se les puede aportar
información, conocimientos y otros puntos de vista acerca de él.

De acuerdo a Bertrand Russel el método científico es el camino que se


sigue para realizar una investigación y se resume en tres pasos:

15
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

 Exacta observación del fenómeno que se estudia.


 Formulación de una hipótesis, mediante la cual puedan explicarse los
hechos observados.
 Verificación de la hipótesis mediante nuevas observaciones.

La Estadística cumple diferentes papeles en cada uno de los tres pasos del
método científico, es un auxiliar irremplazable.

 La Estadística interviene en el primer paso ayudando a que las


observaciones sean fidedignas y exactas.
 En la formulación de las hipótesis al resumir los resultados de las
observaciones, facilita el razonamiento que conduce a la formación de
hipótesis.
 En la verificación de hipótesis, al resumir los resultados de las nuevas
observaciones, y facilitar su análisis.

Población de Muestra al Observaciones


tamaño “N” azar de Cuantificables
tamaño “n”

Prueba de Formulación de
Conclusiones Hipótesis Hipótesis
(Inferencia) (Métodos acerca de la
Estadísticos) Población

El método estadístico debe ser aplicado en el proceso enseñanza-aprendizaje


con el fin de optimizar el proceso y sus resultados.

Las distintas etapas del método estadístico se aplican en el proceso:

 Planificación en esta etapa se determina los objetivos a desarrollar las


metas a alcanzar, se determinan los recursos necesarios.
 Recolección de la información y elaboración de los datos se
corresponde con el desarrollo del proceso de enseñanza en sí.
16
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

 Análisis e interpretación comprenderían la evaluación del proceso


mediante la cuantificación de los resultados, el cumplimiento de las
metas.

¿Para qué sirve la Estadística?: La Estadística puede dar respuesta a


muchas de las necesidades que la sociedad actual nos plantea. Su tarea
fundamental es la reducción de datos, con el objetivo de representar la realidad
y transformarla, predecir su futuro o simplemente conocerla. En cualquier
proceso de investigación, la Estadística permite mejorar la calidad de la
información, disminuir los de la recolección y procesamiento, realizar el análisis
técnico apropiado, cuantificar el riesgo o error que se comete en estudios por
muestreo, impedir la manipulación o distorsión de la información.

La Estadística responde a las necesidades bélicas y fiscales de los


gobernantes. Esto se puede conseguir con un conocimiento claro de la
población con la que se cuenta. La herramienta para conseguirlo es el Censo
de Población y su hermano pequeño, el PADRÓN MUNICIPAL DE
HABITANTES.

La práctica del recuento de la población y de algunas características de esta


por los Estados es muy antigua (se remonta a 3000 años antes de Cristo en
Egipto y Mesopotámica). En palabras de Bielfed, la Estadística es la ciencia
que nos enseña el ordenamiento político de todos los estados del mundo
conocido, es decir, está al servicio del Estado, de hecho, la palabra
Estadística deriva de Estado.

La Estadística responde a la actividad planificadora de la sociedad. Con la


Revolución Industrial aparecen nuevos problemas, sobre todo de
desigualdades sociales. La Estadística es un instrumento para identificar estas
injusticias y para producir información en el llamado Estado del Bienestar.

La Estadística responde a nuevas demandas sociales. Para realizar


investigaciones exhaustivas sobre temas sociales surgen tres problemas
básicos a la hora del trabajo de campo, como el tiempo que tardaríamos en
entrevistar a toda la población y el costo económico y de personal de estas
entrevistas. Con las técnicas de Muestreo se consigue hacer buenas
investigaciones sobre una pequeña parte de esa población, obteniendo
resultados válidos para toda ella.

La Estadística responde a las necesidades del desarrollo científico y


tecnológico de la sociedad. Tras la Revolución Industrial se produce un

17
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

desarrollo de la sociedad en todos sus ámbitos y, en particular, en el Científico


y Tecnológico. Las Comunicaciones, la Industria, la Agricultura, la Salud... se
desarrollan rápidamente y se exige el máximo rendimiento y la mejor utilización
de estos sectores.

Las técnicas de Investigación de Mercados permiten saber si un producto


cualquiera será bien acogido en el mercado antes de su salida a este, o bien
medir la audiencia en Televisión y Radio.

El Control de Calidad permite medir las características de la calidad de un


producto, compararlas con ciertos requisitos y tomar decisiones correctivas si
hay diferencias entre el funcionamiento real y el esperado. Con estudios
estadísticos aplicados a la Agricultura y a la Pesca podemos estimar los
rendimientos obtenidos en una cosecha, o encontrar bancos de peces...

En Medicina e Investigación farmacológica es imprescindible la Estadística,


probando nuevos tratamientos en grupos de pacientes o bien, obteniendo
conclusiones sobre ciertas enfermedades observando durante un tiempo un
grupo de pacientes (saber si para el tratamiento de cierto tipo de cáncer es
más efectiva la cirugía, la radioterapia o la quimioterapia, sin más que observar
un grupo de pacientes tratados con estas técnicas).

La Sociología hace uso de la Estadística para conocer el estatus social, el


rol, el nivel de analfabetismo, los efectos de la propaganda en la masa, a
cerca de los movimientos religiosos, la opinión de una doctrina política.

La Demografía hace uso de la Estadística en la determinación de la estructura


de un país, la cuantificación de los movimientos migratorios, el registro de los
hechos vitales de natalidad, mortalidad.

La Psicología por su parte la utiliza para determinar el coeficiente de


inteligencia, en la construcción y validación de escalas y otras herramientas de
medición.

Con el estudio de los Procesos Estocásticos se puede tener una mejor


comprensión de fenómenos de comportamiento aleatorio como meteorología,
física nuclear, campañas de seguridad.

Gracias al aporte de la estadística en la educación se ha podido corregir


muchas fallas que presentaban los programas educativos, así como los

18
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

instrumentos de evaluación. La constante revisión de los métodos didácticos


ha sido posible por la aplicación de técnicas de muestreo.

Hoy en día es fundamental que un docente tenga conocimientos de estadística


descriptiva, porque esta constituye una herramienta básica para la
obtención de información acerca de sus alumnos, de su actividad como
docente y el logro de las metas propuestas lo que le permite establecer
proyecciones a corto y largo plazo.

El Censo de Población: La principal fuente de información demográfica es el


Censo de población. Su utilidad más directa es elaborar tablas y cuadros
estadísticos, tasas y números índices en relación con las variables que se
preguntan en el cuestionario del censo.

La información que se obtiene de un censo de población permite tomar


decisiones en relación con los siguientes aspectos, entre otros:

 Equipamientos sociales
 Política educativa
 Política sanitaria
 Planificación económica
 Administración y gestión estatal o provincial
 Conocer los movimientos migratorios
 Política de vivienda

Con los datos relativos al censo se elaboran tasas entre las que destacan la de
escolaridad, analfabetismo, actividad económica, paro...

Una tasa es el cociente entre el número de individuos que cumplen un


determinado requisito dentro de un intervalo de edad y el número total de
individuos de ese intervalo.

La Encuesta: El principal objetivo de la Estadística es dar información


sintetizada. Para ello tiene muchas técnicas, y todas ellas se basan en una
herramienta básica, que es la Encuesta.

Una encuesta es un método para obtener información. Se puede actuar de dos


formas, examinando todas las unidades de la población, lo que sería un censo,
o por la obtención de una muestra, es decir, una parte de esta población,

19
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

examinar estas unidades y suponer que los valores obtenidos valen para toda
la población.

Estas encuestas, bien realizadas y con un propósito a gran nivel, pueden ser
muy importantes para la economía de un país, ya que revelan información
válida sobre sus ciudadanos.

Estadística y Computación: Si leemos un periódico dominical o una revista


tendremos ante nosotros más información que toda la que era capaz de
obtener un ciudadano normal del siglo XVII en toda su vida. En concreto, en los
últimos diez años se ha generado más información que en todos los años
anteriores.

La sociedad tiene la necesidad de conocer toda esta información, y de acceder


a ella de la forma más resumida posible. La Estadística es capaz de condensar
la información de todos los hogares españoles en la Encuesta de Presupuestos
Familiares obteniendo, por ejemplo, todos los pagos realizados al día durante
la semana de observación. Sin duda alguna, la cantidad de datos que esto
genera es impresionante.

Con el avance de la Informática y la vinculación de esta a la Estadística se ha


conseguido manejar e manera rápida, fiable y relativamente sencilla estos
volúmenes de información, y obtener conclusiones que después el profesional
interpreta.

Algunos de los paquetes estadísticos más importantes y utilizados son:

 GENSTAT: Planificación, visualización, gestión de datos, análisis


estadístico, gráficos y presentación de resultados.
 ARIMA: Diseño de Experimentos
 SAS: Planificación, visualización, gestión de datos, análisis estadístico,
gráficos y presentación de resultados. Usa un avanzado lenguaje de
programación.
 SPSS: Gestión de datos, análisis estadístico, gráficos y presentación de
resultados. Puede calcular el tamaño muestral de una investigación.
 STATISTICA: Planificación, visualización, gestión de datos, análisis
estadístico, gráficos y presentación de resultados. Alto rendimiento,
aplicaciones flexibles.
 STATGRAPHICS: Paquete de análisis interactivo y sistema gráfico
desarrollado en APL, esencial en la enseñanza.

20
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Tema 02.
Técnicas De Muestreo

Conceptos clave: población, muestra, muestreo probabilistico, no


probabilistico, muestreo aleatorio simple, muestreo sistemático, muestreo
estratificado.

Contenidos

Introducción
Definición y Conceptos Previos
Razones Que Justifican El Muestreo
Errores Del Muestreo
¿Mienten Las Estadísticas?
Métodos Para La Obtención De La Muestra
Muestreo Probabilísticos
 Muestreo Aleatorio Simple (mas)
 Muestreo Sistemático (ms)
 Muestreo Estratificado (me)
 Muestreo Por Conglomerados (mpc)
Muestreo No Probabilísticos
 Muestreo Por Cuotas
 Muestreo Opinático o Intencional
 Muestreo Casual o Incidental
 Bola De Nieve
Calculo Del Tamaño de la Muestra
Tamaño De Muestra Para Estimar La Media De La Población
Tamaño De Muestra Para Estimar La Proporción De La Población
Trabajo Práctico En El Salón De Clases
Trabajo De Campo.

21
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Introducción: Para iniciarse en el campo del muestreo, dos conceptos son


básicos: Población y Muestra. El primero se refiere a un conjunto finito o
infinito de elementos o seres, definidos de acuerdo al objetivo del estudio. La
misma debe definirse sin que haya lugar a ambigüedad alguna en cuanto a los
elementos que se observan (unidades), la característica en estudio
(contenido), su extensión geográfica y el tiempo.

Por el segundo, se entiende como un subconjunto de la población obtenido


con el propósito de estudiar algunas características o propiedades del
conjunto total.

El procedimiento utilizado para la obtención de la muestra, recibe el nombre


de Método de Muestreo o simplemente Muestreo y nos provee igualmente de
métodos para la Estimación de resultados que se obtendrían si un estudio
(encuesta) similar fuese realizado a toda la Población.

Las técnicas estadísticas para ser utilizados necesitan datos, cuya adquisición
es un trabajo difícil. La teoría de muestras o muestreo tiene por objeto
suministrar una metodología que guíe los problemas de recogida de datos, es
decir, cómo tengo que recoger esos datos.

El diseño de muestras tiene dos procesos fundamentales en esta recogida:

Proceso de selección: Reglas y operaciones mediante las cuales


se incluyen algunas unidades de la muestra.

Proceso de estimación: A partir de los datos seleccionados se


estiman ciertos valores desconocidos de la muestra.

El uso de una encuesta por muestreo tiene una serie de ventajas, como que su
coste es mucho menor, es más rápida de realizar y los datos se obtienen con
mayor exactitud debido al poco volumen de encuestados.

Definición y Conceptos Previos: En la investigación científica es habitual que se


empleen muestras como medio de acercarse al conocimiento de la realidad. Sin
embargo, para que esto sea posible , para que a través de las muestras sea posible
reproducir el universo con la precisión que se requiera en cada caso es necesario que
el diseño muestral se atenga a los principios recogidos en las técnicas de muestreo.

22
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Antes de pasar describir algunos de los métodos de muestreo más habituales


introduzcamos algunos conceptos importantes en este contexto:

Población: Es todo conjunto de elementos, finito o infinito, definido por una o


más características, de las que gozan todos los elementos que lo componen, y
sólo ellos. En muestreo se entiende por población a la totalidad del universo
que interesa considerar , y que es necesario que esté bien definido para que se
sepa en todo momento que elementos lo componen.

No obstante, cuando se realiza un trabajo puntual, conviene distinguir entre


población teórica: conjunto de elementos a los cuales se quiere extrapolar los
resultados, y población estudiada : conjunto de elementos accesibles en
nuestro estudio.

Censo: En ocasiones resulta posible estudiar cada uno de los elementos que
componen la población, realizándose lo que se denomina un censo, es decir, el
estudio de todos los elementos que componen la población.

La realización de un censo no siempre es posible, por diferentes motivos: a)


economía: el estudio de todos los elementos que componen una población,
sobre todo si esta es grande, suele ser un problema costoso en tiempo, dinero,
etc; b) que las pruebas a las que hay que someter a los sujetos sean
destructivas; c) que la población sea infinita o tan grande que exceda las
posibilidades del investigador.

Si la numeración de elementos, se realiza sobre la población accesible o


estudiada, y no sobre la población teórica, entonces el proceso recibe el
nombre de marco o espacio muestral.

Muestra: En todas las ocasiones en que no es posible o conveniente realizar


un censo, lo que hacemos es trabajar con una muestra, entendiendo por tal
una parte representativa de la población. Para que una muestra sea
representativa, y por lo tanto útil, debe de reflejar las similitudes y diferencias
encontradas en la población, ejemplificar las características de la misma.
Cuando decimos que una muestra es representativa indicamos que reúne
aproximadamente las características de la población que son importantes para
la investigación.

Por Ejemplo, supongamos que deseamos medir el rendimiento académico de


los(as) niños(as) escolarizados(as) en Mérida en la segunda etapa de EB, pero

23
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

por problemas económicos solo es posible acceder a los(as) niños(as) de


zonas urbanas.

- ¿A quién deseo generalizar los resultados? :

Todos los(as) niños(as) merideños(as) de la segunda etapa (población


teórica).

¿A quien puedo acceder en el estudio? :

Todos los(as) niños(as) escolarizados(as) en zonas urbanas (población


estudiada).

-¿Como puedo acceder a ellos? :

Numerando los sujetos accesibles (espacio o marco muestral).

-¿Quién forma parte del estudio? :

Eligiendo un grupo de los sujetos enumerados (muestra).

1 Razones Que Justifican El Muestreo

Se justifica un estudio por muestreo cuando:

La población sea tan grande que el estudio completo (censo) exceda las
posibilidades del investigador. Estudiar la totalidad de los pacientes o personas
con una característica determinada en muchas ocasiones puede ser una tarea
inaccesible o imposible de realizar.

La población sea suficientemente uniforme, en cuyo caso carece de


sentido examinar la población completa.

Cuando el proceso de medida o investigación conduzca a la destrucción del


elemento.

Aparte de las razones anteriores, existen otras de carácter técnico, operativo


y administrativo que justifican el uso del muestreo.

24
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Calidad: La mayor exactitud, es posible debido a que se cuida más la


precisión de cada medición por el mejor entrenamiento y formación del
personal, así como por el uso de instrumentos más adecuados y la realización
de una supervisión cuidadosa en el trabajo de campo. Igualmente es más
confiable el procesamiento de los resultados. Al disponer de más tiempo y
recursos, las observaciones y mediciones realizadas a un reducido número de
individuos pueden ser más exactas y plurales que si las tuviésemos que
realizar a una población.

La selección de muestras específicas nos permitirá reducir la heterogeneidad


de una población al indicar los criterios de inclusión y/o exclusión.

Ahorrar tiempo. Estudiar a menos individuos es evidente que lleva menos


tiempo.

Razones de tipo económico: Si los datos se obtienen únicamente de una


pequeña fracción del total, los gastos son menores que los que se realizarían
si se llevara a cabo un censo. En poblaciones muy grandes se pueden
obtener resultados lo suficientemente exactos cuando se analizan muestras
que representan sólo una pequeña fracción de la población

Mayor rapidez: Por la misma razón, los datos pueden ser recolectados y
resumidos más rápidamente con una muestra que con la población. Esta es
una consideración vital cuando se necesita con urgencia la información.

Errores Del Muestreo: Existen tres formas de cometer el error en el muestreo:

 El observador o Encuestador.
 El Método de Muestreo.
 El Objeto o Individuo a muestrear.

¿Mienten Las Estadísticas? Cuando través de una muestra pretendemos


obtener información de una población entera los datos obtenidos pueden ser
diferentes a los reales. Son valores aproximados del parámetro desconocido. A
estos valores se les llama Estimaciones.

Al dar una estimación estoy cometiendo un error llamado error de muestreo


debido a que no estoy considerando a toda la población, sino a una parte de
ella. Existen procedimientos que pueden determinar de antemano el error que
puedo cometer.

25
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Aparte de estos, existen otros errores que se presentan tanto en encuestas por
muestreo como en las encuestas por censo. Este tipo de errores son mayores
y de difícil corrección. Son errores ajenos al muestreo. Se dividen en:

Errores de observación: Debidos a la recogida, registro o procesamiento


incorrecto de los datos. Pueden ser de sobrecobertura, cuando el listado de
entrevistados contiene unidades que no pertenecen a la muestra investigada,
de medida, que son la diferencia entre el valor observado y el verdadero, y
errores de procesamiento, debidos a los errores de entrada de datos, edición,
tabulación y análisis.

Errores no de observación: No es posible obtener la información deseada


para ciertos individuos de la población. Estos son errores de cobertura,
cuando hay una parte de la población que no está en el listado, errores de falta
de respuesta por parte del entrevistado.

Este tipo de errores hay que tratar de resolverlos. Para mejorar el resultado de
la encuesta la población puede dividirse en subpoblaciones para trabajar sobre
ellas.

Otra manera de disminuir el error es escoger una muestra mayor y llegar a un


término medio entre el error máximo admisible para la encuesta y el tamaño
muestral.

Pero el principal problema de las encuestas es la falta de respuesta por parte


del entrevistado. Suelen ser personas que se consideran acosadas para que
proporcionen información de su entorno social y de sus actividades. Esto
produce un rechazo a responder cuestiones sobre las que en la mayoría de los
casos se desconoce su utilidad.

Para solventar estos problemas debe contarse con la formación de los


entrevistadores, conociendo estos perfectamente el tema que están tratando y
estar preparados para responder cualquier cuestión sobre el tema que puede
plantear el entrevistado.

La formulación de las preguntas debe ser clara, poco influenciables y cómodas


para los entrevistados. En temas polémicos como el consumo de drogas o las
afinidades políticas, el entrevistado suele ser reacio a contestar. De manera
sugestiva hay que formular ese tipo de preguntas para que el entrevistado no
se vea comprometido ni violento con su contenido.

26
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Por último, decir que hay otros tipos de falta de respuesta en una encuesta
debidos a situaciones como:

 Ausencia temporal del individuo seleccionado para entrevistar (los no


en casa).
 Negativa absoluta a colaborar (los hueso duro)
 Falta de conocimientos del entrevistado o incapacidad del
entrevistador para explicar el contenido de la respuesta.
 Pérdida involuntaria de la información.
 No cubrimiento debido a condiciones ambientales, escasa facilidad de
transporte...

Métodos Para La Obtención De La Muestra: Los autores proponen diferentes


criterios de clasificación de los diferentes tipos de muestreo, aunque en general
pueden dividirse en dos grandes grupos: métodos de muestreo probabilísticos
y métodos de muestreo no probabilísticos.

Métodos De Muestreo Probabilísticos: Los métodos de muestreo


probabilísticos son aquellos que se basan en el principio de equiprobabilidad.
Es decir, aquellos en los que todos los individuos tienen la misma probabilidad
de ser elegidos para formar parte de una muestra y, consiguientemente, todas
las posibles muestras de tamaño n tienen la misma probabilidad de ser
elegidas. Sólo estos métodos de muestreo probabilísticos nos aseguran la
representatividad de la muestra extraída y son, por tanto, los más
recomendables. Dentro de los métodos de muestreo probabilísticos
encontramos los siguientes tipos:

Existen dos tipos de métodos de muestreo: los Probabilísticos y los no


Probabilísticos. En este curso solo estudiaremos los tipos Probabilísticos,
siendo los mas utilizados:

 Muestreo Aleatorio Simple.


 Muestreo Sistemático.
 Muestreo Estratificado.
 Muestreo por Conglomerados.

Muestreo Aleatorio Simple (mas): Este es el más sencillo de los métodos de


muestreo probabilistico, se le considera el diseño básico y su conocimiento
nos ayuda a la comprensión de otros métodos más complejos. El m.a.s. de
poblaciones finitas consiste en la selección de "n" elementos sacados de la
27
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

población con "N" unidades, fácilmente identificables y homogéneas, de modo


que todas las muestras posibles de tamaño n tengan la misma posibilidad de
ser seleccionadas.

En la práctica, un muestreo aleatorio simple se realiza unidad por unidad.


Se enumeran las unidades de 1 a N. Posteriormente se extrae una serie de n
números aleatorios (al azar) entre 1 y N, utilizando una tabla de números
aleatorios. En cada extracción, el proceso debe tener la misma oportunidad de
selección a todos y cada uno de los números que no hayan salido. Las
unidades que llevan estos "n" números constituyen la muestra.

La selección de los elementos que formaran la muestra, puede hacerse de dos


maneras:

 Con reposición, en donde una unidad puede pertenecer a la muestra


varias veces.
 Sin reposición, cuando una unidad sólo puede observarse en la
muestra en una oportunidad, también se le conoce como Muestreo
Irrestrictamente Aleatorio.

Muestreo Sistemático (ms): Anteriormente consideramos un método de


muestreo en el cual las unidades sucesivas se seleccionaban por
mecanismos aleatorios. A continuación sé describir un método de muestreo
en el cual solo la primera unidad se selecciona aleatoriamente y el resto es
seleccionado automáticamente de acuerdo a un patrón determinado y el cual
es utilizado cuando:

 Se tiene un listado completo de la población.


 Cuando hay dudas de la homogeneidad de la población.
 Cuando se puede ordenar la población.

Sea K = N/n, tomemos una unidad al azar entre las k primeras y luego las
subsecuentes a intervalos de K, es decir, si K= 10 y se escoge al azar un
número entre 1 y 10, por ejemplo 4, la muestra quedaría formada por las
unidades que ocupen las posiciones 4, 14, 24,..... (tantas como lo indique el
tamaño de la muestra "n").

Si al determinar n, K no resulta ser un número entero (lo cual ocurrir con


mucha frecuencia), se le redondea al entero más próximo.

28
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Muestreo Estratificado (me): Consiste en obtener una muestra separando


los elementos de la población en grupos distintos, llamados Estratos, y
posteriormente seleccionando una muestra, utilizando cualquiera de los
métodos anteriores.

Consiste en considerar categorías típicas diferentes entre sí (estratos) que


poseen gran homogeneidad respecto a alguna característica (se puede
estratificar, por ejemplo, según la profesión, el municipio de residencia, el sexo,
el estado civil, etc). Lo que se pretende con este tipo de muestreo es
asegurarse de que todos los estratos de interés estarán representados
adecuadamente en la muestra. Cada estrato funciona independientemente,
pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el
estratificado para elegir los elementos concretos que formarán parte de la
muestra. En ocasiones las dificultades que plantean son demasiado grandes,
pues exige un conocimiento detallado de la población. (tamaño geográfico,
sexos, edades,...).

En general, la estratificación consiste en la división de la población en "L"


grupos o clases (Estratos), de modo que los elementos más parecidos, con
respecto a la característica en estudio, estén dentro de un mismo grupo, es
decir, los estratos deben ser internamente homogéneos y heterogéneos entre
sí. Además, la unión de los grupos constituye la totalidad de la población, es
decir N1+ N2 +....+ NL = N, en donde los valores de los NL deben ser conocidos.

Si se toma una muestra aleatoria simple en cada estrato, el procedimiento total


se describe como un muestreo aleatorio estratificado y si se toma una
muestra sistemática en cada estrato, el procedimiento se denominará muestreo
sistemático estratificado.

Una vez determinados los estratos, se proceden a extraer una muestra de


cada uno, las extracciones deben hacerse independientemente en los
diferentes estratos. Los tamaños de la muestra de los estratos se denominan
n1, n2,....,ni, respectivamente. La distribución de la muestra en función de los
diferentes estratos se denomina afijación, y puede ser de diferentes tipos:

Afijación Simple: A cada estrato le corresponde igual número de elementos


muestrales.

Muestras de igual tamaño:


29
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

ni = n/L

Afijación Proporcional: La distribución se hace de acuerdo con el peso


(tamaño) de la población en cada estrato.

Muestras de tamaño proporcional:

NL
ni = --- n
N

Afijación Optima: Se tiene en cuenta la previsible dispersión de los resultados,


de modo que se considera la proporción y la desviación típica. Tiene poca
aplicación ya que no se suele conocer la desviación.

Ejemplo: Supongamos que estamos interesados en estudiar el grado de


aceptación que la implantación de la reforma educativa ha tenido entre los
padres de una determinada ciudad. A tal efecto seleccionamos una muestra
de 600 sujetos. Conocemos por los datos del ministerio que de los 10000
niños(as) escolarizados en las edades que nos interesan, 6000 acuden a
colegios públicos, 3000 a colegios privados concertados y 1000 a colegios
privados no concertados. Como estamos interesados en que en nuestra
muestra estén representados todos los tipos de colegio, realizamos un
muestreo estratificado empleando como variable de estratificación el tipo de
centro.

Si empleamos una afijación simple elegiríamos 200 niños(as) de cada tipo de


centro, pero en este caso parece más razonable utilizar una afijación
proporcional pues hay bastante diferencia en el tamaño de los estratos. Por
consiguiente, calculamos que proporción supone cada uno de los estratos
respecto de la población para poder reflejarlo en la muestra.

Colegios públicos: 6000/10000 = 0.60

Colegios privados concertados: 3000/10000 = 0.30

Colegios privados no concertados: 1000/10000 = 0.10

30
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Para conocer el tamaño de cada estrato en la muestra no tenemos más que


multiplicar esa proporción por el tamaño muestral.

Colegios públicos: 0.60x600 = 360 sujetos

Muestreo Por Conglomerados (mc): Los métodos presentados hasta ahora


están pensados para seleccionar directamente los elementos de la población,
es decir, que las unidades muestrales son los elementos de la población. En el
muestreo por conglomerados la unidad muestral es un grupo de elementos de
la población que forman una unidad, a la que llamamos conglomerado. Las
unidades hospitalarias, los departamentos universitarios, una caja de
determinado producto, etc, son conglomerados naturales. En otras ocasiones
se pueden utilizar conglomerados no naturales como, por ejemplo, las urnas
electorales. Cuando los conglomerados son área geográficas suele hablarse de
"muestreo por áreas".

El muestreo por conglomerados consiste en seleccionar aleatoriamente un


cierto numero de conglomerados (el necesario para alcanzar el tamaño
muestral establecido) y en investigar después todos los elementos
pertenecientes a los conglomerados elegidos.

Una muestra por conglomerados o grupo es una muestra aleatoria, en la cual


cada elemento de la muestra es una colección o conglomerado de elementos.
Este muestreo es un diseño efectivo para obtener una cantidad de
información al costo mínimo, bajo las siguientes condiciones.

 No se encuentra disponible o es muy costoso obtener la lista de las


unidades de la población, mientras que se puede lograr fácilmente un
proceso para obtener la lista de los grupos.
 El costo por obtener observaciones se incrementa con la distancia
que separa las unidades.

Para seleccionar una muestra por conglomerados hay que:

 Especificar los conglomerados apropiados, los elementos dentro


de un conglomerado están frecuentemente juntos físicamente, por lo
que tienden a presentar características similares (la medición de un
elemento en un grupo puede estar altamente correlacionada con la
de otro elemento).
 Los elementos dentro del grupo son diferentes entre sí.
 Los grupos deben ser heterogéneos entre ellos como sea posible.
31
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

 Se procede a seleccionar los elementos utilizando: el mas ó el ms

Ejemplo: En una investigación en la que se trata de conocer el grado de


satisfacción laboral los profesores de instituto necesitamos una muestra de 700
sujetos. Ante la dificultad de acceder individualmente a estos sujetos se decide
hacer una muestra por conglomerados. Sabiendo que el número de profesores
por instituto es aproximadamente de 35, los pasos a seguir serían los
siguientes:

 Recoger un listado de todos los institutos.


 Asignar un número a cada uno de ellos.
 Elegir por muestreo aleatorio simple o sistemático los 20 institutos
(700/35 = 20) que nos proporcionarán los 700 profesores que
necesitamos.

Para finalizar con esta exposición de los métodos de muestreo probabilísticos


es necesario comentar que ante lo compleja que puede llegar a ser la situación
real de muestreo con la que nos enfrentemos es muy común emplear lo que se
denomina muestreo polietápico. Este tipo de muestreo se caracteriza por
operar en sucesivas etapas, empleando en cada una de ellas el método de
muestreo probabilistico más adecuado.

Métodos De Muestreo No Probabilísticos: A veces, para estudios


exploratorios, el muestreo probabilistico resulta excesivamente costoso y se
acude a métodos no probabilísticos, aun siendo conscientes de que no sirven
para realizar generalizaciones, pues no se tiene certeza de que la muestra
extraída sea representativa, ya que no todos los sujetos de la población tienen
la misma probabilidad de se elegidos. En general se seleccionan a los sujetos
siguiendo determinados criterios procurando que la muestra sea
representativa.

Muestreo Por Cuotas: También denominado en ocasiones "accidental". Se


asienta generalmente sobre la base de un buen conocimiento de los estratos
de la población y/o de los individuos más "representativos" o "adecuados" para
los fines de la investigación. Mantiene, por tanto, semejanzas con el muestreo
aleatorio estratificado, pero no tiene el carácter de aleatoriedad de aquél.

En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de


individuos que reúnen unas determinadas condiciones, por ejemplo: 20
individuos de 25 a 40 años, de sexo femenino y residentes en Gijón. Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan
32
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

esas características. Este método se utiliza mucho en las encuestas de


opinión.

Ejemplo, El Ministerio de Salud y Desarrollo Social desea estudiar la incidencia


de las drogas en la adolescencia. Lo que deberíamos hacer sería: conocer por
los informes del Ministerio de Educación y Deportes, cuales son los centros
más afectados por el problema, fijar un número de sujetos a entrevistar
proporcional a cada uno de los estratos (cuotas) y finalmente dejar en manos
de los responsables del trabajo de campo a que sujetos concretos se deberá
entrevistar

Muestreo Opinático o Intencional: Este tipo de muestreo se caracteriza por


un esfuerzo deliberado de obtener muestras "representativas" mediante la
inclusión en la muestra de grupos supuestamente típicos. Es muy frecuente su
utilización en sondeos preelectorales de zonas que en anteriores votaciones
han marcado tendencias de voto.

Muestreo Casual o Incidental: Se trata de un proceso en el que el


investigador selecciona directa e intencionadamente los individuos de la
población. El caso más frecuente de este procedimiento el utilizar como
muestra los individuos a los que se tiene fácil acceso (los profesores de
universidad emplean con mucha frecuencia a sus propios alumnos). Un caso
particular es el de los voluntarios.

Bola De Nieve: Se localiza a algunos individuos, los cuales conducen a otros,


y estos a otros, y así hasta conseguir una muestra suficiente. Este tipo se
emplea muy frecuentemente cuando se hacen estudios con poblaciones
"marginales", delincuentes, sectas, determinados tipos de enfermos, etc.

Cálculo Del Tamaño De La Muestra: A la hora de determinar el tamaño que


debe alcanzar una muestra hay que tomar en cuenta varios factores: el tipo de
muestreo, el parámetro a estimar, el error muestral admisible, la varianza
poblacional y el nivel de confianza. Por ello antes de presentar algunos casos
sencillos de cálculo del tamaño muestral delimitemos estos factores.

Parámetro. Son las medidas o datos que se obtienen sobre la población.

Estadístico. Los datos o medidas que se obtienen sobre una muestra y por lo
tanto una estimación de los parámetros.

33
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Error Muestral, De Estimación o Standard. Es la diferencia entre un


estadístico y su parámetro correspondiente. Es una medida de la variabilidad
de las estimaciones de muestras repetidas en torno al valor de la población,
nos da una noción clara de hasta dónde y con qué probabilidad una estimación
basada en una muestra se aleja del valor que se hubiera obtenido por medio
de un censo completo. Siempre se comete un error, pero la naturaleza de la
investigación nos indicará hasta qué medida podemos cometerlo (los
resultados se someten a error muestral e intervalos de confianza que varían
muestra a muestra). Varía según se calcule al principio o al final. Un estadístico
será más preciso en cuanto y tanto su error es más pequeño. Podríamos decir
que es la desviación de la distribución muestral de un estadístico y su
fiabilidad.

Nivel De Confianza. Probabilidad de que la estimación efectuada se ajuste a


la realidad. Cualquier información que queremos recoger está distribuida según
una ley de probabilidad (Gauss o Student), así llamamos nivel de confianza a la
probabilidad de que el intervalo construido en torno a un estadístico capte el
verdadero valor del parámetro.

Varianza Poblacional. Cuando una población es más homogénea la varianza


es menor y el número de entrevistas necesarias para construir un modelo
reducido del universo, o de la población, será más pequeño. Generalmente es
un valor desconocido y hay que estimarlo a partir de datos de estudios previos.

Tamaño De Muestra Para Estimar La Media De La Población: Veamos los


pasos necesarios para determinar el tamaño de una muestra empleando el
muestreo aleatorio simple. Para ello es necesario partir de dos supuestos: en
primer lugar el nivel de confianza al que queremos trabajar; en segundo lugar,
cual es el error máximo que estamos dispuestos a admitir en nuestra
estimación. Así pues los pasos a seguir son:

1.- Obtener el tamaño muestral imaginando que :

donde:

34
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

: z correspondiente al nivel de confianza elegido

: varianza poblacional

e: error máximo

2.- Comprobar si se cumple

Si esta condición se cumple el proceso termina aquí, y ese es el tamaño


adecuado que debemos muestrear. Si no se cumple, pasamos a una tercera
fase:

3.- Obtener el tamaño de la muestra según la siguiente fórmula:

Ejemplo: El Ministerio de Trabajo planea un estudio con el interés de conocer


el promedio de horas semanales trabajadas por las mujeres del servicio
doméstico. La muestra será extraída de una población de 10000 mujeres que
figuran en los registros de la Seguridad Social y de las cuales se conoce a
través de un estudio piloto que su varianza es de 9.648. Trabajando con un
nivel de confianza de 0.95 y estando dispuestos a admitir un error máximo de
0,1, ¿cuál debe ser el tamaño muestral que empleemos?.

Buscamos en las tablas de la curva normal el valor de que corresponde

con el nivel de confianza elegido: = ±1.96 y seguimos los pasos


propuestos arriba.

35
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Comprobamos que no se cumple , pues en este caso

10000 < 3706 (3706 - 1); 10000 < 13730730

Tamaño De Muestra Para Estimar La Proporción De La Población: Para


calcular el tamaño de muestra para la estimación de proporciones
poblacionales hemos de tener en cuenta los mismos factores que en el caso de
la media. La fórmula que nos permitirá determinar el tamaño muestral es la
siguiente:

donde

: z correspondiente al nivel de confianza elegido


P: proporción de una categoría de la variable
e: error máximo
N: tamaño de la población

Ejemplo: Siguiendo con el estudio planteado en el punto anterior, supongamos


que tratamos de estimar la proporción de mujeres que trabajan diariamente 10
horas o más. De un estudio piloto se dedujo que P = 0.30, fijamos el nivel de
confianza en 0.95 y el error máximo 0.02.

36
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Trabajo Practico: Este ejercicio se ha diseñado con el objeto de familiarizar a


los cursantes con algunos de los métodos usados con más frecuencia para
obtener una muestra (métodos de "muestreo", para emplear un término
aceptado corrientemente).

Se pide que Ud. se imaginé que ha sido comisionado para investigar la


frecuencia de determinado atributo (por ej.: parasitismo intestinal) y determinar
el valor medio de la hemoglobinemía en los niños que asisten a las escuelas
de una Ciudad de Venezuela.

Al llegar a la ciudad, Ud. se informa que existen cinco escuelas con un total
de 500 alumnos, distribuidos así;

Escuela A: 100 alumnos


Escuela B: 60 alumnos
Escuela C: 80 alumnos
Escuela D: 120 alumnos
Escuela E: 140 alumnos

En las paginas siguiente aparece una Lista Muestra, con el número correlativo
de identidad por orden alfabético en cada Escuela, Sexo, parasitismo
(negativo o positivo) y valor de la Hemoglobinemía (contenido de glóbulos
rojos en la sangre) en la población.

Podría proceder de varias maneras, entre otras:

1. Ir a una de las Escuelas, ejemplo la A, y examinar el número de niños


que Ud. estableció como muestra.

 Qué objeciones tendría esta manera de proceder?

2. Realizar un muestreo aleatorio simple irrestricto (mas):

37
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Utilizando cualquiera de los sistemas conocidos, En este ejercicio se usará


el de la Tabla de números aleatorios.

Ud. deberá proceder de la siguiente manera:

 Anote el número de identidad de cada individuo que vaya "saliendo"


en el muestreo, junto con su atributo de parasitismo (positivo o
negativo) y el valor de su hemoglobinemía

 Calcule la frecuencia porcentual de parasitismo y la media de la


hemoglobinemía en esa muestra (50 ALUMNOS), así como la
mediana, moda, varianza, desviación estándar y genera la o las
gráficas necesarias.

3. Realizar un muestreo sistemático de toda la población.

Como el tamaño de la muestra es 50, esto significa que ella es la décima


parte de la población. Por tanto, se requería tomar de cada diez escolares, el
que vaya apareciendo en un orden sistemático, consecutivo. Se procederá de
la siguiente manera:

 Elegir al azar el individuo de comienzo (del nº 001 al 010).


 Tomar entonces cada décimo individuo a partir del seleccionado
como inicial.
 Anotar la identificación y características de cada individuo incluido
en la muestra.
 Calcular la frecuencia porcentual del parasitismo y la media de
hemoglobinemía en la muestra, así como la mediana, moda, varianza,
desviación estándar y genera la o las gráficas necesarias. .

4. Realizar un muestreo estratificado.

Tomando la Escuela como el estrato. Siendo las Escuelas de diverso tamaño,


la muestra deberá reflejar en la población, hasta donde sea posible, el
tamaño relativo de aquéllas.

Proceda de la siguiente manera:

38
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

 Calcule el número de individuos, de cada estrato que deban incluirse


en la muestra de tamaño 50 (Afijación proporcional).

 Identifique mediante cualquier sistema al azar (por ej.: La Tabla


de números aleatorios, muestreo sistemático) los individuos de
cada escuela que deben entrar en la muestra.

 Anote la identificación y características correspondientes a cada


individuo.

 Calcule la frecuencia porcentual del parasitismo y la media de


hemoglobinemía, así como la mediana, moda, varianza, desviación
estándar y genera la o las gráficas necesarias.

39
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Población de 500 escolares distribuidos según escuelas, sexo, Parasitismo


(positivas o negativa) y hemoglobinemia (gramos x 100)

NUM PARAS SEX HEMOGL NUM PARAS SEX HEMOGL NUM PARAS SEX HEMOGL
1 + H 8.30 26 + V 13.00 51 + H 10.00
2 + V 9.20 27 - V 12.00 52 + H 11.20
3 - H 10.40 28 - V 11.00 53 - H 13.00
4 - V 13.00 29 - H 10.00 54 - H 12.40
5 - V 14.10 30 + H 9.00 55 - V 12.50
6 + V 12.20 31 - V 8.00 56 - V 12.60
7 + V 8.90 32 + H 12.90 57 - V 11.00
8 - H 14.00 33 - V 11.90 58 - V 9.00
9 + H 11.30 34 + V 10.90 59 - V 8.60
10 - V 12.90 35 + H 9.90 60 - V 8.70
11 - V 11.70 36 - H 8.90 61 - H 9.30
12 - H 13.00 37 - H 12.80 62 - H 10.90
13 - H 8.50 38 - V 11.80 63 - H 13.50
14 - V 14.00 39 + V 10.80 64 - H 11.00
15 - V 12.30 40 + V 9.80 65 - V 14.00
16 - H 12.80 41 - V 8.80 66 - V 13.20
17 - H 11.20 42 + H 12.50 67 - H 10.50
18 + H 10.50 43 - H 11.50 68 - V 8.80
19 - V 11.00 44 - H 10.50 69 - H 11.50
20 - V 13.00 45 - V 9.50 70 - V 11.90
21 - V 9.00 46 - V 12.30 71 + H 13.10
22 + V 8.90 47 - V 11.30 72 - V 14.10
23 - V 11.30 48 - H 10.30 73 + H 9.80
24 + H 11.20 49 + H 9.30 74 - V 8.90
25 - V 13.00 50 - V 11.00 75 + V 11.10

40
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Población de 500 escolares distribuidos según escuelas, sexo, Parasitismo


(positivas o negativa) y hemoglobinemia (gramos x 100)

NUM PARAS SEX HEMOGL NUM PARAS SEX HEMOGL NUM PARAS SEX HEMOGL
76 + V 13.00 101 + H 10.00 126 + H 8.30
77 - V 12.00 102 + V 11.20 127 + H 9.20
78 - V 11.00 103 - H 13.00 128 - H 10.40
79 - H 10.00 104 - V 12.40 129 - H 13.00
80 + H 9.00 105 - V 12.50 130 - V 14.10
81 - V 8.00 106 + V 12.60 131 - V 12.20
82 + H 12.90 107 + V 11.00 132 - V 8.90
83 - V 11.90 108 - H 9.00 133 - V 14.00
84 + V 10.90 109 + H 8.60 134 - V 11.30
85 + H 9.90 110 - V 8.70 135 - V 12.90
86 - H 8.90 111 - V 9.30 136 - H 11.70
87 - H 12.80 112 - H 10.90 137 - H 13.00
88 - V 11.80 113 - H 13.50 138 - H 8.50
89 + V 10.80 114 - V 11.00 139 - H 14.00
90 + V 9.80 115 - V 14.00 140 - V 12.30
91 - V 8.80 116 - H 13.20 141 - V 12.80
92 + H 12.50 117 - H 10.50 142 - H 11.20
93 - H 11.50 118 + H 8.80 143 - V 10.50
94 - H 10.50 119 - V 11.50 144 - H 11.00
95 - V 9.50 120 - V 11.90 145 - V 13.00
96 - V 12.30 121 - V 13.10 146 + H 9.00
97 - V 11.30 122 + V 14.10 147 - V 8.90
98 - H 10.30 123 - V 9.80 148 + H 11.30
99 + H 9.30 124 + H 8.90 149 - V 11.20
100 - V 11.00 125 - V 11.10 150 + V 13.00

41
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Población de 500 escolares distribuidos según escuelas, sexo, Parasitismo


(positivas o negativa) y hemoglobinemia (gramos x 100)

NUM PARAS SEX HEMOGL NUM PARAS SEX HEMOGL NUM PARAS SEX HEMOGL
151 + H 10.00 176 + V 8.30 201 + H 13.00
152 + H 11.20 177 - V 9.20 202 + V 12.00
153 - H 13.00 178 - V 10.40 203 - H 11.00
154 - H 12.40 179 - H 13.00 204 - V 10.00
155 - V 12.50 180 + H 14.10 205 - V 9.00
156 - V 12.60 181 - V 12.20 206 + V 8.00
157 - V 11.00 182 + H 8.90 207 + V 12.90
158 - V 9.00 183 - V 14.00 208 - H 11.90
159 - V 8.60 184 + V 11.30 209 + H 10.90
160 - V 8.70 185 + H 12.90 210 - V 9.90
161 - H 9.30 186 - H 11.70 211 - V 8.90
162 - H 10.90 187 - H 13.00 212 - H 12.80
163 - H 13.50 188 - V 8.50 213 - H 11.80
164 - H 11.00 189 + V 14.00 214 - V 10.80
165 - V 14.00 190 + V 12.30 215 - V 9.80
166 - V 13.20 191 - V 12.80 216 - H 8.80
167 - H 10.50 192 + H 11.20 217 - H 12.50
168 - V 8.80 193 - H 10.50 218 + H 11.50
169 - H 11.50 194 - H 11.00 219 - V 10.50
170 - V 11.90 195 - V 13.00 220 - V 9.50
171 + H 13.10 196 - V 9.00 221 - V 12.30
172 - V 14.10 197 - V 8.90 222 + V 11.30
173 + H 9.80 198 - H 11.30 223 - V 10.30
174 - V 8.90 199 + H 11.20 224 + H 9.30
175 + V 11.10 200 - V 13.00 225 - V 11.00

42
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Población de 500 escolares distribuidos según escuelas, sexo, Parasitismo


(positivas o negativa) y hemoglobinemia (gramos x 100)

NUM PARAS SEX HEMOGL NUM PARAS SEX HEMOGL NUM PARAS SEX HEMOGL
226 + H 13.00 251 + H 8.30 276 + V 10.00
227 + V 12.00 252 + H 9.20 277 - V 11.20
228 - H 11.00 253 - H 10.40 278 - V 13.00
229 - V 10.00 254 - H 13.00 279 - H 12.40
230 - V 9.00 255 - V 14.10 280 + H 12.50
231 + V 8.00 256 - V 12.20 281 - V 12.60
232 + V 12.90 257 - V 8.90 282 + H 11.00
233 - H 11.90 258 - V 14.00 283 - V 9.00
234 + H 10.90 259 - V 11.30 284 + V 8.60
235 - V 9.90 260 - V 12.90 285 + H 8.70
236 - V 8.90 261 - H 11.70 286 - H 9.30
237 - H 12.80 262 - H 13.00 287 - H 10.90
238 - H 11.80 263 - H 8.50 288 - V 13.50
239 - V 10.80 264 - H 14.00 289 + V 11.00
240 - V 9.80 265 - V 12.30 290 + V 14.00
241 - H 8.80 266 - V 12.80 291 - V 13.20
242 - H 12.50 267 - H 11.20 292 + H 10.50
243 + H 11.50 268 - V 10.50 293 - H 8.80
244 - V 10.50 269 - H 11.00 294 - H 11.50
245 - V 9.50 270 - V 13.00 295 - V 11.90
246 - V 12.30 271 + H 9.00 296 - V 13.10
247 + V 11.30 272 - V 8.90 297 - V 14.10
248 - V 10.30 273 + H 11.30 298 - H 9.80
249 + H 9.30 274 - V 11.20 299 + H 8.90
250 - V 11.00 275 + V 13.00 300 - V 11.10

43
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Población de 500 escolares distribuidos según escuelas, sexo, Parasitismo


(positivas o negativa) y hemoglobinemia (gramos x 100)

NUM PARAS SEX HEMOGL NUM PARAS SEX HEMOGL NUM PARAS SEX HEMOGL
301 + V 8.30 326 + H 10.00 351 + H 13.00
302 - V 9.20 327 + V 11.20 352 + H 12.00
303 - V 10.40 328 - H 13.00 353 - H 11.00
304 - H 13.00 329 - V 12.40 354 - H 10.00
305 + H 14.10 330 - V 12.50 355 - V 9.00
306 - V 12.20 331 + V 12.60 356 - V 8.00
307 + H 8.90 332 + V 11.00 357 - V 12.90
308 - V 14.00 333 - H 9.00 358 - V 11.90
309 + V 11.30 334 + H 8.60 359 - V 10.90
310 + H 12.90 335 - V 8.70 360 - V 9.90
311 - H 11.70 336 - V 9.30 361 - H 8.90
312 - H 13.00 337 - H 10.90 362 - H 12.80
313 - V 8.50 338 - H 13.50 363 - H 11.80
314 + V 14.00 339 - V 11.00 364 - H 10.80
315 + V 12.30 340 - V 14.00 365 - V 9.80
316 - V 12.80 341 - H 13.20 366 - V 8.80
317 + H 11.20 342 - H 10.50 367 - H 12.50
318 - H 10.50 343 + H 8.80 368 - V 11.50
319 - H 11.00 344 - V 11.50 369 - H 10.50
320 - V 13.00 345 - V 11.90 370 - V 9.50
321 - V 9.00 346 - V 13.10 371 + H 12.30
322 - V 8.90 347 + V 14.10 372 - V 11.30
323 - H 11.30 348 - V 9.80 373 + H 10.30
324 + H 11.20 349 + H 8.90 374 - V 9.30
325 - V 13.00 350 - V 11.10 375 + V 11.00

44
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Población de 500 escolares distribuidos según escuelas, sexo, Parasitismo


(positivas o negativa) y hemoglobinemia (gramos x 100)

NUM PARAS SEX HEMOGL NUM PARAS SEX HEMOGL NUM PARAS SEX HEMOGL
376 + H 10.00 401 + V 13.00 426 + H 8.30
377 + H 11.20 402 - V 12.00 427 + V 9.20
378 - H 13.00 403 - V 11.00 428 - H 10.40
379 - H 12.40 404 - H 10.00 429 - V 13.00
380 - V 12.50 405 + H 9.00 430 - V 14.10
381 - V 12.60 406 - V 8.00 431 + V 12.20
382 - V 11.00 407 + H 12.90 432 + V 8.90
383 - V 9.00 408 - V 11.90 433 - H 14.00
384 - V 8.60 409 + V 10.90 434 + H 11.30
385 - V 8.70 410 + H 9.90 435 - V 12.90
386 - H 9.30 411 - H 8.90 436 - V 11.70
387 - H 10.90 412 - H 12.80 437 - H 13.00
388 - H 13.50 413 - V 11.80 438 - H 8.50
389 - H 11.00 414 + V 10.80 439 - V 14.00
390 - V 14.00 415 + V 9.80 440 - V 12.30
391 - V 13.20 416 - V 8.80 441 - H 12.80
392 - H 10.50 417 + H 12.50 442 - H 11.20
393 - V 8.80 418 - H 11.50 443 + H 10.50
394 - H 11.50 419 - H 10.50 444 - V 11.00
395 - V 11.90 420 - V 9.50 445 - V 13.00
396 + H 13.10 421 - V 12.30 446 - V 9.00
397 - V 14.10 422 - V 11.30 447 + V 8.90
398 + H 9.80 423 - H 10.30 448 - V 11.30
399 - V 8.90 424 + H 9.30 449 + H 11.20
400 + V 11.10 425 - V 11.00 450 - V 13.00

45
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Población de 500 escolares distribuidos según escuelas, sexo, Parasitismo


(positivas o negativa) y hemoglobinemia (gramos x 100)

NUM PARAS SEX HEMOGL NUM PARAS SEX HEMOGL


451 + H 8.30 476 + H 10.00
452 + V 9.20 477 + H 11.20
453 - H 10.40 478 - H 13.00
454 - V 13.00 479 - H 12.40
455 - V 14.10 480 - V 12.50
456 + V 12.20 481 - V 12.60
457 + V 8.90 482 - V 11.00
458 - H 14.00 483 - V 9.00
459 + H 11.30 484 - V 8.60
460 - V 12.90 485 - V 8.70
461 - V 11.70 486 - H 9.30
462 - H 13.00 487 - H 10.90
463 - H 8.50 488 - H 13.50
466 - V 14.00 489 - H 11.00
465 - V 12.30 490 - V 14.00
466 - H 12.80 491 - V 13.20
467 - H 11.20 492 - H 10.50
468 + H 10.50 493 - V 8.80
469 - V 11.00 494 - H 11.50
470 - V 13.00 495 - V 11.90
471 - V 9.00 496 + H 13.10
472 + V 8.90 497 - V 14.10
473 - V 11.30 498 + H 9.80
474 + H 11.20 499 - V 8.90
475 - V 13.00 500 + V 11.10
Nota: Ejercicio tomado del Curso de Salud Pública dictado por el Dr. Carlos
Luis González, de la Facultad de Medicina de la U.L.A.

Trabajo De Campo.Se realizará una encuesta o sondeo de opinión, en los


diferentes sectores de la comunidad universitaria.

46
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Tema 03.
Distribuciones De Frecuencias (TDF)

Conceptos clave: escalas de intervalo, ordinal, nominal, datos continuos y


categóricos, datos agrupados, datos no agrupados, arreglo, tabla, distribución
de frecuencias. limites de clases, limites reales, limites aparentes, frecuencias
absolutas, frecuencias relativas, frecuencias simples, frecuencias acumuladas,
marcas de clases, amplitud, rango.

Contenidos

Introducción
Arreglos Ordenados
Distribuciones De Frecuencia Agrupada
Elementos De Una Distribución De Frecuencia
 Intervalo De Clase o Clases
 Límites De Clase
 Amplitud De Clase
 Frecuencia Absoluta De Clase
 Frecuencia Relativa De Una Clase
 Frecuencia Acumulada De Una Clase
 Frecuencia Relativa Acumulada
 Marca De Clase
Reglas y Recomendaciones Generales Para Construir Una TDF.
Tablas Estadísticas:
Notas Importantes
Ejemplo Utilizando La Salida De Un Paquete Estadístico

47
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Introducción: Tal como se definió en el tema anterior, la Estadística


descriptiva mediante técnicas de organización, síntesis y presentación de los
datos, nos permite describir y analizar un fenómeno o hecho de interés de una
forma lógica.

Generalmente el Investigador trabaja con grandes volúmenes de


observaciones correspondiente a un hecho o fenómeno objeto de su
investigación, estas se presentan bajo la forma de una colección de datos
individuales y viene a constituir su materia prima, lo cual trae como dificultad
poder apreciar el comportamiento de una variable a partir de una larga lista de
valores y sacar conclusiones de ellos en su forma original, es debido a esta
situación que se establece la necesidad de agrupar o resumir los datos,
mediante las distribuciones de frecuencias, y de presentar los mismos
organizadamente utilizando para ello los cuadros, y obtener algunos
indicadores numéricos que faciliten la determinación e interpretación de los
aspectos mas importantes.

Este análisis descriptivo puede realizarse en la Población o en la Muestra.

Arreglos Ordenados: Cuando se hacen mediciones de una variable sobre los


elementos de una Muestra o sobre las unidades de la Población, los valores
resultantes llegan al investigador o estadístico, como un conjunto de datos
desordenados (a menos que el número de observaciones sea extremadamente
pequeño), es poco probable que estos datos proporcionen mucha información
hasta que se hayan ordenado en alguna forma. Un arreglo ordenado es una
lista de los valores de una colección (Población o Muestra), en orden de
magnitud, desde el más pequeño hasta el más grande.

La información así presentada tiene algunas ventajas adicionales, ya que


además de conocer los valores máximo, mínimo e intermedios, también
permite observar los valores más comunes.

Sin embargo, genera el inconveniente que resulta ser muy grande cuando
existen muchos valores diferentes. Esto nos conduce a considerar el hecho de
agrupar los datos.

La distribución de frecuencia es la representación estructurada, en forma de


tabla, de toda la información que se ha recogido sobre la variable que se
estudia.

48
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Variable Frecuencias absolutas Frecuencias relativas


(Valor) Simple Acumulada Simple Acumulada
x x x x x
X1 f1 f1 h1 = f1 / n h1
X2 f2 f1 + f2 h2 = f2 / n h1 + h2
... ... ... ... ...
f1 + f2 +..+ hn-1 = fn-1 / h1 + h2
Xn-1 fn-1
fn-1 n +..+hn-1
Xn fn f hn = fn / n 1

Siendo X los distintos valores que puede tomar la variable.


Siendo f el número de veces que se repite cada valor.
Siendo h el porcentaje que la repetición de cada valor supone sobre el
total

Ejemplo: Medimos la altura de los niños de una clase y obtenemos los


siguientes resultados (cm):

Alumno Estatura Alumno Estatura Alumno Estatura


Alumno 1 1,25 Alumno 11 1,23 Alumno 21 1,21
Alumno 2 1,28 Alumno 12 1,26 Alumno 22 1,29
Alumno 3 1,27 Alumno 13 1,30 Alumno 23 1,26
Alumno 4 1,21 Alumno 14 1,21 Alumno 24 1,22
Alumno 5 1,22 Alumno 15 1,28 Alumno 25 1,28
Alumno 6 1,29 Alumno 16 1,30 Alumno 26 1,27
Alumno 7 1,30 Alumno 17 1,22 Alumno 27 1,26
Alumno 8 1,24 Alumno 18 1,25 Alumno 28 1,23
Alumno 9 1,27 Alumno 19 1,20 Alumno 29 1,22
Alumno 10 1,29 Alumno 20 1,28 Alumno 30 1,21

Si presentamos esta información estructurada obtendríamos la siguiente tabla


de frecuencia:

49
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Variable Frecuencias absolutas Frecuencias relativas


(Valor) Simple Acumulada Simple Acumulada
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0% 100,0%

Si los valores que toma la variable son muy diversos y cada uno de ellos se
repite muy pocas veces, entonces conviene agruparlos por intervalos, ya que
de otra manera obtendríamos una tabla de frecuencia muy extensa que
aportaría muy poco valor a efectos de síntesis. (tal como se verá a
continuación).

Distribuciones De Frecuencia Agrupada: Supongamos que medimos la


estatura de los habitantes de una vivienda y obtenemos los siguientes
resultados (cm)

Habitante Estatura Habitante Estatura Habitante Estatura


Habitante 1 1,15 Habitante 11 1,53 Habitante 21 1,21

50
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Habitante 2 1,48 Habitante 12 1,16 Habitante 22 1,59


Habitante 3 1,57 Habitante 13 1,60 Habitante 23 1,86
Habitante 4 1,71 Habitante 14 1,81 Habitante 24 1,52
Habitante 5 1,92 Habitante 15 1,98 Habitante 25 1,48
Habitante 6 1,39 Habitante 16 1,20 Habitante 26 1,37
Habitante 7 1,40 Habitante 17 1,42 Habitante 27 1,16
Habitante 8 1,64 Habitante 18 1,45 Habitante 28 1,73
Habitante 9 1,77 Habitante 19 1,20 Habitante 29 1,62
Habitante 10 1,49 Habitante 20 1,98 Habitante 30 1,01

Si presentáramos esta información en una tabla de frecuencia obtendriamos


una tabla de 30 líneas (una para cada valor), cada uno de ellos con una
frecuencia absoluta de 1 y con una frecuencia relativa del 3,3%. Esta tabla nos
aportaría escasa imformación

En lugar de ello, preferimos agrupar los datos por intervalos, con lo que la
información queda más resumida (se pierde, por tanto, algo de información),
pero es más manejable e informativa:

51
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Estatura Frecuencias absolutas Frecuencias relativas


Cm Simple Acumulada Simple Acumulada
x x
1,01 - 1,10 1 1 3,3% 3,3%
1,11 - 1,20 3 4 10,0% 13,3%
1,21 - 1,30 3 7 10,0% 23,3%
1,31 - 1,40 2 9 6,6% 30,0%
1,41 - 1,50 6 15 20,0% 50,0%
1,51 - 1,60 4 19 13,3% 63,3%
1,61 - 1,70 3 22 10,0% 73,3%
1,71 - 1,80 3 25 10,0% 83,3%
1,81 - 1,90 2 27 6,6% 90,0%
1,91 - 2,00 3 30 10,0% 100,0%

El número de tramos en los que se agrupa la información es una decisión que


debe tomar el analista: la regla es que mientras más tramos se utilicen menos
información se pierde, pero puede que menos representativa e informativa sea
la tabla.

Datos Agrupados: Aunque un conjunto de observaciones pueden hacerse


más comprensible y adquirir mayor significado por medio de un arreglo
ordenado, puede lograrse una mayor síntesis agrupando los datos.

Para agrupar a un conjunto de observaciones, se selecciona un conjunto de


intervalos contiguos, que no se solapen, de modo que cada valor en el
conjunto de observaciones pueda colocarse en uno, y sólo en un intervalo.

Elementos De Una Distribución De Frecuencia: En una distribución de


frecuencias o Tabla de Distribución de Frecuencias (TDF), podemos distinguir
los siguientes elementos.

Intervalo De Clase o Clases: Consisten en intervalos de valores ordenados


en forma ascendentes y que cubren todos los datos disponibles.

Límites De Clase: Son los extremos de la clase ó intervalo, el extremo inferior


o valor menor del intervalo se denomina límite inferior de la clase y se denota

52
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

por LIi, i = 1,2,...,k y el extremo superior se denominan límite superior y se


denota por LSi, i = 1,2,...,k.

Amplitud De Clase: También llamada Longitud de clase ó Tamaño de clase ó


anchura de clase, se obtiene haciendo la diferencia entre el límite superior y el
límite inferior de la clase. Se denota por Ci, i= 1,2...,k.

Frecuencia Absoluta De Clase: Es el número de observaciones contenidas o


incluidas en la clase y se denota por fi.

Frecuencia Relativa De Una Clase: Se obtiene dividiendo la frecuencia


absoluta, entre el número de observaciones n, se denota por hi.

fi
hi = ---
n

Frecuencia Acumulada De Una Clase: Se obtiene sumando las frecuencias


absolutas de todas las clases anteriores a ella y la frecuencia absoluta de la
clase considerada. Se denota por Fi , y la descendente por Fi con:

F1 = f1 F1  = n

F2 = f1 + f2 = F1 + f2 F2 = F1 - f1

F3 = f1 + f2 + f3 = F2 + f3 F3 = F2 - f2

Fi = f1 + f2 +...+ fi = Fi-1 + fi Fn = Fn-1 - fn-1

Frecuencia Relativa Acumulada: Se obtiene dividiendo la correspondiente


frecuencia acumulada Fi entre el número total de datos.

Se denota por Hi.

Fi  Fi 
Hi  = ---------- ; Hi = ---------
n n

donde Hi  = hi

53
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Marca De Clase: Se define como el punto medio de esa clase, es decir, es la


semisuma de los límites inferior y superior de la clase y se denota por mi.

Lii + Lsi
mi = ---------------
2

Reglas y Recomendaciones Generales Para Construir Una TDF.

(a) Se determina el valor máximo y el valor mínimo de los datos y se


calcula la diferencia entre estos valores, esta diferencia se
denomina Rango o Recorrido de la Variable.

R = Xmax - Xmin

(b) Se determina el número de clases y las amplitudes de clase,


teniendo la relación siguiente:

R
Ci = ----------, donde K es el número de Clases
K

En la práctica, en general no se conoce ni el número de clases ni la


amplitud de las mismas, sin embargo existen dos recomendaciones
importantes al construir una TDF. El número de clases no sea inferior a 6 ni
mayor de 15. Un número muy pequeño de clases significaría una agrupación
extremada, y en consecuencia sin utilidad y un número excesivo de clases,
no se logra el objetivo de la síntesis. De ser posible y si le conviene al
investigador, es deseable que todas las clases tengan la misma amplitud.
Siempre nos aseguraremos que cada elemento quede en una y sólo una
clase, para lograrlo debemos asegurarnos que los valores mínimos y
máximos entren en la clasificación.

No existe una regla o método único que permita determinar el número de


clases para una TDF.

En muchos casos se trata de un procedimiento de ensayo y/o error y


generalmente de experiencia.

Sin embargo, existen unos procedimientos o fórmulas matemáticas que se han


desarrollado. Una de estas fórmulas es la conocida como Regla de Sturges, la
54
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

cual viene dada por:

m = 1 + 3.3 (log n), donde

m= número de clases y n = número total de observaciones

Demostración De La Regla De Sturges:

Para obtener la fórmula m se deben hacer los siguientes


supuestos:

 El mínimo de datos que amerita clasificación en intervalos es 16.


 El número de intervalos no debe ser inferior a (5).
 Cada vez que se duplique la información se incrementa en uno (1) el
número de intervalos.

Así las cosas, se obtiene la siguiente correspondencia:

Se llega a la siguiente igualdad:

n = 2m –1

Tomando logaritmo a ambos lados de la ecuación

55
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

donde k = m

Proceder a construir los intervalos de clase, una vez que se han determinado
las amplitudes de clase. En este paso, lo importante es precisar cual va a ser
el límite inferior de la primera clase Li1, ya que una vez fijado éste, utilizando
las amplitudes de clase se generan las clases. Una vez fijado Li1, se le suma
C1 y se obtiene Ls1, el cual va a ser igual al Li2 y así sucesivamente.

Determinar las fi, ya que una vez determinadas las frecuencias absolutas,
fácilmente se pueden calcular los otros tipos de frecuencia.

Tablas Estadísticas: A partir de este momento nos vamos a ocupar de las


estadísticas de una sola variable, "Estadísticas Unidimensionales".

Las tablas estadísticas según el número de observaciones y según el recorrido


de la variable estadística, así tenemos los siguientes tipos de tablas
estadísticas:

Tablas tipo I: Cuando el tamaño de la muestra y el recorrido de la variable son


pequeños, por ejemplo si tenemos una muestra de las edades de 5 personas,
por lo que no hay que hacer nada especial simplemente anotarlas de manera
ordenada en filas o columnas.

Edad de los 5 miembros de una familia: 5, 8, 16, 38, 45

Tablas tipo II: Cuando el tamaño de la muestra es grande y el recorrido de la


variable es pequeño, por lo que hay valores de la variable que se repiten. Por
ejemplo, si preguntamos el número de personas activas que hay en 50 familias
obtenemos la siguiente tabla:

56
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Personas Activas en 50 familias


2 1 2 2 1 2 4 2 1 1
2 3 2 1 1 1 3 4 2 2
2 2 1 2 1 1 1 3 2 2
3 2 3 1 2 4 2 1 4 1
1 3 4 3 2 2 2 1 3 3

Podemos observar que la variable toma valores comprendidos entre 1 y 4, por


lo que precisaremos una tabla en la que resumamos estos datos quedando la
siguiente tabla:

Personas Número de
Activas Familias
1 16
2 20
3 9
4 5
Total 50

Tablas tipo III: Cuando el tamaño de la muestra y el recorrido de la variable


son grandes, por lo que será necesario agrupar en intervalos los valores de la
variable. Por ejemplo si a un grupo de 30 alumnos les preguntamos el dinero
que en ese momento llevan encima, nos encontramos con los siguientes datos:

450 1152 250 300 175 80 25 2680 605 785

1595 2300 5000 1200 100 5 180 200 675 500

375 1500 205 985 185 125 315 425 560 1100

57
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Evidentemente, la variable estadística tiene un recorrido muy grande, 4998


bolívares, por lo que sí queremos hacer una tabla con estos datos tendremos
que tomar intervalos. Para decidir la amplitud de los intervalos, necesitaremos
decidir ¿cuántos intervalos queremos?.

Normalmente se suele trabajar con no más de 10 o 12 intervalos.

Amplitud = 4998/10 = 499,8 Por lo que tomaremos intervalos de amplitud 500

Debemos tener en cuenta las siguientes consideraciones:

 Tomar pocos intervalos implica que la "pérdida de información" sea


mayor.

 Los intervalos serán siempre Cerrados por la izquierda y Abiertos por la


Derecha [ Li-1 , Li )

 Procuraremos que en la decisión de intervalos los valores observados no


coincidan con los valores de los extremos del intervalo y si esto ocurre
que no sea en más de un 5% del total de observaciones.

Con estas recomendaciones tendremos la siguiente tabla:

58
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

[ Li-1 , Li ) Frecuencia
[ 0,500) 16
[ 500, 1000) 6
[ 1000,1500) 3
[ 1500, 2000) 2
[ 2000, 2500) 1
[ 2500, 3000) 1
[ 3000, 3500) 0
[ 3500, 4000) 0
[ 4000, 4500) 0
[ 4500, 5000) 0
[ 5000,5500) 1

Notas Importantes

 En algunos casos, podemos encontrar en una TDF, un intervalo de


clase que no posea límite inferior o superior definidos (Límites
abiertos), intervalos de este tipo se denominan, intervalos abiertos,
caso contrario se denomina límites cerrados.

 A las clases abiertas no se le puede determinar su longitud.

 En una misma TDF, todas las clases pueden tomar o no la misma


longitud. En general, siempre se trata de construir clases con el
mismo tamaño.

  fi = n

59
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

 La frecuencia relativa de una clase representa la proporción de los


datos contenidos en esa clase.

 La frecuencia acumulada de la última clase de la TDF coincide con el


número total de datos n.

 La frecuencia acumulada Fi de una clase se interpreta como el número


de observaciones que están por debajo o que son inferiores al valor
representado por el límite superior de la clase considerada (y que por
supuesto son mayores que el valor representado por el límite inferior
de la primera clase). La frecuencia acumulada Fi de una clase se
interpreta como el número de observaciones que están por encima o que
son superiores al valor representado por el límite inferior de la clase
considerada (y que por supuesto son menores que el valor
representado por el límite superior de la última clase).

 La frecuencia relativa acumulada ascendente Hi de una clase represen-


ta la proporción de datos que son menores que el límite superior de la
clase considerada. Si multiplicamos por 100, se obtiene el porcentaje,
con respecto al total de datos que son menores que el límite superior de
la clase. La frecuencia relativa acumulada descendente Hi de una clase
representa la proporción de datos que son mayores que el límite inferior
de la clase considerada. Si multiplicamos por 100, se obtiene el
porcentaje, con respecto al total de datos que son mayores que el límite
inferior de la clase.

 La respuesta obtenida aplicando esta regla, no debe considerarse


como definitiva, sino sólo como una guía. El número de intervalo de
clase, especificado por esta regla puede ser aumentado o disminuido,
según convenga en beneficio del investigador.

 Dado que el límite superior de una clase es también el límite inferior de


la clase siguiente, para evitar solapamientos vamos a asumir que toda
clase incluye a su límite inferior, pero excluye a su límite superior
(Límites Reales).

 A veces, es conveniente pasar de Límites Aparentes (cuando ambos


límites están incluidos) a Límites Reales, y esto se hace tomando la
semisuma del límite aparente superior de un intervalo con el límite
inferior del intervalo siguiente.

60
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Ejemplo Utilizando La Salida De Un Paquete Estadístico: La siguiente tabla


muestra, las respuestas obtenidas en un cuestionario aplicado a las obreras de
la fábrica "La hilacha", respecto a la edad, estado civil, número de hijos,
experiencia, años de estudio, ingresos diarios, gastos en educación y
ausencias al trabajo en el último mes, así como una calificación del desempeño
otorgada por el supervisor.

61
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Hacer las respectivas distribuciones de frecuencias, para cada una de las


variables.

Edad

Estado Civil

Número de Hijos

62
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Experiencia Laboral

Escolaridad

Gastos en Educación

63
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Ausencias

64
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Tema 04.
Representación Gráfica

Conceptos clave: diagrama de barras, histogramas, polígono de frecuencias,


diagrama de frecuencias acumuladas, diagrama de sectores, gráfico de anillos,
diagrama de puntos, pirámide poblacional

Contenidos

Introducción
Características Generales
Componentes De Una Gráfica
Escalas Del Gráfico y Errores En Su Uso
Tipos De Gráficos
 Diagrama De Barras
o Diagrama De Barras Sencillas
o Diagrama De Barras Dobles
o Diagrama De Barras Compuestas
 Histogramas
 Polígono De Frecuencias
 Ojivas
 Diagrama De Sectores
 Gráfico De Anillos
 Diagrama De Puntos
 Pictogramas
 Representación o Diagrama de Tallo y Hojas
 La Gráfica de Caja o de Bigote (Box and Whiskers Plot)
 Pirámide Poblacional
Notas Importantes

65
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Introducción: La presentación gráfica de los datos constituye uno de los


métodos o formas más utilizadas y posiblemente el más útil de los principales
métodos de representación de datos estadísticos debido a que la
información presentada de esta manera llama la atención y además es
captada, interpretada y retenida en la memoria, más rápida y fácilmente que
cuando se hace en otra forma (tabular ó en texto).

Las gráficas transmiten en forma inmediata una idea general sobre los
principales aspectos de los datos pero no proporcionan detalles. Un gráfico
debe ser sencillo, de fácil interpretación y sólo debe suministrar valores
aproximados. La persona interesada en detalles y/o cifras exactas deberá
acudir a los cuadros estadísticos.

Características Generales: Los gráficos dan una idea mucho más sintética
que los cuadros estadísticos.

Unas veces su finalidad es simplemente tratar de mostrar a otras personas la


evolución de determinado fenómeno, pues mientras que la interpretación de
un cuadro estadístico requiere ciertos conocimientos, cualquier puede
comprender fácilmente que una línea ascendente traduce un aumento del
fenómeno estudiado y que una línea descendente significa una disminución.

Aunque la disposición de los gráficos como de los cuadros variará de


acuerdo de los datos, hay algunos principios comunes que deben tomarse en
cuenta.

Componentes De Una Gráfica: Una gráfica, al igual que un cuadro o una


tabla, debe constar de:

Título adecuado: Tanto los gráficos como los cuadros deben entenderse
fácilmente, sin necesidad de recurrir al texto que lo acompañen, el título
deberá reunir dos condiciones:

 Ser Completo: Deberá indicar claramente cuál es el contenido del


gráfico o cuadro. En otras palabras, debe responder a las preguntas:

o QUE: se estudia, cuál es el universo que se investiga.


o COMO: se estudia, es decir, de acuerdo a cuáles características
se clasifican los individuos investigados.
o DONDE: o a qué lugar se refieren los datos.
66
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

o CUANDO: o sea la época a que se refiere el estudio.

 Ser lo más conciso posible: El título deberá ser breve, aunque no


debe sacrificarse la claridad a la concisión.

El cuerpo: o gráfico en sí, cuya elección debe considerar el o los tipos


variables a relacionar, el público a quien va dirigido y el diseño artístico del
gráfico.

Notas de pie de gráfico: Donde se presentan aclaraciones respecto al gráfico


o las escalas de los ejes, con el fin de que no haya dudas sobre el contenido
de la gráfica o cuadro, estos se acompañan a veces de Notas explicativas.
Estas notas, sólo se utilizan en ocasiones, aunque en trabajos que no son
originales, siempre debe ponerse al pie del gráfico o cuadro. Al igual que los
créditos de las fuentes de donde se obtuvieron los datos, no sólo por
reconocimiento a sus autores, sino para que el lector en un momento dado,
pueda consultar el trabajo original.

Escalas Del Gráfico y Errores En Su Uso: Es de anotar que por medio de


gráficos tendenciosos se pueden deformar o resaltar situaciones o estados,
que presentados en un gráfico apropiado, mostrarían un comportamiento
normal.

Generalmente una información es distorsionada por algunas de las siguientes


causas:

 La relación entre los ejes no es la mas apropiada ( ver gráficos No.1 y


No.2.)
 Gráficos con escalas desproporcionadas, o mala elección del punto de
origen ( ver gráfico No.3).

Variación de La Inflación en Mérida


1995-2000

67
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Gráfico No. 1

Gráfico No. 2

Gráfico No. 3

68
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Como se puede observar, el gráfico No.1 “realza” el decrecimiento de la


variable inflación, mientras que el No.2 intenta mostrar una estabilización o
decrecimiento parsimonioso.

Los dos dibujos son incorrectos debido a que no conservan una proporción
adecuada entre sus ejes. Sin embargo, el gráfico No. 3 tiene una buena
proporción entre los ejes. Pero, la distorsión se debe a la mala numeración en
el eje “Y” pues, el punto de origen O ha sido eliminado y asignado un valor
arbitrario, la escala es inadecuada para resaltar el decrecimiento inflacionario
de los dos últimos periodos.

Ambas situaciones son erróneas o tendenciosas y se deben corregir asignando


escalas apropiadas a los ejes y utilizando las siguientes reglas:

Donde:Lx: Longitud del eje horizontal


Ly: Longitud del eje vertical

 Las dos escalas deben ser de la misma longitud o La longitud del eje
vertical es igual a tres cuartos de la longitud del eje horizontal.
 De igual manera, para evitar la apreciación incorrecta de los hechos, las
escalas deben comenzar en cero, aunque en casos especiales, cuando
los valores son muy elevados y con pequeñas variaciones deberá
"partirse" el gráfico para así evitarse gráficos con poca utilidad.
 Cada escala deberá tener su leyenda de tal manera, que se
comprenda qué representa (edad en años o en meses, etc.).
 Las escalas no deberán tener demasiadas subdivisiones, para ello
están los cuadros con los datos originales.

Tipos De Gráficos: De acuerdo a lo señalado, pueden distinguirse dos tipos


de gráficos: aquellos destinados a mostrar las variaciones de determinado
fenómeno y aquellos utilizados con fines analíticos. Debido a esto son muy
variados los gráficos que se pueden utilizar, entre ellos podemos enumerar
aquellos que se consideran más importantes.

69
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

 Diagrama De Barras
o Diagrama De Barras Sencillas
o Diagrama De Barras Dobles
o Diagrama De Barras Compuestas
 Histogramas
 Polígono De Frecuencias
 Ojivas
 Diagrama De Sectores
 Gráfico De Anillos
 Diagrama De Puntos
 Pictogramas
 Representación o Diagrama de Tallo y Hojas
 La Gráfica de Caja o de Bigote (Box and Whiskers Plot)
 Pirámide Poblacional

En este tema solo presentaremos algunos de ellos, la selección del gráfico


apropiada para representar la información estadística, depende del ingenio,
originalidad e interés del investigador, así como también del tipo de dato.

Diagrama De Barras: Para representar gráficamente datos cualitativos se


utiliza habitualmente el diagrama de barras, en el cual el fenómeno que se
estudia queda representado por una serie de rectángulos o barras, las
cuales pueden dibujarse horizontal o verticalmente. Las barras deben ser del
mismo ancho y el espacio que las separa no debe ser mayor que el espesor
de ellas mismas.

Se procede anotando en el eje horizontal los valores que toma la variable


en estudio y en el eje vertical, los valores correspondientes a las frecuencias
absolutas o a las frecuencias relativas simples en porcentajes, por último se
trazan barras verticales u horizontales tan altas o largas como lo indique las
frecuencias utilizadas.

Existen tres tipos de gráficas de barras, a saber:

Diagrama De Barras Sencillas: Es la utilizada para las distribuciones de


frecuencia cuya escala es cualitativa o cuantitativa discreta.

70
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Vacunaciones practicadas en el primer Distrito Sanitario


del Estado Mérida en 1993

20000

15000
Personas
Inoculadas 10000

5000

0
A

Tr

D
A

A
nt

.C

ob
nt

nt
ip
iv
ip

it
.G
le

le

ifi
rio
ol

c
io

a
lic
m

a
el
itic
a

Tipo de Vacunación
Fuente: Historias Médicas, Corporación de Salud del Estado Mérida 1994

Diagrama De Barras Dobles: Este diagrama, cuya idea es extensiva para


barras triples o cuádruples, se emplea para representar datos de asociación,
cuyas dos escalas son cualitativas. También se emplea cuando se quiere
comparar dos distribuciones de frecuencias con relación al tiempo, por ejemplo,
la distribución de sexos por estado civil. Cuando interesa enfatizar la
proporción que supone una característica respecto al total de una categoría, se
puede suponer a una barra que represente el total (100%). Es importante
señalar que la característica representada ha de ser siempre la misma para
poder establecer comparaciones, y que se debe seguir el mismo patrón en un
mismo gráfico. No se puede representar en una barra la proporción
correspondiente al sexo, y en otra barra sólo la parte correspondiente al total,
ya sea porque no interesa o porque se desconoce el dato en aquella categoría,
puesto que se prestaría a interpretaciones erróneas.

71
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Fuente: Estadísticas de Salud, Hospital de Mucuhíes 2002

Diagrama De Barras Compuestas: Las aplicaciones de este tipo, son muy


semejantes a las del tipo anterior, sobre el cual no hay ninguna ventaja.

Defunciones por accidentes, por causas y sexos


Venezuela, 1999

3000

2500

2000 Otros
Envenamiento
N° de Defunciones Caídas
1500
Sumersión
Transporte
1000

500

0
Hombres Mujeres
Causa del Accidente

Fuente: Anuario de Epidemiología y Estadística Vital de


Venezuela 2002

72
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Histogramas: Este gráfico se utiliza para representar distribuciones de


frecuencias en escala cuantitativa continua y agrupada. Puede representarse
gráficamente una distribución de frecuencias absolutas (fi) o una distribución
de frecuencias relativas simples (hi).

Al construir un histograma, los valores de las variables en consideración


constituyen el eje horizontal, mientras que en el eje vertical tiene como escala
a la fi o hi. Por encima de cada intervalo de clase sobre el eje horizontal se
levanta una barra rectangular de modo que su altura corresponda con la
frecuencia respectiva, semejantes a los del diagrama de barras. Sin embargo,
Las barras del histograma siempre se colocan verticalmente y deben ir
unas al lado de las otras, sin que haya ningún espacio que las separe.

El histograma nos da una idea bastante aproximada de la forma de la


distribución que sigue la variable en estudio.

Histograma de las concentraciones séricas de


colesterol (mg/100 ml) en 1001 estudiantes en ayunas
Mérida 1999

180
160
Número de estudiantes

140
120
100
80
60
40
20
0

Concentración de colesterol (mg/100 ml)

Fuente:Estadísticas Vitales 1999

73
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Procedimiento Para La Construcción De Un Histograma

Tabla de puntos acumulados por un


grupo para su evaluación mensual

1. Trazar ejes coordenados.

74
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

2. Dividir el eje horizontal en segmentos de igual medida, señalando su punto


medio y escribiendo abajo de cada uno el valor del punto medio de la clase
correspondiente.

3. Dividir el eje vertical en segmentos de igual medida y colocar en cada una de


las marcas las frecuencias.

75
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

4. Construir rectángulos cuyas bases sean las clases o intervalos y sus alturas
las frecuencias correspondientes a cada clase.

NOTA: déjese en el eje horizontal siempre una clase antes de la primera y otra
después de la última. Un histograma es una gráfica de rectángulos sin
espaciamiento entre ellos, que se construye colocando en el eje horizontal las
clases o la variable a medir, y en el eje vertical, las frecuencias de la misma.

Polígono De Frecuencias: Al igual que el histograma se utiliza para


representar distribuciones de frecuencias en escala cuantitativa continua y
agrupada. Para trazar un polígono de frecuencias se hace una marca
primero en los puntos medios de la parte superior de cada una de las barras
que representan los intervalos de clase sobre el eje horizontal de la gráfica.
Uniendo los puntos por líneas rectas se obtiene el polígono de frecuencias.

76
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Polígono de frecuencias de las concentraciones séricas


de colesterol (mg/100 ml) en 1001 estudiantes en
ayunas Mérida 1999

170
160
150
140
130
Número de estudiantes

120
110
100
90
80
70
60
50
40
30
20
10
0
90

11

13

15

17

18

21

23

25

27
0

0
Concentración de colesterol (mg/100 ml)

Fuente:
Estadísticas Vitales - 1999

Procedimiento Para La Construcción De Un Polígono De Frecuencias: Es


similar al de la construcción del histograma hasta el número 3 agregando los
siguientes pasos:

Marcar los puntos de intersección de cada punto medio de clase con su


frecuencia respectiva

Unir con segmentos, en forma consecutiva, los puntos de intersección


incluyendo el punto medio de la clase anterior a la primera y el punto medio de
la clase posterior a la última.

77
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Un polígono de frecuencias es la gráfica que se obtiene al unir en forma


consecutiva con segmentos los puntos de intersección entre los puntos medios
de cada clase y su frecuencia, incluyendo el punto medio anterior a la primera
clase y el punto medio posterior a la última clase

78
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

El polígono de frecuencias se obtiene también al unir los puntos medios de


cada clase colocados en la cara superior de cada rectángulo de un histograma.

En las gráficas trazadas se puede observar cómo está respondiendo el grupo,


en qué intervalo se concentran más alumnos, cuántos de ellos se están
atrasando y por lo tanto se les tiene que poner más atención o exigir más,
etcétera.

El histograma y el polígono de frecuencias facilitan la interpretación de datos y


permiten hacer inferencias

Ojivas o Gráfica “S”: También conocido como Diagrama de Frecuencias


Acumuladas, este se utiliza para representar distribuciones de frecuencias en
escala cuantitativa continua. Las frecuencias usadas pueden ser absolutas
acumuladas (Fi) o relativas acumuladas (Hi).

Gráfica de frecuencias acumuladas (Fi) de las


concentraciones séricas de colesterol (mg/100 ml) en
1001 estudiantes en ayunas Mérida 1999

1000

900

800

700

600 Oj iva Ascendente


Oj iva Descendente
Fi 500

400

300 Me

200

100

0
90
10
11
12
13
14
15
16
17
18
18
20
21
22
23
24
25
26
27
28
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0

Concentración de colesterol (mg/100 ml)

Fuente: Estadísticas Vitales 1999

79
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Diagrama De Sectores: Este diagrama, el cual es uno de los más


frecuentemente empleados, se utiliza para fines comparativos, en él se
pueden representar cifras absolutas o porcentajes y es él más
recomendable cuando las características a estudiar son cualitativas o
cuantitativas discretas.

Como el círculo tiene 360°, la manera más fácil de elaborarlo es


expresar los datos que se estudian en forma de porcentajes, pues en tal
caso, cada 1% corresponde a 3.6° del círculo, Hecho los cálculos anteriores
se utiliza un transportador para marcar los diferentes sectores.

fi
i = --- * 360°
n

Defunciones por Leucemia y Aleucemia por formas clínicas


Venezuela, 1998

Aguda
47%

Linfática
14%
Mieloide Otras
15% 24%

Fuente: Anuario de Epidemiología y Estadística Vital –Venezuela 2000

80
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Diagrama De Anillos: Se utilizan en las mismas situaciones que el Diagrama


de Sectores, pero es de gran utilidad a la cuando se desea comparar opinión
hacia un evento por diferentes grupos.

Violencia Doméstica contra la Mujer, Valores


porcentuales,según Edad Ambulatorios Carabobo,
El Llano y Venezuela
Mérida - Venezuela
2001

Venezuela

21% 21%
21% 19%
18%
24%
El Llano

Carabobo
21%
26%

25%

35% 37%
32%

12-19 años 20-27 años 28-35 años 36-44 años

Fuente: Estadísticas de Salud de cada Ambulatorio, Marzo 1999

81
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Diagrama De Puntos: Este gráfico se utiliza en aquellas situaciones en


donde cada observación toma dos características diferentes (nota previa con
nota final, edad con estatura, peso con edad, etc.), es decir, a cada
observación se le clasifica al mismo tiempo con relación a dos escalas
cuantitativas.

En el gráfico cada observación queda representado por un punto y según la


forma como se agrupen estos puntos, se podrá analizar el grado de
asociación entre las dos características estudiadas.

Notas Previas y Finales de 20 alumnos de Estadística 12


Período X.98

18

16

14
Notas Finales

12

10

6
8 10 12 14 16 18 20
Notas Previas

Fuente: Oficina de Registros Estudiantiles Facultad de Medicina, Marzo 1999

82
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Pictogramas: Actualmente, y mucho en los medios masivos de comunicación,


se utilizan gráficos para ilustrar los datos o los resultados de alguna
investigación. Regularmente se utilizan dibujos para representar dicha
información, y el tamaño o el número de estos dibujos dentro de una gráfica
queda determinado por la frecuencia correspondiente. A este tipo de gráfica se
le llama pictograma y éstos son dos ejemplos:

El de la izquierda representa la población de los Estados Unidos (cada


hombrecillo representa a dos millones de habitantes), el de la derecha
representa la masa de tres planetas de nuestro sistema solar tomando como
unidad a la masa de la Tierra (cada representa la masa de nuestro planeta:
Venus tiene masa menor y Neptuno tiene más 17 veces más masa que la
Tierra).

Representación o Diagrama de Tallo y Hojas: Presenta los datos de una


muestra mediante el empleo de los dígitos que constituyen los valores de los
datos. Cada dato numérico se divide en dos partes : el(los) dígito(s)
princiapal(es) se convierte(n) en el tallo, y el (los) dígito(s) posterior(es) se
convierte(n) en la(s) hoja(s). Los tallos se escriben a lo largo del eje principal, y
por cada porción de datos se escribe una hoja para mostrar la distribución de
los datos.

83
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Puntuaciones en un examen de Ingreso a la Escuela de Enfermería de 50


estudiantes

1 6
2 4
3 532
4 77275
5 27352
6 149556848
7 064762664
8 9334554076
9 4405977

Puntuaciones de estudiantes en dos salones durante la prueba de ingreso a la


Escuela de Enfermería.

Sección A Sección B
0 5 245
6 5
55431 7 22566
999875542 8 0677
31 9 122233

La Gráfica de Caja (Box and Whiskers Plot): Es ideal tener un método para
resumir un conjunto de datos que sea capaz de proveer mayor detalle que una
medida del centro de la distribución pero menos detalle que una gráfica de
Rama y Hoja o un histograma. La gráfica de Caja (también conocida como
“cajón y bigote”, “caja y patilla”, o “esquemático”) es esa técnica. Es
económica y, sin embargo, nos provee información acerca del (a) centro, (b) la
dispersión, (c) la simetría de la distribución (o falta de ésta), y (d) sobre la
presencia de casos atípicos .

Para hacer la gráfica resistente al efecto de los casos atípicos o "outliers", está
gráfica está basada en la mediana y el rango intercuartílico (RQ) en vez de
la media aritmética y la desviación típica (aunque también pude prepararse con
esas medidas). Aunque existen diversas versiones de esta gráfica
comenzaremos con la versión más elemental y la seguiremos enriqueciendo
según nos movemos en la discusión.

84
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

La Caja "básica" : Observa con cuidado cada una de las partes que
constituyen la gráfica de caja

 La caja básica se construye dibujando una caja rectangular sobre un eje


horizontal de medición. El lado o "gozne" inferior de la caja corresponde
a la primera cuartila (Q1) y el gozne superior o lado derecho de la caja
corresponde a la tercera cuartila (Q3). Así que los extremos de la caja
reflejan la cantidad de variación en el centro de la distribución.
Observa que esto es exactamente lo mismo que reporta el rango
intercuartílico (RQ).
 Luego de dibujada la caja, se traza una línea vertical dentro de la caja en
el lugar que corresponde a la segunda cuartila (Q2), esto es, a la
mediana (Md).
 Finalmente, se tira una línea horizontal desde los goznes de la caja, esto
es, desde las cuartilas uno (Q1) y tres (Q3), hasta el último valor de la
distribución que NO sea un caso extremo. (NOTA INTERESANTE: Esta
línea es llamada en inglés un "whisker" o "bigote de gato".
Aparentemente dentro de la cultura norteamericana esta forma de la
gráfica recuerda el hocico achatado y bigotudo de un gato u otra bestia
doméstica similar).
 En otras palabras, se tira una línea hasta el valor anterior al comienzo de
la barrera interior de la gráfica. En la ilustración anterior la “barrera
anterior” está representada por líneas verticales entrecortadas. Debe
notarse que estas líneas no se incluyen en la gráfica final y sólo se usan
durante la preparación de la gráfica.
 Finalmente, es necesario señalar que la “barrera interior” de la gráfica
comienza a 1.5RQ desde los goznes, y la “barrera exterior” comienza a

85
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

3RQ desde los goznes. Más adelante encontrarás un ejemplo específico


sobre como calcular las barreras interiores y exteriores.
 Los valores de la distribución que caigan dentro de la barrera interior se
llaman “casos atípicos” y los que caen dentro de la “barrera exterior” se
llaman “casos atípicos extremos”.

Pirámide Poblacional: Representa la distribución relativa de los grupos


quinquenales de edad de cada sexo respecto al total de la población, es decir
representa a la estructura por edad y sexo.

La pirámide de población es un gráfico en el que el sexo masculino figura a la


izquierda y las mujeres a la derecha. Para cada edad (o grupo de edad), hay
rectángulos horizontales que son proporcionales a los montos reales de
población.

La representación gráfica de una población normal toma la forma de pirámide


por una simple razón: no todas las personas que integran un determinado
grupo de edad pasarán a integrar el otro escalón siguiente, debido a la muerte
de algunos de sus integrantes. Otros hechos modificadores de estos
ordenamientos son las guerras, epidemias, inundaciones, migraciones, etc.

Las pirámides poblacionales pueden ser clasificadas en dos grandes grupos:

 Rítmicas: con equilibrio evidente entre los sexos y disminución normal de


los números correspondientes a cada grupo de edades.
 Arrítmicas: con desequilibrios marcados entre los sexos o bien entre las
edades.

Tipos de pirámides de
población

Pirámide rítmica Pirámide arrítmica

86
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Pirámide Poblacional del Estado Mérida


Censo 1990

50-64

50-54

40-44
Hombres
Edades
30-34 Mujeres

20-24

10-14

0-4
15,00 12,00 9,00 6,00 3,00 0,00 3,00 6,00 9,00 12,00
Porcentaje del Total

Fuente: Oficina Central de Estadísticas e Informática XII Censo


general de Población 1990

Notas Importantes

 Las barras no deben estar unidas unas con otras, debido a las escalas
que se utilizan.

 Los histogramas, no se pueden utilizar con respecto a distribuciones de


frecuencias que tengan intervalos abiertos, y se deben utilizar con
extremo cuidado cuando no todas las amplitudes de intervalos sean
iguales.

 Por lo general, el histograma debe preferirse al polígono de


frecuencias. Este debe destinarse a aquellos casos en los cuales se
quiere presentar más de una serie en el mismo gráfico, con el fin de
compararlas.

 En la Gráfica “S”, para las frecuencias acumuladas ascendentes, los


puntos correspondientes se van marcando en el límite superior. Al

87
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

graficar las frecuencias acumuladas descendentes, los puntos


correspondientes se van marcando en el límite inferior.

 El punto de intersección de las ojivas, divide al grupo de datos en dos


partes iguales. (Mediana, Cuartil 2, Decil 5, Percentil 50).

 Los gráficos circulares, también se utilizan para representar datos


temporales correspondientes a dos o más variables, de tal manera que
se refleje el comportamiento de las mismas a lo largo del tiempo.

 En el gráfico de diagrama de puntos, las dos escalas deben ocupar la


misma longitud.

88
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

POBLACIÓN ESTIMADA REPUBLICA BOLIVARIANA

DE VENEZUELA

CENSO 2001

Población
Entidad Federal Estimada Posición %
(Miles)
Amazonas 70.000 24 0.3%
Anzoátegui 1.222.000 07 5.3%
Apure 377.000 19 1.6%
Aragua 1.450.000 06 6.3%
Barinas 624.000 16 2.7%
Bolivar 1.215.000 08 5.3%
Carabobo 1.932.000 03 8.4%
Cojedes 253.000 22 1.1%
Delta Amacuro 98.000 23 0.4%
Dist Capital (DC) 1.836.000 04 8.0%
Falcón 763.000 11 3.3%
Guárico 627.000 15 2.7%
Lara 1.556.000 05 6.8%
Mérida 715.000 13 3.1%
Miranda 2.331.000 02 10.1%
Monagas 713.000 14 3.1%
Nueva Esparta 374.000 20 1.6%
Portuguesa 726.000 12 3.1%
Sucre 786.000 10 3.4%
Táchira 993.000 09 4.3%
Trujillo 609.000 17 2.6%
Vargas 298.000 21 1.3%
Yaracuy 499.000 18 2.2%
Zulia 2.984.000 01 12.9%
TOTAL 23.054.000
Fuente: Censo 2001 El Universal (17-11-2002)

89
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Tema 05.
Medidas De Tendencia Central

Conceptos clave: media aritmética, media geométrica, mediana, moda,


distribución par, distribución impar, datos agrupados, datos no agrupados,
simetría, coeficiente de pearson, coeficiente de fisher, medidas de curtosis.
coeficiente de pearson ß2

Contenidos

Introducción
Medidas Descriptivas Numéricas
Media Aritmética En Datos No Agrupados
La Media Geométrica En Datos No Agrupados
La Media Armónica En Datos No Agrupados
La Mediana En Datos No Agrupados
La Moda En Datos No Agrupados
La Media Aritmética Calculada En Datos Agrupados
La Media Geométrica Calculada En Datos Agrupados
La Mediana En Datos Agrupados
La Moda En Datos Agrupados
Comparación De La Media, La Mediana y La Moda
Medidas de Forma
Medidas de Concentración
Índice Gini (IG)
Medidas De Asimetría
Coeficiente De Pearson
Coeficiente De Fisher
Medidas De Curtosis. Coeficiente De Pearson ß2

90
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Introducción: Aunque la distribución de frecuencias tiene varias aplicaciones,


hay muchos casos que requieren otros tipos de resúmenes de datos. Lo que
se necesita en muchos casos es la habilidad para resumir los datos por medio
de sólo unas cuantas medidas descriptivas. Las medidas descriptivas pueden
calcularse a partir de los datos de una muestra (Estadístico) o de una
población (Parámetro).

Las medidas de tendencia central, también conocidas como medidas de


localización o posición de datos, nos permiten determinar los valores
"centrales" de una colección de datos, entendiéndose centro no solamente en
cuanto a la posición de los datos sino también en el sentido del punto de
equilibrio alrededor del cual se ubican los datos y desde el punto de vista del
valor que más se repite en la colección de datos. Pueden describirse
rígidamente como "promedios" en el sentido de que son más indicativos de
"centro", "mitad" o lo "más común" de un conjunto de datos.

Hay varios tipos de medidas descriptivas que pueden calcularse a partir de un


conjunto de datos. Sin embargo en este tema la atención se ha centrado en
las tres medidas de tendencia central más utilizadas, como lo son: La Media,
La Mediana y La Moda.

Medidas Descriptivas Numéricas : La condensación de los datos, cuando se


trate de una cantidad numerosa de ellos, y la representación gráfica de los
mismos constituyen elementos muy importantes pero no suficientes para
realizar un adecuado análisis descriptivo de una colección de datos. Se hace
necesario utilizar ciertos indicadores numéricos que nos proporcionen una
idea clara sobre aspectos relevantes como lo son: el valor que ocupa la
posición central de los datos, el valor promedio o centro de gravedad de la
masa de los datos, el valor que más se repite. Estos índices constituyen
algunas de las denominadas medidas descriptivas numéricas y dentro de
algunas de las importantes encontramos las medidas de localización o
posición de los datos.

La Media Aritmética En Datos No Agrupados: Es la medida de tendencia


central más conocida. Es la medida descriptiva que la mayoría de las
personas tiene en la mente cuando se habla del "promedio". El adjetivo
aritmética distingue a esta media e otras que pueden calcularse. La media
aritmética se obtiene sumando todos los valores en una población o muestra y
dividiendo el valor obtenido entre el número de valores que se sumaron de la
siguiente manera:
91
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

La fórmula de la media aritmética es:

La media aritmética, que se representa con , de estas calificaciones, se


obtiene con los siguientes pasos:
Se suman todos los datos

10 + 3 + 5 + 9 + 6 + 8 + 8 + 7 + 9 + 6 + 8 + 7 =
La suma ( ) se divide entre el número de datos (n) :

La media aritmética o promedio de las evaluaciones es 7.16, que es el valor


representativo de todos los datos.

Una de las propiedades de la media aritmética (llamada X barra) es que la


suma algebraica de las diferencias de cada uno de los datos con respecto a
su media elevadas al cuadrado es mínima, es decir:

n
 i=1 (Xi - X)2 es un valor mínimo, esto es fácil de demostrar, ya que
si calculamos la expresión anterior sustituyendo la media aritmética por
cualquier otro valor arbitrario que se nos ocurra, se obtiene como resultado un
valor mayor que el que se obtiene utilizando la media aritmética.

Siempre existe, es única, es relativamente confiable, en el sentido de que las


medias de muchas muestras tomadas de la misma población por lo
general no varían. La media toma en cuenta todos y cada uno de los
elementos del conjunto, por lo tanto los valores extremos influyen en la media
y en algunos casos, pueden alterarla tanto que resulta inconveniente como
una medida de tendencia central.

92
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Ejemplo 01: Para probar dos nuevos tipos de dietas para convalecientes de
una cierta enfermedad, se seleccionaron dos muestras aleatorias de 12
pacientes c/u. Una muestra se alimentó con la dieta A y la otra con la dieta B.
La ganancia en peso (grs.) después de 4 días se muestra en la siguiente tabla:

DIETA A: 31 34 29 26 32 35 38 34 30 29 32 31
DIETA B: 26 24 28 29 30 29 32 26 31 29 32 28

Se pide calcular las media aritméticas correspondientes ?

X1 = ( 31+34+29+26+32+35+38+34+30+29+32+31 )/12 = 31.75 grs.

X2 = ( 26+24+28+29+30+29+32+26+31+29+32+28 )/12 = 28.67 grs.

La Media Geométrica En Datos No Agrupados: Dada una colección de n


observaciones X1, X2,...,Xn se define la media geométrica simple como la raíz
n-ésima del producto de esos términos. Si denotamos por G a la media
geométrica, tenemos que:

n
G =  (X1) (X2)...(Xn)

Usualmente la G se obtiene mediante el uso de logaritmos comunes (base


10), ya que esto permite simplificar los cálculos. Aplicando logaritmo en la
expresión anterior tenemos:

n
 Log(Xi) Log(X1) + Log(X2) +... + Log(Xn)
Log G = ----------------------- = ----------------------------------
n n

Aplicando antilogaritmo

antilog (Log(X1) + Log(X2) +... + Log(Xn))


G = --------------------------------------------------------------
n

La media geométrica solo puede ser calculada para series de datos


positivos, ya que los logaritmos de números negativos no están definidos en

93
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

el campo de los números reales. Por otro lado la media G siempre es menor
que la media aritmética.

Se utiliza fundamentalmente cuando los datos están en progresión geométrica,


cuando interesa promediar razones, en el cálculo de interés compuesto y en el
de números índices.

Ejemplo 02: Calcular la media geométrica de los valores 2, 4, 7, 10, 11 y 18.

6
G =  (2 x 4 x 7 x 10 x 11 x 18)

aplicando logaritmos:

(Log2+Log4+Log7+Log10+Log11+Log18) 5,044854
Log(G) = --------------------------------------------------------- = ------------- = 0.840809
6 6

G = antilog (0,840809) = 6,931

La Media Armónica En Datos No Agrupados: Para una colección de datos


X1, X2,...,Xn , se define la media armónica como el inverso de la media
aritmética de los inversos de los valores. Si la denotamos por H, tenemos:

n n
H = ---------------- = --------------------------------
 1/Xi 1/X1 + 1/X2 + ...... + 1/Xn
i=1

Al igual que la media geométrica, la media armónica no se puede calcular


cuando existe algún valor cero ya que la división entre este número no está
definida. La media H, siempre es menor que la media G y por lo tanto
siempre será menor que la media aritmética.

Su utilidad es en los casos que interesa promediar velocidades y en los


casos en que cantidades variables de productos se ofrecen por una misma
cantidad de dinero ó al contrario, es decir, la misma cantidad de producto se
ofrece a diferentes precios.

Ejemplo 03: Calcule el promedio Armónico de los valores 1, 3, 5 y 7


94
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

4
H = ---------------------- = 2,386
1 1 1 1
--- + --- + --- + ---
1 3 5 7

La Mediana En Datos No Agrupados: La mediana de un conjunto finito de


valores ordenados (de menor a mayor) es aquel valor que divide al conjunto
en dos partes iguales, tales que el número de valores iguales a la mediana
o mayores que ella es igual al número de valores iguales a ella o menores que
ella.

Si el número de valores es impar, la mediana será el valor medio, cuando


todos los valores se han arreglado en orden de magnitud. Cuando el número
de observaciones es par, no se tiene una sola observación en el medio, sino
dos. En este caso, se toma la mediana como la media de las observaciones
del medio, cuando todas las observaciones se han dispuesto en orden de
magnitud.

La mediana se obtiene con el siguiente procedimiento:

1. Se ordenan los datos en forma creciente o decreciente:

3, 5, 6,6, 7, 7, 8, 8, 8,9,9,10

2. Ya ordenados se presentan dos casos:

a) Si el número de datos es par, la mediana corresponde a la


media aritmética de los datos que se encuentran en la
mitad de la colección.

3, 5, 6, 6, 7, 7, 8, 8, 8, 9, 9, 10

b) Si el número de datos es impar la mediana es el dato que


se encuentra a la mitad de la colección.

95
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Por ejemplo, en la colección 24, 26, 27, 29, 30, la mediana es 27.

Sólo existe una mediana para un determinado conjunto de datos. No es


afectada tan drásticamente por los valores extremos como la media
aritmética.

La Moda En Datos No Agrupados: Si se observa cual es el dato que más se


repite en las evaluaciones, se tiene: 3, 5, 6, 6, 7, 7, 8, 8, 8, 9, 9, 10 que es el
ocho. Este valor representa la moda de esta colección, por lo tanto, la moda se
refiere al dato que tiene mayor frecuencia.

Si todos los valores son distintos, no existe moda. Puede existir más de una
moda. Es una medida muy imprecisa e inestable. Pude ser utilizada para
representar datos cualitativos (es la única de las medidas descriptivas).

La Media Aritmética Calculada En Datos Agrupados: Al calcular la media,


se supone que todos los valores que caen dentro de un determinado intervalo
de clase, se localizan en el punto medio del intervalo. El punto medio de un
intervalo de clase se obtiene calculando la media de los limites superior e
inferior del intervalo. Los puntos medios de los intervalos de clase sucesivos
pueden encontrarse sumando la amplitud del intervalo de clase al punto
medio anterior. Para encontrar la media, se multiplica cada punto medio por la
frecuencia correspondiente, se suman estos productos y se divide entre la
suma de las frecuencias.

k
 mi fi
X = ----------
n

No se puede calcular cuando existen intervalos con límites abiertos.

La Media Geométrica Calculada En Datos Agrupados

k
 fi Log(mi )
G = Antilog ------------------
n

96
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

La media Armónica rara vez se calcula para datos agrupados.

La Mediana En Datos Agrupados: Cuando se calcula la media a partir de


datos agrupados, se supone que los valores dentro del intervalo de clase se
localizan en el punto medio; sin embargo, al calcular la mediana se supone
que dichos valores están distribuidos uniformemente en todo el intervalo.
Este método se conoce como interpolación y donde la mediana se obtiene,
luego de localizar el intervalo de clase en donde se encuentra, utilizando el
mismo método que para el caso no agrupado, luego de localizar el intervalo
medianal se procede al calculo de la mediana.

PosMe - Faa
Me= LIMe + ----------------- CMe
fMe
Donde:

LI Me = Limite Inferior del intervalo medianal.


n = Número de observaciones.
Faa = Frecuencia Absoluta Acumulada Ascendente, anterior al
intervalo medianal.
f Me = Frecuencia Absoluta Simple, del intervalo medianal.
C Me = Amplitud del intervalo medianal.

Con:
(a) Si n es par, entonces PosMe = (n/2).

(b) Si n es impar, entonces PosMe = (n/2)+1.

La mediana, puede ser calculada en distribuciones de frecuencias con clases


abiertas, siempre y se conozca el intervalo medianal.

Pasos a seguir para el calculo de la mediana:

1. Se calcula la posición de la mediana, dependiendo de si la distribución


es par o impar
2. Se busca en las frecuencias absolutas acumuladas ascendentes a
aquella que sea igual o inmediatamente superior al valor de la posición
de la mediana.
97
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

3. Al intervalo de clases en donde se encuentra esa frecuencia se


denomina Intervalo de la Mediana o clase medianal, por ser este donde
se encuentra los datos necesarios para calcular la Mediana (sustituyendo
cada valor de la formula por su equivalente en la tabla de distribución de
frecuencias)

Ejemplo 04 : Obtener la media aritmética y la mediana en la distribución


adjunta.

li-1 - li fi
0 - 10 60
10 - 20 80
20 - 30 30
30 - 100 20
100 - 500 10

Solución:

li-1 - li fi ci mi xi mi Fi
0 - 10 60 10 5 300 60
10 - 20 80 10 15 1.200 140
Clase
Medianal 20 - 30 30 10 25 750 170
30 - 100 20 70 65 1.300 190
100 - 500 10 400 300 3.000 200
n = 200 6550

La media aritmética es:

∑ mi * fi 6550
X = --------------- = ------------------ = 32.75
n 200

esto significa que el valor promedio de la muestra estudiada es de 32.75

98
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

La primera frecuencia absoluta acumulada que supera el valor de la posición


del intervalo de clase de la mediana n/2=100 (por ser la distribución par) es Fi
=140. Por ello el intervalo medianal es [10;20). Así sustituyendo en las
formular, tenemos que:

(Pos Me) - Faa


Me = LIme + [ -------------------------------- ] Cme
f me

n 200
Pos me = -------- = --------- = 100
2 2

100 – 60
Me = 10 + [ ---------------] 10
80

40
Me = 10 + [ ------- ] 10  Me = 15.00
80

lo que significa que el 50% de las observaciones de la muestra esta por debajo
de 15.00

La Moda En Datos Agrupados: Se ha definido la moda de un conjunto de


valores como el valor que ocurre con más frecuencia. Cuando se designa la
moda de datos agrupados, se refiere por lo general a la clase modal, la cual es
el intervalo de clase con la frecuencia más alta.Al igual que en la mediana,
para calcular la moda en datos agrupados se utiliza el método de
interpolación de la forma siguiente:

d1
Mo = LIMo + --------- CMo
d1 + d2

Donde:
LIMo = Límite Inferior de la clase modal.

d1 = fMo - faMo

99
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

d2 = fMo - fpMo

CMo = Amplitud del intervalo medianal.

fMo = Frecuencia Absoluta simple de la clase modal.

faMo = Frecuencia Absoluta Anterior a la clase modal

fpMo = Frecuencia Absoluta posterior a la clase modal.

Si fuera una distribución con más de una moda, la formula se aplicará tantas
veces como sea necesario.

Comparación De La Media, La Mediana y La Moda: Se tiene:

 La media aritmética o promedio es el valor obtenido al dividir la suma


de todos los datos de una colección entre el número de datos.
 La mediana es una colección de datos ordenados en forma creciente o
decreciente. La determina el dato que se encuentra en el centro de la
colección, y cuando la colección de datos es un número par, la mediana
es igual a la media aritmética de los dos datos centrales.
 La moda es el dato que aparece con mayor frecuencia en una colección.

Medidas De Forma: Las medidas de forma permiten conocer que forma tiene
la curva que representa la serie de datos de la muestra. En concreto, podemos
estudiar las siguientes características de la curva:

 Concentración: mide si los valores de la variable están más


o menos uniformemente repartidos a lo largo de la muestra.
 Asimetría: mide si la curva tiene una forma simétrica, es
decir, si respecto al centro de la misma (centro de simetría)
los segmentos de curva que quedan a derecha e izquierda
son similares.
 Curtosis: mide si los valores de la distribución están más o
menos concentrados alrededor de los valores medios de la
muestra.

Concentración: Para medir el nivel de concentración de una distribución de


frecuencia se pueden utilizar distintos indicadores, entre ellos el Indice de
Gini.
100
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Este índice se calcula aplicando la siguiente fórmula:

(pi - qi)
IG = ----------------------------
pi
(i toma valores entre 1 y n-1)

En donde pi mide el pocentaje de individuos de la muestra que presentan un


valor igual o inferior al de xi.

n1 + n2 + n3 + ... + ni
Pi = ---------------------------- x 100
n

Mientras que qi se calcula aplicando la siguiente fórmula:

(X1*n1) + (X2*n2) + ... + (Xi*ni)


qi = ----------------------------------------------------- x 100
(X1*n1) + (X2*n2) + ... + (Xn*nn)

El Indice Gini (IG) puede tomar valores entre 0 y 1:

IG = 0 : concentración mínima. La muestra está unifomemente


repartida a lo largo de todo su rango.

IG = 1 : concentración máxima. Un sólo valor de la muestra


acumula el 100% de los resultados.

Medidas De Asimetría: Una distribución es simétrica respecto a un punto


cuando las frecuencias absolutas simples fi estan repartidas de igual manera a
ambos lados del punto.

Cuando una distribución es simétrica, la media, la mediana y la moda


coinciden, mientras que cuando la distribución es asimétrica hacia la derecha
(asimetría positiva) entonces Media > Mediana > Moda, y si la distribución es
101
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

asimétrica hacia la izquierda (asimetría negativa), entonces: Moda > Mediana


> Media.

El grado de asimetría se conoce como sesgo

Obsérvese que la mediana está siempre en el medio de las tres medidas.


Una regla para recordar estas relaciones es que la media, la mediana y la
moda están en el orden alfabético en que aparecen en el diccionario cuando la
distribución es asimétrica a la izquierda y en el orden contrario cuando la
distribución es asimétrica hacia la derecha.

Recíprocamente, conocidas la media y la mediana de una distribución


unimodal, se puede determinar si es asimétrica a la izquierda o a la derecha

Hemos comentado que el concepto de asimetría se refiere a si la curva que


forman los valores de la serie presenta la misma forma a izquierda y derecha
de un valor central (media aritemética)

Coeficiente de asimetría de Pearson

_
3 (X – Me)
ASP = -------------
Se
Si:

 ASP = 0; La distribución es Simétrica


 _
 ASP > 0 => X > Me => Asimetría a la izquierda

 ASP < 0 => X < Me => Asimetría a la derecha

En otras palabras, si:


.

102
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

 ASP = 0; Hay igual datos originales Xi por encima y por debajo de la


media aritmética

 ASP > 0; Hay mas datos originales menores a la media aritmética.

 ASP < 0; Hay mas datos originales mayores a la media aritmética.

Coeficiente de asimetría de Fisher

_
 (Xi – X)3
----------------
n
1 = ------------------ ; para datos no agrupados
S3e

_
 (mi – X)3 fi
----------------
n
1 = ------------------ ; para datos agrupados
S3e

La interpretación es igual que para el coeficiente de asimetría de Pearson.

Otra manera para medir el nivel de asimetría utilizando el Coeficiente de


Asimetría de Fisher, es:

Los resultados pueden ser los siguientes:

 g1 = 0 (distribución simétrica; existe la misma concentración


de valores a la derecha y a la izquierda de la media)
 g1 > 0 (distribución asimétrica positiva; existe mayor
concentración de valores a la derecha de la media que a su
izquierda)

103
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

 g1 < 0 (distribución asimétrica negativa; existe mayor


concentración de valores a la izquierda de la media que a su
derecha)

El Coeficiente de Curtosis o Apuntamiento analiza el grado de


concentración que presentan los valores alrededor de la zona central de la
distribución.

Se definen 3 tipos de distribuciones según su grado de curtosis:

 Distribución mesocúrtica: presenta un grado de concentración


medio alrededor de los valores centrales de la variable (el mismo que
presenta una distribución normal).
 Distribución leptocúrtica: presenta un elevado grado de
concentración alrededor de los valores centrales de la variable.
 Distribución platicúrtica: presenta un reducido grado de
concentración alrededor de los valores centrales de la variable.

Para medir la curtosis utilizaremos el coeficiente ß2 de Pearson, el cual se


calcula por las siguientes expresiones:

 (Xi – X)4
----------------
n
ß2 = ------------------ ; para datos no agrupados
S4e

 (mi – X)4 fi
----------------
n
ß2 = ------------------ ; para datos agrupados
S4e
Si:

104
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

 ß2 = 3; Curva normal ó Mesocúrtica


 ß2 > 3; Curva Leptocúrtica, es decir existe una acumulación de datos
originales en la parte central de la distribución.
 ß2 < 3; Curva Platicúrtica.

Otra manera de verificar el Coeficiente de Curtosis viene definido por la


siguiente fórmula:

Los resultados pueden ser los siguientes:

 g2 = 0 (distribución mesocúrtica).
 g2 > 0 (distribución leptocúrtica).
 g2 < 0 (distribución platicúrtica).

Ejemplo 05: Vamos a utilizar la tabla de distribución de frecuencias con los


datos de la estatura de los alumnos

Variable Frecuencias absolutas Frecuencias relativas


(Valor) Simple Acumulada Simple Acumulada
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0% 100,0%

Vamos a calcular los valores de las distintas posiciones centrales:

105
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

1.- Media aritmética:

(1,20*1) + (1,21*4) + (1,22 * 4) + (1,23 * 2) + ......... + (1,29 * 3) + (1,30 * 3)


Xm = -----------------------------------------------------------------------------------------
30

Luego:

Xm = 1,253

Por lo tanto, la estatura media de este grupo de alumnos es de 1,253 cm.

2.- Media geométrica:

X= ((1,20^ 1) * (1,21^4) * (1,22^ 4) * .....* (1,29^3)* (1,30^3)) ^ (1/30)

Luego:

Xm = 1,253

En este ejemplo la media aritmética y la media geométrica coinciden,


pero no tiene siempre por qué ser así.

3.- Mediana: La mediana de esta muestra es 1,26 cm, ya que por


debajo está el 50% de los valores y por arriba el otro 50%. Esto se
puede ver al analizar la columna de frecuencias relativas
acumuladas.

En este ejemplo, como el valor 1,26 se repite en 3 ocasiones, la


media se situaría exactamente entre el primer y el segundo valor
de este grupo, ya que entre estos dos valores se encuentra la
división entre el 50% inferior y el 50% superior.

4.- Moda: Hay 3 valores que se repiten en 4 ocasiones: el 1,21, el


1,22 y el 1,28, por lo tanto esta seria cuenta con 3 modas.

106
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Vamos a calcular el Coefiente de Asimetría de Fisher de la serie de datos


referidos a la estatura de un grupo de alumnos

Variable Frecuencias absolutas Frecuencias relativas

(Valor) Simple Acumulada Simple Acumulada


X x x x x
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0% 100,0%

Recordemos que la media de esta muestra es 1,253

((xi - x)^3)*ni ((xi - x)^2)*ni


x x
0,000110 0,030467

Luego:
(1/30) * 0,000110
g1 = ------------------------------------------------- = -0,1586
(1/30) * (0,030467)^(3/2)

Por lo tanto el Coeficiente de Fisher de Simetría de esta muestra es -0,1586,


lo que quiere decir que presenta una distribución asimétrica negativa (se
concentran más valores a la izquierda de la media que a su derecha).

107
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Vamos a calcular el Indice Gini de una serie de datos con los sueldos de los
empleados de una empresa (millones bolivares).

Empleados (Frecuencias
Sueldos Frecuencias relativas
absolutas)
(Millones) Simple Acumulada Simple Acumulada
x x x x x
3,5 10 10 25,0% 25,0%
4,5 12 22 30,0% 55,0%
6,0 8 30 20,0% 75,0%
8,0 5 35 12,5% 87,5%
10,0 3 38 7,5% 95,0%
15,0 1 39 2,5% 97,5%
20,0 1 40 2,5% 100,0%

Calculamos los valores que necesitamos para aplicar la fórmula del Indice de
Gini:

Xi fi Fi pi Xi * ni  Xi * ni qi pi - qi
3,5 10 10 25,0 35,0 35,0 13,6 10,83
4,5 12 22 55,0 54,0 89,0 34,6 18,97
6,0 8 30 75,0 48,0 147,0 57,2 19,53
8,0 5 35 87,5 40,0 187,0 72,8 15,84
10,0 3 38 95,0 30,0 217,0 84,4 11,19
15,0 1 39 97,5 15,0 232,0 90,3 7,62
25,0 1 40 100,0 25,0 257,0 100,0 0
 pi (entre 1 y n-1) = 435,0  (pi - qi) (entre 1 y n-1 ) = 83,99

Por lo tanto:

IG = 83,99 / 435,0 = 0,19

108
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Un Indice Gini de 0,19 indica que la muestra está bastante uniformemente


repartida, es decir, su nivel de concentración no es excesivamente alto.

Ahora vamos a analizar nuevamente la muestra anterior, pero considerando


que hay más personal de la empresa que cobra el sueldo máximo, lo que
conlleva mayor concentración de renta en unas pocas personas.

Empleados (Frecuencias
Sueldos Frecuencias relativas
absolutas)
(Millones) Simple Acumulada Simple Acumulada
x x x x x
3,5 10 10 25,0% 25,0%
4,5 10 20 25,0% 50,0%
6,0 8 28 20,0% 70,0%
8,0 5 33 12,5% 82,5%
10,0 3 36 7,5% 90,0%
15,0 0 36 0,0% 90,0%
20,0 4 40 10,0% 100,0%

En este caso obtendríamos los siguientes datos:

Xi ni  ni pi Xi * ni  Xi * ni qi pi - qi
x x x x x x x x
3,5 10 10 25,0 35 35 11,7 13,26
4,5 10 20 50,0 45 80 26,8 23,15
6,0 8 28 70,0 48 128 43,0 27,05
8,0 5 33 82,5 40 168 56,4 26,12
10,0 3 36 90,0 30 198 66,4 23,56
15,0 0 36 90,0 0 198 66,4 23,56
25,0 4 40 100,0 100 298 100,0 0,00
 pi (entre 1 y n-1) = 407,5 x  (pi - qi) (entre 1 y n-1 ) = 136,69

El Indice Gini sería:

IG = 136,69 / 407,5 = 0,34

109
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

El Indice Gini se ha elevado considerablemente, reflejando la mayor


concentración de rentas que hemos comentado.

Ejemplo 06: Vamos a calcular el Coefiente de Curtosis de la serie de datos


referidos a la estatura de un grupo de alumnos

Variable Frecuencias absolutas Frecuencias relativas


(Valor) Simple Acumulada Simple Acumulada
X x x x x
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0% 100,0%

Recordemos que la media de esta muestra es 1,253

i - xm)^4)*ni i - xm)^2)*ni
x x
0,00004967 0,03046667

Luego:

(1/30) * 0,00004967
g2 = ------------------------------------------------- -3 = -1,39
((1/30) * (0,03046667))^2

110
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Por lo tanto, el Coeficiente de Curtosis de esta muestra es -1,39, lo que


quiere decir que se trata de una distribución platicúrtica, es decir, con una
reducida concentración alrededor de los valores centrales de la distribución.

111
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Tema 06.
Medidas De Tendencia No Central

Conceptos clave: percentiles, cuartiles, deciles, distribución par, distribución


impar, datos agrupados, datos no agrupados.

Contenidos

Introducción
Los Percentiles
Pasos a seguir para el calculo del Percentil
Los Cuartiles
Pasos a seguir para el calculo del Cuartil
Los Deciles
Pasos a seguir para el calculo del Decil
Formulas Para El Calculo De Los Percentiles, Cuartiles y Deciles
Relaciones Entre Las Diferentes Medidas De Tendencia No Central.
Ejemplos

112
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Introducción: Una Distribución de Frecuencia se caracteriza por su mediana


en el sentido de que ésta representa la posición central del grupo de
observaciones y como se aclaro en el tema anterior esta divide a la distribución
en dos partes iguales. Por la necesidad del investigador en conocer la
tendencia no solo central de los datos sino determinar su localización y
asimetría es que es necesario de definir un grupo de medidas descriptivas
conocidas como medidas de tendencia no central.

Si en un polígono de frecuencias acumuladas (ojiva) se traza una línea vertical


sobre el eje de las abscisas desde el punto de intersección con la frecuencia
correspondiente al 10 %, se obtiene el valor de la variable en estudio que
deja por debajo al 10 % de la población. Si se repite esta operación para
diferentes valores de la frecuencia acumulada, se puede dividir la
distribución en el número de partes deseadas (percentiles, cuartiles o deciles)

Los Percentiles: El término percentil deriva de "por ciento" y por lo tanto, una
serie de observaciones no podrán tener más de 100 percentiles. Cada uno de
estos percentiles indica al investigador el porcentaje de observaciones que en
determinada colección de datos está por debajo de él. Existen noventa y nueve
percentiles denotados por P1, P2, ....,P50,......,P99. Entre dos percentiles
consecutivos cualesquiera se encuentra el 1% de los datos, es decirentre los
percentiles P8 y P30 se encuentra el 22% de los datos originales. Según esto la
mediana es simplemente el Percentil 50.

La utilidad práctica de los percentiles es que su utilización junto a las medidas


de tendencia central, describe completamente la distribución de la variable.
Clásicamente se han utilizado para construir gráficos de valores estándar de
ciertas medidas de interés, como es el caso de los utilizados para detectar
anomalías de crecimiento infantil.

El uso más común de los percentiles es para comparar un valor individual


con un conjunto de normas, tal es el caso de las medidas de destreza e
inteligencia. También para determinar rangos normales de valores de
laboratorios. Si una variable pudiese asumir muchos valores, la representación
de la proporción del total, menor o igual que un valor, tendría una forma
creciente parecida a la siguiente:

113
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Si en este conjunto de valores se quiere encontrar el percentil 20, la solución


gráfica es muy simple

Como puede verse, el valor de la variable bajo el cual se encuentra un 20% de


los valores, es algo mayor que 2. En forma aproximada se podría conocer los
percentiles usando este tipo de gráfico.

Pasos a seguir para el calculo del Percentil:

1. Se calcula la posición del percentil, dependiendo de si la distribución es


par o impar
2. Se busca en las frecuencias absolutas acumuladas ascendentes a
aquella que sea igual o inmediatamente superior al valor de la posición
del percentil.
3. Al intervalo de clases en donde se encuentra esa frecuencia se
denomina Intervalo del Percentil “i”, por ser este donde se encuentra los
datos necesarios para calcular del Percentil (sustituyendo cada valor de
la formula por su equivalente en la tabla de distribución de frecuencias)
114
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Los Cuartiles: Es la medida descriptiva que divide a la colección de datos, la


cual ha sido ordenada en forma creciente, en cuatro partes iguales. El primer
cuartil Q1, es la mediana de todos los valores a la izquierda de la posición de la
mediana en relación con el conjunto total de datos. El segundo cuartil Q2, es la
mediana. El tercer cuartil Q3, es la mediana de todos los valores a la
derecha de la posición de la mediana en relación con el conjunto total de
datos.

Donde por debajo del Q1 se encuentra el 25% de los datos, el 75% esta por
debajo del Q3 y el Q2= Me= P50.

En términos generales, se determina Q3, contando los mismos espacios que


para Q1. Con esta definición siempre hay tantos valores a la izquierda de Q1,
como entre Q1 y Q2, entre Q2 y Q3 y a la derecha de Q3.

Pasos a seguir para el calculo del Cuartil:

1. Se calcula la posición del cuartil, dependiendo de si la distribución es par


o impar
2. Se busca en las frecuencias absolutas acumuladas ascendentes a
aquella que sea igual o inmediatamente superior al valor del posición de
la cuartil.
3. Al intervalo de clases en donde se encuentra esa frecuencia se
denomina Intervalo del cuartil “i”, por ser este donde se encuentra los
datos necesarios para calcular del cuartil (sustituyendo cada valor de la
formula por su equivalente en la tabla de distribución de frecuencias)

Los Deciles: Divide a la colección de datos en 10 partes iguales, cada parte


contiene un 10% de las observaciones. Existen nueve deciles denotados por
D1,D2,D3,...,D9. Es decir por debajo del D1 hay el 10% de los datos, 20% por
debajo del D2, 40% por debajo del D4, 90% por debajo del D9. Hay que resaltar
que D5= Q2= Me= P50.

Pasos a seguir para el calculo del Decil:

1. Se calcula la posición del Decil, dependiendo de si la distribución es par


o impar
2. Se busca en las frecuencias absolutas acumuladas ascendentes a
aquella que sea igual o inmediatamente superior al valor de la posición
del decil.
115
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

3. Al intervalo de clases en donde se encuentra esa frecuencia se


denomina Intervalo del decil “i”, por ser este donde se encuentra los
datos necesarios para calcular del decil (sustituyendo cada valor de la
formula por su equivalente en la tabla de distribución de frecuencias)

Formulas Para El Calculo De Los Percentiles, Cuartiles y Deciles

Datos No Agrupados Datos Agrupados

(a) Caso impar


PosPi - Faa
Pi = LIPi + ---------------- CPi
i fPi
Pi = ----- (n + 1); para i = 1,.....,99
100
Donde:
LIPi = Limite Inferior del intervalo
percentil
n = Número de observaciones.
Faa = Frecuencia Absoluta
Acumulada Ascendente, anterior al
intervalo percentil
fPi = Frecuencia Absoluta Simple,
del intervalo percentil
CPi = Amplitud del intervalo percentil

Si n es par, entonces
PosPi = (n/100) * i.

(b) Caso par Si n es impar, entonces


i PosPi = ((n+1)/100) * i.
Pi = ----- n; para i = 1,.....,99
100

116
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Datos No Agrupados Datos Agrupados

Caso impar
PosQi - Faa
Qi = LIQi + ---------------- CQi
i fQi
Qi = ----- (n + 1); para i = 1,.....,3
4
Donde:
LIQi = Limite Inferior del intervalo
cuartil
n = Número de observaciones.
Faa = Frecuencia Absoluta
Acumulada Ascendente, anterior al
intervalo cuartil
fQi = Frecuencia Absoluta Simple,
del intervalo cuartil
CQi = Amplitud del intervalo cuartil

Si n es par, entonces
PosQi = (n/4) * i.

Caso Par Si n es impar, entonces


i PosQi = ((n+1)/4) * i.
Qi = ----- n; para i = 1,.....,93
4

117
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Datos No Agrupados Datos Agrupados

Caso impar
PosDi - Faa
Di = LIDi + ---------------- CDi
i fDi
Di = ----- (n + 1); para i = 1,.....,9
10
Donde:
LIDi = Limite Inferior del intervalo decil
n = Número de observaciones.
Faa = Frecuencia Absoluta
Acumulada Ascendente, anterior al
intervalo decil
fDi = Frecuencia Absoluta Simple,
del intervalo decil
CDi = Amplitud del intervalo decil

Si n es par, entonces
PosDi = (n/10) * i.

(c) Caso par Si n es impar, entonces


i PosDi = ((n+1)/10) * i.
Di = ----- n; para i = 1,.....,9
10

Relaciones Entre Las Diferentes Medidas De Tendencia No Central: Entre


las medidas de tendencia no central se establecen las siguientes relaciones:

118
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Cuartiles y Percentiles: Q1 = P25


Q2 = P50
Q3 = P75

Deciles y Percentiles: D1 = P10


D2 = P20
D3 = P30
D4 = P40
D5 = P50
D6 = P60
D7 = P70
D8 = P80
D9 = P90

Cuartiles y Deciles: Q2 = D5

Ejemplos : Vamos a calcular los cuartiles de la serie de datos referidos a la


estatura de un grupo de alumnos Los deciles y percentiles se calculan de igual
manera, aunque haría falta distribuciones con mayor número de datos.

Variable Frecuencias absolutas Frecuencias relativas


(Valor) Simple Acumulada Simple Acumulada
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0% 100,0%

119
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

1º cuartil: es el valor 1,22 cm, ya que por debajo suya se situa el


25% de la frecuencia (tal como se puede ver en la columna de la
frecuencia relativa acumulada).

2º cuartil: es el valor 1,26 cm, ya que entre este valor y el 1º


cuartil se situa otro 25% de la frecuencia.

3º cuartil: es el valor 1,28 cm, ya que entre este valor y el 2º


cuartil se sitúa otro 25% de la frecuencia. Además, por encima
suya queda el restante 25% de la frecuencia.

Atención: cuando un cuartil recae en un valor que se ha repetido más de una


vez (como ocurre en el ejemplo en los tres cuartiles) la medida de posición no
central sería realmente una de las repeticiones.

120
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Tema N° 07
Medidas De Dispersión

Conceptos clave: rango, varianza, desviación estandar, coeficiente de


variación, intervalo intercuartil, distribución par, distribución impar, datos
agrupados, datos no agrupados.

Contenidos

Introducción
Rango
La Varianza Datos No Agrupados
La Varianza Datos Agrupados
Desviación Estándar
Coeficiente De Variación
Recorrido Intercuartil
Desviación Cuartil
Intervalo Intercuartil
Uso De Las Diferentes Medidas De Dispersión
Ejemplos

121
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Introducción: La dispersión de un conjunto de observaciones, se refiere a la


variedad que exhiben los valores de las observaciones. Si todos los valores
son iguales, no hay dispersión; si no todos son iguales, hay dispersión en los
datos. La magnitud de la dispersión puede ser pequeña, cuando los valores,
aunque distintos, están muy próximos entre sí. Si los valores están
ampliamente "desparramados", la dispersión es mayor. Otros términos
sinónimos de dispersión son los de variación y diseminación.

Una característica importante de casi todos los tipos de datos es que los
valores no son iguales, y el grado al cual sean desiguales o varíen entre ellos
mismos es de importancia básica en la Bioestadística.

Rango: Las medidas de tendencia central proporcionan una información


parcial sobre la distribución de la variable. Además interesa conocer si los
valores de las variables están muy dispersos o si se encuentran agrupados
alrededor de la media. La manera más simple de conocer esta dispersión es
por medio del rango o recorrido, que se define como la diferencia entre el
valor menor y el mayor de un conjunto de observaciones.

R = Xmáx - Xmín

La utilidad del recorrido es limitada. El hecho de que sólo tome en cuenta dos
valores, hace que sea una medida pobre de la dispersión. Su ventaja principal
es la sencillez de su calculo.

En el caso de datos agrupados en distribuciones de frecuencias, el recorrido


se obtiene restando al Límite superior de la última clase el Limite inferior de la
primera clase.

La Varianza: Cuando los valores de un conjunto de observaciones están muy


próximos a su media, la dispersión es menor que cuando están distribuidos
sobre un amplio recorrido. Dado que esto es cierto, intuitivamente sería
interesante el hecho de que se pudiera medir la dispersión con respecto a la
diseminación de los valores en torno a su media aritmética. Dicha medida se
realiza en lo que se conoce como Varianza y se denota por S2, el cual toma los
desvíos de los valores con respecto a la media elevados al cuadrado.

Datos No Agrupados: Para calcular la Varianza, se resta la media de cada


uno de los valores, se elevan al cuadrado las diferencia y, a continuación, se
suman. Esta suma de las desviaciones de los valores de su media (elevadas
122
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

al cuadrado) se divide entre el tamaño de la media, menos 1, para obtener la


Varianza.
_
(Xi - X)2
S2 = ------------------
n-1

Cuando el número de observaciones es grande, la fórmula siguiente puede


ser menos incómoda, especialmente cuando se utiliza una calculadora.

n (Xi)2 - (Xi)2
2
S = -----------------------------
n(n-1)

La Varianza, representa unidades al cuadrado y, por lo tanto, no es una


medida de dispersión apropiada cuando se desea expresar este concepto en
términos de las unidades originales.

Mientras más alejados estén los valores de su media, entonces mayor será el
valor de la Varianza y mientras más concentrados se encuentren alrededor de
su media, menor será el valor de la Varianza.

Datos Agrupados: Al calcular la Varianza a partir de datos agrupados, se


supone que todos los valores que caen dentro de un determinado intervalo
de clase, se localizan en el punto medio del mismo. Se recordará que ésta es
la hipótesis que se planteó al calcular la media y la moda.
k _
 (mi-X)2 fi
S2 = ---------------
n-1

Cuando el número de observaciones es grande, la fórmula siguiente puede


ser menos incómoda, especialmente cuando se utiliza una calculadora.

k k
n (mi) fi - (mi fi)2
2
2
S = --------------------------------
n(n-1)
Donde:

123
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

k = Número de intervalos de clase.


mi = Marca de clases.
fi = Frecuencia Absoluta simple de la clase.

Desviación Estándar: La desviación estándar o típica (SE) es una constante


universalmente utilizada para medir la variabilidad en una muestra o
población. Su valor se expresa de un modo absoluto y en las mismas
unidades que aquellas que se utilizan para medir las observaciones
individuales en la población y establecer las clases. Su valor indica el valor
absoluto que en promedio se desvían los datos individuales de una población
o muestra, más o menos, de la media de dicha muestra o población.

Tanto para datos agrupados como para datos no agrupados, la Desviación


Estándar, no es mas que la raíz cuadrada de la Varianza

SE = S2

La pregunta sería ¿Cómo se interpreta?

La Desviación Estándar se interpreta como la distancia en que se encuentran


la mayoría de los valores ya sea por debajo o por encima de la media.

Como medidas de variabilidad más importantes, conviene destacar algunas


características de la varianza y desviación típica:

a) Son índices que describen la variabilidad o dispersión y por tanto cuando


los datos están muy alejados de la media, el numerador de sus fórmulas
será grande y la varianza y la desviación típica lo serán.
b) Al aumentar el tamaño de la muestra, disminuye la varianza y la
desviación típica. Para reducir a la mitad la desviación típica, la muestra
se tiene que multiplicar por 4.
c) Cuando todos los datos de la distribución son iguales, la varianza y la
desviación típica son iguales a 0.
d) Para su cálculo se utilizan todos los datos de la distribución; por tanto,
cualquier cambio de valor será detectado.
e) La Desviación Estándar se utiliza, cuando se desea expresar y obtener
una medida de dispersión en las unidades originales.
f) La Varianza al igual que la Desviación Estándar, jamás podrán ser
negativas, la primera por ser una medida elevada al cuadrado y la

124
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

segunda por ser el resultado de una raíz de un número siempre


positivo.

Coeficiente De Variación: Una de las medidas de dispersión relativa (que no


depende de las unidades de los datos de origen) es el coeficiente de variación
el cual se define como el cociente entre la Desviación Estándar y la Media
Aritmética multiplicado por 100, denotada por CV.

SE
CV = ----- * 100
_
X

Es decir que el coeficiente de variación es la porción o tanto por ciento de la


media que representa la Desviación Estándar.

Recorrido Intercuartil: Comprende un 50% de las observaciones, y refleja la


dispersión en la parte central de la distribución.

RQ = Q3 – Q1

Desviacion Cuartil: Recorrido Semi-Intercuartil, se calcula como el cociente


entre el Recorrido Intercuartil y 2, es decir:

Q3 – Q1 RQ
DQ = ------------------- = -------------
2 2

Intervalo Intercuartil: Es aquel comprendido entre el primer cuartil y el


tercer. Se define como la semi suma entre el Q3 y el Q1, si la distribución es
perfectamente simétrica ó sin sesgo pueden asegurar que Me = DQ.

Q 3 + Q1
IQ = ---------------
2

Uso De Las Diferentes Medidas De Dispersión: Las indicaciones siguientes


ayudan a los investigadores a decidir cuál medida de dispersión usar para un
conjunto de datos.

125
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

a) La desviación estándar se emplea cuando también es apropiado el


uso de la media es decir, con distribuciones simétricas de datos
numéricos.
b) Percentiles y rango intercuartílico se emplean en dos casos:
i. Cuando se usa la mediana.
ii. Cuando se utiliza la media pero con el objetivo es
comparar observaciones individuales con un conjunto de
normas.
c) El rango intercuartílico se usa para describir el 50 % central de la
distribución, sin importar su forma.
d) El Rango es una media apropiada para datos numéricos cuando el
propósito es enfatizar valores extremos.
e) El coeficiente de variación es útil cuando la intención es comparar dos
distribuciones numéricas medidas en escalas diferentes.

Ejemplo 01: Vamos a utilizar la serie de datos de la estatura de los alumnos y


vamos a calcular sus medidas de dispersión.

Variable Frecuencias absolutas Frecuencias relativas


(Valor) Simple Acumulada Simple Acumulada
x x x x x
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0% 100,0%

1.- Rango: Diferencia entre el mayor valor de la muestra (1,30) y el menor


valor (1,20). Luego el rango de esta muestra es 10 cm.

126
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

2.- Varianza: recordemos que la media de esta muestra es 1,253. Luego,


aplicamos la fórmula:

Por lo tanto, la varianza es 0,0010

3.- Desviación típica: es la raíz cuadrada de la varianza.

Luego:

4.- Coeficiente de variación de Pearson: se calcula como cociente entre la


desviación típica y la media de la muestra.

Cv = 0,0320 / 1,253

Luego,

Cv = 0,0255

El interés del coeficiente de variación es que al ser un porcentaje permite


comparar el nivel de dispersión de dos muestras. Esto no ocurre con la
desviación típica, ya que viene expresada en las mismas unidas que los datos
de la serie.

Por ejemplo, para comparar el nivel de dispersión de una serie de datos de la


altura de los alumnos de una clase y otra serie con el peso de dichos alumnos,
no se puede utilizar las desviaciones típicas (una viene vienes expresada en
cm y la otra en kg). En cambio, sus coeficientes de variación son ambos
porcentajes, por lo que sí se pueden comparar.

Ejemplo 02: Se tienen dos conjuntos de valores:

Conjunto 1: 42 46 44 48 50

Conjunto 2: 16 66 76 26 46

127
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Determinemos para ambos conjunto su media aritmética:

Conjunto 1: = = = 46

Conjunto 2: = = = 46

Como se puede apreciar ambos conjunto tienen la misma media aritmética.

Veamos gráficamente como se distribuyen los valores con respecto a sus


medias:

Conjunto 1: 42 44 46 48 50

----------------------------------------------------------------------------

Conjunto 2: 16 26 46 66 76

Como se observa en el conjunto 1 los valores se encuentran más agrupados


alrededor de su media que en el conjunto 2, es decir en el conjunto 2 los
valores se encuentran más dispersos con respecto a su media. Esto nos
indica que para describir mejor un conjunto de valores además de la
información que nos suministra el valor de tendencia central necesitamos de
otras medidas que nos den información sobre la dispersión de los valores con
respecto a su media.

Ejemplo 03:

La Varianza: Tomemos los valores del conjunto 1 y determinemos su varianza:

42 46 44 48 50

Primero calculamos la media para el conjunto:

128
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

= = = 46

Ahora podemos determinar la varianza:

S2 =

S2= = = =10

Tomemos ahora los valores del conjunto 2 y determinemos también su


varianza:

Primero calculamos la media del conjunto:

= = = 46

Ahora determinaremos la varianza:

S2 =

S2= = = =650

La varianza presenta un inconveniente que el resultado es cuadrático,


mientras que los valores son lineales. ¿Qué hacer?

129
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

DESVIACIÓN ESTÁNDAR O TÍPICA: se define como la raíz cuadrada de la


Varianza de esta forma se expresa en las mismas unidades de los datos
originales y es por esa razón que es preferible.

Calculemos ahora la desviación estándar para cada conjunto de valores.

Para el conjunto 1 sería:


S= = 3.16

Para el conjunto 2 sería:


S= =25.4

Para el conjunto 1 se interpreta que la mayoría de los valores están entre :


42.84 (Por debajo de la media 46-3.16=42.84) y 48.82 (Por encima de la media
46+3.16=49.16).

Para el conjunto 2 se interpreta que la mayoría de los valores están en el


intervalo:
20.6 (Por debajo de la media 46 - 25.4) y 71.4 (Por encima de la media 46-
25.4).

Apliquemos el coeficiente de variabilidad para el conjunto1 y conjunto 2:

Conjunto 1:

CV= * 100= 6.8

Conjunto 2:

CV= * 100= 55.21

Hay mayor variabilidad donde el Coeficiente de Variabilidad sea mayor. N


este caso en el conjunto 2.

130
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Tema N° 08.
Estadísticas Vitales,
Indicadores Demográficos

Conceptos clave: proporción, porcentaje, tasa, prevalencia, incidencia, riesgo


relativo, sensibilidad, mortalidad, natalidad, morbilidad, epidemia, endemia,
pandemia.

Contenidos:

Introducción
¿Qué son las estadísticas vitales?
¿Cuál es la importancia de las estadísticas vitales?
¿Para qué sirven las estadísticas vitales?
¿Cuál es la relación de las estadísticas vitales con otras fuentes estadísticas?
¿A qué nivel han sido adoptadas en Venezuela las recomendaciones
Internacionales?
¿Qué indicadores se pueden obtener a partir de las estadísticas vitales?
Población
Estadística de Nacimiento
Estadística de Defunción
Estadística de Defunciones Fetales
Estadística de Divorcio
Proporción
 Poblacional
 Muestral
Porcentaje
Razones
 Poblacional
 Muestral
Índices
 Masculinidad
 Vital
Tasas
 Esperanza de Vida al Vacer (EVN)
 Tasa Global de Fecundidad (TGF)
 Tasa de Crecimiento Anual de la Población
 Número de Nacimientos Registrados
 Tasa Bruta de Natalidad
 Número de Defunciones Registradas
131
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

 Porcentaje de Población menor de 15 años


 Porcentaje de Población de 65 años y más
 Tasa de Mortalidad Infantil
 Tasa de Mortalidad Infantil Neo-Natal
 Tasa de Mortalidad Infantil PosNeonatal
 Tasa de Mortalidad Perinatal
 Tasas Estimadas de Mortalidad
 Tasa de Mortalidad General
 Tasa de Mortalidad en Menores de 5 años (UNICEF)
 Proporción de la Mortalidad Infantil debida a Afecciones originadas en el
Período Perinatal
 Mortalidad Materna
 Morbilidad General
 Incidencia
 Prevalencia
 Morbilidad por Causa
 Mortalidad por Grupo de Edad
 Mortalidad Fetal
 Mortalidad por Causa
Tablas de Indicadores Sociales y Demográficos de Venezuela

132
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Introducción: El profesional de la salud particularmente llega a un diagnóstico


y a un plan de tratamiento para un solo paciente por medio de una historia
clínica, un examen físico y varias pruebas de laboratorio. De esta manera
podemos considerar a las comunidades como organismos vivientes, para las
cuales el grupo de salud pública esta formado por los profesionales de las
diferentes áreas de la salud (Médicos, Lic. en Enfermería, Lic. en Nutrición y
Dietética, Bionalistas, Odontólogos, etc.). Para llevar a cabo eficientemente sus
labores el grupo de salud pública debe utilizar las herramientas y técnicas
adecuadas para evaluar el estado de salud de la comunidad. Los datos con los
cuales trabaja el grupo de salud por lo general son datos demográficos de la
comunidad (número de nacimientos, muertes, enfermedades), los cuales
permiten calcular diversas tasas, razones, proporciones e índices (indicadores
demográficos)

¿Qué Son Las Estadísticas Vitales? Las Estadísticas Vitales son el resultado
del recuento de los hechos más importantes de la vida de la población de un
país, como son los nacimientos, defunciones, defunciones fetales, matrimonios
y divorcios.

¿Cuál Es La Importancia De Las Estadísticas Vitales? La generación de


información demográfica en cualquier país, constituye la base fundamental
para analizar la composición y estructura de su población, lo cual permite
proponer políticas de población para planear su desarrollo económico y social.
La utilidad de las Estadísticas Vitales en este proceso es fundamental, por que
los datos estadísticos continuos permiten ahondar sobre la tendencia del
crecimiento de la población, basándose en las tasas de natalidad y mortalidad.

Adicionalmente proporcionan la información para analizar los niveles de


fecundidad y su relación con otras variables como son: grupos de edad, nivel
de escolaridad, estado civil, medio urbano - rural, etc.

Por otro lado, con la información estadística de matrimonios y divorcios es


posible conocer: el volumen, la duración del matrimonio, las edades al casarse
y al divorciarse, la escolaridad, condición de actividad y ocupación de los
contrayentes y de los divorciados. Es preciso mencionar que con esta
información se pueden definir programas de acción encaminados a promover el
bienestar social, y apoyar acciones en los ámbitos de: La urbanización y
planificación de viviendas, construcción de escuelas y hospitales; programas
de salud y seguridad social y la producción de bienes de consumo, entre otros.

133
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

¿Para Qué Sirven Las Estadísticas Vitales? Las Estadísticas Vitales son
elementos básicos para el análisis demográfico de la situación de un país, así
como uno de los requisitos para poder llevar a cabo la planificación del
desarrollo económico y social. Además, proporcionan información sobre la tasa
y la tendencia del crecimiento natural de la población, sobre la conducta de sus
componentes, su distribución geográfica y mediante su agregación a lo largo
del tiempo, sobre el tamaño de la población y su estructura. Por otro lado
permiten identificar a los grupos demandantes de servicios médicos,
educación, vivienda, etc.

Cabe señalar que los factores demográficos, están relacionados con factores
económicos y sociales que abarcan un aspecto importante en el proceso de
desarrollo del país, como son la urbanización, la educación, vivienda, ingreso,
estructura familiar, trabajo, etc.

Una mayor información sobre dichos factores, no solamente mejorará la


compresión de los factores demográficos, sino que también proporcionará, los
elementos necesarios para la elaboración de programas sociales por parte de
la administración pública; así como su
vigilancia y evolución.

¿Cuál Es La Relación De Las Estadísticas Vitales Con Otras Fuentes


Estadísticas? Respecto a su relación con otras fuentes de información
estadística como: censos y encuestas, hay que subrayar que estas fuentes de
información describen aspectos similares de la población, con la diferencia de
que tanto los censos como las encuestas, permiten tener resultados periódicos
de la dinámica poblacional (en el caso de los censos generalmente cada 10
años), mientras que las Estadísticas Vitales permiten obtener información
continua del crecimiento poblacional.

En algunos trabajos de carácter demográfico, tanto los Censos como las


Estadísticas Vitales se hacen dependientes de manera recíproca; por ejemplo,
cuando se trata de medir la calidad de un censo, generalmente se hace a partir
de las estadísticas vitales, al tomar de éstas los datos observados, y luego con
los datos obtenidos en el censo, se calcula un factor de corrección, el cual se
aplica a la información que previamente se le hayan detectado errores de
omisión.

Asimismo las encuestas tienen la particularidad de retomar parte del universo


de la información demográfica, tanto de los censos como de los registros

134
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

administrativos para estudiar sus características y confirmar su


comportamiento.

Otra manifestación importante de la relación que existe entre estas


estadísticas, es el caso de la construcción de la población base para las
proyecciones de población, la cual se obtiene a partir de lo que se conoce
como conciliación censal.

¿A Qué Nivel Han Sido Adoptadas En Venezuela Las Recomendaciones


Internacionales? La Organización de las Naciones Unidas (ONU), en su afán
para que los países puedan poner en su adecuada perspectiva de desarrollo
sus sistemas de estadísticas vitales, ha elaborado una serie de manuales, a
través de los cuales es posible estudiar las prácticas del registro civil y las
estadísticas vitales, y establecer normas estadísticas, conceptos, definiciones y
procedimientos uniformes.

En el "Manual de Sistemas y Métodos de Estadísticas Vitales", se recomienda


homogeneidad en el manejo de las estadísticas vitales, a fin de garantizar la
comparabilidad internacional, además resalta la importancia que tiene extender
esa comparabilidad con los censos, de tal forma que pueda darse la
retroalimentación necesaria entre éstos y las estadísticas vitales, lo cual va en
beneficio de la consolidación del Sistema Nacional de Información Estadística.

En cuanto a las estadísticas de defunciones además de los manuales de la


ONU, se basan en las normas y reglas establecidas en la "Clasificación
Internacional de Enfermedades" elaborada por la Organización Mundial de la
Salud (OMS).

¿Qué Indicadores Se Pueden Obtener A Partir De Las Estadísticas


Vitales? La construcción de indicadores a partir de estas estadísticas, juega un
papel importante en la medida en que permite conocer un fenómeno a través
de la combinación de dos o más variables y a partir del dato obtenido analizar
su comportamiento, magnitud o alcance, ya sea para la planificación y en su
caso, para la solución de los problemas de nuestro país. Por ejemplo, el
número de nacimientos: si en Venezuela se tiene como una meta que todos los
partos ocurran en hospitales, esta información es un indicador tanto de la
capacidad hospitalaria, como de la población objeto de atención en los
programas de salud materno-infantil.

El número de defunciones por zonas, regiones y entidades federativas, obliga a


las autoridades de salud a dar respuestas y lo más importante a buscar
135
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

soluciones a preguntas como: ¿Cuántas vidas se están perdiendo?, ¿De qué


se están muriendo?; desde el punto de vista epidemiológico y de salud pública,
conocer el número de defunciones

Población: Todos los habitantes de un país, territorio o área. A los efectos


demográficos es el número de habitantes que viven efectivamente dentro de
los limites fronterizos del país. Territorio o área. La población a mitad del año
se refiere a la población de facto al 1o. de julio.

Estadística de Nacimientos Esta estadística refleja la frecuencia con que


ocurren los nacimientos en todo el país. En dicha estadística, como en todas
las estadísticas vitales, además de medir la intensidad de ocurrencia, se captan
algunas de las características que trae consigo un nacimiento, por ejemplo:
lugar de atención del parto, persona que atendió el parto, sexo del registrado,
orden del parto, lugar de residencia habitual de la madre y condición de
actividad de los padres, su escolaridad y edad, entre otras. La intención de
estudiar las características que identifican al nacimiento, así como a cada uno
de los hechos vitales, es determinar las condiciones sociales y económicas en
que se desarrollan cada uno de ellos. En el caso de los nacimientos, una vez
obtenido su volumen y desglose según cada una de sus características, es
posible conocer entre otros aspectos, el sistema de salud materno-infantil, los
programas de planificación familiar, la efectividad de las campañas de registro
así
como detectar las necesidades de servicios y recursos médicos y materiales de
la población.

Estadística de Defunciones Con este término se identifica al recuento de los


decesos ocurridos en el país referido a un período determinado, generalmente
de un año. Como en otros casos, aquí también se investigan las características
principales que identifican el hecho; edad, sexo, causa de la muerte, lugar de
residencia habitual del fallecido, entre otras.

Con lo anterior, es posible colocar en su adecuada perspectiva el nivel de


mortalidad que se está observando en el país, así como determinar las causas
que originan las muertes e identificar los diferenciales de mortalidad que se dan
a nivel de entidades, municipios y localidades.

Estadística de Defunciones Fetales Este concepto coincide en su esencia


con lo que se conoce como la pérdida del producto de un embarazo, y se le
denomina así a la muerte ocurrida con anterioridad a la expulsión o extracción
completa del cuerpo de la madre, de un producto de la concepción,
136
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

independientemente de la duración del embarazo. Se puede llamar como


estadística de defunciones fetales a la recopilación de la información referente
a todas las defunciones fetales acontecidas en el país.

Por otro lado, la creación de un sistema de información sobre defunciones


fetales, tiene un carácter tanto médico como social, ya que reflejan los
progresos logrados en la reducción de la mortalidad infantil y hacen posible que
los servicios sanitarios sean dirigidos adecuadamente a resolver el problema
que representan las pérdidas de embarazos; esto será posible en la medida en
que se cuente con un sistema de información que nos permita identificar con
mayor precisión el problema.

De la misma forma que los demás hechos vitales, la estadística de matrimonios


se integra mediante la recopilación de la información referente a los
matrimonios civiles celebrados en el país. El objeto de contabilizar todos los
matrimonios tiene un carácter sociocultural, demográfico y económico. Conocer
el volumen de los matrimonios, así como sus características, permite saber en
qué medida se da la formación de nuevas familias; además, hace ver a qué
edad están llegando las parejas al matrimonio; éstas y otras características
captadas al levantar un acta de matrimonio, son aspectos relacionados con la
fecundidad, la cual es la variable que más influye en la dinámica de la
población.

Estadística de Divorcios La estadística de divorcios es el recuento de las


disoluciones legales de los matrimonios registrados en todo el país. Este hecho
está identificado por características que se captan al realizar un divorcio, las
cuales se refieren a: causa del divorcio lugar de registro, lugar de residencia
habitual, nivel de escolaridad de los divorciados, edad y fecha de registro del
hecho, la cual comparada con la fecha en que se dio la unión matrimonial,
permite determinar la duración del matrimonio (condición que está relacionada
con la fecundidad).

Proporción: Es el peso que tiene una variable con respecto al total, se


relaciona con la frecuencia relativa simple (hi) vista en el tema correspondiente
a T.D.F.

Proporción Poblacional

X
 = -----
N
137
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Proporción Muestral
x
p = -----
n

Porcentaje: Es la proporción multiplicada por 100

Razones: Es la relación entre dos fenómenos independientes, multiplicado por


K (los valores utilizados con mayor frecuencia son 1 y 100). Por ejemplo, la
razón de personas-médicos, la razón de personas-camas en el I.A.H.U.L.A.

El propósito del multiplicador K, llamado base, es evitar resultados que


comprendan números muy pequeños que puedan surgir en el cálculo de las
tasas, y facilitar la comprensión de estas últimas. El valor elegido de K depende
de la magnitud del numerador y del denominador.

Razón Poblacional
X
R = -----
Y

En donde:
X: Es la variable a pesar
Y: Es la variable a comparar

Razón Muestral
x
r = -----
y
En donde:
x: Es la variable a pesar
y: Es la variable a comparar

Índices: Es la razón multiplicada por 100

X
I = ----- por 100
Y
En donde:
X: Es la variable a pesar
Y: Es la variable a comparar
138
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Índice De Masculinidad
Nacidos varones
IM = ------------------------ por 100
Nacidas hembras

1.1 Índice Vital

Nacidos vivos
IV = ---------------------------- por 100
Defunciones totales

Tasas: Es el número de veces que ocurre un fenómeno en un lugar


determinado y en un lapso determinado sobre el total de la población para el
1ero. de Julio, multiplicado por una potencia de 10.

Aun cuando hay algunas excepciones, este término se utiliza por lo general
para referirse a aquellos cálculos que implican la probabilidad de que ocurra
algún evento. Una tasa se expresa en la siguiente forma:

a
-------- por K
a+b

Donde:

 a = es la frecuencia con la cual se ha presentado un evento durante


algún período especificado.

 a + b = es el número de personas expuestas al riesgo del evento


durante el mismo período.

 K = algún número como 10, 100, 1000, 10000 ó 100000

El propósito del multiplicador K, llamado base, es evitar resultados que


comprendan números muy pequeños que puedan surgir en el cálculo de las
tasas, y facilitar la comprensión de estas últimas. El valor elegido de K depende
de la magnitud del numerador y del denominador.

Esperanza De Vida Al Nacer (EVN): Para una población y año determinado,


es el número promedio de años que un nacido vivo en dicha población y año,
puede esperar a vivir si se mantuvieran constantes durante su vida las tasas de
139
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

mortalidad por edad de dicho año. Se calcula como el cociente entre el número
total de años que una cohorte de niños recién nacidos llegaría vivir si estuviera
expuesta, a lo largo de su vida, a dichas tasas de mortalidad (numerador) y el
tamaño de la cohorte (denominador). Unidad de medida: Años

Tasa Global De Fecundidad (TGF): Para un determinado año o período, es el


número promedio de hijos que habría tenido una mujer (o grupo de mujeres)
durante su vida, si sus años de reproducción transcurrieran conforme las tasas
de fecundidad por edad de dicho año. Por lo general se trabaja con mujeres de
15 a 44 años ó de 15 a 49 años. Se calcula sumando las tasas de fecundidad
por edad para todas las edades consideradas y multiplicando el resultado por
el tamaño del intervalo en el cual las edades fueron agrupadas, que por lo
general es 5. Unidad de medida: Hijos por mujer

Tasa De Crecimiento Anual De La Población: Es la razón, para un año


determinado, entre el incremento anual de la población y la población total. El
cálculo podría hacerse simplemente por el cociente entre el incremento anual -
nacimientos menos defunciones más inmigrantes menos emigrantes - en el
año (numerador) y la cantidad total de la población (denominador), estimada,
por lo general, a mitad del año. Sin embargo, por la dificultad de obtención de
los datos, en general se calcula a partir del resultado de dos censos. La tasa se
debe expresar como porcentaje. Unidad de medida: Por ciento

Número De Nacimientos Registrados: Número total de nacidos vivos


inscritos en el registro civil en un año determinado. Unidad de medida:
Nacimientos

Tasa Bruta De Natalidad: Es la razón, en un determinado año, entre el


número de nacidos vivos en una población y la cantidad de habitantes de dicha
población. El numerador es el número de nacimientos que ocurren durante el
año y el denominador es el total de la población (estimada, por lo general, a
mitad del año) donde han ocurrido esos nacimientos. Es costumbre multiplicar
este cociente por 1.000. Unidad de medida: Por 1.000 habitantes Esta tasa es
la medida de fertilidad (se refiere al acto de dar a luz, contrario a la capacidad
de concebir, fenómeno para el cual se utiliza el término fecundidad) que se
utiliza más ampliamente. Conocer la esta tasa en una comunidad es importante
para quienes se dedican a la salud pública, ya que de esta forma se pueden
planificar los servicios e instalaciones para las madres, bebés y niños.

140
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Nacidos vivos en un lugar y año


TNG = ----------------------------------------------------------- por K
Población al 1ero. de Julio en un lugar y año

Por lo general, se elige como 1000 el valor para K.

Esta es la tasa que se utiliza con mayor frecuencia para estimar el crecimiento
de un país. Otras tasas de fertilidad importante son: Tasa general de fertilidad,
tasa de fertilidad especifica por edades, tasa de fertilidad total, tasa acumulada
de fertilidad y tasa estandarizada de fertilidad.

Número De Defunciones Registradas: Número total de defunciones inscritas


en el registro civil en un año determinado. Unidad de medida: Defunciones

Porcentaje De Población Menor De 15 Años: Porcentaje de representa la


población joven, menor de 15 años, del total de la población. Unidad de
medida: Por ciento

Porcentaje De Población De 65 Años Y Más: Porcentaje que representa la


población de 65 años y más del total de la población. Unidad de medida: Por
ciento

Tasa De Mortalidad Infantil: Es la razón, en un determinado año, entre el


número de muertes de niños menores de un año y el número de nacidos vivos,
en dicho período de tiempo. Se calcula como el cociente entre el número de
nacidos vivos que mueren antes de cumplir un año de edad (numerador), en el
período dado de un año, dividido por el número total de nacidos vivos
(denominador), durante el mismo período de tiempo, multiplicado por mil.
Unidad de medida: Por mil nacidos vivos

Número total de muertes en niños menores de


1 año de edad durante un año
TMI = -------------------------------------------------------------------------------- por K
Número total de nacimientos de niños vivos durante el año

Por lo general, se elige como 1000 el valor para K.

Tasa De Mortalidad Infantil Neo-Natal: La parte de la mortalidad infantil, que


corresponde a la razón, para un año determinado, entre el número de muertes
de niños entre 0 y 27 días de vida y el número de nacidos vivos, en dicho
período de tiempo. Se calcula como el cociente entre el número de nacidos
141
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

vivos que mueren antes de cumplir 28 días de edad de edad (numerador),


dividido el número total de nacidos vivos en el período dado de un año
(denominador), multiplicado por mil. Se puede dividir en dos: la mortalidad neo-
natal precoz (0 a 6 días) y la mortalidad neo-natal tardía (7 a 27 días). Unidad
de medida: Por mil nacidos vivos Es una tasa utilizada para entender con
mayor precisión la naturaleza de las muertes infantiles.

Número total de muertes en niños menores de


28 días de edad durante un año
TMN = -------------------------------------------------------------------------------- por K
Número total de nacimientos de niños vivos durante el año

Por lo general, se elige como 1000 el valor para K.

Tasa De Mortalidad Infantil Posneonatal: La parte de la mortalidad infantil,


que corresponde a la razón, para un año determinado, entre el número de
muertes de niños entre 28 y 364 días de edad y el número de nacidos vivos, en
dicho período de tiempo. Se calcula como el cociente entre el número de
nacidos vivos que mueren antes de cumplir un año de edad de edad pero han
vivido 28 días o más (numerador), dividido el número total de nacidos vivos en
el período dado de un año (denominador), multiplicado por mil. Unidad de
medida: Por mil nacidos vivos

Tasa De Mortalidad Perinatal: Es la razón, para un año determinado, entre la


suma del número de muertes fetales tardías (28 semanas o más de gestación)
más las muertes de nacidos vivos menores de 7 días (numerador) y el número
de nacidos vivos (denominador), multiplicado por mil. A partir del uso de la CIE
10 se cambia la definición, ya que el período perinatal se define a partir de 22
semanas completas de gestación, y no más de 28 semanas. Unidad de
medida: Por mil nacidos vivos

Tasas Estimadas De Mortalidad: Es la razón, para un año determinado, entre


el número de muertes de un grupo de edad y la población de ese grupo de
edad, en dicho período de tiempo. Se calcula como el cociente entre el número
de defunciones (numerador) y la población, estimada a mitad del año
(denominador), multiplicado por mil. Unidad de medida: Por 100.000 habitantes

Tasa De Mortalidad General: Expresa el riesgo que tiene toda la población de


morir por cualquier causa

142
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Defunciones por causa y edad


TMG = --------------------------------------------------- por K
Población al 1ero. de Julio

Por lo general, se elige como 1000 el valor para K.

Esta es la tasa mortalidad que se utiliza con mayor frecuencia para estimar la
salud global de una comunidad. Una tasa de mortalidad baja se traduce en un
mayor desarrollo de los países.

Tasa De Mortalidad En Menores De 5 Años (UNICEF): Es la razón, para un


año determinado, entre el número de muertes de niños menores de 5 años de
edad y el número de nacidos vivos, en dicho período de tiempo. Se calcula
como el cociente entre el número de defunciones de niños que mueren antes
de cumplir 5 años de edad de edad (numerador) y el número total de nacidos
vivos en el período dado de un año (denominador), multiplicado por mil. Es una
aproximación a la probabilidad de morir antes de cumplir 5 años de vida.
Unidad de medida: Por mil nacidos vivos

Proporción De La Mortalidad Infantil Debida A Afecciones Originadas En


El Período Perinatal: Componente de la Tasa de Mortalidad Infantil obtenido
al restringir las muertes de niños Unidad de medida: Por ciento

Mortalidad Materna: Es la muerte de una mujer mientras está embarazada o


dentro de los 42 días siguientes a la terminación de su embarazo, sea cual sea
la duración y sitio del embarazo, debido a cualquier causa relacionada con o
agravada por el embarazo mismo o su atención (complicaciones del embarazo,
parto y puerperio), pero no por causas accidentales o incidentales. La tasa de
mortalidad materna (TMM) es la razón, para un año determinado, entre el
número de muertes maternas y el número de nacidos vivos, en dicho período
de tiempo. Se calcula como el cociente entre el número de defunciones
debidas a complicaciones del embarazo, parto y puerperio, dividido por el
número total de nacidos vivos (denominador), en el período dado de un año,
multiplicado por 100.000. La mortalidad materna tardía corresponde a la
mortalidad por causas maternas ocurridas entre 42 y 364 días después de la
terminación del embarazo. Unidad de medida: Por 100.000 habitantes

Número total de muertes por causas puerperales durante un año


TMM = -------------------------------------------------------------------------------- por K
Número total de nacimientos de niños vivos durante el año

143
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Donde K preferiblemente debe ser 1000 ó 100000.

El denominador más real para esta tasa es el número de mujeres embarazadas


durante el año, pero es imposible en la mayoría de los casos determinar este
dato.

Es importante recordar que una muerte debida a una causa puerperal es


aquella que se le atribuye a alguna de las fases del parto.

Aspectos que limitan la tasa de mortalidad materna:

 Las muertes fetales son incluidas en el denominador lo cual ocasiona


que una madre muera por una causa puerperal sin producir un
nacimiento vivo (se aumenta la tasa).
 La muerte de la madre se cuenta una sola vez, aunque se produzca
nacimientos múltiples (disminuye la tasa).
 Cuando no se registran los nacimientos vivos (aumenta la tasa).
 Cuando la muerte de la madre ocurre un año después del nacimiento.

Tasa De Morbilidad General: La palabra morbilidad se refiere al estudio de


una comunidad con respecto a la enfermedad. Generalmente los datos para el
estudio de la morbilidad de una comunidad no son tan completos ni se
encuentran con tanta facilidad como los que se refieren a la natalidad y
mortalidad. Las dos tasas que se utilizan con mayor frecuencia en el estudio de
las enfermedades de una comunidad son:

Tasa De Incidencia: Esta tasa, mide el grado con el cual ocurren nuevos
casos en la comunidad, es útil para determinar la necesidad de medidas
preventivas. Es una medida muy importante tanto para las enfermedades
crónicas como para las agudas.

Número total de nuevos casos de una enfermedad específica durante un año


TI = ----------------------------------------------------------------------------------------- por K
Población al 1ero. de Julio

K depende del tamaño del numerador

K= 1000 es la más conveniente.


K= 100 para las enfermedades más comunes
K= 10000 ó 100000 para las enfermedades menos comunes o raras

144
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Tasa De Prevalencia: Aunque se menciona como una tasa, la tasa de


prevalencia es en realidad una razón, ya que se calcula a partir de la relación:

Número total de nuevos y viejos casos de una enfermedad Específica,


que existen en un instante
TP = ---------------------------------------------------------------------------------------- por K
Población total en ese instante

Donde el valor de K se elige mediante los mismos críterios que para la tasa de
incidencia. Esta tasa es esencialmente útil en el estudio de las enfermedades
crónicas, pero puede calcularse también para las enfermedades agudas.

Tasa De Morbilidad Por Causa: Indica el riesgo que tiene la población en


estudio de sufrir una enfermedad dada:

Número total de casos de una enfermedad específica


TMEC = ----------------------------------------------------------------------- por K
Población al 1ero. de Julio en un lugar y año

Por lo general, se elige como 100000 el valor para K.

Tasa De Mortalidad Por Grupo De Edad

Número total de muertes en un grupo dado


TMEE = ----------------------------------------------------------------------- por K
Población al 1ero. de Julio en ese grupo dado

Por lo general, se elige como 1000 el valor para K.

Tasa De Mortalidad Fetal: La muerte fetal se define como un producto de la


concepción que no muestra signos vitales al concluir el nacimiento y se calcula
de la siguiente manera:

Número total de muertes fetales durante un año


TMF = -------------------------------------------------------------------------------- por K
Número total de nacimientos de niños vivos durante el año

145
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Por lo general, se elige como 100 ó 1000 el valor para K.

Tasa De Mortalidad Por Causa

Número total de muertes por una causa durante un año


TM? = -------------------------------------------------------------------------------- por K
Número total de muertes durante el año

Tablas:
Indicadores Sociales y Demográficos VENEZUELA

Población total:
24.641.912 (Septiembre 2001 est.)
Estructura por Edad y Sexo:
0-14 años: 33% (hombres 3.967.544; mujeres 3.721.658)
15-64 años: 63% (hombres 7.406.086; mujeres 7.355.923)
65 años en adelante: 4% (hombre 499.102; mujeres 592.336) (2000 est.)
Tasa de Crecimiento:
1,6% (2000 est.)
Tasa de Nacimiento:
21,09 nacimientos / cada 1.000 habitantes (2000 est.)
Tasa de Mortalidad:
4,94 defunciones / cada 1.000 habitantes (2000 est.)
Tasa de Mortalidad Infantil:
26,17 defunciones / cada 1.000 nacimientos vivos
Tasas de Alfabetismo Adultos:
92% (1997)
Tasa Bruta de Inscripción en 1°, 2do y 3er Nivel:
67% (1997)
Grupos Étnicos:
mestizos 67%, blancos 21%, negros 10%, indígenas 2%

146
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

POBLACIÓN TOTAL, SEGÚN ENTIDAD FEDERAL


Estado 1994 1995
Distrito Federal 2.278.640 2.279.677
Amazonas 93.974 94.590
Anzoátegui 1.012.457 1.034.311
Apure 366.975 382.572
Aragua 1.315.756 1.344.099
Barinas 596.279 519.197
Bolívar 1.109.884 1.142.210
Carabobo 1.768.706 1.823.767
Cojedes 221.015 227.741
Delta Amacuro 110.004 114.390
Falcón 688.690 699.232
Guárico 571.679 583.221
Lara 1.400.119 1.430.968
Mérida 667.966 680.503
Miranda 2.242.695 2.303.302
Monagas 546.280 555.705
Nueva Esparta 320.981 330.307
Portuguesa 699.416 720.865
Sucre 772.997 781.756
Táchira 929.176 946.949
Trujillo 556.905 562.752
Yaracuy 455.495 466.132
Zulia 2.743.815 2.820.250
Total 21.377.426 21.844.496
Tasa de crecimiento (%) 2,18
Fuente: Oficina Central de Estadística e Informática.

147
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

POBLACIÓN TOTAL, POR SEXO


Población
Año
Total Hombres Mujeres
1990 19.501.849 9.833.408 9.668.441
1995 21.844.496 11.002.507 10.841.989
2000 24.169.744 12.160.964 12.008.780
2005 26.467.834 13.303.351 13.164.483
2010 28.715.887 14.417.900 14.297.987
Fuente: Oficina Central de Estadística e Informática.

INDICADORES DEMOGRÁFICOS ANUALES


Concepto 1993 1994 1995
Población 20.909.727 21.377.426 21.844.496
Hombres 10.536.389 10.769.620 11.002.507
Mujeres 10.373.338 10.607.806 10.841.989
Población urbana 17.709.445 18.183.104 18.656.451
Población rural 3.200.282 3.194.322 3.188.045
Nacimientos registrados 524.387 547.819 520.584
Tasa bruta de natalidad (‰) 25,08 25,63 23,83
Defunciones registradas 89.105 96.696 92.273
Tasa bruta de mortalidad (‰) 4,26 4,52 4,22
Esperanza de vida al nacer 71,77 71,97 72,17
Saldo migratorio registrado 6.965 -90.670 -11.752
Fuente: Oficina Central de Estadística e Informática.

148
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Datos Básicos para las Américas


(actualizado en Set/1998)

Indicador Venezuela

A.1 - Población 23.242.000

Hombres 11.699.000

Mujeres 11.543.000

men.1 año 561.000

1-4 años 2.223.000

5-14 años 5.339.000

15-44 años 11.045.000

45-64 años 3.073.000

65 y más años 1.000.000

hombres menores 1 año 286.600

hombres 1-4 años 1.135.500

hombres 5-14 años 2.724.000

hombres 15-44 años 5.578.000

hombres 45-64 años 1.521.000

hombres 65 y más años 453.000

mujeres menores 1 año 274.500

mujeres 1-4 años 1.087.600

mujeres 5-14 años 2.615.000

mujeres 15-44 años 5.468.000

mujeres 45-64 años 1.552.000

mujeres 65 y más años 547.000

149
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Indicador Venezuela
A.2 - Esperanza de vida al nacer 72,9
Hombres 70,1
Mujeres 75,8
A.3 - Tasa global de fecundidad 3,0
A.4 - Tasa de crecimiento anual de la población 2,0
A.5 - Porcentaje de población urbana 86,8
A.6 - Número registrado de nacimientos 574.000
A.7 - Tasa bruta estimada de natalidad 24,7

150
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

INDICADORES DEMOGRÁFICOS RELEVANTES POR PAÍS


(Último año disponible)
Tasa bruta
Tasa de mortalidad Población
Tasa bruta de de
infantil (menores de de 60 años
natalidad (por 1 mortalidad
País 5 años de edad por 1 y más (por
000 habitantes) (por 1 000
000 nacidos vivos) ciento)
1995-2000 habitantes)
1995-2000 2000
1995-2000

Alemania 9 11 6 23.2

Arabia S. 34 4 27 4.6

Argentina 20 8 25 13.3

Australia 14 a/ 8 a/ 7 a/ 16.2

Brasil 20 7 48 7.8

Canadá 12 7 7 16.8

Corea
Sur 15 6 13 10.6

Costa
Rica 23 4 15 7.5

Chile 20 6 15 10.2

China 16 b/ 7 b/ 48 10.1 b/

España 9 9 8 21.8

USA 14 9 9 16.4

Rusa 10 14 22 18.5

Francia 12 9 8 20.5

Holanda 12 9 8 18.4
a/ Incluye Isla Navidad, Islas de Cocos (Keeling) e Isla Norfolk.
b/ Excluye Hong Kong.

151
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

INDICADORES DEMOGRÁFICOS RELEVANTES POR PAÍS


(Último año disponible)
Tasa de
Tasa bruta de Tasa bruta de
mortalidad infantil Población de
natalidad (por mortalidad (por
(menores de 5 60 años y
País 1 000 1 000
años de edad por más (por
habitantes) habitantes)
1 000 nacidos ciento) 2000
1995-2000 1995-2000
vivos) 1995-2000

Israel 20 6 10 13.1

Italia 9 10 8 24.2

Japón 10 8 6 23.1

Libia 29 5 32 5.1

México 22 c/ 5 d/ 15 e/ 7 f/

Nigeria 39 15 147 4.9

Noruega 13 10 6 19.7

Nueva Z. 15 8 8 15.6

Reino U. 12 g/ 11 g/ 8 21.0 g/

Singapur 15 5 6 10.5

Sudáfrica 27 12 87 5.7

Suiza 11 9 8 19.4

Venezuela 25 5 25 6.6

c/ Cifras a 2000.
d/ Cifras a 1999.
e/ Cifras a 1999. Número de defunciones de niños menores de un
año de edad por cada mil nacidos vivos.
f/ Cifras al 14 de febrero de 2000.
g/ Los datos se refieren a la Gran Bretaña e Irlanda del Norte.
FUENTE: ONU. World Population Prospects. www.un.org/popin
WHO. The World Health Report 2000. Suiza, 2000.

152
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

BIBLIOGRAFÍA

1. Abad de Servin, A. y Servin Andrade, L. (1978). Introducción Al


Muestreo .México: Limusa.
2. Abdellah F, Levine E. (1994) Preparing Nursing Research For The
21 St Century. Evolution. Methodologies, Chalges. Springer: New
York;
3. Altman DA. Practical Statistics For Medical Research. (1997) 1th
ed., repr. 1997. London: Chapman & Hall;
4. Altman DG, Bland JM. (1996) Statistics Notes: Presentation Of
Numerical Data. BMJ; 312: 572
5. Álvarez R. (1996) El Método Científico En Las Ciencias De La
Salud. Las Bases De La Investigación Biomédica. Madrid: Díaz
de Santos.
6. Armas J.M (1988).: Estadística Sencilla - Descriptiva, Universidad
de Los Andes, Facultad de Ciencias Económicas y Sociales, Mérida
Venezuela.
7. Azorin, F. (1972). Curso De Muestreo y Aplicaciones. Madrid:
Aguilar.
8. Azorin, F. y Sánchez, J. (1986). Métodos y Aplicaciones De
Muestreo. Madrid: Alianza.
9. Bajo L. (1997): Estadística Inferencial, Fundación Universitaria
Cecilio Acosta, Los Teques
10. Buccé A. (1999): Apuntes y Banco de Problemas de
Bioestadística, Universidad de Los Andes Trabajo mimeografiado
Primera Edición, Mérida
11. Buccé A. (2000): Apuntes y Banco de Problemas de
Bioestadística, Universidad de Los Andes Trabajo mimeografiado
Segunda Edición, Mérida
12. Buccé A. (2001): Apuntes y Banco de Problemas de
Bioestadística, Universidad de Los Andes Trabajo mimeografiado
Tercera Edición, Mérida
13. Buccé A. (2002): Apuntes y Banco de Problemas de
Bioestadística, Universidad de Los Andes Trabajo mimeografiado
Cuarta Edición, Mérida

153
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

14. Cabrero L, Martínez R. (1996) El Debate Investigación Cualitativa


Frente A Investigación Cuantitativa Enfermería clínica, 6: 212-217
15. Calero J.(2000) Investigación Cualitativa y Cuantitativa.
Problemas No Resueltos En Los Debates Actuales. Rev. Cubana
Endocrinol; 11 (3): 192-8.
16. Camel Fayad (1988): Estadística Médica, Universidad de Los
Andes Consejo de Publicaciones Mérida Venezuela

17. Campbell D, Stanley J. (1982) Diseños Experimentales y Cuasi


Experimentales En La Investigación Social. Buenos Aires:
Ammorrortu Editores; p. 76-8.
18. Campilongo V. (1996): Bioestadística y Epidemiología Fundación
Universitaria Cecilio Acosta, 2da. Edición, Los Teques
19. Canavos, G.C. (1989). "Probabilidad y Estadística. Aplicaciones
y métodos". MacGraw-Hill.
20. Cao, R. y otros. (1998). "Estadística básica aplicada". Ed. Tórculo.
21. Christensen, H. (1983) Estadística Paso a Paso, (1a. Imp), México:
TRILLAS.
22. Cuadras, C. y otros. (1977). "Ejercicios de Bioestadística".
Editorial Universitaria de Barcelona.
23. Daniel, W. (1991). "Biostatistics. A Foundation for Analysis in
the Health Sciences". J. Wiley.
24. Dawson B.; Trapp R. (1990): Bioestadística Médica, Manual
Moderno México
25. Dawson B, Trapp R. (1996) Bioestadística Médica. 2ª ed. México:
Editorial el Manual Moderno;
26. De la Horra, J. (2001). "Estadística Aplicada". 2ª edición. Rústica.
27. Elston R.; Johnson W. (1990): Principios De Bioestadística,
Manual Moderno, México.
28. Fletcher R., Fletcher S., Wagner E. (1998) Epidemiología Clínica.
2ª ed. Barcelona: Masson, Williams & Wilkins;

154
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

29. Freund J.; Manning R. (1989): Estadística, Prentice Hall


Hispanoamericana S.A. 4ta. Edición México.
30. Freytez O´c. José (1994): Perfil Diagnóstico De Salud y Algunos
Aspectos Nutricionales Del Estado Mérida, Universidad de Los
Andes, Facultad de Medicina, trabajo mimeografiado, Mérida
Venezuela
31. Gonick, L. y Smith, W. (2001). "A estatística ¡en caricaturas!".
SGAPEIO.
32. Gonsalvo, G. (1978), Diccionario De Metodología Estadística,
Madrid: Murat
33. Habber-Runyon (1972), Estadística General, (1a. Imp), México:
ADDISSON WESLEY INTERAMERICANA.
34. Hernández, V., Ramos, E. y Yáñez, I. (1995). "Estadística I". ITIS.
UNED.
35. Holguin F., Hayashi L. (1993): Estadística Elementos De Muestreo
y Correlación Editorial Diana, México
36. Ibañes J. (1994) El Regreso Del Sujeto. La Investigación Social
De Segundo Orden. Madrid: Siglo XXI; p.77-84.
37. Johnson, R. y Bahttachariya, G. (1992). "Statistical Principes and
Methods". J. Wiley.
38. Lang T, Secic M. (1997) How To Report Statistics In Medicine.
Annotated Guidelines For Authors, Editors, and reviewers.
Philadelphia: Port City Press;
39. Lincoyan, P. (1988), Curso Práctico De Estadística, (1a.imp.),
México: McGRAW-HILL.
40. Lizarraga, I. (1993), Estadística, (1a. imp.), México McGRAW-HILL.
41. Mann, P. (1992). "Introductory Statistics". J. Wiley.
42. Martín, A. y Luna, J. (1999). "Bioestadística para las Ciencias de
la Salud". 4ª edición. Norma.
43. Martínez, M. Macia, A. Y Pérez, J. (1989. Psicología Matemática II.
Madrid: UNED.

155
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

44. Milton J, Tsokos J. (2001) Estadística Para Biología y Ciencias De


La Salud. Madrid: Interamericana McGraw Hill;
45. Milton, J. (2001) "Estadística para Biología y Ciencias de la
Salud". 3ª edición. McGraw-Hill.
46. Pardo, A. y San Martín, R. (1994). Análisis De Datos En
Psicología II. Madrid: pirámide.
47. Peña, D. (1991) "Estadística. Modelos y Métodos. 1.
Fundamentos". Ed. Alianza Universidad.
48. Pita S., López I. (1998) Número Necesario De Pacientes A Tratar
Para Reducir Un Evento. Cad Aten Primaria; 96-98.
49. Pita S. Pértega S.(2000) Significancia Estadística y Relevancia
Clínica. Cad Aten Primaria8: 191-195
50. Popper K (1983) Realismo y El Objetivo De La Ciencia. Madrid:
Editorial Tecnos,
51. Popper K (1995) La Lógica De La Investigación Científica.
Barcelona: Círculo de Lectores;
52. Portille, C. (1994), Estadística Primer Curso, (1a. imp.), México:
McGRAW - HILL.
53. Quesada, V., Isidoro, A. y López, L (1984). "Curso y Ejercicios de
Estadística". Alhambra Universidad.
54. Reichart C, Cook T. (1986) Hacia Una Superación Del
Enfrentamiento Entre Los Métodos Cualitativos y Cuantitativos.
Madrid: Morata,
55. Reyes P. (1980): Bioestadística Aplicada, Editorial Trillas, México.
56. Rodríguez, J. (1991). Métodos De Muestreo. Madrid: CIS.
57. Rodríguez, J. (1993). Métodos De Muestreo. Casos Prácticos.
Madrid: CIS
58. Rosner, B. (1990) "Fundamentals of Biostatistics". PWS-KENT
Publishing Company.

156
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

59. Sackett, D., Haynes, R., Guyatt, G., Tugwell, P. (1994)


Epidemiología Clínica. Ciencia Básica Para La Medicina Clínica.
2ª ed. Madrid : Médica Panamericana;
60. Scheaffer R.; Mendenhall W.; Ott Lyman (1987): Elementos De
Muestreo, Grupo Editorial Iberoamericano, México.
61. Simpson R, Johnson T, Amara I. (1988) The Box-Plot: An
Exploratory Analysis For Biomedical Publications. Am Heart J;
116 (6 Part 1): 1663-5.
62. Singer P, Feinstein A. (1993) Graphical Display Of Categorical
Data. J Clin Epidemiol ; 46(3): 231-6
63. Spiegel, M. (1987), Estadística. (1a. imp), México: McGRAWHILL.
64. Steel / Torrie (1990) Bioestadística Principios y Procedimientos,
segunda edición McGraw Hill; México.
65. Strauss A.(1987) Qualitative Analysis For Social Scientifics. New
York: Cambridge University oress,
66. Viedma, J. (1990) "Exposición Intuitiva y Problemas Resueltos
de Métodos Estadísticos: Fundamentos y Aplicaciones". Ed.
Castillo.
67. Viedma, J. (1976). "Bioestadística (Métodos Estadísticos
Aplicados a la Biología y Medicina)". Ed del autor.
68. Wayne D.l (1997): Bioestadística “Base Para El Análisis De Las
Ciencias De La Salud” Noriega Editores México.
69. Williamson D, Parker R, Kendrick J. (1989) The Box Plot: A Simple
Visual Method To Interpret Data. Ann Intern Med ; 110 (11): 916-
21
70. Young, R., (1991), Introducción A La Estadística Aplicada A Las
Ciencias De La Conducta, (8a.Reimp) México: TRILLAS.
71. Zar, J. (1996) "Biostatistical Analysis". Prentince Hall International
Editions.

157
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

ANEXOS

158
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

REPASO DE ALGEBRA DE CONJUNTOS

Definiciones

Dado un conjunto A={a, b, c, d}, la relación de pertenencia se representa por a


 A.

Se llama cardinal del conjunto, y se representa car(A), al número de


elementos que contiene.

Se llama conjunto vacío, y se representa por al conjunto que no contiene


ningún elemento. No desespere, estamos de acuerdo en que si no contiene
ningún elemento, no es un conjunto, sin embargo su definición como tal es muy
útil.

Se llama universo o conjunto universal, y se suele representar por H, al


conjunto formado por todos los elementos que se están considerando.

Dado un conjunto A, se llama complementario del mismo, y se representa por


Ac, al conjunto formado por los elementos del universo que no son de A.

Dos conjuntos son iguales si están formados por los mismos elementos.

Se dice que B es subconjunto de A, y se representa B  A, si todos los


elementos de B pertenecen a A. Se dice también que B está incluido en A.

Dados dos conjuntos A y B, se llama unión de ambos, y se representa A  B,


al conjunto formado por los elementos que pertenecen a A o a B.

Ejemplo 1: A = {a, b, c, d} B = {c, d, e, h}

A B = {a, b, c, d, e, h}

Ejemplo 2: C = {personas obesas} D = {personas hipertensas}

C D = {personas obesas o hipertensas}

Se llama intersección y se representa A B, al conjunto formado por los


elementos que pertenecen a A y a B.

Ejemplo 3: para los conjuntos anteriores

159
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

A B = {c, d} C D = {hipertensos y obesos}

Si dos conjuntos no tienen elementos comunes, se llaman disjuntos y su


intersección es el conjunto vacío. Si, para el ejemplo 2, en el universo que se
está considerando no hay nadie que sea hipertenso y obeso C D = 

Al conjunto formado por todos los subconjuntos de un conjunto dado se le


denomina conjunto de las partes del conjunto o álgebra y se representa por
P(A)

Ejemplo: A = {1, 2, 3}

, {1}, {2}, {3}, {1,2}, {1,3}, {2,3}, {1,2,3}}

Propiedades

Propiedades de la inclusión

i) A  A

ii)  A

iii) A  B  B  A ; sólo si A = B

iv) A  B y B  D ==> A  D

Propiedades de la unión e intersección

 Identidad A =A A H=A


 Idempotencia A A=A A A=A
 Commutatividad A B=B A A B=B A
 Asociatividad (A B) D = A (B D) (A B) D = A (B D)
 Distributividad (A B) D = (A D) (B D) (A B) D = (A D) (B D)
 Absorción A (A B) = A A (A B) = A
 Complementaridad A Ac = H A Ac = 

160
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Nota: A todo conjunto en el que se hayan definido dos operaciones que tengan
estas propiedades, se le denomina Algebra de Boole.

Función de conjunto: toda regla que de un modo perfectamente determinado


haga corresponder un número real a cada elemento del conjunto. Se
representa por

f: A  

el número x que le corresponde al elemento a, se representa por x = f(a)

Se denomina imagen de la función al conjunto de números que están en


correspondencia con algún elemento, a través de la función.

im f = { x ; a  A , f(a)=x }

Aplicaciones De Conjuntos

Problema 1 : En La Industria De Investigación De Mercados

De una investigación realizada en un Colegio con 350 estudiantes , se detectó


que 150 estudiantes poseían computadora, 70 eran dueños de teléfono celular
y 40 tenían teléfono celular y computadora. Usar diagramas de Venn para
resolver el problema.

a) ¿Cuántos estudiantes poseen exclusivamente computadora?

b) ¿Cuántos estudiantes son propietarios exclusivamente de teléfono celular ?

c) ¿Cuántos estudiantes son propietarios de teléfono celular o de


computadora?

d) ¿Cuántos estudiantes no poseen teléfono celular ni computadora?

Solución :

Datos : Se detectan los conjuntos y se les da nombre :

U = Conjunto universal = Conjunto de estudiantes de la muestra = 350

C = Conjunto de estudiantes que poseen computadora = 150

161
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

T = Conjunto de estudiantes que poseen teléfono celular = 70

En el enunciado dicen que "40 tenían teléfono celular y computadora" ===>


entre el conjunto T y el conjunto C, por lo que puede escribirse como :

T C = Conjunto de estudiantes que tenían teléfono celular y computadora = 40

En diagrama de Venn se escriben los conjuntos detectados anteriormente :

U = Conjunto Universal

C = Conjunto de estudiantes que poseen computadora

T = Conjunto de estudiantes que poseen teléfono celular

T C = Conjunto de estudiantes que tenían teléfono celular y

computadora

a) ¿Cuántos estudiantes poseen exclusivamente computadora?

Como se muestra en el diagrama de Venn (zona ashurada en rojo) se requiere


obtener :

C - (T C) = 150 - 40 = 110 estudiantes que poseen exclusivamente


computadora

162
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

b) ¿Cuántos estudiantes son propietarios exclusivamente de teléfono celular ?

Como se muestra en el diagrama de Venn (zona ashurada en azul marino y )


se requiere obtener :

T - (T C ) = 70 - 40 = 30 estudiantes que son propietarios exclusivamente de


teléfono celular

c) ¿Cuántos estudiantes son propietarios de teléfono celular o de


computadora?

Como se muestra en el diagrama de Venn (zona azul agua marina) se requiere


obtener :

C T = (C - (T C )) (T C ) (T- (T C )) = 110 + 40 +30 = 180 estudiantes que


son propietarios de teléfono celular o de computadora

d) ¿Cuántos estudiantes no poseen teléfono celular ni computadora?

Como se muestra en el diagrama de Venn anterior (zona gris o rectangular) se


requiere obtener :

(C T)' = U - (C T) = 350 - 180 = 170 estudiantes que no poseen teléfono celular


ni computadora.

Problema 2 : En Negocios y Economía

En un estudio que comprende 1000 directores de administración de negocios,


se encontró que 600 habían cursado matemáticas finitas, 500 habían cursado
cálculo y 300 habían cursado ambas materias, Sean

F = Conjunto de estudiantes de la muestra que cursaron matemáticas finitas

163
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

C = Conjunto de estudiantes de la muestra que cursaron cálculo

Encuentre el número de estudiantes de cada conjunto que se describe a


continuación.

a) F C

b) F C

c) (F C)'

d) (F C)'

e) F' C

f) F C'

g) El conjunto de estudiantes que cursaron matemáticas finitas o cálculo

h) El conjunto de estudiantes que cursaron matemáticas finitas y cálculo

i) El conjunto de estudiantes que no cursaron matemáticas finitas o cálculo

j) El conjunto de estudiantes que no cursaron ambas asignaturas

k) El conjunto de estudiantes que cursaron cálculo, pero no matemáticas finitas

i) El conjunto de estudiantes que cursaron matemáticas finitas, pero no cálculo

Solución :

Datos : Se detectan los conjuntos y se les da nombre :

U = Conjunto universal = Conjunto de estudiantes de la muestra = 1000

F = Conjunto de estudiantes de la muestra que cursaron matemáticas finitas =


600

C = Conjunto de estudiantes de la muestra que cursaron cálculo = 500

164
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

En el enunciado dicen que " 300 habían cursado ambas materias" ===>
estudiantes que cursaron matemáticas finitas y que cursaron cálculo ===>
entre el conjunto F y el conjunto C, por lo que puede escribirse como :

F C = Conjunto de estudiantes que cursaron matemáticas finitas y que


cursaron cálculo = 300

En diagrama de Venn se escriben los conjuntos detectados anteriormente :

F C=

a) Para calcular F C debe calcularse antes :

F - (F C) = 600 - 300 = 300

C - (F C) = 500 - 300 = 200

Ahora ya puede calcularse F C :

F C = (F - (F C)) (F C) (C - (F C)) = 300 + 300 + 200 = 800

Quedando como se muestra en el diagrama de Venn (zona azul agua marina) :

b) Nos lo dan como dato, es decir :

F C = Conjunto de estudiantes que cursaron matemáticas finitas y que


cursaron cálculo = 300

c) (F C)' es la zona gris de la gráfica anterior, por lo que calculamos :

(F C)' = U - (F C) = 1000 - 800 = 200

d) Para obtener (F C)' vemos en el diagrama de Venn (zona gris o rectangular)


que se requiere obtener:

165
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

(F C)' = U - (F C) = 1000 - 300 = 700

e) Para obtener F' C vemos en el diagrama de Venn (zona agua marina

ashurada o rectangular) que se requiere obtener: F' =


quedando

F' = U - F = 1000 - 600 = 400

F' C = F' - (C - (F C)) = 400 - (500 - 300) = 200

f) Para obtener F C' vemos en el diagrama de Venn (zona agua marina

ashurada o rectangular) que se requiere obtener: C' =

quedando

C' = U - C = 1000 - 500 = 500

F C' = F - (F C) = 600 - 300 = 300

g) El conjunto de estudiantes que cursaron matemáticas finitas o cálculo

F C = 800

h) El conjunto de estudiantes que cursaron matemáticas finitas y cálculo

166
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

F C = 300

i) El conjunto de estudiantes que no cursaron matemáticas finitas o cálculo

(F C)' = 200

j) El conjunto de estudiantes que no cursaron ambas asignaturas

(F C)' = 700

k) El conjunto de estudiantes que cursaron cálculo, pero no matemáticas finitas

F' C = 200

l) El conjunto de estudiantes que cursaron matemáticas finitas, pero no cálculo

F C' = 300

Problema 3 : En la Industria Química

En la empresa X se fabricaron 1100 litros del perfume, de los cuales 550 litros
son del aroma 1, 800 litros de perfume son del aroma 2, y 250 son de la mezcla
del aroma 1 con el aroma 2.

a) ¿Cuántos litros poseen exclusivamente el aroma 1 ?

b) ¿Cuántos litros son exclusivamente del aroma 2 ?

c) ¿Cuántos litros son de la mezcla de aromas ?

d) ¿Cuántos litros son del aroma 1 o del aroma 2 ?

e) ¿Cuántos litros no tiene el aroma 1 ni aroma 2 ?

Solución :

Datos : Se detectan los conjuntos y se les da nombre :

U = Conjunto universal = Conjunto de litros de la muestra = 1000

A = Conjunto de litros del aroma 1 = 550

167
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

B = Conjunto de litros del aroma 2 = 800

En el enunciado dicen que "250 litros son de la mezcla del aroma 1 con el
aroma 2" ===> entre el conjunto A y el conjunto B, por lo que puede
escribirse como

A B = Conjunto de litros de la mezcla del aroma 1 con el aroma 2 = 250

a) ¿Cuántos litros poseen exclusivamente el aroma 1 ?

Se requiere obtener :

A - B = A - (A B) = 550 - 250 = 300 litros poseen exclusivamente el aroma 1

b) ¿Cuántos litros son exclusivamente del aroma 2 ?

Se requiere obtener :

B - A = B - (A B) = 800 - 250 = 550 litros poseen exclusivamente el aroma 2

c) ¿Cuántos litros son de la mezcla de aromas ?

A B nos lo dan como dato, es decir A B = 250 son de la mezcla del aroma 1
con el aroma 2

d) ¿Cuántos litros son del aroma 1 o del aroma 2 ?

A B = (A - B) (A B) (B - A) = 300 + 250 + 550 = 1100 litros son del aroma


1 o del aroma 2

e) ¿Cuántos litros no tiene el aroma 1 ni aroma 2 ?

(A B)' = U - (A B) = 1100 - 1100 = 0 litros que no tiene el aroma 1 ni aroma 2


===> que todos los litros tienen aroma 1, aroma 2, o ambos.

Problema 4 : En Ciencias Sociales

Una academia de música tiene un total de 200 alumnos. El grupo de flauta


consta de 85 alumnos. El grupo de piano consta de 96 alumnos. El grupo de
guitarra consta de 110 alumnos. De los cuales 58 tocan flauta, piano y guitarra.

168
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

12 sólo tocan flauta y piano. 7 sólo tocan flauta y guitarra. Y 5 sólo tocan piano
y guitarra. El resto toca teclado.

Hacer el diagrama de Venn para auxiliarse y calcular :

a) F P

b) F G

c) P G

d) F1 = Al número de alumnos que estudian exclusivamente flauta

e) G1 = Al número de alumnos que estudian exclusivamente guitarra

f) P1 = Al número de alumnos que estudian exclusivamente piano

g) F P G

h) T = Al número de alumnos que estudian exclusivamente teclado

Solución :

Datos : Se detectan los conjuntos y se les da nombre :

U = Conjunto universal = Conjunto de todos los alumnos de la academia = 200

F = Conjunto (grupo) de alumnos que tocan flauta = 85

P = Conjunto (grupo) de alumnos que tocan piano = 96

G = Conjunto (grupo) de alumnos que tocan guitarra = 110

FPG = Conjunto de alumnos que sólo tocan flauta, piano y guitarra = 58

FP = Conjunto de alumnos que sólo tocan flauta y piano = 12

FG = Conjunto de alumnos que sólo tocan flauta y guitarra = 7

PG = Conjunto de alumnos que sólo tocan piano y guitarra = 5

T = Conjunto de alumnos (resto) que sólo toca teclado

169
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

F1 = Conjunto de alumnos que toca flauta pero no piano o guitarra

P1 = Conjunto de alumnos que toca piano pero no flauta o guitarra

G1 = Conjunto de alumnos que toca guitarra pero no piano o flauta

Ahora calculemos los incisos :

a) F P = FP FPG = 12 + 58 = 70

b) F G = FG FPG = 7 + 58 = 65

c) P G = PG FPG = 5 + 58 = 63

d) Número de alumnos que estudian exclusivamente flauta, o bien Conjunto de


alumnos que toca flauta pero no piano o guitarra.

F1 = F - (F P) - FG = 85 - 70 - 7 = 8

e) Número de alumnos que estudian exclusivamente guitarra, o bien Conjunto


de alumnos que toca guitarra pero no piano o flauta.

G1 = G - (F G) - PG = 110 - 65 - 5 = 40

f) Número de alumnos que estudian exclusivamente piano, o bien Conjunto de


alumnos que toca piano pero no flauta o guitarra.

P1 = P - (P G) - FG = 96 - 63 - 12 = 21

g) F P G = F1 FP P1 FPG FG PG G1 = 8 + 12 + 21 + 58 + 7 + 5 + 40 =
151

h) Número de alumnos que estudian exclusivamente teclado

T = (F P G)' = 200 - 151 = 49

170
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

Problema 5 : En Ciencias de la Vida

Tipos de Sangre : Cuando se recibe una transfusión de sangre, un recipiente


debe tener todos los antígenos del donador. Una persona puede tener uno o
más de los tres antíguenos A, B, Rh, o ninguno de ellos. Son posibles ocho
tipos de sangre, como indica el diagrama de Venn, donde U es el conjunto de
todas las personas bajo consideración.

Una persona A- tiene antígenos A pero no B o Rh; una persona O+ tiene Rh


pero no A ni B; una persona AB- tiene antígenos A y B pero no Rh; y así
sucesivamente.

Utilizando el diagrama de Venn, indique cuáles de los ocho tipos de sangre


están incluidos en cada conjunto.

a) A Rh

b) A B

c) A Rh

d) (A B)'

e) (A B Rh)'

f) A' B

171
APUNTES 2003 ESTADÍSTICA DESCRIPTIVA Ing. Armando A. Buccé Bravo

g) Rh' A

Solución :

Antes de calcular los incisos calcularemos cada literal, es decir :

1.- AB+ = A B Rh

2.- AB- = (A B) - AB+

3.- A+ = (A Rh) - AB+

4.- B+ = (B Rh) - AB+ = (A B Rh) - (B Rh )

5.- A- = A - (A B) - A+ = (B - Rh) (B - A)

6.- B- = B - (A B) - B+ = (B - Rh) (B - A)

7.- O+ = Rh - (Rh B) - A+ = (Rh - A ) (Rh - B)

8.- O- = (A B Rh)' = U - (A B Rh)

Ahora calculamos los incisos :

a) A Rh = A+ AB+

b) A B = AB- AB+

c) A Rh = A- AB- AB+ A+ B+ O+

d) (A B)' = O+ O-

e) (A B Rh)' = O-

f) A' B = B - A = B- B+

g) Rh' A = A - Rh = A- AB-

Como puede verse los tipos de sangre están incluidos en todos los conjuntos
calculados.

172

También podría gustarte