Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADISTICA DESCRIPTIVA
El estudio de la estadística no tiene por que convertirse en una serie de ejercicios progresivos de cálculos
tediosos. Si nos acercamos a ella con actitud mental adecuada, encontraremos que la estadística puede constituir
uno de los más interesantes temas de estudio ya que, virtualmente, tiene aplicaciones en todas las áreas del
quehacer humano y se relaciona con incontables campos del saber. H.G.Wells, el profeta del siglo XIX señaló que: el
pensamiento estadístico será algún día tan necesario para el eficiente desenvolvimiento ciudadano como la
facultad de leer y escribir.
Téngase constantemente esta idea. El texto será mucho más interesante y provechoso si el lector desarrolla
el hábito de pensar estadísticamente. Procure siempre aplicar los conceptos estadísticos a todas las actividades
diarias, sin importar cuan rutinaria puedan ser.
Cuando el lector vea publicada alguna información estadística, desarrolle ante ella una saludable actitud
de escepticismos. Formule siempre algunas preguntas pertinentes. Pregunte en que forma se obtuvo información,
si es representativa de la población, etc.
Si se hace del pensamiento estadístico un hábito cotidiano, no sólo se encontrará que el estudio de
estadística resulta más interesante, sino también que el mundo en que se vive parecerá diferente y quizás mas
atractivo.
Hoy mas que en ningún otro momento de nuestra historia tenemos mas intentos de comunicación y un
exceso de medios de comunicación. Las comunicaciones se han convertido en inquietud fundamental de los
estudiosos y profesionales de todas las instituciones: empresas, fuerzas armadas, administración pública,
hospitales, universidades, etc. Pero las comunicaciones se han mostrado tan esquivas como el unicornio, el nivel de
ruido se ha elevado tan velozmente que en realidad hoy lo único que puede oírse es el parloteo acerca de las
comunicaciones, es evidente que cada vez hay menos comunicación. Entretanto hay una explosión de información,
de hecho, todo el mundo tiene acceso a una inagotable abundancia de datos. Todos nos sentimos como el niño
pequeño que está solo en la confitería, no sabemos qué debe hacerse para conseguir que esta cornucopia de datos
se convierta en información y, mas aun, en conocimiento.
Vivimos en un mundo que se encuentra en un proceso de cambio permanente, a diario se producen
modificaciones en los esquemas de vida del hombre, motivados por la irrupción de nuevas técnicas, máquinas mas
avanzadas, sistemas de gestión perfeccionados, etc. Hay una aceleración muy grande de la ciencia y la tecnología,
el conocimiento es un factor determinante y no es otra cosa que lo expresado anteriormente: la problemática de
transformar la información en conocimiento.
A lo largo del tiempo, el hombre se ha ocupado de acumular determinados bienes considerados de mayor
valor según las épocas (alimentos, metales preciosos, etc.).
Hoy, con los avances tecnológicos la información se expande e incrementa año tras año. Ese crecimiento
sostenido ha llevado a afirmar que estamos frente al fin de la era industrial y en presencia de la sociedad de la
información. Por ello, y teniendo en cuenta que las organizaciones actuales están sujetas a cambios constantes, no
es difícil comprender que la información sea considerada un insumo de gran importancia, con el que comercia,
procesa y reprocesa obteniendo un valioso bien que facilita la toma de decisiones.
Por todo lo expuesto y considerando que las funciones de la administración (planear, organizar, dirigir y
controlar) exigen tomar decisiones en forma constante, es de gran importancia analizar de qué forma obtiene la
organización su información, en qué momento la consigue, cómo la utiliza y cómo circula dentro de su estructura.
1.2 - TIPOS
La estadística descriptiva o deductiva tiene como finalidad colocar en evidencia aspectos característicos
(promedios, variabilidad de los datos, etc.) que sirven para efectuar comparaciones sin pretender sacar
conclusiones de tipo más general.
La estadística descriptiva – analítica se define como un conjunto sistemático de procedimientos para
observar y describir numéricamente el fenómeno, y descubrir las leyes que regulan la aparición, transformación y
desaparición del mismo.
La estadística analítica o inductiva busca dar explicaciones al comportamiento de un conjunto de
observaciones, probar la validez de los resultados, intenta descubrir las causas que lo originan, con gran aplicación
en el campo del muestreo, lográndose de esta manera conclusiones que se extienden mas allá de las muestras
estadísticas mismas.
MUESTREO
Existen diferentes tipos de muestreos aleatorios:
Muestreo aleatorio simple: en él se seleccionan muestras mediante métodos que permiten que cada posible
muestra tenga una igual probabilidad de ser seleccionada y que cada elemento de la población tenga una
oportunidad igual de ser incluido en la muestra. La forma más fácil de seleccionar una muestra de manera
aleatoria es mediante el uso de la tabla de números aleatorios.
Muestreo sistemático: en este tipo, los elementos son seleccionados dentro de un intervalo uniforme que se mide
respecto al tiempo, al orden o al espacio, por ejemplo entrevistar a los pacientes internados en las camas nº 11-16-
21-26-31, etc.; si observamos con relación al muestreo aleatorio simple vemos que en este tipo de muestreo todos
los elementos tienen la misma posibilidad de ser escogidos, pero no así todas las muestras, porque las camas nº 12-
13-14 y 15 jamás hubieran sido escogidas juntas; si principal ventaja el ahorro de tiempo y costo al momento de
seleccionar los elementos de la muestra.
Muestreo estratificado: Para aplicar este tipo de muestreo dividimos a la población en grupos relativamente
homogéneos que reciben el nombre de estratos, luego aplicamos cualquiera de los métodos mencionados
anteriormente: aleatorio simple o sistemático. En las estadísticas de salud probablemente sea éste el mejor sistema,
los grupos a los que hacemos referencia pueden ser los tipos de enfermedades, o las edades o sexos de los
pacientes, etc.
TAMAÑO DE LA MUESTRA.
Uno de los aspectos mas importantes al trabajar con muestras es poder definir si la misma es o no
representativa de la población que pretendemos estudiar. El otro aspecto a dilucidar es cual es el tamaño de la
muestra que debemos analizar para poder aplicar los resultados obtenidos y trasladarlos como estimadores de los
parámetros poblacionales.
Elementos Características
Es importante resaltar el hecho de que a pesar de encontrarse una población constituida por un grupo de
elementos, a la estadística no le interesa el elemento en sí, sino su característica.
Según sea el tamaño, la población puede considerarse como finita o infinita. Es población finita cuando el
número de elementos que la componen es limitado; es población infinita cuando el número de elementos que la
componen es infinito.
VARIABLES
Las características o caracteres (xi) corresponden a ciertos rasgos, cualidades o propiedades que poseen los
elementos que constituyen a la población o muestra.
Variables cuantitativas: Algunos caracteres son mensurables y se describen numéricamente, por tal motivo se
denominan caracteres cuantitativos o variables, tales como estatura, peso, ingreso, valor, producción, ventas, etc. y
pueden clasificarse en:
Variables continuas: pueden tomar cualquier valor dentro de los números reales (edad, temperatura, kilos, etc.)
Variables discretas: solo toman valores enteros (cantidad de hijos, materias aprobadas, etc.)
Variables cualitativas: Otros se expresan mediante palabras por no ser mensurables pero si contabilizables, tales
como profesión, cargo, marcas, calidad, etc. y se denominan caracteres cualitativos o atributos. Estos pueden ser:
Atributos dicotómicos: son aquellos que aceptan solo dos alternativas; por ejemplo: ciudadano argentino o
extranjero.
Atributos policotómicos: son aquellos que aceptan mas de dos alternativas; por ejemplo: nacionalidad de los
barcos ingresados al puerto.
La determinación del tipo de variable que estemos estudiando es muy importante, porque de ella
dependen la forma de ordenar los datos, de sistematizarlos en la tabla de frecuencia, la manera de presentar tablas
resúmenes y tipo de gráfico que se debe utilizar.
Toda ciencia tiene su propia metodología de estudio y aplicación, la estadística tiene su método propio
que, en definitiva, son una serie de etapas a cumplir para asegurar el éxito de la investigación. Los pasos del
método estadístico son:
Planeamiento:
Objetivo: como en la mayoría de las actividades humanas, es imprescindible antes de iniciar cualquier acción la
definición del objetivo del estudio estadístico, pues de él depende el resto de las etapas que componen un trabajo
de esta naturaleza. Es importante reflexionar y contestar los interrogantes anteriormente detallados; que se va a
estudiar, cuándo se va a realizar el estudio, cómo se va a efectuar el trabajo, dónde se recolectará la información,
esta lista no es taxativa, sino meramente enunciativa.
Unidad de investigación: en esta etapa se define cual es la población pausible de estudio, es decir cuales son los
elementos que reúnen los requisitos o características de nuestro objetivo de estudio.
Método de observación: en función de la cantidad de elementos que compongan nuestra unidad de investigación,
en este momento se decidirá por estudiar a la población (si ésta fuera lo suficientemente chica, en función de
razones de necesidad o costo) o si estudiaremos una muestra de esa población. Asimismo se debe decidir que tipo
de muestreo se usará: aleatorio simple, aleatorio sistemático o aleatorio
Proceso de recolección de datos: ya hemos dicho que la descripción estadística de un fenómeno se hace mediante
datos numéricos. La recogida de estos datos puede realizarse utilizando fuentes de datos internas o externas.
Algunas veces los datos son intrínsecos a la propia actividad de la empresa que los recopila en un momento
determinado. Se dice, entonces, que el dato es interno y la fuente de datos interna. Tal sería, por ejemplo: la
información que puede proporcionar el departamento de personal de una empresa sobre la categoría, edad o
sueldo de sus empleados.
Otras veces interesa obtener datos ajenos al funcionamiento de la propia empresa. La fuente de esos datos ha
de ser, en consecuencia, externa y los datos son externos. Por ejemplo: una empresa desea introducir un producto
para comercializar en una cierta población, para lo cual necesita saber el nivel adquisitivo de sus posibles
compradores. Consultará entonces diversas fuentes de datos externas: bancos, dependencias gubernamentales, etc.
Los datos externos suelen obtenerse por medio de:
Recolección
Estos datos así presentados presentan una ventaja y un inconveniente, si los mismos son trabajados en una
planilla de cálculo del estilo de Q-Pro o Excel es sumamente fácil obtener los estadigrafos mas importantes
(medidas de tendencia central, de dispersión, de asimetría y de apuntamiento), por otra parte si el análisis de estos
datos se hace manualmente el proceso se torna engorroso, para lo cual se sugiere trabajar con el concepto de
frecuencia, es decir agrupar los datos en función de la cantidad de veces que se repiten.
Intervalos de clase: para estudiar un hecho en el que la amplitud de la población o muestra es grande, donde la
variable continua puede tomar un número elevado de valores, se definen los intervalos de clase que son
subconjuntos del conjunto de valores que puede tomar la variable continua. Estas clases pueden tener una
amplitud constante o variable; así, por ejemplo, si se trata de estudiar la estatura de una población de individuos,
una vez elegida la muestra (que eventualmente podría coincidir con la población, como es sabido), es conveniente
dividir en clases las posibles estaturas de los individuos investigados. Continuando con el ejemplo anterior podría
hacerse de la siguiente forma:
Se llaman limites del intervalo a los valores extremos de dicho intervalo. Por ejemplo, dado el intervalo 70
- 80, diremos que 70 es el límite inferior (L.I.) y que 80 es el límite o extremo superior (L.S.).
En cuanto a la amplitud de cada clase podemos considerar como una elección acertada es elegir clases de
mayor amplitud en las regiones donde el carácter es mas raro y de menor amplitud en el resto. Esto sucede si
elegimos clases de amplitud variable; sin embargo, es mucho mas general elegir las clases con amplitud constante,
por simplicidad. Para calcular la amplitud del intervalo (c) se realiza la siguiente operación: “c= rango / m”
En cuanto al número de clases a adoptar dependerá de la precisión de las medidas que se pretende
alcanzar, finalidad del estudio, grado de variabilidad de los datos, necesidad de efectuar comparaciones, etc.; en
todo caso se recomienda que el valor de m, hasta donde sea posible, no sea menor de 5 ni mayor de 16. Es común
la utilización de la fórmula de Sturgest para obtener la cantidad de intervalos de clase (m), esta es “m = 1+3,3 log n”
Los estudios estadísticos están sujetos a una serie de factores que, según se manejen, harán que el estudio
sea suficientemente fiable o no lo sea. Además de estos factores, existe otro tipo de error que podríamos
considerar numérico, debido al redondeo de los cálculos, etc. Dichos errores están implícitos en una buena parte
de los estudios realizados.
Con respecto a la agrupación de los datos en clases o intervalos, hay que decir que lleva implícito un cierto
error en el cálculo posterior de las distintas medidas de la distribución, y este error será mayor cuanto mayor sea la
amplitud de los intervalos elegidos. Pero si esta amplitud es muy pequeña y, por consiguiente, el número de
intervalos es muy grande, entonces la serie estadística pierde claridad y los cálculos resultan mas engorrosos. Por lo
tanto, se debe tender al máximo equilibrio entre estos dos efectos contrarios:
mayor número de clases implica menos claridad pero mas exactitud y precisión;
menos clases y mas amplias significa ganar en claridad de exposición y facilidad de cálculo, pero en detrimento
de la exactitud y precisión a conseguir en los cálculos.
Distribución de frecuencias: la tabla de frecuencias tiene como finalidad presentar en forma ordenada los valores
que toman las diferentes características, en tal forma que permitan al lector tener una visión de conjunto. Los datos
se clasifican y ordenan de acuerdo con ciertas características cualitativas o cuantitativas, indicándose el número de
veces que se repite el valor de la variable o atributo.
xi ri fri Ri Fri
0 3 3/30= 0,10 3 0,10
1 6 6/30= 0,20 9 0,30
2 12 12/30= 0,40 21 0,70
La frecuencia relativa nos indica la distribución porcentual, en el ejemplo se tiene que el 10% de las cajas
no tienen figuras defectuosas.
Se desarrolla a continuación un ejemplo para la variable continua. Consideremos nuevamente la población
de 300 cajas (N= 300) y seleccionemos aleatoriamente una muestra de 30 cajas (n= 30), o sea el 10% a fin de
investigar el peso en kg. de cada caja. La información sobre el peso de cada caja se da en números enteros con el
fin de simplicar el trabajo, sin olvidar que la medida utilizada admite valores fraccionarios, por tal motivo se la
clasifica como variable continua.
x1= 48 x2= 56 x3= 60 x4= 67 x5= 47 x6= 70
x7= 70 x8= 63 x9= 72 x10= 76 x11= 74 x12= 67
x13= 92 x14= 70 x15= 69 x16= 61 x17= 71 x18= 79
x19= 85 x20= 68 x21= 82 x22= 55 x23= 65 x24= 88
x25= 52 x26= 58 x27= 76 x28= 57 x29= 72 x30= 67
En la elaboración de la tabla de frecuencias se deben observar los siguientes pasos:
se determina el valor máximo y el valor mínimo que toma la variable xi, en este caso xmin= 47 y xmax= 92;
se calcula el rango, es decir, 92 - 47 = 45.
se hace necesario determinar el número de intervalos (m) que se utilizará para agrupar los datos, aplicando la regla
de Sturges con la cual se obtiene una aproximación aceptable sobre el número de intervalos necesarios; m= 1 + 3,3
log 30, lo que arroja un resultado de 5,87. El número de intervalos estará entre 5 y 6, utilizaremos en nuestro
ejercicio seis intervalos (m=6).
Se debe decidir sobre la amplitud de cada intervalo (c). Al determinar el valor de c no es necesario que
sean todos los intervalos iguales; sin embargo, con fines de simplicidad y funcionalidad se puede considerar el valor
de c constante para todos los intervalos. Dicho valor constante se obtiene aplicando la fórmula siguiente: c=
rango/m, entonces, 45/6= 7,5. Para facilitar los cálculos se aproxima c a 8; por lo tanto se altera el valor del rango,
si recordamos que m fue fijado y no se debe cambiar, se tendrá: 8=rango/6, entonces 8=48/6. En este caso el rango
se incrementa en tres unidades, de 45 pasó a 48, el incremento debe ser distribuido proporcionalmente, sumando
unas unidades al límite superior y restándole otras al límite inferior.
l. C. xi ri fri Ri Fri
46,1 - 54 50 3 0,10 3 0,10
54,1 - 62 58 6 0,20 9 0,30
62,1 - 70 66 10 0,33 19 0,63
70,1 - 78 74 6 0,20 25 0,83
78,1 - 86 82 3 0,10 28 0,93
86,1 - 94 90 2 0,07 30 1,00
-- 30 1,00 -- --
Debe quedar bien claro que la amplitud del intervalo sigue siendo 8 y que el 0,1 es usado únicamente
como ayuda para la clasificación.
Propiedades de las frecuencias: estas son:
las frecuencias absolutas son números enteros;
la suma de las frecuencias absolutas es igual a tamaño de la muestra (n) o al de la población (N);
las frecuencias relativas son números fraccionarios, esto es “0<fri<1”;
la suma de las frecuencias relativas es igual a 1;
el último término de las frecuencias absolutas acumuladas es igual a n;
el último término de las frecuencias relativas acumuladas es igual a 1.
CUADRO Nº
TITULO (qué, cómo, cuándo, dónde)
Título en mayúsculas
ENCABEZAMIENTO (título en mayúsculas) Subtítulo en minúscula TOTAL
Sub -
total
TOTALES
PIE
ELABORACIÓN DE GRÁFICOS
La presentación de las informaciones obtenidas se puede realizar de varias formas:
textual (en forma de texto); cuadros, tal como analizamos anteriormente; gráficos.
Cuando el informe se hace en forma textual, se trata de una presentación simple y limitada, tal como
sucede en los reportajes y artículos periodísticos, donde los datos aparecen intercalados con los comentarios y con
las conclusiones derivadas de las interpretaciones de los mismos, en una forma ligera y descriptiva.
En un informe textual complementado con cuadros, estos sirven de ayuda al lector para entender o
ampliar lo que dice el texto. Sin embargo, la utilización de texto y cuadros no es suficiente para la presentación de
un buen informe, ya que la lectura del texto implicará un tiempo precioso para entender todo el contenido; ahora,
si el lector se remite a los cuadros encontrará unas cifras, que en algunos casos no le aclaran lo suficiente y en
otros, no le dicen mucho sobre el problema estudiado, de ahí que sea necesario que el informe vaya acompañado
de gráficos, no como sustituto de las formas anteriores de presentación, sino como la mejor manera de visualizar la
información contenida en los cuadros y en el texto.
De todas las representaciones de datos estadísticos, los gráficos muestran en forma extensiva y con la
necesaria profundidad las características del fenómeno en estudio.
El gráfico es una representación de datos ilustrada, construida principalmente mediante la asignación de
valores a un conjunto de líneas horizontales y verticales llamadas ejes.
Generalmente los gráficos usan como sostén un sistema de ejes cartesianos X e Y donde se presentan dos
variables asociadas. Generalmente en el eje “Y” se colocan las frecuencias que presentan los distintos valores de la
variable x que se representa sobre el eje de abscisas o eje “X”.
Ventajas y Desventajas
Sus principales ventajas son: concisión, rapidez de percepción, vista de conjunto de una situación y síntesis
de datos. Entre las desventajas encontramos que desprecia necesariamente ciertos detalles y resulta confuso
cuando se pretende comparar varias distribuciones.
Reglas en la elaboración de gráficas
La forma de la gráfica depende en gran medida del gusto de la persona que la elabora; sin embargo, hay
ciertos principios generales que se deben tener en cuenta en el logro de una buena gráfica:
La mejor gráfica es la mas simple. Las líneas y símbolos usados deben ser los estrictamente indispensables
para una mejor visualización de la información.
Si hay más de dos gráficas deben estar numeradas.
El primer aspecto que hay que considerar que la planilla de cálculo frece una variada cantidad de gráficos a utilizar,
pero que según el tipo de variable que queramos representar es el tipo de gráfico que hay que realizar.
Los datos que recolectemos pueden ser números (edad, presión arterial, cantidad de hijos, estatura, peso, etc.) o
pueden ser palabras (sexo, departamento de residencia, alérgico a:, estado civil, vacunado contra la gripe: si o no),
o pueden ser una serie de datos a través del tiempo (pacientes atendidos por mes, población de una zona a una
fecha determinada, etc.)
Vamos a describir para cada caso cual es el gráfico mas adecuado, más allá que la planilla pueda representarlo de
otra manera.
Ejemplos:
Luego de ordenada la base de datos por departamento, nos vamos al menú de datos y presionamos el icono de
subtotal
Presionamos sobre el número 2 y los datos se van a contraer mostrando sólo los subtotales por departamento, los
datos originales están ocultos, pueden ver en la planilla que aparecen las filas 1, 7 10, 12, 14, etc.
Presionamos y aparecerá en la pantalla el gráfico seleccionado. Luego hacemos “doble click” arriba del gráfico y
aparecerá un nuevo menú
En ambos casos aparecerá una pantalla como figura a continuación marcamos en editar las categorías de x
Volvemos a cliquear el botón derecho del mouse y ahora seleccionamos Agregar etiqueta de datos.
Apretamos aceptar y ahora se puede visualizar que además de la cantidad de personas por departamento aparece
el porcentaje que representan sobre el total.