Está en la página 1de 27

Estadística descriptiva es una ciencia que analiza series de datos (por ejemplo, edad

de una población, altura de los estudiantes de una escuela, temperatura en los meses de
verano, etc) y trata de extraer conclusiones sobre el comportamiento de estas variables.
Las variables pueden ser de dos tipos:
Variables cualitativas o atributos: no se pueden medir numéricamente (por ejemplo:
nacionalidad, color de la piel, sexo).
Variables cuantitativas: tienen valor numérico (edad, precio de un producto, ingresos
anuales).
Las variables también se pueden clasificar en:
Variables unidimensionales: sólo recogen información sobre una característica (por
ejemplo: edad de los alunmos de una clase).
Variables bidimensionales: recogen información sobre dos características de la
población (por ejemplo: edad y altura de los alumnos de una clase).
Variables pluridimensionales: recogen información sobre tres o más características
(por ejemplo: edad, altura y peso de los alumnos de una clase).
Variables cuantitativas se pueden clasificar en discretas y continuas:
Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: número de
hermanos (puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podrá ser 3,45).
Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la
velocidad de un vehículo puede ser 80,3 km/h, 94,57 km/h...etc.
Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes
conceptos:
Individuo: cualquier elemento que porte información sobre el fenómeno que se estudia.
Así, si estudiamos la altura de los niños de una clase, cada alumno es un individuo; si
estudiamos el precio de la vivienda, cada vivienda es un individuo.
Población: conjunto de todos los individuos (personas, objetos, animales, etc.) que
porten información sobre el fenómeno que se estudia. Por ejemplo, si estudiamos el precio
de la vivienda en una ciudad, la población será el total de las viviendas de dicha ciudad.
Muestra: subconjunto que seleccionamos de la población. Así, si se estudia el precio de
la vivienda de una ciudad, lo normal será no recoger información sobre todas las viviendas
de la ciudad (sería una labor muy compleja), sino que se suele seleccionar un subgrupo
(muestra) que se entienda que es suficientemente representativo.

Las variables cuantitativas son de naturaleza numérica y se obtienen con instrumentos de medición (peso, talla,
presión arterial, valores de hematócrito); pueden ser continuas, cuando no poseen interrupciones en la escala
de valores que se presente (ejemplo: talla: 1.79 m; peso: 51.99 kg),
o pueden ser discretas cuando tienen interrupciones en la escala de valores (ejemplo: número de hijos, ingresos en una guardia,
defunciones hospitalarias).

La escala de razón, utilizada para variables cuantitativas, es el nivel más alto de medición medición; consiste en
obtener los valores reales de cada medición individual
La escala de intervalos que se aplica a variables cuantitativas consiste en ordenar los valores de una serie de datos, estableciendo
distancias definidas entre dichos datos.

LAS VARIABLES CUALITATIVAS son características que no pueden ser medidas con instrumentos (como el color de ojos,
la religión o el estado civil); se clasifican en nominales y ordinales.
En la escala nominal se designan o nombran las observaciones en varias categorías como el grupo y Rh, religión, estado civil y
algunas pueden ser dicotómicas, por ejemplo, aprobado sí o no, género masculino o femenino.
La escala ordinal consiste en clasificar por grados de acuerdo con algún criterio, por ejemplo, vómito leve, moderado, severo;
estado socioeconómico bajo, medio, alto.
Ejemplo de la utilización de diferentes tipos de escalas de las variables para un mismo fenómeno.
Evaluación de la diarrea.
Escala de razón: número de evacuaciones por día = 20.
Escala de intervalo: número de evacuaciones por
día = de 1-5; 6-15, >15.

Escala ordinal: diarrea leve, moderada, severa. Escala nominal: con diarrea, sin diarrea

RAZÓN
Es la comparación, a través de una división, de dos grupos de individuos con atributos de diferente naturaleza. Es la forma
más simple de mostrar desigualdades entre grupos.
Continuando con otro ejemplo hipotético, se han atendido a 1,200 pacientes con diabetes en el Servicio de Urgencias, 900
de ellos fueron mujeres y 300 hombres.
En la división puede considerarse como numerador cualquiera de los valores. De ahí que 900/300 = 3, por lo que la relación
entre mujeres y hombres con respecto a diabetes mellitus que acudieron al Servicio de Urgencias fue de 3 mujeres por
cada hombre (3:1).

TASA
La tasa es la medida de frecuencia que da cuenta de la velocidad de cambio en la población, de estar sana a pasar al estado
enfermo, o del estado de enfermo a sano. La tasa es la comparación, a través de una división, entre el número de veces
que se presenta una enfermedad, o el evento estudiado, en un periodo determinado, entre el tiempo-persona o tiempo
poblacional, que es la expresión con la que cada individuo contribuye libre de la enfermedad, o del evento, en el tiempo
de seguimiento
MEDICIÓN CLÍNICA-DESCRIPTIVA: La estadística descriptiva tiene como objetivo mostrar el comportamiento en conjunto
de los valores que se obtienen a través de la medición de las variables elegidas. Muestra los detalles simples de cada
variable en el grupo de individuos que son estudiados así como su distribución.

Las medidas de resumen de las variables cuantitativas en escala de razón que se usan para la descripción son: media,
mediana y moda. También se llaman medidas de tendencia central.

Las medidas de dispersión para variables cuantitativas en escala de razón son: varianza y desviación estándar. Indican qué
tan alejados están los valores del centro de la distribución
MEDIA

Es el promedio aritmético de las observaciones. Es el valor que representa a todos los individuos de la muestra. La fórmula
es: X= x /n

Donde x es el valor de cada una de las observaciones y n representa el total de las observaciones. Los pasos para obtener
la media son: 1. Sumar los valores de todas las observaciones. 2. El resultado de la suma se divide entre el número total
de observaciones. Ejemplo: Se pretende describir el promedio de edad de los 10 niños que ingresaron por primera vez a
una guardería. Las edades registradas en años fueron: 1, 2, 3, 2, 1, 4, 1, 1, 3 y 4. La suma de las edades de todos los niños
es 22, dividido entre los 10 niños es igual a 2.2 años. Por lo tanto, el promedio de edad de los niños que ingresaron por
primera vez a una guardería es de 2.2 años. Uno de los inconvenientes de esta medida de resumen es su sensibilidad a
valores extremos, tanto muy altos como muy bajos, ya que la media se ve influida por estos valores. Cuando esto ocurre
es preferible utilizar otra medida de resumen como la mediana.

MEDIANA

Es el valor que divide exactamente a la mitad una serie de valores ordenados de menor a mayor, lo que provee una lista
de observaciones con los valores más bajos y otra de observaciones con los valores más altos.

Cuando la cantidad de observaciones es impar, la mediana es el valor de la observación que justamente está en medio de
la serie ordenada de valores; su fórmula es mediana = n + 1/ 2

Cuando el número de observaciones es par, la mediana es el promedio de los dos valores centrales, ordenados en forma
progresiva. Pasos para obtener la mediana: 1. Ordenar los valores de las observaciones de menor a mayor. 2. Identificar
la ubicación del valor de la mediana. 3. Cuando la serie es par, identificar los dos valores centrales, sumarlos y
promediarlos.

Ejemplo: Encontrar la mediana de la hemoglobina glicosilada (medida en %) de 14 personas con diabetes mellitus tipo II
tratados con glibenclamida: 8, 11.9, 8.5, 7.4, 8, 9.6, 8.5, 6.7, 7, 10.4, 7, 8.2, 8.7, 8.1.

Observaciones ordenadas de menor a mayor: 6.7, 7, 7, 7.4, 8, 8 ,8.1, 8.2, 8.5, 8.5, 8.7, 9.6, 10.4 y 11.9.

Se obtiene el promedio de los números centrales marcados en negritas (8.1 + 8.2)/2 = 16.3/2 = 8.15, que es el valor de la
mediana.

MODA

Es el valor que más se repite en una serie de datos. En algunos casos, es posible encontrar dos o más modas por lo que la
distribución se considera bimodal o trimodal. En el ejemplo anterior hay tres modas, ya que los valores 7, 8 y 8.5 se repiten
en dos ocasiones. Si la media, la mediana y la moda adoptan el mismo valor en una serie de datos, podemos concluir que
la distribución se acerca a la normalidad.

MEDIDAS DE DISPERSION:
Las medidas de dispersión son números reales no negativos, su valor es igual a cero cuando los datos son iguales
y este se incrementa a medida que los datos se vuelven más diversos.
Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la media de las
desviaciones de las puntuaciones respecto a la media aritmética. Pero la suma de las desviaciones es siempre
cero, así que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en
valor absoluto (desviación media) y otra es tomando las desviaciones al cuadrado (varianza).

La s m ed i d a s de di sp e r si ó n n o s i n fo r man s ob r e cu án t o s e al ej an del c en t r o l os v al o r es
de l a di st ri bu ci ón .
El conocimiento de la forma de la distribución y del respectivo promedio de una colección de valores de una
variable, puede servir para tener una idea bastante clara de la conformación, pero no de de la homogeneidad de cada
una de los valores con respecto a la medida de tendencia central aplicada.
En el caso de las variables con valores que pueden definirse en términos de alguna escala de medida de igual
intervalo, puede usarse un tipo de indicador que permite apreciar el grado de dispersión o variabilidad existente en
el grupo de variantes en estudio.
A estos indicadores les llamamos medidas de dispersión, por cuanto que están referidos a la variabilidad que
exhiben los valores de las observaciones, ya que si no hubiere variabilidad o dispersión en los datos interés, entonces
no habría necesidad de la gran mayoría de las medidas de la estadística descriptiva.
Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas
de dispersión nos dicen hasta que punto estas medidas de tendencia central son representativas como síntesis de
la información. Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la
distribución respecto al valor central. Distinguimos entre medidas de dispersión absolutas, que no son comparables
entre diferentes muestras y las relativas que nos permitirán comparar varias muestras.
 LA DISPERSIÓN.

Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda sólo nos revelan una parte de la
información que necesitamos acerca de las características de los datos. Para aumentar nuestro entendimiento del
patrón de los datos, debemos medir también su dispersión, extensión o variabilidad.
La dispersión es importante porque:
 Proporciona información adicional que permite juzgar la confiabilidad de la medida de tendencia central. Si los
datos se encuentran ampliamente dispersos, la posición central es menos representativa de los datos.
 Ya que existen problemas característicos para datos ampliamente dispersos, debemos ser capaces de distinguir
que presentan esa dispersión antes de abordar esos problemas.
 Quizá se desee comparar las dispersiones de diferentes muestras. Si no se desea tener una amplia dispersión de
valores con respecto al centro de distribución o esto presenta riesgos inaceptables, necesitamos tener habilidad
de reconocerlo y evitar escoger distribuciones que tengan las dispersiones más grandes.

Pero si hay dispersión en la mayoría de los datos, y debemos estar en capacidad de describirla. Ya que la dispersión
ocurre frecuentemente y su grado de variabilidad es importante, ¿cómo medimos la variabilidad de una distribución
empírica?. Vamos a considerar sólo algunas medidas de dispersión absolutas: el rango, la varianza, la desviación
estándar y el coeficiente de variación.

RANGO:
Rango: mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor
más elevado y el valor más bajo.
VARIANZA Y DESVIACIÓN ESTÁNDAR

La varianza es la dispersión que presentan los datos con respecto al valor promedio. Da cuenta de la variabilidad de los
valores tomando como referencia al promedio. La fórmula es:

Debido a que la varianza es muy compleja de interpretar, ya que el resultado se expresa al cuadrado, por ejemplo litro
cuadrado, metro cuadrado, mmHg cuadrado, es conveniente utilizar una medida de dispersión más comprensible como
lo es la desviación estándar.
La desviación estándar es la distancia a lo largo de un eje horizontal entre el promedio y el punto donde la curva pasa de
convexa a cóncava y nos brinda información del porcentaje del área bajo la curva que se logra tener, es decir, el porcentaje
de los valores de que se encuentran bajo la curva de distribución normal.

Se consideran como normales los valores ubicados entre la media y más menos dos desviaciones estándar, que equivalen
al 95.4% (Figura 1). La desviación estándar se obtiene simplemente calculando la raíz cuadrada de la varianza y la fórmula
es:
Siguiendo el ejemplo anterior, el valor promedio de la hemoglobina glicosilada sería de 8.35 y la varianza de estos valores
con respecto al promedio sería de 1.54 al cuadrado. Si calculamos la raíz cuadrada de 1.54 obtenemos la desviación
estándar que sería en este caso de 1.24. Por lo anterior, los valores normales se encontrarían entre 8.35 más menos 2
(1.24), lo que da un intervalo de valores entre 5.87 y 10.83.
Desviación típica: Se calcula como raíz cuadrada de la varianza.
Coeficiente de varización de Pearson: se calcula como cociente entre la desviación
típica y la media.
Las medidas de forma permiten conocer que forma tiene la curva que representa la serie
de datos de la muestra. En concreto, podemos estudiar las siguientes características de
la curva:
a) Concentración: mide si los valores de la variable están más o menos uniformemente
repartidos a lo largo de la muestra. Para medir el nivel de concentración de una
distribución de frecuencia se pueden utilizar distintos indicadores, entre ellos el Indice
de Gini.
b) Asimetría: mide si la curva tiene una forma simétrica, es decir, si respecto al centro
de la misma (centro de simetría) los segmentos de curva que quedan a derecha e izquierda
son similares.
c) Curtosis: mide si los valores de la distribución están más o menos concentrados
alrededor de los valores medios de la muestra.
Por lo tanto, el Coeficiente de Curtosis de esta muestra es -1,39, lo que quiere decir que se
trata de una distribución platicúrtica, es decir, con una reducida concentración alrededor de los
valores centrales de la distribución

GRAFICACION:
Un gráfico circular o gráfica circular, también llamado "gráfico de pastel", "gráfico de tarta", "gráfico de torta" o
"gráfica de 360 grados", es un recurso estadístico que se utiliza para representar porcentajes y proporciones. El
número de elementos comparados dentro de una gráfica circular suele ser de más de cuatro.
Se utilizan en aquellos casos donde interesa no solamente mostrar el número de veces que se dan una
característica o atributo de manera tabular sino más bien de manera gráfica, de tal manera que se pueda visualizar
mejor la proporción en que aparece esa característica respecto del total.
A pesar de su popularidad, se trata de un tipo de gráfico poco recomendable debido a que nuestra capacidad
perceptual para estimar relaciones de proporción o diferencias entre áreas de sectores circulares es mucho menor
que, por ejemplo, entre longitudes o posiciones, tal y como sucede en otras gráficas.

El diagrama circular (también llamado gráfica circular, gráfica de pastel o diagrama de


sectores) sirve para representar variables cualitativas o discretas. Se utiliza para
representar la proporción de elementos de cada uno de los valores de la variable.
Consiste en partir el círculo en porciones proporcionales a la frecuencia relativa.
Entiéndase como porción la parte del círculo que representa a cada valor que toma
la variable.
Diagrama de Caja y Bigotes
Los diagramas de Caja-Bigotes (boxplots o box and whiskers) son una presentación visual que describe varias
características importantes, al mismo tiempo, tales como la dispersión y simetría.

Para su realización se representan los tres cuartiles y los valores mínimo y máximo de los datos, sobre un
rectángulo, alineado horizontal o verticalmente.

 Construcción:
 Comparar distribuciones
 Diagrama de Caja a través de Excel

Construcción:
Una gráfica de este tipo consiste en una caja rectangular, donde los lados más largos muestran el recorrido
intercuartílico. Este rectángulo está dividido por un segmento vertical que indica donde se posiciona la mediana y
por lo tanto su relación con los cuartiles primero y tercero(recordemos que el segundo cuartil coincide con la
mediana).
Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y máximo de la variable.
Las lineas que sobresalen de la caja se llaman bigotes. Estos bigotes tienen tienen un límite de prolongación, de
modo que cualquier dato o caso que no se encuentre dentro de este rango es marcado e identificado individualmente
Las líneas de tendencia se usan para mostrar gráficamente las tendencias de los datos y analizar
los problemas de predicción. Este análisis también se denomina análisis de regresión. Mediante el uso
del análisis de regresión, puede representarse una línea de tendencia en un gráfico más allá de los
datos reales para predecir los valores futuros. Por ejemplo, en el siguiente gráfico se utiliza una línea
de tendencia lineal simple que pronostica los cuatro próximos trimestres para mostrar claramente una
tendencia hacia ingresos en incremento.

Diagrama de dispersión
Un diagrama de dispersión o gráfica de dispersión o gráfico de dispersión es un tipo de diagrama matemático
que utiliza las coordenadas cartesianas para mostrar los valores de dos variables para un conjunto de datos.

Descripción[editar]
Se emplea cuando una variable está bajo el control del experimentador. Si existe un parámetro que se incrementa
o disminuye de forma sistemática por el experimentador, se le denomina parámetro de control o variable
independiente y habitualmente se representa a lo largo del eje horizontal (eje de las abscisas). La variable medida
o dependiente usualmente se representa a lo largo del eje vertical (eje de las ordenadas). Si no existe una variable
dependiente, cualquier variable se puede representar en cada eje y el diagrama de dispersión mostrará el grado
de correlación (no causalidad) entre las dos variables.
Un diagrama de dispersión puede sugerir varios tipos de correlaciones entre las variables con un intervalo de
confianza determinado. La correlación puede ser positiva (aumento), negativa (descenso), o nula (las variables no
están correlacionadas). Se puede dibujar una línea de ajuste (llamada también "línea de tendencia") con el fin de
estudiar la correlación entre las variables. Una ecuación para la correlación entre las variables puede ser
determinada por procedimientos de ajuste. Para una correlación lineal, el procedimiento de ajuste es conocido
como regresión lineal y garantiza una solución correcta en un tiempo finito.
Uno de los aspectos más poderosos de un gráfico de dispersión, sin embargo, es su capacidad para mostrar las
relaciones no lineales entre las variables. Además, si los datos son representados por un modelo de mezcla de
relaciones simples, estas relaciones son visualmente evidentes como patrones superpuestos.
El diagrama de dispersión es una de las herramientas básicas de control de calidad, que incluyen además
el histograma, el diagrama de Pareto, la hoja de verificación, los gráficos de control, el diagrama de Ishikawa y
el diagrama de flujo...

Los dispersogramas son gráficos elaborados a partir la utilización de las


coordenadas cartesianas con el fin de mostrar los valores de datos "x" e "y" de un
mismo elemento suceso. También conocido como diagrama de dispersión, puede
sugerir diferentes tipos de correlaciones entre las variables con un intervalo de
confianza determinado. Dicha correlación puede ser positiva, negativa o nula.
Dispersograma
Gráfico que representa la distribución de dos variables en una población de
muestra. Una variable se representa gráficamente en el eje vertical y la otra
horizontal. Un dispersograma demuestra el grado de tendencia de
presentación de las variables en relación mutua.
Denominamos parámetro de control cuando un parámetro incrementa o
disminuye de forma sistemática por el experimentados. Un diagrama de
dispersión puede indicar diferentes tipos de correlaciones:
 Correlación positiva. Indica un aumento.
 Correlación negativo. Indica un descenso.
 Nula. No hay correlación entre las variables.
Con tal de estudiar la correlación que existe entre las variables, es posible
trazar una línea de ajuste o línea de tendencia. En el caso de una
correlación lineal, el ajuste se conoce como regresión lineal y asegura una
solución correcta en un tiempo finito. Uno de los aspectos más relevantes
del disperiograma es que permite mostrar las relaciones no lineales entre
las variables.

HISTOGRAMA:
En estadística, un histograma es una representación gráfica de una variable en forma de barras, donde la
superficie de cada barra es proporcional a la frecuencia de los valores representados. Sirven para obtener una
"primera vista" general, o panorama, de la distribución de la población, o de la muestra, respecto a una
característica, cuantitativa y continua (como la longitud o el peso). De esta manera ofrece una visión de grupo
permitiendo observar una preferencia, o tendencia, por parte de la muestra o población por ubicarse hacia una
determinada región de valores dentro del espectro de valores posibles (sean infinitos o no) que pueda adquirir la
característica. Así pues, podemos evidenciar comportamientos, observar el grado de homogeneidad, acuerdo o
concisión entre los valores de todas las partes que componen la población o la muestra, o, en contraposición, poder
observar el grado de variabilidad, y por ende, la dispersión de todos los valores que toman las partes, también es
posible no evidenciar ninguna tendencia y obtener que cada miembro de la población toma por su lado y adquiere
un valor de la característica aleatoriamente sin mostrar ninguna preferencia o tendencia, entre otras cosas.

En el eje vertical se representan las frecuencias, es decir, la cantidad de población o la muestra, según sea el caso, que se
ubica en un determinado valor o sub-rango de valores de la característica que toma la característica de interés, evidentemente,
cuando este espectro de valores es infinito o muy grande el mismo es reducido a sólo una parte que muestre la tendencia o
comportamiento de la población, en otras ocasiones este espectro es extendido para mostrar el alejamiento o ubicación de la
población o la muestra analizada respecto de un valor de interés.

Se utilizan para relacionar variables cuantitativas continuas. Para variables cuantitativas discretas las barras se
dibujan separadas y el gráfico se llama diagrama de frecuencias, porque la variable representada en el eje
horizontal ya no representa un espectro continuo de valores, sino valores cuantitativos específicos, igual que ocurre
en un diagrama de barras, usado para representar una característica cualitativa o categórica. Su utilidad se hace
más evidente cuando se cuenta con un gran número de datos cuantitativos y que se han agrupado en intervalos de
clase.
Ejemplos de su uso es la representación de edades o estaturas de una población. Por comodidad, sus valores se
agrupan en clases, es decir, en intervalos continuos. En los casos en los que los datos son cualitativos (no
numéricos), como sexto grado de acuerdo o nivel de estudios, es preferible un diagrama de sectores.
Los histogramas son más frecuentes en ciencias sociales, humanas y económicas que en ciencias naturales y
exactas. Y permite la comparación de los resultados de un proceso.

Tipos de gráficos relacionados con el histograma[editar]


 Histograma de frecuencias absolutas
Representa la frecuencia absoluta mediante la altura de las barras. Se usa mucho en educación no
universitaria por su sencillez, pero sólo se puede aplicar cuando todos los intervalos son iguales, ya que en
ese caso las alturas y las superficies son proporcionales. En esos niveles educativos se introduce una
estadística elemental y todavía no se puede profundizar en estos detalles.

 Histograma de frecuencias relativas


Representa la frecuencia relativa mediante la altura de las barras. Igual que en el caso anterior se usa
mucho en educación no universitaria. La elaboración del gráfico es más complicada pues los números ya
no son enteros. Como en el caso anterior sólo se puede aplicar cuando todos los intervalos son iguales, ya
que en ese caso las alturas y las superficies son proporcionales.

 Histograma
Representa la frecuencia relativa mediante la superficie de las barras. Aunque esto sea cierto en todos los
histogramas, cuando se agrupan los datos en intervalos desiguales hay que atender a la superficie de las
barras, que no se corresponderá con la altura como ocurría en los casos anteriores. Es el que se suele usar
en educación universitaria. Para su elaboración debe introducirse el concepto de altura de histograma, que
es un concepto equivalente al de densidad de probabilidad, y que se calcula dividiendo la frecuencia
relativa de ese intervalo (o sea la superficie que queremos darle) entre la anchura del intervalo (la base del
rectángulo). Ahora las barras tendrán siempre superficie igual a la frecuencia relativa y la suma de todas
esas superficies (de todas las barras) será 1, o sea el 100%.
frente a otros en que no salen nunca) y de la costumbre, se pueden encontrar otras elecciones.
¿Qué es?

Es una gráfica de la distribución de un conjunto de datos. Es un tipo especial de gráfica de barras, en la cual una barra va
pegada a la otra, es decir no hay espacio entre las barras. Cada barra representa un subconjunto de los datos. ¿Qué
muestra el histograma?

Un histograma muestra la acumulación ó tendencia, la variabilidad o dispersión y la forma de la distribución.

¿Para qué tipo de variable se usa? Un histograma es una gráfica adecuada para representar variables continuas, aunque
también se puede usar para variables discretas. Es decir, mediante un histograma se puede mostrar gráficamente la
distribución de una variable cuantitativa o numérica. Los datos se deben agrupar en intervalos de igual tamaño, llamados
clases.
DEFINICIÓN DE POLÍGONO DE FRECUENCIA
Polígono de frecuencia es el nombre que recibe una clase de gráficoque se crea a partir
de un histograma de frecuencia. Estos histogramas emplean columnas verticales para
reflejar frecuencias): el polígono de frecuencia es realizado uniendo los puntos de mayor
altura de estas columnas.

Es decir, por tanto, podríamos establecer que un polígono de frecuencia es aquel que se forma
a partir de la unión de los distintos puntos medios de las cimas de las columnas que
configuran lo que es un histograma de frecuencia. Este se caracteriza porque utiliza siempre lo
que son columnas de tipo vertical y porque nunca debe haber espacios entre lo que son unas y
otras.

En las ciencias sociales, en las ciencias naturales y también en las económicas es donde con
más frecuencia se hace uso de estos mencionados histogramas ya que se emplean para llevar a
cabo lo que es la comparación de los resultados de un proceso determinado.
Se conoce como polígonos de frecuencia para datos agrupados a aquellos que se
desarrollan mediante la marca de clase que tiene coincidencia con el punto medio de las
distintas columnas del histograma. En el momento de la representación de todas las
frecuencias que forman parte de una tabla de datos agrupados, se genera el histograma
de frecuencias acumuladas que posibilita la diagramación del polígono correspondiente.
Un polígono de frecuencia, por ejemplo, permite reflejar las temperaturas máximas
promedio de una ciudad en un determinado periodo temporal. En el eje X (horizontal),
deben indicarse los meses del año (enero, febrero, marzo, abril, etc.). En el eje Y (vertical), en
cambio, se registran las temperaturas más altas promedio de cada mes (28º, 26º, 22º…). El
polígono de frecuencia se creará al unir, mediante un segmento, las diversas temperaturas
más elevadas promedio.
Los polígonos de frecuencia se suelen usar cuando se pretende retratar varias distribuciones
distintas o la clasificación cruzada de una variable cuantitativa continua con una cualitativa o
cuantitativa discreta en el mismo dibujo.

El punto de más altura de un polígono de frecuencia equivale a la mayor frecuencia, mientras


que el área que se sitúa debajo de la curva incluye todos los datos que existen. Cabe recordar
que la frecuencia es la repetición mayor o menor de un evento, o el número de veces
que un acontecimiento periódico se reitera en una unidad temporal.
Dado el valor y la utilidad que tienen los citados polígonos hay que resaltar que estos se
pueden confeccionar de una manera muy sencilla y rápida. En concreto, se da la oportunidad
de acometerlos mediante un programa informático que se ha convertido en uno de los ejes
claves del funcionamiento de cualquier empresa. Nos estamos refiriendo al software conocido
como Excel.

Este es un programa, de Microsoft Office, que se confeccionó con el claro objetivo de que sus
usuarios pudieran trabajar con lo que son hojas de cálculo. Por tal motivo, es lógico que
también permita la posibilidad de crear polígonos de frecuencia a la hora de comparar cifras y
tomar decisiones en base a las mismas.
En concreto, para conseguir crear los mismos con Excel se tiene que partir de la existencia de
una serie de gráficos que se hayan confeccionado previamente para seguidamente desarrollar
un conjunto de acciones que den lugar a aquellos.

También podría gustarte