Está en la página 1de 12

Cómo hacer un

histograma en Excel
Un histograma es una representación gráfica de una variable en forma de
barras donde el tamaño de cada barra es proporcional a la frecuencia del
valor que está representando. El eje horizontal del histograma tiene los
valores de las variables y el eje vertical las frecuencias.

Crear un histograma en Excel


Para este ejemplo supondremos que hemos recolectado las edades de
un grupo de personas que han respondido a una encuesta. En total tengo
un listado de 100 personas con sus respectivas edades:
Para poder crear el histograma en Excel es necesario agrupar los datos
por clases. Por clases nos referimos a las diferentes “categorías” en las
que se clasificarán los datos que en nuestro ejemplo son las edades 18,
19, 20, etc. El objetivo del histograma es representar gráficamente
cuántos elementos pertenecen a cada una de dichas clases.

Si no conoces las clases de los datos de entrada, puedes hacer una


copia del rango de datos y utilizar el comando Quitar duplicados para
obtener una lista de valores únicos. En este caso yo conozco de
antemano que el rango de edades recolectadas en la encuesta está entre
18 y 25 así que lo ingresaré manualmente en la columna C:

Herramienta Histograma en Excel


Para poder clasificar los datos para el histograma en Excel debo
empezar por activar las Herramientas para análisis que son
un complemento de Excel. Debemos ir a la ficha Archivo > Opciones >
Complementos > Complementos de Excel.
Después de activar las Herramientas para análisis debemos ir a la ficha
Datos y dentro del grupo Análisis, hacer clic sobre el comando Análisis
de datos para obtener el siguiente cuadro de diálogo:

Selecciona la opción Histograma la cual nos permitirá especificar los


argumentos necesarios para poder clasificar nuestros datos.
Como Rango de entrada especificaré el rango que contiene las edades
(sin incluir el título de la columna) y en el cuadro Rango de
clases colocaré el rango de celdas con las clases previamente creadas.
Me aseguro de seleccionar la opción En una hoja nueva y de marcar la
opción Crear gráfico. Al pulsar el botón Aceptar se creará una nueva hoja
con el histograma.

Dar formato al Histograma en Excel


Para mejorar un poco la apariencia del gráfico de Histograma recién
creado aplicaré algunas acciones adicionales. Primero eliminaré de la
tabla de datos la opción “y mayor…” de manera que dicha opción no
aparezca en el gráfico y en segundo lugar eliminaré la leyenda del
gráfico.

Finalmente removeré los espacios entre las columnas del gráfico. Para
ello puedes hacer clic derecho sobre alguna de las columnas y
seleccionar la opción Dar formato a serie de datos y en la sección
de Opciones de serie colocar el Ancho del intervalo en 0%.

Después de aplicar este último ajuste tendremos un histograma en


Excel como el mostrado al inicio de este artículo.
Cómo hacer una campana
de Gauss en Excel
Campana de Gauss es el nombre informal que le damos a la
representación gráfica de una distribución normalde un conjunto de
datos, pero ¿qué es una distribución normal? Este es un término
ampliamente conocido en la teoría de probabilidad y estadística.

La distribución normal
Cuando medimos cierto atributo de un grupo de personas u objetos que
nos rodean y los analizamos, es muy común obtener una distribución
normal en los resultados, es decir, la mayoría de los valores estarán
cercanos al promedio mientras que una menor cantidad de valores
estarán ubicados en los extremos.
Por ejemplo, si medimos la estatura de un grupo de personas y
posteriormente graficamos los resultados obtendremos una distribución
normal ya que la mayoría tendrá una estatura promedio pero también
encontraremos algunas personas de menor o mayor estatura.

Ya que la distribución normal también es conocida como distribución de


Gauss y que la forma de la curva del gráfico se asemeja a una campana,
este tipo de gráfico es ampliamente conocido como campana de
Gauss. Antes de aprender cómo hacer una campana de Gauss en
Excel, es necesario repasar un par de conceptos básicos que nos
ayudarán al momento de crear el gráfico.

Promedio y desviación estándar


Como ya lo he mencionado antes, la mayoría de los valores en
una distribución normal se ubicará muy cerca del promedio por lo que es
importante obtener la media de esos valores utilizando la función
PROMEDIO en Excel. El uso de esta función es muy sencillo, solamente
debemos colocar el rango de datos y obtendremos el resultado correcto:

=PROMEDIO(A2:D2)

Otro valor de importancia es la desviación estándar la cual mide la


cercanía de cada uno de los valores respecto al promedio. Entre más
alejados del promedio se encuentren los valores, mayor será la
desviación estándar. Por ejemplo, en la siguiente imagen puedes notar
varios conjuntos de datos cuyo promedio es siempre el mismo pero la
desviación estándar es diferente:

El primer conjunto de valores es el que tiene la desviación estándar más


pequeña porque son los números más cercanos al promedio que es 5.
Para calcular la desviación estándar en Excel utilizamos la función
DESVESTAtal como se muestra en la imagen.

Crear una campana de Gauss en Excel


Ahora estamos listos para crear una campana de Gauss en Excel y
para ello supondremos un conjunto de datos recopilados con la edad de
2000 personas. Todos los datos se encuentran en el rango A2:A2001 y
en la columna C he creado la lista de las edades identificadas, es decir,
los datos contienen edades que van desde los 22 años hasta los 37
años.
Por otro lado, la celda G1 hace uso de la función PROMEDIO para
obtener el promedio del rango A2:A2001 y en la celda G2 he colocado la
desviación estándar utilizando la función DESVESTA. Estos son todos
los datos necesarios para calcular la distribución normal y para ello
utilizaremos la función DISTR.NORM.N de la siguiente manera:

=DISTR.NORM.N(C2,$G$1,$G$2,FALSO)

Esta función nos devuelve la distribución normal para un valor dadas la


media y la desviación estándar como segundo y tercer argumento
respectivamente. En la fórmula he colocado ambos argumentos como
referencias absolutas para que se mantengan fijas al copiar la fórmula
hacia abajo. El último argumento de la función indica si deseamos utilizar
la función de distribución acumulativa y que para nuestro ejemplo
colocaremos el valor falso. Observa el resultado obtenido al copiar esta
fórmula en la columna D:
Ahora nuestros datos están listos y solo nos falta insertar el gráfico y
para ello seleccionaré cualquier celda del rango C1:D17 y pulsaré el
comando Insertar > Gráficos > Dispersión > Dispersión con líneas
suavizadas. Removeré el título y la leyenda del gráfico recién creado y
ajustaré el valor máximo y mínimo del eje horizontal para tener el
siguiente resultado:
Aunque también podríamos crear la campana de Gauss utilizando un
gráfico de líneas, es recomendable hacerlo con un gráfico de dispersión
porque nos permitirá modificar la escala del eje horizontal tal como lo
hice para este ejemplo.

Ahora ya sabes cómo hacer una campana de Gauss en Excel. Solo


debes recordar que debemos comenzar por preparar los datos con las
funciones PROMEDIO, DESVESTA y DISTR.NORM.N para finalmente
insertar el gráfico de dispersión que representará adecuadamente la
distribución normal de nuestros datos.

Coeficiente de determinación
Ajuste ordinario por mínimos cuadrados. Mientras puntos no disten mucho de la línea de la regresión, el
coeficiente de determinación adoptará valores altos.

En estadística, el coeficiente de determinación, denominado R² y pronunciado R cuadrado,


es un estadístico usado en el contexto de un modelo estadístico cuyo principal propósito es
predecir futuros resultados o probar una hipótesis. El coeficiente determina la calidad del
modelo para replicar los resultados, y la proporción de variación de los resultados que puede
explicarse por el modelo.1

Hay varias definiciones diferentes para R² que son algunas veces equivalentes. Las más
comunes se refieren a la regresión lineal. En este caso, el R² es simplemente el cuadrado
del coeficiente de correlación de Pearson, lo cual es sólo cierto para la regresión lineal
simple. Si existen varios resultados para una única variable, es decir, para una X existe una Y,
Z... el coeficiente de determinación resulta del cuadrado del coeficiente de determinación
múltiple. En ambos casos el R² adquiere valores entre 0 y 1. Existen casos dentro de la
definición computacional de R² donde este valor puede tomar valores negativos.2

Para la regresión lineal[editar]


Para la regresión basta con hacer el cuadrado del coeficiente de correlación de Pearson.

Donde:

 sigma yx es la covarianza de (x,y)

 sigma y es la desviación típica de la variable y


 sigma x es la desviación típica de la variable x

También podría gustarte