Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Excel Separata PDF
Excel Separata PDF
El uso tanto de las funciones como de las herramientas estadísticas del Excel 2010 facilita el
aprendizaje de los contenidos teóricos del curso de Estadística a todo nivel.
Esperemos que el documento sea aprovechado en toda su magnitud por todo aquel que ve en
la estadística, una herramienta indispensable en la adecuada toma de decisiones.
Los autores
Estadística en Excel
3
Estadística en Excel
1
¢&yPRKDFHUFiOFXORVHVWDGtVWLFRVHQ([FHO"
)XQFLRQHVHVWDGtVWLFDV
8VRGHXQDIXQFLyQHVWDGtVWLFDV
8VRGHOFXDGURGHGLiORJR,QVHUWDUIXQFLyQ
)XQFLRQHVHVWDGtVWLFDV
+HUUDPLHQWDVGH$QiOLVLV(VWDGtVWLFR
Estadística en Excel
4
1.1 Estadística en Excel
¿Cómo hacer cálculos estadísticos en Excel?
Para hacer cálculos estadísticos en Excel hay dos posibilidades:
Usar las funciones estadísticas.
Usar el cuadro de diálogo análisis de datos
Estadística en Excel
5
Problemas habituales
Funciones estadísticas
Función Descripción
Frecuencias
CONTAR Cuenta cuántos números hay en la lista de argumentos
CONTAR.BLANCO Cuenta el número de celdas en blanco dentro de un rango
CONTAR.SI Cuenta el número de celdas que no están en blanco dentro de un
rango que coincida con los criterios especificados
CONTARA Cuenta cuántos valores hay en la lista de argumentos
FRECUENCIA Devuelve una distribución de frecuencia como una matriz vertical
PERMUTACIONES Devuelve el número de permutaciones para un número
determinado de objetos
COMBINAT Devuelve el número de combinaciones para un número
determinado de objetos. (Categoría Matemáticas)
PROBABILIDAD Devuelve la probabilidad de que los valores de un rango se
encuentren entre dos límites
Promedios
MEDIA.ACOTADA Devuelve la media del interior de un conjunto de datos
MEDIA.ARMO Devuelve la media armónica
MEDIA.GEOM Devuelve la media geométrica
MEDIANA Devuelve la mediana de los números dados
MODA.UNO Devuelve el valor más frecuente en un conjunto de datos
PROMEDIO Devuelve la media aritmética de los argumentos
PROMEDIOA Devuelve la media aritmética de los argumentos, incluidos
números, texto y valores lógicos
Estadística en Excel
6
Medidas de dispersión
COVAR Devuelve la covarianza, el promedio de los productos de las
desviaciones pareadas
DESVEST.M Calcula la desviación estándar basada en una muestra
DESVESTA Calcula la desviación estándar de una muestra, incluidos números,
texto y valores lógicos
DESVEST.P Calcula la desviación estándar de la población total
DESVESTPA Calcula la desviación estándar de la población total, incluidos
números, texto y valores lógicos
DESVIA2 Devuelve la suma de los cuadrados de las desviaciones
DESVPROM Devuelve el promedio de las desviaciones absolutas de la media
de los puntos de datos
VAR.S Calcula la varianza de una muestra
VARA Calcula la varianza de una muestra, incluidos números, texto y
valores lógicos
VAR.P Calcula la varianza en función de toda la población
VARPA Calcula la varianza de la población total, incluidos números, texto
y valores lógicos
Función Descripción
Medidas de posición , asimetría y curtosis
COEFICIENTE.ASIMETRIA Devuelve la asimetría de una distribución
CUARTIL Devuelve el cuartil de un conjunto de datos
CURTOSIS Devuelve la curtosis de un conjunto de datos
JERARQUIA Devuelve la jerarquía de un número en una lista de números
K.ESIMO.MAYOR Devuelve el k-ésimo mayor valor de un conjunto de datos
K.ESIMO.MENOR Devuelve el k-ésimo menor valor de un conjunto de datos
MAX Devuelve el valor máximo de una lista de argumentos
MAXA Devuelve el valor máximo de una lista de argumentos,
incluidos números, texto y valores lógicos
MIN Devuelve el valor mínimo de una lista de argumentos
MINA Devuelve el valor mínimo de una lista de argumentos,
incluidos números, texto y valores lógicos
PERCENTIL Devuelve el k-ésimo percentil de los valores de un rango
RANGO.PERCENTIL Devuelve el rango de un valor en un conjunto de datos como
porcentaje del conjunto
Distribuciones discretas
INV.BINOM Devuelve el valor menor cuya desviación binomial
acumulativa es menor o igual que un valor de un criterio
DISTR.BINOM.N Devuelve la probabilidad de una variable aleatoria discreta
siguiendo una distribución binomial
Estadística en Excel
7
DISTR.HIPERGEOM.N Devuelve la probabilidad para una variable aleatoria discreta
siguiendo una distribución hipergeométrica
NEGBINOM.DIST Devuelve la distribución binomial negativa o Pascal
POISSON.DIST Devuelve la distribución de Poisson
Distribuciones continuas
ALEATORIO Devuelve un número aleatorio mayor o igual que 0 y menor
que 1 distribuido uniformemente. Es volátil.
ALEATORIO.ENTRE Devuelve un número aleatorio entero distribuido
uniformemente entre los límites que se especifique
DISTR.CHICUAD Devuelve la probabilidad de una variable aleatoria continua
siguiendo una distribución chi cuadrado de cola izquierda.
DISTR.CHICUAD.CD Devuelve la probabilidad de una variable aleatoria continua
siguiendo una distribución chi cuadrado de cola derecha.
DISTR.BETA.N Devuelve la función de distribución beta acumulativa
INV.BETA.N Devuelve la inversa de la función de distribución acumulativa
para una distribución beta especificada
DISTR.EXP.N Devuelve la probabilidad de una variable aleatoria continua
siguiendo una distribución exponencial acumulativa (cola
izquierda).
DISTR.F.CD Devuelve la probabilidad de una variable aleatoria continua
siguiendo una distribución F de cola derecha.
DISTR.F.N Devuelve la probabilidad de una variable aleatoria continua
siguiendo una distribución F acumulativa (cola izquierda).
INV.F Devuelve el inverso de una distribución de probabilidad F de
INV.F.CD cola izquierda.
Devuelve el inverso de una distribución de probabilidad F de
cola derecha
DISTR.GAMMA.N Devuelve la probabilidad de una variable aleatoria siguiendo
una distribución gamma acumulativa (cola izquierda).
INV.GAMMA Devuelve el inverso de la función gamma.
DISTR.NORM.N Devuelve la probabilidad de una variable aleatoria continua
siguiendo una distribución normal acumulativa (cola
izquierda). Con una madia y desviación estándar específicos.
DISTR.NORM.ESTAND.N Devuelve la probabilidad de una variable aleatoria continua
siguiendo una distribución normal estándar acumulativa.
INV.NORM.ESTAND Devuelve el inverso de la distribución normal estándar
acumulativa.
INV.NORM Devuelve el inverso de la distribución normal acumulativa.
Con una media y desviación estándar específicas.
DISTR.T.2C Devuelve la probabilidad de una variable aleatoria continua
siguiendo una distribución t de Student de dos colas.
DISTR.T.N Devuelve la probabilidad de una variable aleatoria continua
siguiendo una distribución t de Student de cola izquierda.
Devuelve la probabilidad de una variable aleatoria continua
DISTR.T.CD
siguiendo una distribución t de Student de cola derecha.
Estadística en Excel
8
INV.T Devuelve el inverso de cola izquierda de la distribución t de
INV.T.2C Student.
Devuelve el inverso de dos colas de la distribución t de
Student.
DIST.WEIBULL Devuelve la probabilidad de una variable aleatoria continua
siguiendo una distribución de Weibull acumulativa (cola
izquierda).
NORMALIZACION Devuelve un valor normalizado
Regresión
COEF.DE.CORREL Devuelve el coeficiente de correlación de dos conjuntos de
datos
COEFICIENTE.R2 Devuelve el cuadrado del coeficiente de correlación del
momento del producto Pearson
CRECIMIENTO Devuelve valores en una tendencia exponencial
ERROR.TIPICO.XY Devuelve el error típico del valor de y previsto para cada x de
la regresión
ESTIMACION.LINEAL Devuelve los parámetros de una tendencia lineal
ESTIMACION.LOGARITMICA Devuelve los parámetros de una tendencia exponencial
INTERSECCION.EJE Devuelve la intersección de la línea de regresión lineal
PENDIENTE Devuelve la pendiente de la línea de regresión lineal
PRONOSTICO Devuelve un valor en una tendencia lineal
TENDENCIA Devuelve valores en una tendencia lineal
Pruebas
INTERVALO.CONFIANZA.NORM Devuelve el intervalo de confianza para la media de una
población usando la distribución normal.
INTERVALO.CONFIANZA.T Devuelve el intervalo de confianza para la media de una
población usando la distribución t Student.
PRUEBA.CHICUAD Devuelve una probabilidad llamada “p-valor” de las pruebas
de aplicaciones de la chi cuadrado.
INV.CHICUAD Devuelve el inverso de una probabilidad dada, de cola
izquierda, en una distribución chi cuadrado.
INV.CHICUAD.CD Devuelve el inverso de una probabilidad dada, de cola
derecha, en una distribución chi cuadrado.
PRUEBA.F.N Devuelve una probabilidad llamada “p-valor” del resultado de
una prueba F de dos colas para homogeneidad de varianzas.
PRUEBA.FISHER.INV Devuelve el inverso de la transformación Fisher
PRUEBA.T Devuelve una probabilidad llamada “p-valor” asociada con la
prueba t de Student para dos medias: pareadas, varianzas
desconocidas pero homogéneas o varianzas desconocidas pero
heterogéneas.
PRUEBA.Z Devuelve una probabilidad llamada “p-valor” asociada a una
prueba Z de una cola para una media.
Estadística en Excel
9
1.3 Herramientas para análisis estadístico
La Herramienta de análisis estadístico es un programa de complemento de Excel que está
disponible al instalar Excel., para usarlo es necesario cargarlo primero.
Si el comando Análisis de datos no está disponible, deberá cargar el programa de complemento
Herramientas para análisis
En Excel ir a Opciones
Haga clic en Ir
Estadística en Excel
10
Marcar con un check Herramientas
para análisis y luego haga clic en
Aceptar
Las Herramientas para análisis incluyen las herramientas que se describen a continuación. Para tener
acceso a estas herramientas, haga clic en Análisis de datos en el grupo Análisis de la ficha Datos.
Análisis de varianza de varianza de dos factores con una sola muestra por
grupo
Se usa cuando los datos se clasifican en dos dimensiones diferentes, pero suponemos que
existe una única observación para cada par. Es usado para el análisis de varianza del Diseño
Bloque Completo al Azar.
Coeficiente de Correlación
Calcula una matriz de correlación que muestra el valor del coeficiente de correlación para
cada uno de los pares de variables en estudio.
Las funciones COEF.DE.CORREL y PEARSON hacen lo mismo para dos variables.
Covarianza
Calcula una matriz de correlación que muestra el valor de la covarianza para cada uno de los
pares de variables en estudio.
La función COVAR hace lo mismo para dos variables.
Estadística descriptiva
Genera un informe estadístico de una sola variable para los datos del rango de entrada, y
proporciona información acerca de la tendencia central y dispersión de los datos.
Estadística en Excel
11
Suavización exponencial
Predice un valor basándose en el pronóstico del período anterior, ajustándose al error en ese
pronóstico anterior. La herramienta utiliza la constante de suavización a, cuya magnitud
determina la exactitud con la que los pronósticos responden a los errores en el pronóstico
anterior.
Los valores de 0,2 a 0,3 son constantes de suavización adecuadas. Estos valores indican que el
pronóstico actual debe ajustarse entre un 20% y un 30% del error en el pronóstico anterior.
Las constantes mayores generan una respuesta más rápida, pero pueden producir proyecciones
erróneas. Las constantes más pequeñas pueden dar como resultado retrasos prolongados en los
valores pronosticados.
Histograma
Calcula las frecuencias individuales y acumulativas de rangos de celdas de datos y de clases
de datos. Esa herramienta genera datos acerca del número de apariciones de un valor en un
conjunto de datos.
Media móvil
Proyecta valores en el período de pronósticos, basándose en el valor promedio de la variable
calculada durante un número específico de períodos anteriores.
Una media móvil proporciona información de tendencias que se vería enmascarada por una
simple media de todos los datos históricos. Utilice esta herramienta para pronosticar ventas,
inventario u otras tendencias. Todos los valores de pronóstico están basados en la siguiente
fórmula:
donde:
N es el número de períodos anteriores que se incluyen en la media móvil
Aj es el valor real en la hora j
Fj es el valor pronosticado en la hora j
Jerarquía y percentil
Crea una tabla que contiene los rangos ordinales y porcentuales de cada valor de un conjunto
de datos. Puede analizar la importancia relativa de los valores en un conjunto de datos.
Esta herramienta utiliza las funciones JERARQUÍA y RANGO.PERCENTIL
Regresión
Realiza un análisis de regresión lineal utilizando el método de los "mínimos cuadrados" para
ajustar una línea a una serie de observaciones. Puede utilizar esta herramienta para analizar la
forma en que los valores de una o más variables independientes afectan a una variable
dependiente.
Usa a función ESTIMACION.LINEAL de la hoja de cálculo.
Estadística en Excel
12
Muestras
Crea una muestra de población tratando el rango de entrada como una población. Cuando la
población sea demasiado grande para procesarla o para presentarla gráficamente, puede
utilizarse una muestra representativa. Además, si cree que los datos de entrada son periódicos,
puede crear una muestra que contenga únicamente los valores de una parte determinada de un
ciclo.
Estadística en Excel
13
Estadística Descriptiva
Estadística en Excel
14
Estadística descriptiva
El presente capítulo tiene como objetivo mostrar, partiendo de una base de datos, el uso de Excel para
organizar y presentar las variables en cuadros de resumen, en gráficas y calcular las principales
medidas descriptivas. Los ejercicios están diseñados para que el estudiante pueda manejar con
propiedad las variables cualitativas y cuantitativas.
Caso 1:
Enigma S.A., fabricante de productos lácteos, cuenta actualmente con 3257 trabajadores. Para la
aplicación efectiva de una filosofía de administración para la calidad total (TQM) en toda la compañía
e incrementar así la productividad, el consejo de directores de la empresa ha puesto en marcha un
estudio del perfil de los trabajadores para medir su satisfacción con el trabajo. Como parte del estudio
se tomó una encuesta a 185 empleados elegidos al azar.
3. Edad: ________
6. Ingresos anuales familiares totales netos (en soles) el año pasado: _______________
9. Las oportunidades de ser promovido a un puesto superior, ¿son mejores o peores para personas de su género?
͔ 1. Mejores ͔ 2. Peores ͔ 3. El género no influye
10. ¿Cuántas veces que ha sido capacitado formalmente por la empresa? _________
11. ¿Rechazaría otro trabajo de más paga para poder quedarse en Enigma S.A.?
͔ 1. Muy probable 2. Probable ͔ 3. No está seguro
͔ 4. Improbable ͔ 5. Muy improbable
12. ¿Cómo son las relaciones en su lugar de trabajo entre la gerencia y los trabajadores?
͔ 1. Muy buenas ͔ 2. Buenas ͔ 3. Regulares
͔ 4. Malas 5. Muy malas
En el archivo BaseDatos_1.xlsx se muestran las respuestas obtenidas en la encuesta. Para cada una de
las pregunta se ha definido una variable.
Estadística en Excel
15
Ejercicio 1- Distribución de frecuencia y gráfico de
columnas
El presente ejercicio tiene como objetivo lograr que el alumno se familiarice con las herramientas del
Excel en la elaboración de cuadros o tablas, así como la de gráfico de columnas.
Solución
Estadística en Excel
16
Hacer clic en Aceptar y arrastrando el recuadro tipo de errores a la zona de fila y a la zona de
campos de campos de valor nos da lo siguiente.
Copie la tabla a partir de la celda D21. Calcule la frecuencia relativa (h) y la frecuencia
relativa acumulada (H).
b. El gráfico de columnas.
Estadística en Excel
17
Para seleccionar dos columnas no contiguas se procede de la siguiente manera: Seleccione el
rango de datos: D21:D26, luego presione Crtl y el rango F21:F26
Clic en la opción Insertar de la barra de menú y active el icono Columnas
• Y luego aceptar.
• Aparece la siguiente ventana.
Doble clic en el área del gráfico, aparecerá una pestaña de Herramientas de gráficos con las
opciones: Diseño, Presentación y formato. Seleccionar Presentación, y de ahí escogemos el
botón Título de gráfico, rótulo del eje y etiqueta de datos.
Estadística en Excel
18
En el botón título de gráfico, seleccionamos la ubicación del título encima del gráfico y
escribimos: Distribución porcentual de trabajadores según opinión si rechazaría
propuesta de trabajo por quedarse en la empresa.
• En rótulos del eje, escogeremos Eje X y eje Y, según corresponda y escribiremos su etiqueta.
Estadística en Excel
19
En el botón etiquetas de datos, activa la posición donde irán los valores de cada barra.
Para cambiar a porcentaje los valores del eje Y y las etiquetas de valor :
Doble clic en la columna de los valores del eje Y, aparecerá la siguiente ventana:
Estadística en Excel
20
Asi quedará:
ŝƐƚƌŝďƵĐŝſŶƉŽƌĐĞŶƚƵĂůĚĞƚƌĂďĂũĂĚŽƌĞƐƐĞŐƷŶŽƉŝŶŝſŶ
ƐŝƌĞĐŚĂnjĂƌşĂƉƌŽƉƵĞƐƚĂĚĞƚƌĂďĂũŽƉŽƌƋƵĞĚĂƌƐĞĞŶůĂ
ĞŵƉƌĞƐĂ
ϯϬй Ϭ͘Ϯϱϵϱ
Ϭ͘ϭϵϰϲ Ϭ͘ϮϬϬϬ Ϭ͘ϮϬϱϰ
WŽƌĐĞŶƚũĂĞ
ϮϬй Ϭ͘ϭϰϬϱ
ϭϬй
Ϭй
DƵLJ /ŵƉƌŽďĂďůĞ EŽĞƐƚĄ WƌŽďĂďůĞ DƵLJƉƌŽďĂďůĞ
ŝŵƉƌŽďĂďůĞ ƐĞŐƵƌŽ
KƉŝŶŝſŶ
• Igual, las etiquetas de valor lo cambiamos a porcentaje, con dos decimales: doble clic sobre
los valores y nos muestra:
Estadística en Excel
21
ŝƐƚƌŝďƵĐŝſŶƉŽƌĐĞŶƚƵĂůĚĞŽƉŝŶŝſŶƐŝƌĞĐŚĂnjĂƌşĂ
ƉƌŽƉƵĞƐƚĂĚĞƚƌĂďĂũŽƉŽƌƋƵĞĚĂƌƐĞĞŶůĂ
ĞŵƉƌĞƐĂ
ϯϬй Ϯϱ͘ϵϱй
Ϯϱй ϭϵ͘ϰϲй ϮϬ͘ϬϬй ϮϬ͘ϱϰй
WŽƌĐĞŶƚũĂĞ
ϮϬй
ϭϰ͘Ϭϱй
ϭϱй
ϭϬй
ϱй
Ϭй
DƵLJ /ŵƉƌŽďĂďůĞ EŽĞƐƚĄ WƌŽďĂďůĞ DƵLJƉƌŽďĂďůĞ
ŝŵƉƌŽďĂďůĞ ƐĞŐƵƌŽ
KƉŝŶŝſŶ
Estadística en Excel
22
Ejercicio 2 - Tabla de contingencia o de doble entrada
El presente ejercicio tiene como finalidad que el alumno maneje los procedimientos para la
elaboración de una tabla de contingencia o de doble entrada.
Las tablas de contingencia se emplean para registrar y analizar la relación entre dos o más variables.
Se utilizan para representar gráficamente variables nominales u ordinales.
En la hoja Ejercicio 2, copie los datos de las variables Genero (1) y Prom-gen (9) y elabore:
Solución
Clic en Aceptar.
Aparecerá:
Estadística en Excel
23
Arrastre el recuadro Prom-gen que aparece en el lado superior derecho a la zona de campos de
fila y Género va al encabezado de columna.
Luego arrastre cualquiera de las variables, al campo de valor, aparecerá la tabla dinámica:
Estadística en Excel
24
Ubique el cursor del mouse sobre la celda Cuenta de Prom-gen y dé doble clic.
Aparecerá el siguiente cuadro:
Activar pestaña de mostrar datos como y seleccionar de las opciones el % del total general
Estadística en Excel
25
Nota: De manera similar se pueden obtener las frecuencias porcentuales respecto al total
columnas o de filas seleccionando la opción: % del total de columna o % del total de fila
según sea el caso
b. Tomando como base la tabla de frecuencias relativas obtenida en el punto anterior, elabore
el diagrama de columnas de la variable Género por Prom-gen.
Hacer doble clic en el área del gráfico y aparecerá una pestaña de Herramientas de gráficos
con las opciones: Diseño, Presentación y formato. Seleccionar Presentación, y de ahí
escogemos botón Título de gráfico, rótulo del eje y etiqueta de datos.
Estadística en Excel
26
KƉŝŶŝſŶĚĞŽƉŽƌƚƵŶŝĚĂĚĞƐĚĞƐĞƌƉƌŽŵŽǀŝĚŽƐĞŶĞů
ƚƌĂďĂũŽLJŐĠŶĞƌŽ
ϲϬ͘ϬϬй
ϱϬ͘ϬϬй
WŽƌĐĞŶƚĂũĞ
ϰϬ͘ϬϬй
ϯϬ͘ϬϬй
&ĞŵĞŶŝŶŽ
ϮϬ͘ϬϬй
ϭϬ͘ϬϬй DĂƐĐƵůŝŶŽ
Ϭ͘ϬϬй
DĞũŽƌĞƐ EŽŝŶĨůƵLJĞ WĞŽƌĞƐ
KƉŝŶŝſŶ
• En el botón etiquetas de datos, seleccionar la posición donde irán los valores de cada barra.
Estadística en Excel
27
El ejercicio 3 tiene como objetivo elaborar el gráfico de Pareto el cual es un gráfico de barras
ordenado por frecuencias por medio del cual se puede detectar e identificar los problemas que tienen
más relevancia, por lo que este tipo de gráfico es utilizado para separar los aspectos significativos de
un problema y dirigir adecuadamente los esfuerzos de mejora.
Caso 2.
CBT Co es un distribuidor de productos de automatización eléctricos y transmisiones de poder.
Últimamente se ha observado un constante retraso en las entregas por lo que el gerente desea saber
cuáles son los errores más frecuentes para tomar una acción de mejora. Por lo tanto diseñó un formato
donde se registran los errores de cada orden que no se entregan a tiempo. Los datos se encuentran en la
base de datos ÓRDENES. Realice un análisis de los tipos de errores que se presentan en la entrega a
destiempo de los pedidos y ayude al gerente a decidir cuáles son las causas principales de este
problema.
Solución
Seleccione la pestaña Insertar luego active la opción tabla dinámica.
Seleccione el rango de datos B1:B101 y la ubicación de salida del cuadro en la celda D4.
Arrastre el recuadro Tipo de errores que aparece en el lado superior derecho, a la zona de
FILA y a la zona de DATOS. Luego presione Aceptar y Finalizar para obtener la tabla
dinámica.
Estadística en Excel
28
Clic en aceptar y resultará:
Estadística en Excel
29
Como las dos últimas categorías tienen una cantidad muy baja podemos unirlos en otro rubro
denominado “otros”. Crear nueva tabla en D29.
Ahora pulsamos con el botón derecho del mouse en cualquiera de las barras Pi. Clic en
cambiar tipo de gráfico en serie y elegimos tipo de gráfico Líneas
Estadística en Excel
30
En él hay que hacer varias modificaciones:
En segundo lugar, pulsamos con el botón derecho del mouse sobre cualquiera de los puntos de
la línea y elegimos la opción Dar Formato de serie de datos.
Estadística en Excel
31
En el recuadro Opciones de serie, seleccionar Eje secundario.
Y luego cerrar.
Igual se hace para modificar los valores del eje de la derecha que está entre 0 y 100.
Ahora, colocaremos los valores sobre los puntos de la línea. Hacer clic sobre la línea y
seleccionamos agregar etiquetas de datos y automáticamente aparecen los valores.
Estadística en Excel
32
Y para terminar en la barra de menú escoger Insertar y seleccionar la pestaña Presentación.
Escoger botón Título de gráfico, rótulo del eje y etiqueta de datos para completar todo el
gráfico y finalmente quedará como se muestra a continuación.
Estadística en Excel
33
Ejercicio 4 – Distribución de frecuencias de datos
discretos y gráfico.
Con el desarrollo del ejercicio 4, se espera lograr en el alumno elabore tablas y gráfico para datos
discretos.
Para este ejercicio trabajaremos con el archivo Base de datos.xls con la hoja Ejercicio 4. Copie los
datos de la variable No-Capac (10) y elabore:
Solución
Estadística en Excel
34
En la ventana de FRECUENCIA, ingrese en Datos el rango de los datos que se desea contar
B2:B186.
En Grupos, ingrese el rango de celdas de las categorías de la variable D6:D11.
Nota.- Una manera alternativa de obtener la tabla de frecuencias es con la función contar o con el
uso de la tabla dinámica.
b. El diagrama de bastones.
Estadística en Excel
35
• Seleccione las celdas F6:F11
Estadística en Excel
36
Se muestra la siguiente tabla para designar el rango de rotulo de datos
Marcar la serie derecha, click derecho –Formato de serie de datos-color de línea-sin línea
Para hacer los bastones, seleccionar el área de gráfico, y en herramientas de gráfico, la opción
Líneas-Líneas de unión
Estadística en Excel
37
Tener en cuenta que en opciones del eje, el eje vertical cruza en categoría 1, se han agregado
etiquetas en formato porcentaje.
Estadística en Excel
38
Ejercicio 5 - Distribución de frecuencias con intervalos y
gráficos.
En el siguiente ejercicio tiene como objetivo mostrar paso a paso la herramienta proporcionada por
Excel para la elaboración de tablas de frecuencia para datos agrupados en intervalos, así como sus
gráficas respectivas.
En la hoja Ejercicio 5 del archivo BaseDatos_1.xlsx, copie los datos de la variable Ing-pers (5) y
elabore:
a. La tabla de frecuencias con los datos agrupados en intervalos. Utilice la regla de Sturges.
b. El histograma, el polígono de frecuencias y la ojiva.
Solución
a. La tabla de frecuencias con los datos agrupados en intervalos. Utilice la regla de Sturges.
En la celda H5 elija como el límite inferior del primer intervalo el valor mínimo. A partir de
este valor genere los demás límites. En la celda H6, sume la amplitud del intervalo para
determinar el segundo límite inferior de clase. Continúe en las celdas siguientes verticalmente
hasta completar los límites inferiores de las clases restantes.
Obtenga los límites superiores correspondientes a cada clase.
A partir de la celda K5 obtenga la marca de clase de cada intervalo que es el promedio de los
respectivos límites.
Estadística en Excel
39
Obtenga las frecuencias utilizando la metodología vista en el ejercicio 4, considerando como
GRUPOS los límites superiores de los intervalos.
Estadística en Excel
40
b. El histograma, el polígono de frecuencias y la ojiva.
Seleccionar H5:H13, luego en barra de menú la opción Insertar, columna, columna agrupada
Para que se junten los rectángulos: hacer clic en una barra, y elegir dar formato a serie de
datos, luego en ancho del intervalo 0%
Para que aparezca los límites de cada clase, se procede de la siguiente manera.
Clic con el botón derecho en una barra y seleccionar datos.
Estadística en Excel
41
Clic en editar e indicar posición de los rótulos del eje
Y para finalizar colocar el eje Y en porcentaje, el título del gráfico y los rótulos del eje Y e X.
De una manera similar debe construirse el polígono de frecuencias y la ojiva, tal como se
muestra a continuación.
Estadística en Excel
42
Estadística en Excel
43
Ejercicio 6 - Medidas descriptivas para datos no
agrupados o simples
En el siguiente ejercicio tiene como objetivo mostrar paso a paso la herramienta proporcionada por
Excel para el cálculo de las medidas descriptivas para datos agrupados en intervalos.
En la hoja de ejercicios 6 copie los datos de la variable No-Capac (10) y calcule las medidas
descriptivas.
Solución
En la celda E15 active el ícono Insertar función. En el cuadro de diálogo O seleccionar una
categoría: seleccione Estadísticas y seleccionar una función PROMEDIO
Estadística en Excel
44
El mismo procedimiento debe seguir para el cálculo de las otras medidas descriptivas. Digite
las siguientes fórmulas a partir de la celda E16.
MEDIANA =MEDIANA(B2:B186)
MODA =MODA.UNO(B2:B186)
VARIANZA MUESTRAL =VAR.S(B2:B186)
DESVIACIÓN ESTANDAR MUESTRAL =DESVEST.M(B2:B186)
Otra opción fácil de emplear para calcular las principales medidas descriptivas es usando la
barra de menú. Active Datos, luego Análisis de datos y estadística descriptiva.
Luego dé aceptar.
Estadística en Excel
45
Se visualizará lo siguiente, luego de dar aceptar a la ventana anterior.
No-capac
Media 1.448648649
Error típico 0.09321301
Mediana 1
Moda 1
Desviación estándar 1.267834001
Varianza de la muestra 1.607403055
Curtosis 0.446737249
Coeficiente de asimetría 0.852503002
Rango 5
Mínimo 0
Máximo 5
Suma 268
Cuenta 185
Estadística en Excel
46
Ejercicio 7 – Medidas descriptivas para datos no
agrupadas de acuerdo a las categorías de una
variable cualitativa.
En el siguiente ejercicio tiene como objetivo mostrar paso a paso la herramienta proporcionada por
Excel para el cálculo de medidas descriptivas para datos no agrupados de variables cualitativas.
En la hoja de ejercicio 7 copie los datos de las variables Función (2) e Ing-pers (5) y calcule la media,
la desviación estándar y el coeficiente de variación del ingreso personal de los trabajadores (Ing-pers)
para cada tipo de función de trabajador (Función).
Solución
Estadística en Excel
47
Ubique el cursor del mouse sobre la celda Suma de Ing-pers y dé doble clic. Aparecerá el
cuadro la configuración de campo de valor.
Los datos de la tabla dinámica cambian presentando los promedios de los ingresos personales
por categoría de la variable Función.
A partir de la celda E15 elabore una tabla copiando los resultados obtenidos en la tabla
dinámica.
Estadística en Excel
48
Nuevamente ubique el cursor del mouse esta vez sobre la celda Promedio de Ing-pers y dé
doble clic.
Aparecerá el cuadro Configuración de campo de valor.
En el grupo de opciones Resumir campo de valor por, seleccionar la opción Desvest y dé
Aceptar.
Copie los valores de las desviaciones estándar de las categorías de función en la tabla inferior,
al lado de los respectivos valores del promedio.
Finalmente obtenga los valores del coeficiente de variación (CV) de cada categoría de función
dividiendo la desviación estándar entre el promedio y expresando el resultado en porcentaje.
Estadística en Excel
49
Estadística en Excel
50
Ejercicio 8 – Diagrama de cajas
El siguiente ejercicio tiene como objetivo mostrar paso a paso la herramienta proporcionada por Excel
para la construcción de los diagramas de cajas.
Haga un diagrama de cajas que permita comparar las notas del parcial por horario
Calcule los percentiles de cada sección y escríbalos de la siguiente manera:
Estadística en Excel
51
En la barra de menú, escoger insertar luego diseño y finalmente cambiar entre filas y
columnas.
Con esto se eliminará la línea horizontal. Hay que repetir el proceso hasta eliminar todas las
líneas.
Estadística en Excel
52
Dé clic en el gráfico y elija la opción Análisis, Barras ascendentes o descendentes y nos
dará:
Estadística en Excel
53
Ejercicio 9. Diagrama de dispersión y coeficiente de
correlación
El siguiente ejercicio tiene por objetivo mostrar paso a paso las herramientas proporcionada por Excel
para la construcción de los diagramas de dispersión y el cálculo del coeficiente de correlación.
Un curso de estadística tiene tres horarios y el coordinador del curso y los profesores están interesados
en construir gráficos que le permita analizar las notas de las distintas evaluaciones y en los distintos
horarios. Los datos se encuentran en el archivo: Base_Datos_2.xlsx.
Realice un diagrama de dispersión y calcule el coeficiente de correlación entre las variables notas de
la primera práctica y notas del parcial.
Solución
Estadística en Excel
54
Añadir el título y rotular los ejes
Marque cualquiera de los puntos azules y de botón derecho. Marque la opción Agregar línea
de tendencia… del menú desplegable.
Estadística en Excel
55
Insertar la función : COEF.DE.CORREL.
Dé aceptar.
Ingrese los datos de las dos variables que quiere relacionar:
Estadística en Excel
56
Distribución de probabilidades
Ejercicio 1 - Distribución Binomial
Estadística en Excel
57
Ejercicio 1 – Distribución Binomial
Se sabe que el 12% de las personas que son atendidas en un centro de telefonía móvil se quejan de la
atención. Se eligen aleatoriamente a 180 personas que son atendidas en dicho centro de atenciones.
Solución
a. Sea X: la cantidad de personas que se quejan de la atención del centro de telefonía.
X ∼B (180; 0,12) y la probabilidad que nos piden es: P(x 45)
Trabaje en una hoja nueva. En la celda B2 ingrese el número de ensayos: 180. En la celda B3
ingrese la probabilidad de éxito: 0,12.
A partir de la celda A6, construya una tabla con los valores de x de 0 a 180.
Estadística en Excel
58
NOTA 1: Recuerda que debes fijar con la tecla de función F4 los valores de: Ensayos (180) y
Prob_éxito (0,12) y en Acumulado escribir cero o falso (para que te arroje la probabilidad
simple y no acumulada).
Luego dar clic en aceptar y se obtendrá la probabilidad cuando X es igual 0
NOTA 2: Los otros valores de la probabilidad de x (P(X=x) serán obtenidos realizando un
arrastre.
Estadística en Excel
59
La respuesta es:
P(X< = 45) = 0.99999953
Hacer clic donde dice dispersión (el primer icono) y automáticamente te presentara el siguiente
gráfico:
Estadística en Excel
60
Este gráfico nos muestra el comportamiento de una variable que tiene distribución Binomial con los
parámetros n=180 y p=0,12.
Nota: Si se desea dar formato al gráfico (es decir, agregarle título, indicar los subtítulos en los ejes,
etc.) hacer clic en un lugar dentro del mismo y automáticamente en la parte superior de la hoja de
cálculo aparecerán las opciones y elegir uno de los iconos donde dice diseño de gráfico. Si se elige el
primero, con un solo clic Excel te dará la opción que se observa en el gráfico siguiente:
Ahora con un solo clic en cada uno de los títulos podrás cambiarlos.
Estadística en Excel
61
También puedes usar el gráfico de bastones visto en el capítulo 2 para obtener algo así:
Estadística en Excel
62
Ejercicio 2 – Distribución hipergeométrica
En un lote de 150 computadoras de la marca Compacto, existen 40 computadoras con el disco duro
dañado. Un comprador desea adquirir todo el lote, pero lo hará siempre y cuando, al elegir 60
computadoras al azar, al probarlas a lo más 3 de ellas estén dañadas.
a. Elabore la tabla de distribución de probabilidades del número de computadoras con disco duro
dañado.
b. Halle la probabilidad de seleccionar más de 20 pero menos de 33 computadoras con el disco duro
dañado.
c. Halle la probabilidad que el comprador no adquiera el lote.
Solución
Estadística en Excel
63
Hacer clic en aceptar y aparecerá la siguiente ventana:
Estadística en Excel
64
b. Para el cálculo del valor P (20 < X < 33), de la tabla sume los valores de probabilidad de X = 21 a
X = 32; para esto ubicar el cursor en una celda vacía y escribir:
=SUMA (C21:C32)
Solución
a. La variable sigue una distribución hipergeométrica con parámetros N, M, n = 4
En una hoja de cálculo defina los valores de los parámetros de la distribución tal como se
muestra a continuación:
Estadística en Excel
65
Para cada serie de parámetros generar una tabla de distribución de probabilidades, la variable
aleatoria variará en este caso de 0 a 4.
b. Generar una tabla de distribución de probabilidades de la variable binomial con n=4 y p=1/3.
De las dos tablas anteriores, se observa que las probabilidades obtenidas con la distribución
hipergeométrica con N=1200, M=400, n=4, se asemejan a las probabilidades obtenidas con la
distribución binomial con n=4 y p=1/3.
c. Los valores de las tablas se presentan en un solo gráfico, tal como se muestra a continuación:
Estadística en Excel
66
Comparación de las distribuciones
hipergeométrica y binomial
0.50
0.45
0.40
0.35 12
0.30 24
60
P(x)
0.25
120
0.20 1200
0.15 Binomial
0.10
0.05
0.00
0 1 2 3 4
X
El gráfico muestra que a medida que el tamaño de la población es más grande respecto del
tamaño de la muestra, la distribución hipergeométrica tiende a comportarse como una distribución
binomial, es decir que la proporción de éxitos en la población se puede considerar
aproximadamente constante. En la gráfica, las curvas correspondientes a la distribución binomial y
e la hipergeométrica con N = 1200 están prácticamente superpuestas.
Estadística en Excel
67
Ejercicio 4 - Distribución de Poisson
El número de pacientes por día que llegan al consultorio de la doctora Carla sigue una distribución de
Poisson con un promedio de 10 clientes por día. Por lo complicado de su horario, dado que trabaja
también en otros hospitales, ella solo puede atender un máximo de 20 clientes. Si llegan más de 20
clientes, al exceso los atenderá al día siguiente en estricto orden de llegada.
a. Elabore la tabla de distribución de probabilidades de la variable X: número de pacientes que llegan
al consultorio de la doctora al día.
b. ¿Cuál es la probabilidad de que lleguen más de 10pacientes pero a lo más 19 en un día cualquiera?
c. ¿Cuál es la probabilidad de atender pacientes al día siguiente?
Solución
Estadística en Excel
68
Ingresar los valores de la variable y los parámetros de la distribución. Como la función se
copiará en las celdas inferiores, no olvidar fijar las celdas con F4.
b. Para encontrar P(10 < X < = 19) se debe ubicar el cursor en una celda vacía cualquiera y escribir:
=SUMA(C14:C23) la respuesta es: 0.53861594
Estadística en Excel
69
Ejercicio 5 – Distribución Exponencial
Una empresa brinda un servicio a su público mediante el uso de una ventanilla de atención. El tiempo
que transcurre entre llegadas de clientes sigue una distribución exponencial con un tiempo promedio
entre llegadas de 4 minutos. Si se define X como el tiempo que transcurre desde la llegada del último
cliente:
a. ¿Cuál es la probabilidad de que deba esperarse máximo 15 minutos para que llegue un cliente?
b. ¿Cuál es la probabilidad de que deba esperarse más de 10 minutos para que llegue un cliente?
c. ¿Cuál es la probabilidad de que deba esperarse más de 10 minutos pero menos de 20 minutos
para que llegue un cliente?
Solución
Estadística en Excel
70
El valor encontrado es: P(X 15) = 0.976482254
Note que en este caso en Acum se DEBERÁ escribir 1, ya que se está calculando una
probabilidad acumulada.
b. Para obtener P(X > 10) = 1 - P(X 10), en una celda vacía escribir:
=1-DISTR.EXP.N(10,0.25,1)
DISTR.EXP.N(20,0.25,1) - DISTR.EXP.N(10,0.25,1)
Estadística en Excel
71
Ejercicio 6 – Distribución Normal
Una máquina dispensadora de refrescos está ajustada para servir un promedio de 200 mililitros por
vaso. Si la cantidad de refresco está normalmente distribuida con una desviación estándar de 15
mililitros:
a. ¿Cuál es la probabilidad de que un vaso contenga menos de 224 mililitros?
b. ¿Cuál es la probabilidad de que un vaso contenga entre 191 y 209 mililitros?
c. ¿Cuál es la probabilidad de que un vaso se derrame si se utilizan vasos de 230 mililitros?
d. ¿Debajo de qué valor se obtiene el 25% de refrescos con menor contenido?
Solución
Dar clic en aceptar e ingresar los valores de los parámetros de la distribución y de la variable y
en acumulado digitar 1 o verdadero. Obtendrá el valor de la función acumulada. P(X < 224)
= 0,9452
Estadística en Excel
72
b. De manera similar al procedimiento seguido en el inciso anterior, se calculan las probabilidades
acumuladas para los valores 191 y 209.
c. La probabilidad de que un vaso se derrame es: P(X > 230), entonces aplicando complemento
tenemos: P(X > 230) = 1 – P(X 230) = 1 – DISTR.NORM.N(230,200,15,1)
= 1 - 0,97725 = 0,02275
d. El cálculo requiere utilizar la función inversa dado que el dato es la probabilidad y la incógnita es el
valor de la variable.
En una celda vacía ingresar el valor 0,25 que corresponde a la proporción de contenidos de
menos valor.
Estadística en Excel
73
Ingrese los valores de los parámetros de la distribución y de la probabilidad. Obtendrá el valor de la
variable: X = 189,882654
Estadística en Excel
74