Documentos de Académico
Documentos de Profesional
Documentos de Cultura
La palabra estadística tiene varias acepciones para cada persona. Para un fanático de fútbol es la
información referente a los goles anotados por su equipo y los juegos en los que ha obtenido
victorias, para un gerente de una compañía petrolera es el número de barriles de petróleo vendidos
en una temporada específica, para el director de una escuela, es la información acerca del
ausentismo, las calificaciones de los alumnos y los sueldos de su personal docente.
Todas estas personas están empleando correctamente el término estadística y sin embargo cada
una de ellas le da un significado ligeramente diferente y la usa para un propósito un poco distinto.
En vista de que los números están presentes en todos los campos de la actividad humana, la
estadística que es una de las ciencias que estudia el manejo de los números, debe ser una
herramienta de cotidiano uso para los tomadores de decisiones.
Reseña Histórica
La palabra estadística proviene de una voz italiana statista que significa “estadista”, la acuño
Gottfried Achenwall (1719-1772, un profesor en Marlborough y Göttinguen.
Las estadísticas oficiales del gobierno tienen la misma antigüedad que la historia escrita. En el
Antiguo Testamento encontramos varias relaciones de censos. Los gobiernos de Egipto, Babilonia
y Roma reunían registros detallados de la población de los recursos. En la Edad Media, los
gobiernos empezaron a asentar en documentos la propiedad del suelo. En el año 762 el emperador
Carlomagno pidió descripciones pormenorizadas de las propiedades de la Iglesia.
Debido al temor que Enrique VII tenía por la peste, en Inglaterra empezaron a registrase las
defunciones en 1532. Más o menos por la misma época, en Francia la ley exigió a los clérigos
registrar los bautismos, fallecimientos y matrimonios. Durante un brote de peste que apareció a
fines de la década de 1500el gobierno inglés comenzó a publicar estadísticas semanales de los
decesos. Esa costumbre continuó muchos años y en 1632 estos Bills of Mortality contenían los
nacimientos y fallecimientos por sexo. En 1662, el capitán John Graunt usó documentos que
abarcaban 30 años y efectuó predicciones sobre el número de personas que morirían de varias
enfermedades y sobre las proporciones de nacimientos de varones y mujeres que cabía esperar. El
trabajo de Graunt condensado en su obra titulada Natural and Political Observations… Made upon
the Bills of Mortality fue un esfuerzo innovador en el análisis estadístico.
La historia del desarrollo de la teoría estadística y de su aplicación es muy larga. Solo nos hemos
limitado a mencionar aquellos que hicieron importantes aportaciones a esta disciplina.
Subdivisiones de la Estadística
Los Gerentes aplican algunas técnicas estadísticas prácticamente en todas las ramas de la
empresa pública y privada. Esas técnicas son tan diversas que los estadísticos suelen agruparlas
en dos categorías generales: estadística descriptiva y estadística inferencial.
Supongamos que un profesor calcula la calificación promedio de un curso. Dado que la estadística
describe el aprovechamiento de ese grupo pero sin hacer generalizaciones sobre varios grupos
podemos afirmar que el profesor está aplicando la estadística descriptiva. Las gráficas, tablas y
diagramas que muestran los datos son ejemplo de este tipo de estadística.
Supongamos que ahora el profesor decide servirse de las calificaciones para estimar el promedio
de diez grupos que asisten al mismo curso. El proceso de estimación de la calificación promedio
sería un problema de estadística inferencial
1
Organización de Datos
Los datos son colecciones de un número cualquiera de observaciones relacionadas entre sí. Por
ejemplo:
21 35 24 23 28 33 32 29
32 40 22 32 24 25 26 33
25 42 37 35 35 27 19 31
Ordenamiento de datos
Para que los datos sean útiles debemos organizarlos para poder obtener tendencias y llegar a
conclusiones lógicas. Excel permite organizar datos en forma ascendente o descendente, siga
estos pasos
3. Utilice los controles de Ordenar por para seleccionar la columna que servirá de criterio para
realizar el ordenamiento, luego seleccione el tipo de ordenamiento Ascendente o
Descendente,
5. Indique si el rango seleccionado contiene o no contiene una fila de títulos para evitar que
se incluya en el ordenamiento.
2
7. Observe los datos ordenados
La finalidad de organizar los datos es permitirnos ver rápidamente todas las características
posibles de los datos que hemos recabado, Buscamos valores máximos, mínimos, tendencias
notorias, valores en torno a los cuales los datos tienden a agruparse, etc.
3
Organización de Datos mediante Distribuciones de Frecuencia
Frecuencia Absoluta
El arreglo de datos es una de las formas más sencillas de presentar los datos. Agrupa los valores
en forma ascendente o descendente.
Los arreglos de datos ofrecen varias ventajas sobre los datos brutos:
La tabla de distribución de frecuencia es una forma de sintetizar los datos, organiza los datos en
clases es decir en grupos de valores que describen una característica de los datos.
1. Defina el número de clases: no existe un método para definir el número de clases a utilizar
en una distribución de frecuencia, así que el número dependerá del número de
observaciones a arreglar, un ordenamiento de datos permitirá definir el valor mínimo de la
primera clase y el valor máximo de una clase.
2. Definir el intervalo de clases: para definir el intervalo de clase utilizar esta ecuación:
4
Creación de una Distribución de Frecuencia en Excel
2. Defina el ancho de los intervalos de clase, (utilice el procedimiento descrito en la página 4),
digite los limites superiores de cada clase en un rango distinto del que ocupa los datos.
5
4. Seleccione Histograma y haga clic en Aceptar.
5. En el campo Rango de entrada Indique el rango de datos que contiene los valores a ser
tomados en cuenta para el conteo.
En el campo Rango de clases indique el rango que contiene los límites superiores de los
intervalos.
6
6. Observe el conteo y edite la tabla de distribución de frecuencias para mejorar su estética
La sumatoria de las frecuencias debe ser igual al número de datos contenidos en el rango
de entrada
7
Frecuencia Relativa
La frecuencia absoluta muestra un conteo de datos respecto a las clases definidas, en base a ella
podemos construir una frecuencia relativa que es la comparación de la frecuencia absoluta de
cada clase contra el total de datos. La frecuencia relativa debe expresarse en forma de porcentaje.
Para calcular la frecuencia relativa divida la frecuencia absoluta de la clase entre el numero total de
observaciones. Para la primera clase: 3 / 24 = 0.125 o sea 12.5%. La sumatoria de las frecuencias
relativas siempre es 100%.
Frecuencia Frecuencia
Clase
Absoluta Relativa
19 - 22 3 12.5%
23 - 26 6 25.0%
27 - 30 3 12.5%
31 - 34 6 25.0%
35 - 38 4 16.7%
39 - 42 2 8.3%
y mayor... 0 0.0%
SUMATORIA 24 100%
La frecuencia relativa permite realizar mejores observaciones a un conjunto de datos, en este caso
podemos afirmar que solamente el 8.3% de los alumnos del curso de Excel Estadístico superan los
38 años.
8
Graficación de Distribución de Frecuencia
Las gráficas ofrecen datos en una representación bidimensional. Sobre el eje horizontal mostramos
los valores de la variable (la característica que estamos midiendo); siguiendo nuestro ejemplo sería
las edades de los alumnos. Sobre el eje vertical marcamos las frecuencias mostradas de las clases
mostradas sobre el eje horizontal.
Las gráficas de distribución de frecuencia y de distribución de frecuencia relativa son útiles porque
ponen de relieve y aclaran las tendencias que no se captan tan fácilmente en las tablas.
Histograma
Existen 2 alternativas
Primera Alternativa: Utilice el procedimiento descrito en la página 5, en el paso 5 marque la opción
Crear Gráfico. Y haga clic en Aceptar.
Esta acción le permitirá crear en forma simultánea una distribución de frecuencia y su histograma
respectivo
Histograma
6
5
Frecuencia
2
1
0
22 26 30 34 38 42 y
mayor...
Clase
9
Segunda Alternativa: Si creó la distribución de frecuencias y ha realizado modificaciones estéticas
a la misma inserte un gráfico tipo columna y utilice como rango de datos las celdas que contienen
las clases y sus frecuencias respectivas.
7
6
Número de Alumnos
5
4
3
2
1
0
Edades
19 - 22 23 - 26 27 - 30 31 - 34 35 - 38 39 - 42
2. El área de cada rectángulo muestra la proporción del número total de datos que ocurren en
esa clase.
10
Polígono de Frecuencia
Aunque de menor uso, los polígonos de frecuencias son otro medio de representar gráficamente
tanto las distribuciones de frecuencia absoluta como las de frecuencia relativa.
Para construir un polígono de frecuencia en Excel, únicamente cambie el tipo de gráfico del
histograma a Líneas.
11
Ojiva
Una distribución de frecuencia acumulativa nos permite ver cuántas observaciones se hallan por
arriba o debajo de ciertos valores, en lugar de limitarnos a encontrar el número de elementos
dentro de los intervalos. Se llama Ojiva a la gráfica de una distribución de frecuencia acumulativa.
En una distribución de frecuencia acumulativa los valores de cada clase comprenden los valores
acumulados de todas las clases anteriores. Podemos formar frecuencias acumulativas absolutas y
relativas.
Frecuencia Frecuencia
Frecuencia Frecuencia
Clase Acumulativa Acumulativas
Absoluta Relativa
Absoluta Relativa
22 3 3 12.5% 12.5%
26 6 9 25.0% 37.5%
30 3 12 12.5% 50.0%
34 6 18 25.0% 75.0%
38 4 22 16.7% 91.7%
42 2 24 8.3% 100.0%
En esta frecuencia acumulativa podemos afirmar que únicamente 12 estudiantes tienen edades
menores o iguales a 30 años
Para construir una Ojiva en Excel cree un gráfico de líneas utilizando como origen de datos el
rango de celdas que contienen las clases y la Frecuencia Acumulativa.
Ojiva
30
25
20
15
10
0
22 26 30 34 38 42
Frecuencia Acumulativa
12
MÓDULO II
MEDIDAS DESCRIPTIVAS DE UNA DISTRIBUCIÓN DE FRECUENCIA
En el módulo I aprendimos a ordenar datos, construir tablas y gráficas a partir de datos brutos. Las
representaciones resultantes de las distribuciones de frecuencia nos permitieron discernir las
tendencias y patrones de los datos pero necesitamos medidas exactas de un conjunto de datos, los
que llamaremos estadísticos resumidos, ellos nos servirán para describir ciertas características de
dicho conjunto. A partir de ellos lograremos una comprensión mas precisa de los datos de la que
podríamos conseguir con nuestras tablas y gráficas.
Curva A
Curva A Curva B
3. Medidas de Sesgo (Asimetría): las curvas que representas los datos pueden ser simétricas o
asimétricas (sesgadas), las curvas simétricas
Curva A: Curva B:
Sesgada a la derecha Sesgada a la izquierda
13
La curva A está sesgada a la derecha (asimetría positiva), pues disminuye al extremo superior
de la escala. Lo contrario sucede con la curva B (asimetría negativa) dado que disminuye
gradualmente hacia el extremo inferior de la escala.
Curva Mesocúrtica
(meso, palabra griega que
significa “mitad”)
Curva Leptocúrtica
(lepto, palabra griega que
significa “esbelto”)
Curva Platicúrtica
(platos, palabra griega que
significa “ancho” o “plano”)
14
Medidas de Tendencia Central
La Media Aritmética:
La mayor parte de las veces cuando nos referimos al “promedio” de algo, estamos hablando de la
media aritmética. Ellos sucede en tales como la temperatura promedio en verano de una ciudad, la
vida promedio de una batería de un vehículo y la producción promedio de maíz una hectárea de
tierra.
Siga este procedimiento para calcular en Excel la media aritmética de un conjunto de datos.
1. Digite los datos en la hoja de cálculo y posicione el cursor en la celda donde desea ubicar
el resultado del cálculo de la media.
15
4. Busque la función Promedio y haga clic en Aceptar.
5. Indique el (los) rango(s) que contiene los datos cuya Media se desea conocer, haga clic en
Aceptar.
16
FUNCION PROMEDIO
Devuelve el promedio (media aritmética) de los argumentos.
Sintaxis
PROMEDIO(número1;número2;...)
Número1, número2, ... son entre 1 y 30 argumentos numéricos cuyo promedio desea obtener.
Observaciones
Los argumentos deben ser números o nombres, matrices o referencias que contengan
números.
Si el argumento matricial o de referencia contiene texto, valores lógicos o celdas vacías,
estos valores se pasan por alto; sin embargo, se incluirán las celdas con el valor cero.
Una distribución de frecuencia está compuesta de datos que se agrupan por clases y no
necesariamente conocemos los valores individuales de cada clase.
Supongamos que tenemos una distribución de frecuencia sobre el saldo promedio de los saldos
mensuales de las cuentas de cheques de 600 clientes en una agencia bancaria.
Clases
Frecuencia
Limite Inferior Limite Superior
0 49.99 78
50 99.99 123
100 149.99 187
150 199.99 82
200 249.99 51
250 299.99 47
300 349.99 13
350 399.99 9
400 449.99 6
450 499.99 4
Para encontrar la media aritmética de estos datos agrupados siga estos pasos:
17
2. Multiplique cada frecuencia por su respectiva marca de clase
Clases Frecuencia X
Frecuencia Marcas de Clase
Limite Inferior Limite Superior Marca de clase
0 49.99 78 25.0 1,950
50 99.99 123 75.0 9,224
100 149.99 187 125.0 23,374
150 199.99 82 175.0 14,350
200 249.99 51 225.0 11,475
250 299.99 47 275.0 12,925
300 349.99 13 325.0 4,225
350 399.99 9 375.0 3,375
400 449.99 6 425.0 2,550
450 499.99 4 475.0 1,900
Sumatorias 600 85,347
3. Divida la sumatoria de los productos de las frecuencias y marcas de clase por la sumatoria
de la frecuencia.
Media = 85,347
600
Media = 142.25
18
La Media Ponderada
La media ponderada nos permite obtener un promedio que tiene en cuenta la importancia de cada
valor para el total global.
Tomemos como ejemplo el de una compañía que usa 3 grados de mano de obra (no calificada,
semicalificada y calificada). La compañía desea conocer el costo promedio de la mano de obra por
hora para cada uno de los productos.
En este caso cada tipo de mano de obra tiene un grado de importancia distinto en el desarrollo del
producto. Para calcular la media ponderada siga este procedimiento:
Para mano de obra no calificada sería igual a 1/8 =0.125, que expresado porcentualmente
es igual a 12.5%. Es decir 1 hora de mano de obra no calificada sobre 8 horas de trabajo
que requiere el producto. Repetimos el procedimiento de cada elemento hasta completar el
100%.
2. Multiplique el grado de importancia de cada elemento por cada observación en este caso el
Sueldo por Hora, seguidamente sume los productos obtenidos.
19
La Media Geométrica
Algunas veces estamos manejando cantidades que cambian a lo largo del período; entonces
necesitamos conocer una tasa promedio de cambio, como el crecimiento promedio a través de un
periodo de varios años. En tales casos la media aritmética no es apropiada porque no proporciona
las respuestas correctas.
Consideremos por ejemplo, el crecimiento de una cuenta de ahorros. Supóngase que depositamos
L100.00 inicialmente y dejamos que el interés se acumule a diferentes tasas por 5 años. El
crecimiento se resume en esta tabla.
Factor de Ahorros al
Año Tasa de Interés
Crecimiento final del Año
0 0 0.00 100.00
1 7% 1.07 107.00
2 8% 1.08 115.56
3 10% 1.10 127.12
4 12% 1.12 142.37
5 18% 1.18 168.00
El factor de crecimiento es la cantidad por la cual multiplicamos los ahorros al inicio del año para
obtener los ahorros al final del año.
Para conocer la Media Geométrica utilice la función MEDIA.GEOM y aplíquela al rango que
contiene el factor de crecimiento de los datos, se encuentra en la categoría de funciones
Estadísticas.
FUNCIÓN MEDIA.GEOM
Sintaxis
MEDIA.GEOM(número1;número2; ...)
Número1, número2, ... son de 1 a 30 argumentos cuya media desea calcular. También puede
utilizar una matriz única o una referencia matricial en lugar de argumentos separados con punto y
coma.
Observaciones
Los argumentos deben ser números o nombres, matrices o referencias que contengan
números.
Si el argumento matricial o de referencia contiene texto, valores lógicos o celdas vacías, estos
valores se pasan por alto; sin embargo, se incluirán las celdas con el valor cero.
Si uno de los puntos de datos ≤ 0, MEDIA.GEOM devuelve el valor de error #¡NUM!.
Esto significa que si multiplicamos 100.00 X 1.1093 X 1.1093 X 1.1093 X 1.1093 X 1.1093
obtendremos la cantidad de 168 al término del quinto año.
20
La Mediana
La mediana es una medida de tendencia central diferente de las medias que hemos venido
explicando hasta ahora. La mediana es un solo valor del conjunto de datos que mide el elemento
central de los datos. Ese elemento es el mas central en el conjunto de números. La mitad de los
elementos se encuentran por arriba de este punto y la otra mitad cae debajo de él.
Cálculo de la Mediana
Para calcular en forma manual la mediana de un conjunto de datos primero se ordenan en forma
ascendente o descendente. Si el conjunto contiene un número impar de datos, el de la mitad será
la mediana. Si existe un número par de elementos, la mediana será el promedio de los dos que se
hallen en la mitad.
Para calcular la mediana de un conjunto de datos en Excel utilice la función MEDIANA, la cual se
encuentra en la categoría de funciones Estadísticas.
FUNCION MEDIANA
Sintaxis
MEDIANA (número1;número2; ...)
Número1, número2, ... son entre 1 y 30 números cuya mediana desea obtener.
Observaciones
Los argumentos deben ser números o nombres, matrices o referencias que contengan
números. Microsoft Excel examina todos los números en cada argumento matricial o de
referencia.
Si el argumento matricial o de referencia contiene texto, valores lógicos o celdas vacías, estos
valores se pasan por alto; sin embargo, se incluirán las celdas con el valor cero.
21
La Moda
La moda es una medida de tendencia central que difiere de la media, pero que se parece un poco
a ella porque realmente no se calcula por medio de los procesos ordinarios de la aritmética. La
moda es el valor que mas se repite dentro del conjunto de datos.
Para encontrar la moda en un conjunto de datos en Excel utilice la función Moda, la cual se
encuentra en la categoría de funciones Estadísticas.
FUNCION MODA
Devuelve el valor que se repite con más frecuencia en una matriz o rango de datos. Al igual que
MEDIANA, MODA es una medida de posición.
Sintaxis
MODA(número1;número2; ...)
Número1, número2, ... son de 1 a 30 argumentos cuya moda desea calcular. También puede
utilizar una matriz única o una referencia matricial en lugar de argumentos separados con punto y
coma.
Observaciones
Los argumentos deben ser números, nombres, matrices o referencias que contengan números.
Si el argumento matricial o de referencia contiene texto, valores lógicos o celdas vacías, estos
valores se pasan por alto; sin embargo, se incluirán las celdas con el valor cero.
Si el conjunto de datos no contiene puntos de datos duplicados, MODA devuelve el valor de
error #N/A.
22
Observaciones y Conclusiones sobre las Medidas de Tendencia Central
2. Una desventaja de la media es que es afectada por valores extremos, es decir muy altos o
muy bajos.
3. La mediana ofrece varias ventajas sobre la media. La más importante consiste en que los
valores extremos no la afectan tan profundamente como a la media. La mediana es fácil de
entender y puede ser calculada con cualquier clase de datos, podemos obtener la mediana
aún cuando los datos sean descripciones cualitativas como el color o la nitidez de un
aparato de televisión.
4. La moda, a semejanza de la mediana, puede usarse como una localización central para
datos cualitativos y también cuantitativos. A la moda tampoco la afectan los valores
extremos. A pesar de estas ventajas la moda se usa menos para medir la tendencia central
que la media y la mediana. Algunas veces no hay un valor modal porque el conjunto de
datos no contiene valores que ocurran mas de una vez, otras veces la moda se repite
muchas veces, en ambos casos la moda es una medida inútil.
23
Medidas de Dispersión
Dos o más conjuntos de datos pueden tener la misma localización central y no obstante ser muy
distintos si uno se halla mas disperso que el otro. En la siguiente figura la media de las 3 curvas es
la misma pero la curva A tiene menor dispersión (o variabilidad) que la curva B y ésta a su vez
menor variabilidad que la curva C.
Curva A
Curva B
Curva C
¿Por qué la dispersión de la distribución es una característica tan importante de entender y medir?
Segundo, puesto que se trata de problemas típicos en los datos sumamente dispersos, se
requiere la capacidad de reconocer que los datos están muy dispersos, de lo contrario no
podremos abordar esos problemas.
Tercero, podemos comparar las dispersiones de varias muestras, si no conviene tener una
amplia dispersión de valores o si esa dispersión representa un gran riesgo, debemos ser
capaces de reconocerlo y no escoger las distribuciones que presentan la máxima
dispersión.
A los analistas financieros les interesa la dispersión de las ganancias de una empresa. Las
utilidades con una fuerte dispersión, o sea las que incluyen desde niveles extremadamente altos
hasta los muy bajos incluso negativos indican un riesgo mayor para los inversionistas que las
utilidades que permanecen relativamente estables. De igual manera, los expertos en control de
calidad analizan la dispersión de los niveles de calidad de un producto. Un medicamento que tiene
una pureza promedio pero que fluctúa entre muy alto grado de pureza e impureza puede constituir
un peligro para la vida del paciente.
a. Distancia
b. Desviación Promedio
c. Dispersión Relativa
24
Medidas de Distancia
Intervalo
El intervalo es la diferencia entre el valor mas alto y el mas bajo observados. Siga este
procedimiento para calcular el intervalo de un conjunto de datos:
1. Obtenga el valor máximo de la muestra, utilice la función MAX, encuentre la función MAX
en la categoría Funciones Estadísticas.
FUNCION MAX
Devuelve el valor máximo de un conjunto de valores.
Sintaxis
MAX(número1;número2; ...)
Número1, número2, ... son entre 1 y 30 números de los cuales desea encontrar el valor
máximo.
Observaciones
Puede especificar los argumentos que sean números, celdas vacías, valores lógicos o
representaciones numéricas en texto. Los argumentos que sean valores de error o
texto que no se pueda traducir a números causarán errores.
Si un argumento es una matriz o referencia, sólo se usan los números de esa matriz o
referencia. Las celdas vacías, valores lógicos o texto que se encuentren dentro de la
matriz o referencia se pasan por alto. Utilice MAXA si no se deben pasar por alto los
valores lógicos y el texto.
Si el argumento no contiene números, MAX devuelve 0.
Aplique la función MAX al rango de datos cuyo valor máximo se desea conocer.
25
2. Obtenga el valor mínimo de la muestra, utilice la función MIN, encuentre la función MIN en
la categoría Funciones Estadísticas.
MIN
Devuelve el valor mínimo de un conjunto de valores.
Sintaxis
MIN(número1;número2; ...)
Número1, número2, ... son entre 1 y 30 números de los que desea encontrar el valor
mínimo.
Observaciones
Puede especificar los argumentos que sean números, celdas vacías, valores lógicos o
representaciones numéricas en texto. Los argumentos que sean valores de error o
texto que no se pueda traducir a números causarán errores.
Si un argumento es una matriz o referencia, sólo se usan los números de esa matriz o
referencia. Las celdas vacías, valores lógicos o texto que se encuentren dentro de la
matriz o referencia se pasan por alto. Si los valores lógicos o el texto no deben pasarse
por alto, utilice la función MINA.
Si los argumentos no contienen números, MIN devuelve 0.
Aplique la función MAX al rango de datos cuyo valor máximo se desea conocer.
3. Reste el valor mínimo del máximo, el resultado obtenido será el intervalo de los datos.
26
Intervalo de Interfractil
En una distribución de frecuencia, una fracción o proporción de los datos se encuentra en un fractil
o debajo de él. Así la mediana es el .5 fractil porque la mitad del conjunto de datos son menores o
iguales que este valor. Los fractiles se asemejan a los porcentajes. En toda distribución, 25% de
los datos se halla en el .25 fractil o debajo de él. El intervalo de interfractil es una medida de la
dispersión entre los valores del fractil.
Para calcular este intervalo dividimos los datos en 4 partes cada una de ellas contiene 25% de los
elementos de la distribución. Los cuarteles son los valores máximos en las 4 partes y el intervalo
del intercuartil es la diferencia entre los valores del primer y tercer cuartiles:
Intervalo de Intercuartil
FUNCIÓN CUARTIL
Devuelve el cuartil de un conjunto de datos. Los cuartiles se usan con frecuencia en los datos de
ventas y encuestas para dividir las poblaciones en grupos. Por ejemplo, puede utilizar la función
CUARTIL para determinar el 25 por ciento de ingresos más altos en una población.
Sintaxis
CUARTIL(matriz;cuartil)
Matriz es la matriz o rango de celdas de valores numéricos cuyo cuartil desea obtener.
Cuartil indica el valor que se devolverá.
27
Observaciones
Si el argumento matriz esta vacío, CUARTIL devuelve el valor de error #¡NUM!
Si el argumento cuartil no es un número entero, se trunca.
Si cuartil < 0 o si cuartil > 4, CUARTIL devuelve el valor de error #¡NUM!
Las funciones MIN, MEDIANA y MAX devuelven el mismo valor que CUARTIL cuando el
argumento cuartil es igual a 0 (cero), 2 y 4 respectivamente.
La desviación del cuartil mide el intervalo promedio de un cuarto de los datos. Es representativa de
todos ellos ya se que obtiene tomando un promedio de la mitad intermedia de los datos en vez de
escoger una de las cuartas partes.
28
Medidas de Desviación Promedio
Las descripciones mas completas de la dispersión son aquellas que se refieren a la desviación
promedio respecto a alguna medida de tendencia central. Dos de esas medidas son importantes en
nuestro estudio de la estadística: la varianza y la desviación standard. Ambas nos indican una
distancia promedio de cualquier observación en el conjunto de datos a partir de la media de la
distribución.
Para calcular la Desviación Absoluta Promedio utilice la función DESVPROM, que se encuentra en
la categoría de Funciones Estadísticas.
FUNCION DESVPROM
Devuelve el promedio de las desviaciones absolutas de la media de los puntos de datos.
DESVPROM mide la dispersión de los valores en un conjunto de datos.
Sintaxis
DESVPROM(número1;número2;...)
Número1, número2, ... son de 1 a 30 argumentos cuyo promedio de las desviaciones absolutas
desea calcular. También puede utilizar una matriz única o una referencia matricial en lugar de
argumentos separados con punto y coma.
Observaciones
Los argumentos deben ser números o nombres, matrices o referencias que contengan
números.
Si el argumento matricial o de referencia contiene texto, valores lógicos o celdas vacías,
estos valores se pasan por alto; sin embargo, se incluirán las celdas con el valor cero.
29
Varianza
La varianza se asemeja a la desviación absoluta promedio, sólo que utiliza la suma de los
cuadrados de las distancias entre la media y cada elemento. En el caso del intervalo, desviación de
cuartil y desviación absoluta promedio las respuestas fueron expresadas en las mismas unidades
que los datos. En el caso de la varianza las unidades son los cuadrados de las unidades, por
ejemplo, “dólares al cuadrado” o “galones al cuadrado”.
Para calcular la Varianza de una población utilice la función VARP, que se encuentra en la
categoría de Funciones Estadísticas.
FUNCIÓN VARP
Calcula la varianza en función de toda la población.
Sintaxis
VARP(número1;número2; ...)
Número1, número2, ... son de 1 a 30 argumentos numéricos correspondientes a una población.
Observaciones
VARP parte de la hipótesis de que los argumentos representan la población total. Si sus
datos representan una muestra de la población, utilice VAR para calcular la varianza.
Se pasan por alto los valores lógicos como VERDADERO y FALSO y el texto. Si los
valores lógicos y el texto no se deben pasar por alto, utilice la función de hoja de cálculo
VARPA.
40 150 210
60 170 210
120 170 220
140 180 240
140 190 250
30
Desviación Standard
La desviación standard es útil para describir cuánto se apartan de la media de la distribución los
elementos que la conforman.
Para calcular la desviación standard de una población utilice la función DESVESTP, que se
encuentra en la categoría de Funciones Estadísticas.
FUNCION DESVESTP
Calcula la desviación estándar de la población total determinada por los argumentos. La desviación
estándar es la medida de la dispersión de los valores respecto a la media (valor promedio).
Sintaxis
DESVESTP(número1; número2; ...)
Número1, número2, ... son de 1 a 30 argumentos numéricos correspondientes a una población.
También puede utilizar una matriz única o una referencia matricial en lugar de argumentos
separados con punto y coma.
Se pasan por alto los valores lógicos, como VERDADERO y FALSO, y de texto. Si los
valores lógicos y el texto no se deben pasar por alto, utilice la función de hoja de cálculo
DESVESTA.
Observaciones
DESVESTP parte de la hipótesis de que los argumentos representan la población total. Si
sus datos representan una muestra de la población, utilice DESVESTP para calcular la
desviación estándar.
Cuando el tamaño de las muestras es importante, las funciones DESVEST y DESVESTP
devuelven aproximadamente el mismo valor.
40 150 210
60 170 210
120 170 220
140 180 240
140 190 250
31
Medidas de Dispersión Relativa
Coeficiente de Variación
Le desviación standard es una medida absoluta de dispersión y expresa la variación en las mismas
unidades que los datos originales. La desviación standar no es la única base para comparar dos
distribuciones. Necesitamos una medida relativa que nos de una idea general de la magnitud de la
desviación standard en relación con la magnitud de la media. El coeficiente de variación es
precisamente esa medida de dispersión.
58.29
CV= X 100 = 35.1%
166
La importancia del CV estriba en ¿qué tan conveniente es que los datos estén alejados de la
media?, un porcentaje alto representa que gran cantidad de los datos están relativamente lejos de
la media, y un porcentaje bajo significa que los datos están cerca de la media.
32
MODULO III PROBABILIDADES
Introducción
La probabilidad forma parte de nuestra vida diaria, en las decisiones de carácter personal y
gerencial, enfrentamos la incertidumbre y nos valemos de la teoría de la probabilidad, sin importar
si admitimos o no el empleo de una herramienta tan refinada. Cuando oímos un pronóstico del
tiempo, cambiamos nuestros planes, en vez de ir a un día de campo nos quedamos en casa a ver
la televisión.
Vivimos en un mundo donde somos incapaces de pronosticar el futuro con absoluta certeza. La
necesidad de sortear la incertidumbre nos lleva a estudiar y aplicar la teoría de la probabilidad. En
muchos casos.
Conceptos Básicos
b. Experimento: Proceso que lleva a la ocurrencia de una y sólo una de varias observaciones
posibles.
Por ejemplo:
Tipos de Probabilidad
Probabilidad Clásica
La probabilidad clásica se basa en la suposición de que los resultados de un experimento son
igualmente viables, desde el punto de vista clásico, la probabilidad de que un evento suceda se
calcula dividiendo el número de resultados favorables entre el número de resultados posibles:
33
Probabilidad Relativa
La teoría de la probabilidad relativa establece que la probabilidad de que un evento ocurra se
determina al observar en qué fracción de tiempo sucedieron eventos similares en el pasado. En
términos de una fórmula:
Probabilidad Subjetiva
Si existe poca o ninguna experiencia anterior o información sobre la cual basar la probabilidad,
podemos llegar a ella en forma subjetiva. En esencia esto significa que un individuo evalúa las
opiniones disponibles y otra información y después estima o asigna la probabilidad.
Reglas de Probabilidad
La mayor parte de los gerentes que utilizan las probabilidades se interesan en dos situaciones:
Nos interesa el primer caso cuando preguntamos: “¿Cuál es la probabilidad de que la demanda de
hoy exceda nuestro inventario?” En las siguientes secciones explicaremos los métodos para
responder a estas preguntas
Reglas de Adición
P (2 o 3) = P (2) + P (3)
P (2 o 3) = 1/6 + P 1/6
P (2 o 3) = 2/6
P (2 o 3) = 0.3333
P (2 o 3) = 33.3%
34
Si dos eventos no son mutuamente excluyentes la regla de adición se modifica:
P(A o B) = P (A) + P (B) – P(AB)
P (~A) = 1- P (A)
P (~5) = 1 - P (5)
P (~5) = 1 – 1/6
P (~5) = 1 – 0.1667
P (~5) = 0.8333
P (~5) = 83.33%
Ejercicio:
Una muestra de empleados de World Wide Enterprises participa en una encuesta sobre un nuevo
plan de pensión. Los empleados se clasifican como sigue:
35
Probabilidades en Condiciones de Independencia Estadística
Probabilidad Marginal
Una probabilidad marginal o incondicional es la simple probabilidad de que suceda un evento. En el
lanzamiento de un dado P(1) o sea la probabilidad de obtener 1 es igual a 1/6. El lanzamiento no
es afectado por lanzamientos previos, a eso se le llama probabilidad marginal.
Probabilidad Conjunta
La probabilidad de que dos o más eventos ocurran al mismo tiempo o en sucesión es el producto
de sus probabilidades marginales. En forma matemática puede expresarse así:
P(AB) = P (A) x P (B)
Ejercicio:
Utilizando la misma muestra de empleados de World Wide Enterprises quienes están participando
en una encuesta sobre un nuevo plan de pensión.
36
Probabilidad Condicional
La tercera clase de probabilidad es la condicional que se expresa matemáticamente así:
P (B|A) = P (B)
Donde P (B|A): Probabilidad del evento B si el evento A ha ocurrido.
Donde P (B) = Probabilidad de que ocurra el evento B
P (4|6) = P (4)
P (4|6) = 1/6
P (4|6) = 0.1667
P (4|6) = 16.67%
Ejercicio:
Utilizando la misma muestra de empleados de World Wide Enterprises quienes están participando
en una encuesta sobre un nuevo plan de pensión.
37
Probabilidades en Condiciones de Dependencia Estadística
Probabilidad Condicional
Expresada en una fórmula general la ecuación de probabilidad condicional en condiciones de
dependencia estadística es:
P (B|A) = P (A B)
P (A)
Donde P (B | A): Probabilidad del evento B si el evento A ha ocurrido.
Ejemplo: Supongamos que tenemos una caja de diez bolas distribuidas del modo siguiente:
3 son de colores y están punteadas
1 es de color y tiene rayas
2 son grises y punteadas
4 son grises y tienen rayas
Una persona extrae de la caja una bola de colores. ¿Cuál es la probabilidad de que sea punteada?
¿Cuál es la probabilidad de que tenga rayas?
Para responder dividimos el número de bolas entre la cantidad total de bolas de colores.
Número de
Clasificación Evento Caballeros Damas
Empleados
Supervisores A 120 75 45
Mantenimiento B 50 27 23
Producción C 1,460 511 949
Administración D 302 158 144
Secretarias E 68 - 68
Sumatoria 2,000 771 1,229
38
Probabilidad Conjunta
Ejemplo: Supongamos que tenemos una caja de diez bolas distribuidas del modo siguiente:
3 son de colores y están punteadas
1 es de color y tiene rayas
2 son grises y punteadas
4 son grises y tienen rayas
Una persona extrae de la caja una bola de colores. ¿Cuál es la probabilidad de que sea punteada y
que sea gris P (GP)?
Ejercicio:
Utilizando la misma muestra de empleados de World Wide Enterprises quienes están participando
en una encuesta sobre un nuevo plan de pensión.
Número de
Clasificación Evento Caballeros Damas
Empleados
Supervisores A 120 75 45
Mantenimiento B 50 27 23
Producción C 1,460 511 949
Administración D 302 158 144
Secretarias E 68 - 68
Sumatoria 2,000 771 1,229
39
Probabilidad Marginal
Las probabilidades marginales se calculan sumando las probabilidades de todos los eventos
conjuntos en que ocurre el evento simple. En el ejemplo precedente, podemos obtener la
probabilidad del evento marginal del evento “bolas de colores” sumando las probabilidades de los
dos eventos conjuntos en que ocurren las bolas de colores:
Ejercicio:
Utilizando la misma muestra de empleados de World Wide Enterprises quienes están participando
en una encuesta sobre un nuevo plan de pensión.
Número de
Clasificación Evento Caballeros Damas
Empleados
Supervisores A 120 75 45
Mantenimiento B 50 27 23
Producción C 1,460 511 949
Administración D 302 158 144
Secretarias E 68 0 68
Sumatoria 2,000 771 1,229
40
MODULO IV Distribuciones de Probabilidad
Las distribuciones de frecuencia son una forma útil de condensar las variaciones de los datos
observados. Las distribuciones de probabilidad guardan relación con las de frecuencia. En efecto
podemos concebir una distribución de probabilidad como una distribución teórica de frecuencia, es
decir como se espera que varíen los datos.
Una distribución de frecuencia es un listado de las frecuencias observadas de todos los resultados
de un experimento que, en realidad se han presentado cuando se llevó a cabo el experimento, en
cambio, una distribución de probabilidad es un listado de las probabilidades de todos los resultados
posibles que podrían presentarse si se llevara a cabo el experimento.
Discreta: se dice que una probabilidad es discreta cuando asume únicamente un número
limitado de valores, por ejemplo la probabilidad de mes de nacimiento de una persona se
reduce a 12 resultados posibles.
Esta última es una forma adecuada de representar las distribuciones discretas que tienen
multitud de resultados posibles, muy cercanos unos de otros.
Variables Aleatorias
Una variable aleatoria es aquella que sume diferentes valores a consecuencia de los resultados de
un experimento aleatorio. Estas variables pueden ser discretas o continuas. Si se permite que una
variable aleatoria adopte sólo un numero limitadote valores, se le llama variable aleatoria discreta.
Si se le permite asumir cualquier valor dentro de determinados limites, recibe el nombre de variable
aleatoria continua.
Por ejemplo una clínica de detección de cáncer mamario no puede conocer con exactitud cuantas
mujeres serán examinadas en un día cualquiera. Por tanto, el nùmero de pacientes a atender es
una variable aleatoria. Los expedientes diarios de la clínica indican que los valores del intervalo de
la variable aleatoria fluctúan entre 100 y 115 pacientes diarios, por lo cual la variable aleatoria es
discreta.
41
Numero Numero de días que en Probabilidad de que la
Examinado Que se observó variable aleatoria
Este nivel asuma este valor
100 1 0.01
101 2 0.02
102 3 0.03
103 5 0.05
104 6 0.06
105 7 0.07
106 9 0.09
107 10 0.10
108 12 0.12
109 11 0.11
110 9 0.09
111 8 0.08
112 6 0.06
113 5 0.05
114 4 0.04
115 2 0.02
Sumatoria 100 1.00
12.0%
10.0%
8.0%
6.0%
4.0%
2.0%
0.0%
100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115
Numero de Mujeres examinadas
42
Valor Esperado
Para obtener el valor esperado de una variable aleatoria discreta multiplicamos cada valor que esta
puede asumir por la probabilidad de ocurrencia de ese valor y luego sumamos los productos.
Ya prendimos a calcular el valor esperado de una variable aleatoria discreta ahora explicaremos
como combinar las probabilidades de ocurrencia de una variable con el cálculo de la ganancia o
pérdida monetaria que se producirá por cada valor que la variable adopte.
Estudiemos el caso de un comerciante mayorista de frutas y verduras que vende fresas, este
producto tiene una vida útil muy breve, si no se vende el mismo día de la entrega pierde todo su
valor. Una caja de fresas cuesta L20 y la vende a L50. El mayorista ni puede especificar el número
de cajas que los clientes adquirirán en un día pero sus registros presentan la siguiente historia:
43
Definición de Tipos de Pérdidas: El mayorista incurre en dos clases de pérdidas
Si adquiere demasiada fruta y no logra venderla tendrá que deshacerse de ella
Si adquiere poca fruta penderá la oportunidad de realizar ventas.
Cada valor aquí expresado está condicionado a cierto número de cajas que se guardan y a un
número particular que piden los clientes. Esta tabla comprende los dos tipos de perdidas. Los
valores encima de los ceros representan las perdidas por cajas de fresas que no se venden y los
valores bajo los ceros las perdidas por pedidos no satisfechos.
Si examinamos cada acción posible de inventario, podremos calcular la pérdida esperada, esto lo
hacemos ponderando las cuatro cifras de la pérdida posible en cada columna de la tabla anterior.
44
Caso 3: En una acción de almacenamiento de de 12 cajas la pérdida esperada se calcula
multiplicando la perdida condicional de cada evento de ventas posibles (columna 2) por su
respectiva probabilidad de ocurrencia (columna 3) y sume los productos resultantes
Conclusión:
La pérdida se minimiza al almacenar 12 cajas, este caso también pudo haber sido resuelto
adoptando un enfoque alternativo; maximizar la ganancia esperada (L50 recibidos por caja menos
L20 del costo por caja). La respuesta hubiera sido la misma: 12 cajas
45
Distribución Binomial
Una distribución de probabilidad ampliamente utilizada para el estudio de una variable aleatoria
discreta es la distribución binomial, ésta describe datos discretos, no continuos, resultantes de un
experimento denominado “Proceso de Bernoulli”.
FUNCION DISTR.BINOM
Devuelve la probabilidad de una variable aleatoria discreta siguiendo una distribución binomial.
Utilice DISTR.BINOM en problemas con un número fijo de pruebas o ensayos, cuando los
resultados de un ensayo son sólo éxito o fracaso, cuando los ensayos son independientes y
cuando la probabilidad de éxito es constante durante todo el experimento. Por ejemplo,
DISTR.BINOM puede calcular la probabilidad de que dos de los próximos tres bebés que nazcan
sean hombres.
Sintaxis
DISTR.BINOM(núm_éxito;ensayos;prob_éxito;acumulado)
Núm_éxito es el número de éxitos en los ensayos.
Ensayos es el número de ensayos independientes.
Prob_éxito es la probabilidad de éxito en cada ensayo.
Acumulado es un valor lógico que determina la forma de la función. Si el argumento acumulado
es VERDADERO, DISTR.BINOM devuelve la función de distribución acumulada, que es la
probabilidad de que exista el máximo número de éxitos; si es FALSO, devuelve la función de masa
de probabilidad, que es la probabilidad de que un evento se reproduzca un número de veces igual
al argumento núm_éxito.
Observaciones
Los argumentos núm_éxito y ensayos se truncan a enteros.
Si el argumento núm_éxito, ensayos o prob_éxito no es numérico, DISTR.BINOM devuelve el
valor de error #¡VALOR!
Si el argumento núm_éxito < 0 o si núm_éxito > ensayos, DISTR.BINOM devuelve el valor de
error #¡NUM!
Si el argumento prob_éxito < 0 o si prob_éxito > 1, DISTR.BINOM devuelve el valor de error
#¡NUM!
46
Ejemplo
Una directora de una escuela primaria ha detectado que los alumnos llegan tarde a menudo, ha
estudiado el problema y ha llegado a la conclusión de que hay una probabilidad de 40% que un
alumno llegue tarde independientemente uno del otro. ¿Cuál es la probabilidad de que 0, 1, 2, 3, 4
o 5 estudiantes lleguen tarde simultáneamente?
Núm_éxito = 0
Ensayos = 5
Prob_éxito = 0.4
Acumulado = falso
Continuando con este ejemplo ¿Cuál es la probabilidad de que 3 estudiantes o menos lleguen
tarde simultáneamente? Para responder a esta interrogante debemos sumar los resultados
obtenidos para 0, 1, 2 y 3 alumnos, utilice la función DISTR.BINOM completando los argumentos
de la siguiente forma:
Núm_éxito = 3
Ensayos = 5
Prob_éxito = 0.4
Acumulado = verdadero
47
Distribución de Poisson
X = numero de ocurrencia
= lambda, número medio de ocurrencia por intervalo de tiempo
FUNCION POISSON
Devuelve la distribución de Poisson. Una de las aplicaciones comunes de la distribución de
Poisson es la predicción del número de sucesos en un determinado período de tiempo, como por
ejemplo, el número de automóviles que se presenta a una zona de peaje en el intervalo de un
minuto.
Sintaxis
POISSON(x;media;acumulado)
X es el número de sucesos.
Media es el valor numérico esperado.
Acumulado es un valor lógico que determina la forma de la distribución de probabilidad devuelta.
Si el argumento acumulado es VERDADERO, POISSON devuelve la probabilidad de Poisson de
que un suceso aleatorio ocurra un número de veces comprendido entre 0 y x inclusive; si el
argumento acumulado es FALSO, la función devuelve la probabilidad de Poisson de que un suceso
ocurra exactamente x veces.
Observaciones
Si el argumento x no es un entero, se trunca.
Si los argumentos x o media no son numéricos, POISSON devuelve el valor de error
#¡VALOR!
Si x ≤ 0, POISSON devuelve el valor de error #¡NUM!
Si media ≤ 0, POISSON devuelve el valor de error #¡NUM!
48
Ejemplo
Los Archivos de la Dirección de Tránsito indican una media de 5 accidentes por mes en un cruce
considerado altamente peligroso. El número de accidentes esta distribuido conforme a la
Distribución de Poisson, la Dirección de Tránsito quiere calcular la probabilidad de que ocurran 0,
1, 2, 3 y 4 accidentes en un mes.
X = 0
Media = 5
Acumulado = falso
Continuando con este ejemplo ¿Cuál es la probabilidad de que 2 accidentes o menos ocurran?
Para responder a esta interrogante debemos sumar los resultados obtenidos para 0, 1 y 2
accidentes, utilice la función POISSON completando los argumentos de la siguiente forma:
X = 2
Media = 5
Acumulado = verdadero
49
Distribución Normal
4. Las dos colas se extienden de manera indefinida y nunca tocan el eje horizontal
Media
Mediana
Moda
La DN es simétrica
alrededor de la
media
No importa cual sea la media y desviación standard para una distribución normal de probabilidades
el área total bajo la curva es de 1.00
Para comprender mejor estos enunciados observe las ilustraciones en la siguiente página.
50
Valores dentro de una desviación standard
16% 16%
68%
Del Área Del Área
Del Área
1 1
Desv. St. Desv. St.
2.25% 2.25%
Del Área Del Área
95.5% Del Área
2 2
Desv. St. Desv. St.
.15% 0.15%
Del Área Del Área
3 3
Desv. St. Desv. St.
51
Para utilizar la distribución normal debemos identificar los siguientes elementos:
DISTR.NORM
Devuelve la distribución normal para la media y desviación estándar especificadas. Esta función
tiene un gran número de aplicaciones en estadística, incluidas las pruebas de hipótesis.
Sintaxis
DISTR.NORM(x;media;desv_estándar;acum)
X es el valor cuya distribución desea obtener.
Media es la media aritmética de la distribución.
Desv_estándar es la desviación estándar de la distribución.
Acum es un valor lógico que determina la forma de la función. Si el argumento acum es
VERDADERO, la función DISTR.NORM devuelve la función de distribución acumulada; si es
FALSO, devuelve la función de masa de probabilidad.
Observaciones
Si los argumentos media o desv_estándar no son numéricos, DISTR.NORM devuelve el
valor de error #¡VALOR!
Si el argumento desv_estándar ≤ 0, la función DISTR.NORM devuelve el valor de error
#¡NUM!
Si el argumento media = 0, desv_estándar = 1 y acumulado = VERDADERO, la función
DISTR.NORM devuelve la distribución normal estándar, DISTR.NORM.ESTAND.
La ecuación para la función de densidad normal (acumulado = FALSO) es:
Ejemplo
Se ha diseñado un curso de capacitación para mejorar las habilidades de los supervisores, el curso
es autoaplicable. UN estudio anterior revela que el tiempo medio dedicado al curso es de 500
horas y una desviación standard de 100.
Caso 1
¿Cuál es la probabilidad de que un participante tarde más de 500 horas en el curso?
En la gráfica advertimos que la mitad del área bajo la curva está situada en uno u otro lado de la
media de 500. Así pues podemos deducir que la probabilidad es la mitad en la parte superior de la
distribución. O sea 0.5.
P (>500) =.5
500
52
Caso 2
¿Cuál es la probabilidad de que un participante tarde menos 400 horas en el curso?
P (<400) =?
400 500
Podemos responder a esta pregunta utilizando la función DISTR.NORM con los siguientes
argumentos:
X = 400
Media = 500
Desv_estándar = 100
Acum = Verdadero
53
Caso 3
¿Cuál es la probabilidad de que un participante tarde más de 600 horas y menos de 700 en el
desarrollo del curso?
P (>600) y P (<700) =?
a. Para responder a esta pregunta primero debemos aplicar la función DISTR.NORM con los
siguientes argumentos:
X = 600
Media = 500
Desv_estándar = 100
Acum = Verdadero
X = 700
Media = 500
Desv_estándar = 100
Acum = Verdadero
c. Tercero restaremos las probabilidades de desarrollo del curso menores de 600 horas de las
menores de 700.
97.72
- 84.13
13.59
Con esta operación encontramos la probabilidad del tramo que corresponde a las
probabilidades de que el curso se desarrollo entre 600 y 700 horas… 13.59%.
54
Elección de la correcta Distribución de Probabilidad
Si planeamos utilizar una distribución de probabilidad para describir una situación, debemos elegir
con cuidado la distribución correcta, necesitamos estar seguros de que no empleamos la
distribución de Poisson cuando es la binomial.
Recuérdese que la distribución binomial se aplica cuando el número de ensayos se fija antes de
iniciar el experimento y que cada ensayo es independiente y puede producir solo dos resultados.
Aun cuando la distribución normal es la única continua que hemos aplicado existen otras de gran
utilidad que podrán ser estudiadas en el siguiente modulo de este diplomado.
55
MODULO V
MUESTREO Y DISTRIBUCIONES MUESTRALES
Introducción
Las personas que van de compra prueban a menudo un poco de queso antes de adquirirlo. De un
pedazo deducen el sabor de un trozo mayor; de igual manera en el control de calidad de una línea
de producción de una fábrica de jabón, unas cuantas unidades son extraídas de cada lote de
producción para certificar que cumplen los stándares requeridos para su comercialización. En
ambas acciones estamos realizando muestreo.
Estadísticos y Parámetros
Matemáticamente podemos describir las muestras y poblaciones con medidas como media,
mediana, moda, desviación standard, cuando estos términos describen las características de una
población reciben el nombre de parámetros y cuando describen a una muestra reciben el nombre
de estadísticos.
Tipos de Muestreo
Muestreo Aleatorio
En una muestra aleatoria, sabemos qué posibilidades hay de que un elemento de la población
figure en la muestra, por eso podemos evaluar objetivamente las características de la población
que resultan de la muestra.
56
Ejemplo: para obtener una muestra de los hogares de una zona de viviendas, se selecciona la
vigésima cada, es decir se cuentan las viviendas de 1 a 19 y cada número 20 es la que
compondrá la muestra.
Ejemplo: una compañía farmacéutica desea realizar un estudio sobre un medicamento para
adultos y clasifica a los pacientes de acuerdo a su edad:
12 a 20 años 20%
21 a 40 años 35%
41 a 60 años 30%
61 años en adelante 15%
La compañía seleccionará su muestra de acuerdo al porcentaje de importancia de cada estrato
para su estudio, de este modo seleccionará 20% de su muestra del primer estrato, 35% del
segundo y así sucesivamente con los demás.
Distribuciones de Muestreo
Descripción
Toda distribución de probabilidad y de muestreo pueden describirse en parte mediante su media y
desviación standard.
Debido a que existen diferencias en cada muestra y la población cabe esperar variabilidad entre las
medidas de ambas, a esa diferencia la denominaremos error por muestreo. La desviación standard
de la distribución de las medias muestrales mide el grado en que esperamos que las medias de
diferentes muestras varíen por este error del proceso de muestreo. Por consiguiente, la desviación
standard de la distribución de un estadístico muestral recibe el nombre de error standard del
estadístico
El error standard indica no solo el tamaño del error accidental que se ha cometido, si no que
además la exactitud que seguramente alcanzaremos si usamos un estadístico muestral para
estimar un parámetro de la población.
57
Cálculo del Error Standard de la Media.
Para conocer el error estándar de una media muestral respecto a la de una población infinita utilice
esta fórmula:
σ media = σ
√n
Ejemplo
Un banco calcula que sus cuentas individuales de ahorro tienen una distribución normal, con una
media de L2,000 y con una desviación standard de L600. Si el banco toma una muestra aleatoria
de 100 cuentas, ¿Cuál es la probabilidad de que la media se halle entre L1,900 y L2,050? Para
responder a esta pregunta debemos realizar las siguientes acciones:
a. Primero: calcular el error standard de la media. En este caso utilizamos la ecuación del cálculo
del error standard de la media para poblaciones infinitas.
σ media = 600
√ 100
σ media = 600
10
σ media = 60
b. Segundo: calcular los dos valores de z (área bajo la curva) utilizando la siguiente fórmula:
z = 1900 - 2000
60
Para 1900
z = 2050 - 2000
60
58
c. Tercero: encontramos la probabilidad correspondiente a 1.67 y 0.83, para ello utilizamos la
función DISTR.NORM.ESTAND
FUNCION DISTR.NORM.ESTAND
Devuelve la función de distribución normal estándar acumulativa. La distribución tiene una
media de 0 (cero) y una desviación estándar de uno. Use esta función en lugar de una tabla
estándar de áreas de curvas normales.
Sintaxis
DISTR.NORM.ESTAND(z)
Z es el valor para el cual desea obtener la distribución.
Observaciones
Si el argumento z no es numérico, DISTR.NORM.ESTAND devuelve el valor de error
#¡VALOR!
La ecuación para la función de densidad normal estándar es:
Conclusión: existe un 74.92% de que la media de la muestra esté comprendida entre 1900 y
2050. Para una mejor ilustración observe la gráfica de la siguiente página.
59
Área entre la media Área entre la media
y una z de -1.67 y una z de 0.83
=.4525 =.2967
Área Total
=.7492
Si una población está distribuida normalmente, las distribuciones muestrales de la media también
son normales. Sin embargo quienes toman decisiones deben trabajar con muchas poblaciones que
no son normales. Como reacciona la distribución muestral de la media cuando no es normal la
población de donde se extraen las muestras.
Ejemplo
Analicemos los datos referentes a la vida útil (en meses) de las llantas de cinco motocicletas:
La población es muy pequeña como para ser aproximada a una distribución normal, tomaremos
muestras en grupos de 3, calcularemos la media de la muestra, las enumeraremos y luego
calcularemos la media de la distribución muestral.
Los cálculos muestran que, aun en caso en que la población no esté distribuida normalmente, la
media de la distribución de la muestral, sigue siendo igual a la media de la población.
60
Teorema del Límite central
Diseño de Experimentos
a. Objetivo: ya que es el punto de partida debe definirse en forma clara que es lo que se
pretende. En el caso de una compañía que produce baterías, uno de los objetivos puede
ser la medición del poder de arranque.
b. Que debe medirse?: Existen muchas variables a estudiar sin embargo la empresa debe
definir con claridad que variable estudiará, por ejemplo se puede medir el tiempo que
tardan las baterías en descargarse, el numero total de arranques que se requieren para
descargar la batería o el número de meses de vida útil, la variable a elegir dependerá del
objetivo definido.
e. Análisis de los datos: Los datos referentes a 20 pruebas de baterías son sometidos a
análisis, ¿los resultados reflejan ventajas significativas de la batería de la empresa frente a
la de la competencia? Si esta respuesta es positiva el resultado del experimento puede
incluirse en su publicidad.
61