Está en la página 1de 61

MÓDULO I

INTRODUCCIÓN TEÓRICA Y ORGANIZACIÓN DE DATOS


Preámbulo

La palabra estadística tiene varias acepciones para cada persona. Para un fanático de fútbol es la
información referente a los goles anotados por su equipo y los juegos en los que ha obtenido
victorias, para un gerente de una compañía petrolera es el número de barriles de petróleo vendidos
en una temporada específica, para el director de una escuela, es la información acerca del
ausentismo, las calificaciones de los alumnos y los sueldos de su personal docente.

Todas estas personas están empleando correctamente el término estadística y sin embargo cada
una de ellas le da un significado ligeramente diferente y la usa para un propósito un poco distinto.
En vista de que los números están presentes en todos los campos de la actividad humana, la
estadística que es una de las ciencias que estudia el manejo de los números, debe ser una
herramienta de cotidiano uso para los tomadores de decisiones.

Reseña Histórica

La palabra estadística proviene de una voz italiana statista que significa “estadista”, la acuño
Gottfried Achenwall (1719-1772, un profesor en Marlborough y Göttinguen.

Las estadísticas oficiales del gobierno tienen la misma antigüedad que la historia escrita. En el
Antiguo Testamento encontramos varias relaciones de censos. Los gobiernos de Egipto, Babilonia
y Roma reunían registros detallados de la población de los recursos. En la Edad Media, los
gobiernos empezaron a asentar en documentos la propiedad del suelo. En el año 762 el emperador
Carlomagno pidió descripciones pormenorizadas de las propiedades de la Iglesia.

Debido al temor que Enrique VII tenía por la peste, en Inglaterra empezaron a registrase las
defunciones en 1532. Más o menos por la misma época, en Francia la ley exigió a los clérigos
registrar los bautismos, fallecimientos y matrimonios. Durante un brote de peste que apareció a
fines de la década de 1500el gobierno inglés comenzó a publicar estadísticas semanales de los
decesos. Esa costumbre continuó muchos años y en 1632 estos Bills of Mortality contenían los
nacimientos y fallecimientos por sexo. En 1662, el capitán John Graunt usó documentos que
abarcaban 30 años y efectuó predicciones sobre el número de personas que morirían de varias
enfermedades y sobre las proporciones de nacimientos de varones y mujeres que cabía esperar. El
trabajo de Graunt condensado en su obra titulada Natural and Political Observations… Made upon
the Bills of Mortality fue un esfuerzo innovador en el análisis estadístico.

La historia del desarrollo de la teoría estadística y de su aplicación es muy larga. Solo nos hemos
limitado a mencionar aquellos que hicieron importantes aportaciones a esta disciplina.

Subdivisiones de la Estadística

Los Gerentes aplican algunas técnicas estadísticas prácticamente en todas las ramas de la
empresa pública y privada. Esas técnicas son tan diversas que los estadísticos suelen agruparlas
en dos categorías generales: estadística descriptiva y estadística inferencial.

Supongamos que un profesor calcula la calificación promedio de un curso. Dado que la estadística
describe el aprovechamiento de ese grupo pero sin hacer generalizaciones sobre varios grupos
podemos afirmar que el profesor está aplicando la estadística descriptiva. Las gráficas, tablas y
diagramas que muestran los datos son ejemplo de este tipo de estadística.

Supongamos que ahora el profesor decide servirse de las calificaciones para estimar el promedio
de diez grupos que asisten al mismo curso. El proceso de estimación de la calificación promedio
sería un problema de estadística inferencial

1
Organización de Datos

Los datos son colecciones de un número cualquiera de observaciones relacionadas entre sí. Por
ejemplo:

Edades de los alumnos del curso Excel Estadístico

21 35 24 23 28 33 32 29
32 40 22 32 24 25 26 33
25 42 37 35 35 27 19 31

Ordenamiento de datos

Para que los datos sean útiles debemos organizarlos para poder obtener tendencias y llegar a
conclusiones lógicas. Excel permite organizar datos en forma ascendente o descendente, siga
estos pasos

1. Seleccione el rango que contiene los datos que desea ordenar.


2. Elija en el menú principal Datos - Ordenar

3. Utilice los controles de Ordenar por para seleccionar la columna que servirá de criterio para
realizar el ordenamiento, luego seleccione el tipo de ordenamiento Ascendente o
Descendente,

4. Si desea realizar un subordenamiento repita el paso 3 en el control Luego por


seleccionando otra columna.

5. Indique si el rango seleccionado contiene o no contiene una fila de títulos para evitar que
se incluya en el ordenamiento.

6. Haga clic en Aceptar:

2
7. Observe los datos ordenados

La finalidad de organizar los datos es permitirnos ver rápidamente todas las características
posibles de los datos que hemos recabado, Buscamos valores máximos, mínimos, tendencias
notorias, valores en torno a los cuales los datos tienden a agruparse, etc.

3
Organización de Datos mediante Distribuciones de Frecuencia

Frecuencia Absoluta

El arreglo de datos es una de las formas más sencillas de presentar los datos. Agrupa los valores
en forma ascendente o descendente.

Los arreglos de datos ofrecen varias ventajas sobre los datos brutos:

1. Descubrir rápidamente los valores mínimos y máximos en los datos


2. Dividir los datos en secciones
3. Identificar los valores que aparecen más de una vez en el arreglo.
4. Observar la distancia entre valores consecutivos de la tabla.

Una mejor manera de arreglar los datos: La distribución de Frecuencia

La tabla de distribución de frecuencia es una forma de sintetizar los datos, organiza los datos en
clases es decir en grupos de valores que describen una característica de los datos.

Una distribución de frecuencia muestra el número de observaciones provenientes del conjunto de


datos que caen dentro de cada una de las clases.

Pasos para crear una distribución de frecuencia

1. Defina el número de clases: no existe un método para definir el número de clases a utilizar
en una distribución de frecuencia, así que el número dependerá del número de
observaciones a arreglar, un ordenamiento de datos permitirá definir el valor mínimo de la
primera clase y el valor máximo de una clase.

2. Definir el intervalo de clases: para definir el intervalo de clase utilizar esta ecuación:

Ancho de los siguiente valor unitario después valor mas pequeño


Intervalos de clase = del máximo valor en los datos --- de los datos
Numero total de intervalos de clase

Utilizando los datos de la página 2 y suponiendo que deseamos 6 intervalos de clase:

Ancho de intervalos de clase = (49 – 19) / 6


=4

3. Realizar el conteo de datos por clase.

Distribución de Frecuencia de las edades de los alumnos


del curso Excel Estadístico
Clase Frecuencia
19 - 22 3
23 - 26 6
27 - 30 3
31 - 34 6
35 - 38 4
39 - 42 2

4
Creación de una Distribución de Frecuencia en Excel

1. Realice un ordenamiento de datos, (utilice el procedimiento descrito en la página 2).

2. Defina el ancho de los intervalos de clase, (utilice el procedimiento descrito en la página 4),
digite los limites superiores de cada clase en un rango distinto del que ocupa los datos.

3. Elija en el menú principal las opciones Herramientas – Análisis de Datos:

5
4. Seleccione Histograma y haga clic en Aceptar.

5. En el campo Rango de entrada Indique el rango de datos que contiene los valores a ser
tomados en cuenta para el conteo.

En el campo Rango de clases indique el rango que contiene los límites superiores de los
intervalos.

En el campo Rango de salida indique el rango en donde desea visualizar el conteo.

Haga clic en Aceptar.

6
6. Observe el conteo y edite la tabla de distribución de frecuencias para mejorar su estética

7. Interpretación de la tabla: esta operación desplegará en el rango de salida dos columnas,


en la primera los límites superiores de cada intervalo y en la segunda el conteo respectivo
de cada clase. De este modo en el ejemplo podemos apreciar que a la clase 22
corresponde una frecuencia de 3, esto quiere decir que en rango de entrada existen 3
valores menores o iguales a 22; a la clase 26 corresponde una frecuencia de 6, esto quiere
decir que en el rango de entrada existen 6 valores menores a 26 y a la vez mayores que 22
que es el límite superior de la clase anterior, y así sucesivamente.

La sumatoria de las frecuencias debe ser igual al número de datos contenidos en el rango
de entrada

8. Edite la tabla de distribución de frecuencias para mejorar su estética.

7
Frecuencia Relativa

La frecuencia absoluta muestra un conteo de datos respecto a las clases definidas, en base a ella
podemos construir una frecuencia relativa que es la comparación de la frecuencia absoluta de
cada clase contra el total de datos. La frecuencia relativa debe expresarse en forma de porcentaje.

Para calcular la frecuencia relativa divida la frecuencia absoluta de la clase entre el numero total de
observaciones. Para la primera clase: 3 / 24 = 0.125 o sea 12.5%. La sumatoria de las frecuencias
relativas siempre es 100%.

Frecuencia Frecuencia
Clase
Absoluta Relativa
19 - 22 3 12.5%
23 - 26 6 25.0%
27 - 30 3 12.5%
31 - 34 6 25.0%
35 - 38 4 16.7%
39 - 42 2 8.3%
y mayor... 0 0.0%
SUMATORIA 24 100%

La frecuencia relativa permite realizar mejores observaciones a un conjunto de datos, en este caso
podemos afirmar que solamente el 8.3% de los alumnos del curso de Excel Estadístico superan los
38 años.

8
Graficación de Distribución de Frecuencia

Las gráficas ofrecen datos en una representación bidimensional. Sobre el eje horizontal mostramos
los valores de la variable (la característica que estamos midiendo); siguiendo nuestro ejemplo sería
las edades de los alumnos. Sobre el eje vertical marcamos las frecuencias mostradas de las clases
mostradas sobre el eje horizontal.

Las gráficas de distribución de frecuencia y de distribución de frecuencia relativa son útiles porque
ponen de relieve y aclaran las tendencias que no se captan tan fácilmente en las tablas.

Histograma

El histograma es una serie de rectángulos, todos ellos de anchura proporcional a la gama de


valores dentro de una clase y también de altura proporcional a los elementos que caen dentro de la
clase.

Creación de un Histograma en Excel

Existen 2 alternativas
Primera Alternativa: Utilice el procedimiento descrito en la página 5, en el paso 5 marque la opción
Crear Gráfico. Y haga clic en Aceptar.

Esta acción le permitirá crear en forma simultánea una distribución de frecuencia y su histograma
respectivo
Histograma

6
5
Frecuencia

2
1

0
22 26 30 34 38 42 y
mayor...
Clase

9
Segunda Alternativa: Si creó la distribución de frecuencias y ha realizado modificaciones estéticas
a la misma inserte un gráfico tipo columna y utilice como rango de datos las celdas que contienen
las clases y sus frecuencias respectivas.

Esta alternativa le permite crear un histograma personalizado y más estético.

Edades de los Alumnos de Excel Estadistico

7
6
Número de Alumnos

5
4
3
2
1
0
Edades

19 - 22 23 - 26 27 - 30 31 - 34 35 - 38 39 - 42

Ventajas del Histograma

1. Cada rectángulo muestra claramente cada clase individual en la distribución.

2. El área de cada rectángulo muestra la proporción del número total de datos que ocurren en
esa clase.

10
Polígono de Frecuencia

Aunque de menor uso, los polígonos de frecuencias son otro medio de representar gráficamente
tanto las distribuciones de frecuencia absoluta como las de frecuencia relativa.

Para construir un polígono de frecuencia en Excel, únicamente cambie el tipo de gráfico del
histograma a Líneas.

El resultado de esta operación le brindará un polígono de frecuencia.

Ventajas del Polígono de Frecuencia

1. El polígono ofrece un esquema claro del patrón de datos.

2. Permite apreciar una tendencia de los datos.

11
Ojiva

Una distribución de frecuencia acumulativa nos permite ver cuántas observaciones se hallan por
arriba o debajo de ciertos valores, en lugar de limitarnos a encontrar el número de elementos
dentro de los intervalos. Se llama Ojiva a la gráfica de una distribución de frecuencia acumulativa.

En una distribución de frecuencia acumulativa los valores de cada clase comprenden los valores
acumulados de todas las clases anteriores. Podemos formar frecuencias acumulativas absolutas y
relativas.

Frecuencia Frecuencia
Frecuencia Frecuencia
Clase Acumulativa Acumulativas
Absoluta Relativa
Absoluta Relativa
22 3 3 12.5% 12.5%
26 6 9 25.0% 37.5%
30 3 12 12.5% 50.0%
34 6 18 25.0% 75.0%
38 4 22 16.7% 91.7%
42 2 24 8.3% 100.0%

En esta frecuencia acumulativa podemos afirmar que únicamente 12 estudiantes tienen edades
menores o iguales a 30 años

Para construir una Ojiva en Excel cree un gráfico de líneas utilizando como origen de datos el
rango de celdas que contienen las clases y la Frecuencia Acumulativa.

Ojiva
30

25

20

15

10

0
22 26 30 34 38 42

Frecuencia Acumulativa

12
MÓDULO II
MEDIDAS DESCRIPTIVAS DE UNA DISTRIBUCIÓN DE FRECUENCIA
En el módulo I aprendimos a ordenar datos, construir tablas y gráficas a partir de datos brutos. Las
representaciones resultantes de las distribuciones de frecuencia nos permitieron discernir las
tendencias y patrones de los datos pero necesitamos medidas exactas de un conjunto de datos, los
que llamaremos estadísticos resumidos, ellos nos servirán para describir ciertas características de
dicho conjunto. A partir de ellos lograremos una comprensión mas precisa de los datos de la que
podríamos conseguir con nuestras tablas y gráficas.

Cuatro de estas características son de suma importancia:

1. Medidas de Tendencia Central: indican el punto medio o típico de los datos.

Curva A

2. Medidas de Dispersión: La dispersión se refiere al esparcimiento los datos.

Curva A Curva B

En este ejemplo la curva A tiene una dispersión mayor que la curva B

3. Medidas de Sesgo (Asimetría): las curvas que representas los datos pueden ser simétricas o
asimétricas (sesgadas), las curvas simétricas

Curva A: Curva B:
Sesgada a la derecha Sesgada a la izquierda

13
La curva A está sesgada a la derecha (asimetría positiva), pues disminuye al extremo superior
de la escala. Lo contrario sucede con la curva B (asimetría negativa) dado que disminuye
gradualmente hacia el extremo inferior de la escala.

4. Medidas de Curtosis: Cuando medimos la curtosis de una distribución estamos midiendo su


grado de pico. Existen muchos grados diferentes de curtosis, pero los estadísticos
normalmente utilizan tres clases generales:

Curva Mesocúrtica
(meso, palabra griega que
significa “mitad”)

Curva Leptocúrtica
(lepto, palabra griega que
significa “esbelto”)

Curva Platicúrtica
(platos, palabra griega que
significa “ancho” o “plano”)

14
Medidas de Tendencia Central

La Media Aritmética:

La mayor parte de las veces cuando nos referimos al “promedio” de algo, estamos hablando de la
media aritmética. Ellos sucede en tales como la temperatura promedio en verano de una ciudad, la
vida promedio de una batería de un vehículo y la producción promedio de maíz una hectárea de
tierra.

Calculo de la Media a partir de datos no agrupados.

Formula de la media µ=Σx


N
µ = media de la población
Σx = suma de todos los valores de las observaciones
N = número de elementos de la población

Siga este procedimiento para calcular en Excel la media aritmética de un conjunto de datos.

1. Digite los datos en la hoja de cálculo y posicione el cursor en la celda donde desea ubicar
el resultado del cálculo de la media.

2. Ingrese al asistente para Inserción de Funciones y seleccione Mas Funciones:

3. Seleccione la categoría de funciones Estadísticas:

15
4. Busque la función Promedio y haga clic en Aceptar.

5. Indique el (los) rango(s) que contiene los datos cuya Media se desea conocer, haga clic en
Aceptar.

6. El resultado será la media aritmética de los datos.

16
FUNCION PROMEDIO
Devuelve el promedio (media aritmética) de los argumentos.

Sintaxis
PROMEDIO(número1;número2;...)
Número1, número2, ... son entre 1 y 30 argumentos numéricos cuyo promedio desea obtener.

Observaciones
 Los argumentos deben ser números o nombres, matrices o referencias que contengan
números.
 Si el argumento matricial o de referencia contiene texto, valores lógicos o celdas vacías,
estos valores se pasan por alto; sin embargo, se incluirán las celdas con el valor cero.

Calculo de la Media a partir de datos agrupados.

Una distribución de frecuencia está compuesta de datos que se agrupan por clases y no
necesariamente conocemos los valores individuales de cada clase.

Supongamos que tenemos una distribución de frecuencia sobre el saldo promedio de los saldos
mensuales de las cuentas de cheques de 600 clientes en una agencia bancaria.

Clases
Frecuencia
Limite Inferior Limite Superior
0 49.99 78
50 99.99 123
100 149.99 187
150 199.99 82
200 249.99 51
250 299.99 47
300 349.99 13
350 399.99 9
400 449.99 6
450 499.99 4

Para encontrar la media aritmética de estos datos agrupados siga estos pasos:

1. Calcule el punto medio de cada clase mediante esta formula


Marca de clase = Limite inferior + Limite Superior
2
Clases Marcas de
Frecuencia
Limite Inferior Limite Superior Clase
0 49.99 78 25.0
50 99.99 123 75.0
100 149.99 187 125.0
150 199.99 82 175.0
200 249.99 51 225.0
250 299.99 47 275.0
300 349.99 13 325.0
350 399.99 9 375.0
400 449.99 6 425.0
450 499.99 4 475.0

17
2. Multiplique cada frecuencia por su respectiva marca de clase

Clases Frecuencia X
Frecuencia Marcas de Clase
Limite Inferior Limite Superior Marca de clase
0 49.99 78 25.0 1,950
50 99.99 123 75.0 9,224
100 149.99 187 125.0 23,374
150 199.99 82 175.0 14,350
200 249.99 51 225.0 11,475
250 299.99 47 275.0 12,925
300 349.99 13 325.0 4,225
350 399.99 9 375.0 3,375
400 449.99 6 425.0 2,550
450 499.99 4 475.0 1,900
Sumatorias 600 85,347

3. Divida la sumatoria de los productos de las frecuencias y marcas de clase por la sumatoria
de la frecuencia.

Media = 85,347
600

Media = 142.25

18
La Media Ponderada

La media ponderada nos permite obtener un promedio que tiene en cuenta la importancia de cada
valor para el total global.

Tomemos como ejemplo el de una compañía que usa 3 grados de mano de obra (no calificada,
semicalificada y calificada). La compañía desea conocer el costo promedio de la mano de obra por
hora para cada uno de los productos.

Tipo de Horas de trabajo


Sueldo por Hora
Mano de Obra Producto 1
No calificada 4 1
Semicalificada 6 2
Calificada 8 5
Sumatoria 8

En este caso cada tipo de mano de obra tiene un grado de importancia distinto en el desarrollo del
producto. Para calcular la media ponderada siga este procedimiento:

1. Asigne el grado de importancia a cada elemento:


En nuestro ejemplo podríamos utilizar el número de horas requeridas de cada tipo de mano
de obra respecto del total. Este grado de importancia debe expresarse como porcentaje.

Para mano de obra no calificada sería igual a 1/8 =0.125, que expresado porcentualmente
es igual a 12.5%. Es decir 1 hora de mano de obra no calificada sobre 8 horas de trabajo
que requiere el producto. Repetimos el procedimiento de cada elemento hasta completar el
100%.

Tipo de Horas de trabajo Grado de


Sueldo por Hora
Mano de Obra Producto 1 Importancia
No calificada 4 1 12.5%
Semicalificada 6 2 25.0%
Calificada 8 5 62.5%
Sumatoria 8 100.0%

2. Multiplique el grado de importancia de cada elemento por cada observación en este caso el
Sueldo por Hora, seguidamente sume los productos obtenidos.

Tipo de Horas de trabajo Grado de


Sueldo por Hora Sueldo ponderado
Mano de Obra Producto 1 Importancia
No calificada 4 1 12.5% 0.5
Semicalificada 6 2 25.0% 1.5
Calificada 8 5 62.5% 5
Sumatoria 8 100.0% 7

3. La sumatoria de los productos obtenidos es igual a la media ponderada, en este caso, 7, lo


cual significa que el costo promedio por hora es de L7.00

19
La Media Geométrica

Algunas veces estamos manejando cantidades que cambian a lo largo del período; entonces
necesitamos conocer una tasa promedio de cambio, como el crecimiento promedio a través de un
periodo de varios años. En tales casos la media aritmética no es apropiada porque no proporciona
las respuestas correctas.

Consideremos por ejemplo, el crecimiento de una cuenta de ahorros. Supóngase que depositamos
L100.00 inicialmente y dejamos que el interés se acumule a diferentes tasas por 5 años. El
crecimiento se resume en esta tabla.

Factor de Ahorros al
Año Tasa de Interés
Crecimiento final del Año
0 0 0.00 100.00
1 7% 1.07 107.00
2 8% 1.08 115.56
3 10% 1.10 127.12
4 12% 1.12 142.37
5 18% 1.18 168.00

El factor de crecimiento es igual a 1 + tasa de interés


100

El factor de crecimiento es la cantidad por la cual multiplicamos los ahorros al inicio del año para
obtener los ahorros al final del año.

Para conocer la Media Geométrica utilice la función MEDIA.GEOM y aplíquela al rango que
contiene el factor de crecimiento de los datos, se encuentra en la categoría de funciones
Estadísticas.

FUNCIÓN MEDIA.GEOM

Devuelve la media geométrica de una matriz o de un rango de datos positivos.

Sintaxis
MEDIA.GEOM(número1;número2; ...)
Número1, número2, ... son de 1 a 30 argumentos cuya media desea calcular. También puede
utilizar una matriz única o una referencia matricial en lugar de argumentos separados con punto y
coma.

Observaciones
 Los argumentos deben ser números o nombres, matrices o referencias que contengan
números.
 Si el argumento matricial o de referencia contiene texto, valores lógicos o celdas vacías, estos
valores se pasan por alto; sin embargo, se incluirán las celdas con el valor cero.
 Si uno de los puntos de datos ≤ 0, MEDIA.GEOM devuelve el valor de error #¡NUM!.

Aplicando la función MEDIA.GEOM al rango de los factores de crecimiento de la tabla anterior


obtendremos el valor 1.1093, el cual representa el factor de crecimiento promedio de los ahorros
los 5 años.

Esto significa que si multiplicamos 100.00 X 1.1093 X 1.1093 X 1.1093 X 1.1093 X 1.1093
obtendremos la cantidad de 168 al término del quinto año.

20
La Mediana

La mediana es una medida de tendencia central diferente de las medias que hemos venido
explicando hasta ahora. La mediana es un solo valor del conjunto de datos que mide el elemento
central de los datos. Ese elemento es el mas central en el conjunto de números. La mitad de los
elementos se encuentran por arriba de este punto y la otra mitad cae debajo de él.

Cálculo de la Mediana

Para calcular en forma manual la mediana de un conjunto de datos primero se ordenan en forma
ascendente o descendente. Si el conjunto contiene un número impar de datos, el de la mitad será
la mediana. Si existe un número par de elementos, la mediana será el promedio de los dos que se
hallen en la mitad.

Para calcular la mediana de un conjunto de datos en Excel utilice la función MEDIANA, la cual se
encuentra en la categoría de funciones Estadísticas.

FUNCION MEDIANA

Devuelve la mediana de los números. La mediana es el número que se encuentra en medio de un


conjunto de números, es decir, la mitad de los números es mayor que la mediana y la otra mitad es
menor.

Sintaxis
MEDIANA (número1;número2; ...)
Número1, número2, ... son entre 1 y 30 números cuya mediana desea obtener.

Observaciones
 Los argumentos deben ser números o nombres, matrices o referencias que contengan
números. Microsoft Excel examina todos los números en cada argumento matricial o de
referencia.
 Si el argumento matricial o de referencia contiene texto, valores lógicos o celdas vacías, estos
valores se pasan por alto; sin embargo, se incluirán las celdas con el valor cero.

Aplique la función MEDIANA al rango de datos cuya mediana se desea conocer

21
La Moda

La moda es una medida de tendencia central que difiere de la media, pero que se parece un poco
a ella porque realmente no se calcula por medio de los procesos ordinarios de la aritmética. La
moda es el valor que mas se repite dentro del conjunto de datos.

Para encontrar la moda en un conjunto de datos en Excel utilice la función Moda, la cual se
encuentra en la categoría de funciones Estadísticas.

FUNCION MODA

Devuelve el valor que se repite con más frecuencia en una matriz o rango de datos. Al igual que
MEDIANA, MODA es una medida de posición.

Sintaxis
MODA(número1;número2; ...)
Número1, número2, ... son de 1 a 30 argumentos cuya moda desea calcular. También puede
utilizar una matriz única o una referencia matricial en lugar de argumentos separados con punto y
coma.

Observaciones
 Los argumentos deben ser números, nombres, matrices o referencias que contengan números.
 Si el argumento matricial o de referencia contiene texto, valores lógicos o celdas vacías, estos
valores se pasan por alto; sin embargo, se incluirán las celdas con el valor cero.
 Si el conjunto de datos no contiene puntos de datos duplicados, MODA devuelve el valor de
error #N/A.

Aplique la función MODA al rango de datos cuya moda se desea conocer.

22
Observaciones y Conclusiones sobre las Medidas de Tendencia Central

1. En un conjunto de valores, la moda es el valor que se repite con mayor frecuencia; la


mediana es el valor central y la media es el valor promedio. Ninguna de estas medidas de
la tendencia central tomada individualmente proporciona una imagen completa de los
datos.

2. Una desventaja de la media es que es afectada por valores extremos, es decir muy altos o
muy bajos.

3. La mediana ofrece varias ventajas sobre la media. La más importante consiste en que los
valores extremos no la afectan tan profundamente como a la media. La mediana es fácil de
entender y puede ser calculada con cualquier clase de datos, podemos obtener la mediana
aún cuando los datos sean descripciones cualitativas como el color o la nitidez de un
aparato de televisión.

4. La moda, a semejanza de la mediana, puede usarse como una localización central para
datos cualitativos y también cuantitativos. A la moda tampoco la afectan los valores
extremos. A pesar de estas ventajas la moda se usa menos para medir la tendencia central
que la media y la mediana. Algunas veces no hay un valor modal porque el conjunto de
datos no contiene valores que ocurran mas de una vez, otras veces la moda se repite
muchas veces, en ambos casos la moda es una medida inútil.

23
Medidas de Dispersión

Dos o más conjuntos de datos pueden tener la misma localización central y no obstante ser muy
distintos si uno se halla mas disperso que el otro. En la siguiente figura la media de las 3 curvas es
la misma pero la curva A tiene menor dispersión (o variabilidad) que la curva B y ésta a su vez
menor variabilidad que la curva C.

Curva A

Curva B

Curva C

¿Por qué la dispersión de la distribución es una característica tan importante de entender y medir?

 Primero, nos suministra información complementaria que nos permite juzgar la


confiabilidad de nuestra medida de tendencia central. Si los datos están ampliamente
dispersos como los de la curva C, la localización central será menos representativa de los
datos en su conjunto de lo que sería en el caso de datos que se acumulasen más
alrededor de la media como lo que sucede en la curva A.

 Segundo, puesto que se trata de problemas típicos en los datos sumamente dispersos, se
requiere la capacidad de reconocer que los datos están muy dispersos, de lo contrario no
podremos abordar esos problemas.

 Tercero, podemos comparar las dispersiones de varias muestras, si no conviene tener una
amplia dispersión de valores o si esa dispersión representa un gran riesgo, debemos ser
capaces de reconocerlo y no escoger las distribuciones que presentan la máxima
dispersión.

A los analistas financieros les interesa la dispersión de las ganancias de una empresa. Las
utilidades con una fuerte dispersión, o sea las que incluyen desde niveles extremadamente altos
hasta los muy bajos incluso negativos indican un riesgo mayor para los inversionistas que las
utilidades que permanecen relativamente estables. De igual manera, los expertos en control de
calidad analizan la dispersión de los niveles de calidad de un producto. Un medicamento que tiene
una pureza promedio pero que fluctúa entre muy alto grado de pureza e impureza puede constituir
un peligro para la vida del paciente.

Las medidas de dispersión están clasificadas en

a. Distancia

b. Desviación Promedio

c. Dispersión Relativa

24
Medidas de Distancia

La dispersión puede medirse en términos de la diferencia existente entre dos valores


seleccionados del conjunto de datos. En esta sección estudiaremos 3 medidas de distancia: el
intervalo, el intervalo de interfractil y la desviación de cuartil.

Intervalo

El intervalo es la diferencia entre el valor mas alto y el mas bajo observados. Siga este
procedimiento para calcular el intervalo de un conjunto de datos:

1. Obtenga el valor máximo de la muestra, utilice la función MAX, encuentre la función MAX
en la categoría Funciones Estadísticas.

FUNCION MAX
Devuelve el valor máximo de un conjunto de valores.

Sintaxis
MAX(número1;número2; ...)
Número1, número2, ... son entre 1 y 30 números de los cuales desea encontrar el valor
máximo.

Observaciones
 Puede especificar los argumentos que sean números, celdas vacías, valores lógicos o
representaciones numéricas en texto. Los argumentos que sean valores de error o
texto que no se pueda traducir a números causarán errores.
 Si un argumento es una matriz o referencia, sólo se usan los números de esa matriz o
referencia. Las celdas vacías, valores lógicos o texto que se encuentren dentro de la
matriz o referencia se pasan por alto. Utilice MAXA si no se deben pasar por alto los
valores lógicos y el texto.
 Si el argumento no contiene números, MAX devuelve 0.

Aplique la función MAX al rango de datos cuyo valor máximo se desea conocer.

25
2. Obtenga el valor mínimo de la muestra, utilice la función MIN, encuentre la función MIN en
la categoría Funciones Estadísticas.

MIN
Devuelve el valor mínimo de un conjunto de valores.

Sintaxis
MIN(número1;número2; ...)
Número1, número2, ... son entre 1 y 30 números de los que desea encontrar el valor
mínimo.

Observaciones
 Puede especificar los argumentos que sean números, celdas vacías, valores lógicos o
representaciones numéricas en texto. Los argumentos que sean valores de error o
texto que no se pueda traducir a números causarán errores.
 Si un argumento es una matriz o referencia, sólo se usan los números de esa matriz o
referencia. Las celdas vacías, valores lógicos o texto que se encuentren dentro de la
matriz o referencia se pasan por alto. Si los valores lógicos o el texto no deben pasarse
por alto, utilice la función MINA.
 Si los argumentos no contienen números, MIN devuelve 0.

Aplique la función MAX al rango de datos cuyo valor máximo se desea conocer.

3. Reste el valor mínimo del máximo, el resultado obtenido será el intervalo de los datos.

26
Intervalo de Interfractil

En una distribución de frecuencia, una fracción o proporción de los datos se encuentra en un fractil
o debajo de él. Así la mediana es el .5 fractil porque la mitad del conjunto de datos son menores o
iguales que este valor. Los fractiles se asemejan a los porcentajes. En toda distribución, 25% de
los datos se halla en el .25 fractil o debajo de él. El intervalo de interfractil es una medida de la
dispersión entre los valores del fractil.

Intervalo de Intercuartil y Desviación del Cuartil

El intervalo de intercuartil mide aproximadamente la distancia de la mediana que debemos recorrer


en ambos lados antes de poder incluir una mitad de los valores del conjunto de datos

Para calcular este intervalo dividimos los datos en 4 partes cada una de ellas contiene 25% de los
elementos de la distribución. Los cuarteles son los valores máximos en las 4 partes y el intervalo
del intercuartil es la diferencia entre los valores del primer y tercer cuartiles:

Intervalo de Intercuartil

1er Cuartil Mediana 3er Cuartil


Q1 Q2 Q3

Cálculo de Cuartiles e Intervalo de Intercuartil

Para encontrar los cuartiles de un conjunto de datos utilice la función CUARTIL

FUNCIÓN CUARTIL
Devuelve el cuartil de un conjunto de datos. Los cuartiles se usan con frecuencia en los datos de
ventas y encuestas para dividir las poblaciones en grupos. Por ejemplo, puede utilizar la función
CUARTIL para determinar el 25 por ciento de ingresos más altos en una población.

Sintaxis
CUARTIL(matriz;cuartil)
Matriz es la matriz o rango de celdas de valores numéricos cuyo cuartil desea obtener.
Cuartil indica el valor que se devolverá.

Si cuartil es igual a La función CUARTIL devuelve


0 Valor mínimo
1 El primer cuartil (percentil 25)
2 El valor de la mediana (percentil 50)
3 El tercer cuartil (percentil 75)
4 Valor máximo

27
Observaciones
 Si el argumento matriz esta vacío, CUARTIL devuelve el valor de error #¡NUM!
 Si el argumento cuartil no es un número entero, se trunca.
 Si cuartil < 0 o si cuartil > 4, CUARTIL devuelve el valor de error #¡NUM!
 Las funciones MIN, MEDIANA y MAX devuelven el mismo valor que CUARTIL cuando el
argumento cuartil es igual a 0 (cero), 2 y 4 respectivamente.

En el ejemplo obtenemos los siguientes valores para cada cuartil:

Valor Mínimo 24.6


Primer cuartil (Q1) 35.1
Segundo cuartil (Q2) 44.1
Tercer Cuartil (Q3) 49.4
Cuarto Cuartil 75.0

El intervalo de intercuartil = (Q3 – Q1) es decir 49.4 – 35.1 = 14.3

Desviación del Cuartil

La desviación del cuartil mide el intervalo promedio de un cuarto de los datos. Es representativa de
todos ellos ya se que obtiene tomando un promedio de la mitad intermedia de los datos en vez de
escoger una de las cuartas partes.

Desviación del Cuartil = Q3 – Q1


2

49.4 – 35.1 = 7.15


2

28
Medidas de Desviación Promedio

Las descripciones mas completas de la dispersión son aquellas que se refieren a la desviación
promedio respecto a alguna medida de tendencia central. Dos de esas medidas son importantes en
nuestro estudio de la estadística: la varianza y la desviación standard. Ambas nos indican una
distancia promedio de cualquier observación en el conjunto de datos a partir de la media de la
distribución.

Desviación Absoluta Promedio


Para tener una mejor idea de la varianza y desviación estándar calcularemos primero la desviación
absoluta promedio, que nos indica la distancia promedio de todos los datos de una distribución con
respecto a la media.

Para calcular la Desviación Absoluta Promedio utilice la función DESVPROM, que se encuentra en
la categoría de Funciones Estadísticas.

FUNCION DESVPROM
Devuelve el promedio de las desviaciones absolutas de la media de los puntos de datos.
DESVPROM mide la dispersión de los valores en un conjunto de datos.

Sintaxis
DESVPROM(número1;número2;...)
Número1, número2, ... son de 1 a 30 argumentos cuyo promedio de las desviaciones absolutas
desea calcular. También puede utilizar una matriz única o una referencia matricial en lugar de
argumentos separados con punto y coma.

Observaciones
 Los argumentos deben ser números o nombres, matrices o referencias que contengan
números.
 Si el argumento matricial o de referencia contiene texto, valores lógicos o celdas vacías,
estos valores se pasan por alto; sin embargo, se incluirán las celdas con el valor cero.

Calcule la desviación promedio absoluta de estos datos,

863 1,138 1,698


903 1,204 1,745
957 1,354 1,802
1,041 1,624 1,883

Aplique el rango de los datos al


argumento “numero” de la función.

El resultado a obtenido en este caso,


333.33 quiere decir que en promedio los
datos están a una distancia de 333.33
unidades de la media.

29
Varianza

La varianza se asemeja a la desviación absoluta promedio, sólo que utiliza la suma de los
cuadrados de las distancias entre la media y cada elemento. En el caso del intervalo, desviación de
cuartil y desviación absoluta promedio las respuestas fueron expresadas en las mismas unidades
que los datos. En el caso de la varianza las unidades son los cuadrados de las unidades, por
ejemplo, “dólares al cuadrado” o “galones al cuadrado”.

Para calcular la Varianza de una población utilice la función VARP, que se encuentra en la
categoría de Funciones Estadísticas.

FUNCIÓN VARP
Calcula la varianza en función de toda la población.

Sintaxis
VARP(número1;número2; ...)
Número1, número2, ... son de 1 a 30 argumentos numéricos correspondientes a una población.

Observaciones
 VARP parte de la hipótesis de que los argumentos representan la población total. Si sus
datos representan una muestra de la población, utilice VAR para calcular la varianza.
 Se pasan por alto los valores lógicos como VERDADERO y FALSO y el texto. Si los
valores lógicos y el texto no se deben pasar por alto, utilice la función de hoja de cálculo
VARPA.

Calcule la varianza de estos datos

40 150 210
60 170 210
120 170 220
140 180 240
140 190 250

Aplique el rango de los datos al


argumento “numero” de la función.

El resultado a obtenido en este caso,


3,397.33 es la varianza de la población.

30
Desviación Standard

La desviación standard de la población, es simplemente la raíz cuadrada de la varianza de la


población. La desviación standar nos permite determinar con mayor grado de precisión, donde se
sitúan los valores de una distribución de frecuencia en relación con la media.

La desviación standard es útil para describir cuánto se apartan de la media de la distribución los
elementos que la conforman.

Para calcular la desviación standard de una población utilice la función DESVESTP, que se
encuentra en la categoría de Funciones Estadísticas.

FUNCION DESVESTP
Calcula la desviación estándar de la población total determinada por los argumentos. La desviación
estándar es la medida de la dispersión de los valores respecto a la media (valor promedio).

Sintaxis
DESVESTP(número1; número2; ...)
Número1, número2, ... son de 1 a 30 argumentos numéricos correspondientes a una población.
También puede utilizar una matriz única o una referencia matricial en lugar de argumentos
separados con punto y coma.
 Se pasan por alto los valores lógicos, como VERDADERO y FALSO, y de texto. Si los
valores lógicos y el texto no se deben pasar por alto, utilice la función de hoja de cálculo
DESVESTA.

Observaciones
 DESVESTP parte de la hipótesis de que los argumentos representan la población total. Si
sus datos representan una muestra de la población, utilice DESVESTP para calcular la
desviación estándar.
 Cuando el tamaño de las muestras es importante, las funciones DESVEST y DESVESTP
devuelven aproximadamente el mismo valor.

Calcule la desviación standard de estos datos

40 150 210
60 170 210
120 170 220
140 180 240
140 190 250

Aplique el rango de los datos al


argumento “numero” de la función.

El resultado a obtenido en este caso,


58.29 es la desviación standard de la
población.

31
Medidas de Dispersión Relativa

Coeficiente de Variación

Le desviación standard es una medida absoluta de dispersión y expresa la variación en las mismas
unidades que los datos originales. La desviación standar no es la única base para comparar dos
distribuciones. Necesitamos una medida relativa que nos de una idea general de la magnitud de la
desviación standard en relación con la magnitud de la media. El coeficiente de variación es
precisamente esa medida de dispersión.

El coeficiente de variación relaciona la desviación standard como porcentaje de la media. De ahì


que la unidad de medida se llame “por ciento” en vez de las unidades que los datos originales.

La fórmula para el cálculo del coeficiente de variación es la siguiente:

Desviación Standard de la Población


CV= X 100
Media de la Población

Tomando en cuenta los datos de obtenidos en las páginas 30 y 31 obtendremos el siguiente


coeficiente de variación.

58.29
CV= X 100 = 35.1%
166

La importancia del CV estriba en ¿qué tan conveniente es que los datos estén alejados de la
media?, un porcentaje alto representa que gran cantidad de los datos están relativamente lejos de
la media, y un porcentaje bajo significa que los datos están cerca de la media.

32
MODULO III PROBABILIDADES
Introducción

La probabilidad forma parte de nuestra vida diaria, en las decisiones de carácter personal y
gerencial, enfrentamos la incertidumbre y nos valemos de la teoría de la probabilidad, sin importar
si admitimos o no el empleo de una herramienta tan refinada. Cuando oímos un pronóstico del
tiempo, cambiamos nuestros planes, en vez de ir a un día de campo nos quedamos en casa a ver
la televisión.

Vivimos en un mundo donde somos incapaces de pronosticar el futuro con absoluta certeza. La
necesidad de sortear la incertidumbre nos lleva a estudiar y aplicar la teoría de la probabilidad. En
muchos casos.

Conceptos Básicos

a. Probabilidad: es en general la medida que describe la posibilidad de que algo suceda.


Matemáticamente probabilidad es un valor entre cero y uno inclusive, que describe la
posibilidad o viabilidad relativa de que ocurra un evento.

b. Experimento: Proceso que lleva a la ocurrencia de una y sólo una de varias observaciones
posibles.

c. Resultado: la consecuencia de un experimento en particular.

d. Evento: Conjunto de uno o mas resultados de un experimento.

Por ejemplo:

El lanzamiento de un dado es un experimento, se pueden obtener 6 resultados posibles: 1, 2, 3, 4,


5 y 6; algunos eventos posibles es obtener un número par, obtener un número mayor que 4 u
obtener valor 3 o menor.

Tipos de Probabilidad

Probabilidad Clásica
La probabilidad clásica se basa en la suposición de que los resultados de un experimento son
igualmente viables, desde el punto de vista clásico, la probabilidad de que un evento suceda se
calcula dividiendo el número de resultados favorables entre el número de resultados posibles:

Probabilidad de Número de resultados favorables


Un evento=
Numero total de resultados posibles

33
Probabilidad Relativa
La teoría de la probabilidad relativa establece que la probabilidad de que un evento ocurra se
determina al observar en qué fracción de tiempo sucedieron eventos similares en el pasado. En
términos de una fórmula:

Probabilidad de Número de veces que un evento ocurrió en el pasado


Un evento=
Numero total de Observaciones

Probabilidad Subjetiva
Si existe poca o ninguna experiencia anterior o información sobre la cual basar la probabilidad,
podemos llegar a ella en forma subjetiva. En esencia esto significa que un individuo evalúa las
opiniones disponibles y otra información y después estima o asigna la probabilidad.

Reglas de Probabilidad
La mayor parte de los gerentes que utilizan las probabilidades se interesan en dos situaciones:

a. El caso en que ocurra uno u otro evento (eventos mutuamente excluyentes)


b. El caso donde ocurran dos o mas eventos (eventos no mutuamente excluyentes o
complementarios)

Nos interesa el primer caso cuando preguntamos: “¿Cuál es la probabilidad de que la demanda de
hoy exceda nuestro inventario?” En las siguientes secciones explicaremos los métodos para
responder a estas preguntas

Definiciones y Reglas de Uso Común

Reglas de Adición

Podemos aplicar la regla de adición a eventos ser mutuamente excluyentes y no mutuamente


excluyentes.

Si dos eventos A y B son mutuamente excluyentes la regla de la adición establece que la


probabilidad de que ocurra uno u otro es igual a la suma de sus probabilidades, la regla se expresa
en la siguiente fórmula.
P(A o B) = P (A) + P (B)

Donde P (A o B) = Probabilidad de que ocurra el evento A o el evento B


Donde P (A) = Probabilidad de que ocurra el evento A
Donde P (B) = Probabilidad de que ocurra el evento B

¿Cual es la probabilidad de obtener 2 o 3 en el lanzamiento de un dado?

P (2 o 3) = P (2) + P (3)
P (2 o 3) = 1/6 + P 1/6
P (2 o 3) = 2/6
P (2 o 3) = 0.3333
P (2 o 3) = 33.3%

34
Si dos eventos no son mutuamente excluyentes la regla de adición se modifica:
P(A o B) = P (A) + P (B) – P(AB)

Donde P (A o B) = Probabilidad de que ocurra el evento A o el evento B


Donde P (A) = Probabilidad de que ocurra el evento A
Donde P (B) = Probabilidad de que ocurra el evento B
Donde P (AB) = Probabilidad de que el evento A y el evento B ocurran simultáneamente

¿Cual es la probabilidad de extraer un as o un corazón de una baraja de cartas?

P (As o Corazón) = P (As) + P (Corazón) – P(As y Corazón)


P (As o Corazón) = 4/52 + 13/52 – 1/52
P (As o Corazón) = 16/52
P (As o Corazón) = 0.3076
P (As o Corazón) = 30.76%

Regla del Complemento


Se utiliza para determinar la probabilidad que un evento ocurra restando a 1 la probabilidad de que
el evento no ocurra, fórmula:
P(A) = 1- P (~A)

O lo que equivale a decir:

P (~A) = 1- P (A)

Donde P (~A) = probabilidad de que no ocurra el evento A

¿Cual es la probabilidad de no obtener 5 en el lanzamiento de un dado?

P (~5) = 1 - P (5)
P (~5) = 1 – 1/6
P (~5) = 1 – 0.1667
P (~5) = 0.8333
P (~5) = 83.33%

Ejercicio:
Una muestra de empleados de World Wide Enterprises participa en una encuesta sobre un nuevo
plan de pensión. Los empleados se clasifican como sigue:

Clasificación Evento Número de Empleados


Supervisores A 120
Mantenimiento B 50
Producción C 1,460
Administración D 302
Secretarias E 68
Sumatoria 2,000

Conteste las siguientes preguntas


a. ¿Cuál es la probabilidad de que la primera persona seleccionada sea:
i. Un empleado de mantenimiento o una secretaria?
ii. Un empleado que no forma parte de la gerencia?

b. Los eventos en el inciso a. i. son complementarios, mutuamente excluyentes o ambos.

35
Probabilidades en Condiciones de Independencia Estadística

Probabilidad Marginal
Una probabilidad marginal o incondicional es la simple probabilidad de que suceda un evento. En el
lanzamiento de un dado P(1) o sea la probabilidad de obtener 1 es igual a 1/6. El lanzamiento no
es afectado por lanzamientos previos, a eso se le llama probabilidad marginal.

Probabilidad Conjunta
La probabilidad de que dos o más eventos ocurran al mismo tiempo o en sucesión es el producto
de sus probabilidades marginales. En forma matemática puede expresarse así:
P(AB) = P (A) x P (B)

Donde P(AB)= Probabilidad de que los eventos A y B ocurran juntos o en sucesión


Donde P (A) = Probabilidad de que ocurra el evento A
Donde P (B) = Probabilidad de que ocurra el evento B

¿Cual es la probabilidad de obtener 3 en el lanzamiento de un dado y luego obtener 6 en el


segundo lanzamiento?

P (3,6) = P(3) x P (5)


P (3,6) = 1/6 x 1/6
P (3,6) = 0.1667 x 0.1667
P (3,6) = 0.0278
P (3,6) = 2.78%

Ejercicio:
Utilizando la misma muestra de empleados de World Wide Enterprises quienes están participando
en una encuesta sobre un nuevo plan de pensión.

Clasificación Evento Número de Empleados


Supervisores A 120
Mantenimiento B 50
Producción C 1,460
Administración D 302
Secretarias E 68
Sumatoria 2,000

Conteste las siguientes preguntas

a. ¿Cuál es la probabilidad de que la primera persona seleccionada sea un empleado de


mantenimiento y la segunda persona sea secretaria?

b. ¿Cuál es la probabilidad de que la primera persona seleccionada sea un supervisor, el


segundo sea de producción y el tercero de administración?

36
Probabilidad Condicional
La tercera clase de probabilidad es la condicional que se expresa matemáticamente así:
P (B|A) = P (B)
Donde P (B|A): Probabilidad del evento B si el evento A ha ocurrido.
Donde P (B) = Probabilidad de que ocurra el evento B

Aunque parezca contradictorio y tienda a generar confusión, ya que se trata de eventos


estadísticamente independientes la probabilidad de que ocurra el evento B no es afectada por la
ocurrencia del evento A.

¿Cual es la probabilidad de obtener 4 en el segundo lanzamiento de un dado si en el primero se


obtuvo 1?

P (4|6) = P (4)
P (4|6) = 1/6
P (4|6) = 0.1667
P (4|6) = 16.67%

Ejercicio:
Utilizando la misma muestra de empleados de World Wide Enterprises quienes están participando
en una encuesta sobre un nuevo plan de pensión.

Clasificación Evento Número de Empleados


Supervisores A 120
Mantenimiento B 50
Producción C 1,460
Administración D 302
Secretarias E 68
Sumatoria 2,000

Conteste las siguientes preguntas

a. ¿Cuál es la probabilidad de que la segunda persona seleccionada sea un empleado de


mantenimiento y la primera persona sea secretaria?

b. ¿Cuál es la probabilidad de que la segunda persona seleccionada sea un supervisor y la


primera sea de producción?

37
Probabilidades en Condiciones de Dependencia Estadística

Probabilidad Condicional
Expresada en una fórmula general la ecuación de probabilidad condicional en condiciones de
dependencia estadística es:
P (B|A) = P (A B)
P (A)
Donde P (B | A): Probabilidad del evento B si el evento A ha ocurrido.

Ejemplo: Supongamos que tenemos una caja de diez bolas distribuidas del modo siguiente:
 3 son de colores y están punteadas
 1 es de color y tiene rayas
 2 son grises y punteadas
 4 son grises y tienen rayas

Una persona extrae de la caja una bola de colores. ¿Cuál es la probabilidad de que sea punteada?
¿Cuál es la probabilidad de que tenga rayas?

Para responder dividimos el número de bolas entre la cantidad total de bolas de colores.

P (P|C) = Probabilidad de extraer una bola punteada si es de colores

=bolas punteadas / numero total de bolas de colores


= 3/4
= 0.75
= 75%

P (R|C) = Probabilidad de extraer una bola rayada si es de colores

=bolas rayadas / numero total de bolas de colores


= 1/4
= 0.25
= 25%
Ejercicio:
Utilizando la misma muestra de empleados de World Wide Enterprises quienes están participando
en una encuesta sobre un nuevo plan de pensión.

Número de
Clasificación Evento Caballeros Damas
Empleados
Supervisores A 120 75 45
Mantenimiento B 50 27 23
Producción C 1,460 511 949
Administración D 302 158 144
Secretarias E 68 - 68
Sumatoria 2,000 771 1,229

Conteste las siguientes preguntas

a. ¿Cuál es la probabilidad de seleccionar una dama si la persona elegida pertenece a


Producción?

b. ¿Cuál es la probabilidad de seleccionar un caballero si la persona elegida pertenece a la


sección de Mantenimiento?

38
Probabilidad Conjunta

La fórmula de probabilidad conjunta en condiciones de dependencia estadística es la siguiente:

P (AB) = P (B|A) x P (B)

Donde P (AB)= Probabilidad de que los eventos A y B ocurran juntos o en sucesión


P (B|A) = Probabilidad del evento B si ya tuvo lugar el evento A
Donde P (B)= Probabilidad de que ocurra el evento B

Observación: esta fórmula NO es P (BA) = P (B) x P(A), como lo sería en condiciones de


independencia estadística.

Ejemplo: Supongamos que tenemos una caja de diez bolas distribuidas del modo siguiente:
 3 son de colores y están punteadas
 1 es de color y tiene rayas
 2 son grises y punteadas
 4 son grises y tienen rayas

Una persona extrae de la caja una bola de colores. ¿Cuál es la probabilidad de que sea punteada y
que sea gris P (GP)?

P (GP) = P (G|P) x P (P)

P (GP) = numero de bolas punteadas y grises x número de bolas punteadas

número total de bolas punteadas número total de bolas

P (GP) = 2/5 x 5/10


P (GP) = 0.4 x 0.5
P (GP) = 0.2
P (GP) = 20%

Ejercicio:
Utilizando la misma muestra de empleados de World Wide Enterprises quienes están participando
en una encuesta sobre un nuevo plan de pensión.

Número de
Clasificación Evento Caballeros Damas
Empleados
Supervisores A 120 75 45
Mantenimiento B 50 27 23
Producción C 1,460 511 949
Administración D 302 158 144
Secretarias E 68 - 68
Sumatoria 2,000 771 1,229

Conteste las siguientes preguntas

c. ¿Cuál es la probabilidad de seleccionar una dama que sea Supervisor?

d. ¿Cuál es la probabilidad de seleccionar un caballero de la sección de Mantenimiento?

39
Probabilidad Marginal
Las probabilidades marginales se calculan sumando las probabilidades de todos los eventos
conjuntos en que ocurre el evento simple. En el ejemplo precedente, podemos obtener la
probabilidad del evento marginal del evento “bolas de colores” sumando las probabilidades de los
dos eventos conjuntos en que ocurren las bolas de colores:

 3 son de colores y están punteadas 3/10


 1 es de color y tiene rayas 1/10
 2 son grises y punteadas
 4 son grises y tienen rayas

La probabilidad de obtener bolas de colores es de 3/10 + 1/10 = 4/10 0 o sea 40%

Ejercicio:
Utilizando la misma muestra de empleados de World Wide Enterprises quienes están participando
en una encuesta sobre un nuevo plan de pensión.

Número de
Clasificación Evento Caballeros Damas
Empleados
Supervisores A 120 75 45
Mantenimiento B 50 27 23
Producción C 1,460 511 949
Administración D 302 158 144
Secretarias E 68 0 68
Sumatoria 2,000 771 1,229

Conteste las siguientes preguntas

a. ¿Cuál es la probabilidad de seleccionar una dama?

40
MODULO IV Distribuciones de Probabilidad
Las distribuciones de frecuencia son una forma útil de condensar las variaciones de los datos
observados. Las distribuciones de probabilidad guardan relación con las de frecuencia. En efecto
podemos concebir una distribución de probabilidad como una distribución teórica de frecuencia, es
decir como se espera que varíen los datos.

Una distribución de frecuencia es un listado de las frecuencias observadas de todos los resultados
de un experimento que, en realidad se han presentado cuando se llevó a cabo el experimento, en
cambio, una distribución de probabilidad es un listado de las probabilidades de todos los resultados
posibles que podrían presentarse si se llevara a cabo el experimento.

Tipos de Distribuciones de Probabilidad

Las distribuciones de probabilidad se clasifican en discretas o continuas

 Discreta: se dice que una probabilidad es discreta cuando asume únicamente un número
limitado de valores, por ejemplo la probabilidad de mes de nacimiento de una persona se
reduce a 12 resultados posibles.

 Continua: En una distribución continua de probabilidad, las variables en estudio pueden


asumir cualquier valor dentro de determinados límites, por ejemplo la probabilidad de peso
de una persona puede asumir un enorme número de valores. A la distribución de esta
variable (peso) la llamaremos distribución continua.

Esta última es una forma adecuada de representar las distribuciones discretas que tienen
multitud de resultados posibles, muy cercanos unos de otros.

Variables Aleatorias

Una variable aleatoria es aquella que sume diferentes valores a consecuencia de los resultados de
un experimento aleatorio. Estas variables pueden ser discretas o continuas. Si se permite que una
variable aleatoria adopte sólo un numero limitadote valores, se le llama variable aleatoria discreta.
Si se le permite asumir cualquier valor dentro de determinados limites, recibe el nombre de variable
aleatoria continua.

Por ejemplo una clínica de detección de cáncer mamario no puede conocer con exactitud cuantas
mujeres serán examinadas en un día cualquiera. Por tanto, el nùmero de pacientes a atender es
una variable aleatoria. Los expedientes diarios de la clínica indican que los valores del intervalo de
la variable aleatoria fluctúan entre 100 y 115 pacientes diarios, por lo cual la variable aleatoria es
discreta.

La experiencia de los últimos 100 días presenta la siguiente historia:

41
Numero Numero de días que en Probabilidad de que la
Examinado Que se observó variable aleatoria
Este nivel asuma este valor
100 1 0.01
101 2 0.02
102 3 0.03
103 5 0.05
104 6 0.06
105 7 0.07
106 9 0.09
107 10 0.10
108 12 0.12
109 11 0.11
110 9 0.09
111 8 0.08
112 6 0.06
113 5 0.05
114 4 0.04
115 2 0.02
Sumatoria 100 1.00

12.0%

10.0%

8.0%

6.0%

4.0%

2.0%

0.0%
100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115
Numero de Mujeres examinadas

42
Valor Esperado

El valor esperado es un concepto fundamental en el estudio de las distribuciones de probabilidad.


Es un concepto aplicado ampliamente al negocio de los seguros y que se ha extendido a otros
campos donde los profesionales que casi siempre toman decisiones en condiciones de
incertidumbre.

Para obtener el valor esperado de una variable aleatoria discreta multiplicamos cada valor que esta
puede asumir por la probabilidad de ocurrencia de ese valor y luego sumamos los productos.

Numero Numero de días que en Probabilidad de que la


Examinado Que se observó variable aleatoria
Este nivel asuma este valor
100 0.01 1.00
101 0.02 2.02
102 0.03 3.06
103 0.05 5.15
104 0.06 6.24
105 0.07 7.35
106 0.09 9.54
107 0.10 10.70
108 0.12 12.96
109 0.11 11.99
110 0.09 9.90
111 0.08 8.88
112 0.06 6.72
113 0.05 5.65
114 0.04 4.56
115 0.02 2.30
Valor esperado - 108.02

Uso de Valor Esperado en Toma de Decisiones

Ya prendimos a calcular el valor esperado de una variable aleatoria discreta ahora explicaremos
como combinar las probabilidades de ocurrencia de una variable con el cálculo de la ganancia o
pérdida monetaria que se producirá por cada valor que la variable adopte.

Estudiemos el caso de un comerciante mayorista de frutas y verduras que vende fresas, este
producto tiene una vida útil muy breve, si no se vende el mismo día de la entrega pierde todo su
valor. Una caja de fresas cuesta L20 y la vende a L50. El mayorista ni puede especificar el número
de cajas que los clientes adquirirán en un día pero sus registros presentan la siguiente historia:

Número de días PBB de que se


Ventas Diarias
venta venda cada numero
10 15 15%
11 20 20%
12 40 40%
13 25 25%
Sumatoria 100 100%

43
Definición de Tipos de Pérdidas: El mayorista incurre en dos clases de pérdidas
 Si adquiere demasiada fruta y no logra venderla tendrá que deshacerse de ella
 Si adquiere poca fruta penderá la oportunidad de realizar ventas.

Tabla de Pérdidas Condicionales

Ventas Acciones Posibles de Almacenamiento


Posibles de
Fresas 10 11 12 13
10 0 20 40 60
11 30 0 20 40
12 60 30 0 20
13 90 60 30 0

Cada valor aquí expresado está condicionado a cierto número de cajas que se guardan y a un
número particular que piden los clientes. Esta tabla comprende los dos tipos de perdidas. Los
valores encima de los ceros representan las perdidas por cajas de fresas que no se venden y los
valores bajo los ceros las perdidas por pedidos no satisfechos.

Calculo de Pérdidas Esperadas

Si examinamos cada acción posible de inventario, podremos calcular la pérdida esperada, esto lo
hacemos ponderando las cuatro cifras de la pérdida posible en cada columna de la tabla anterior.

Caso 1: En una acción de almacenamiento de de 10 cajas la pérdida esperada se calcula


multiplicando la perdida condicional de cada evento de ventas posibles (columna 2) por su
respectiva probabilidad de ocurrencia (columna 3) y sume los productos resultantes

Ventas Perdida Probabilidad de esta Perdida


Posibles Condicional cantidad de peticiones Esperada
10 0 15% 0
11 30 20% 6
12 60 40% 24
13 90 25% 22.5
Perdida Esperada 52.5

Para un almacenamiento de 10 cajas se espera una pérdida de L52.5.

Caso 2: En una acción de almacenamiento de de 11 cajas la pérdida esperada se calcula


multiplicando la perdida condicional de cada evento de ventas posibles (columna 2) por su
respectiva probabilidad de ocurrencia (columna 3) y sume los productos resultantes

Ventas Perdida Probabilidad de esta Perdida


Posibles Condicional cantidad de peticiones Esperada
10 20 15% 3
11 0 20% 0
12 30 40% 12
13 60 25% 15
Perdida Esperada 30

Para un almacenamiento de 11 cajas se espera una pérdida de L30

44
Caso 3: En una acción de almacenamiento de de 12 cajas la pérdida esperada se calcula
multiplicando la perdida condicional de cada evento de ventas posibles (columna 2) por su
respectiva probabilidad de ocurrencia (columna 3) y sume los productos resultantes

Ventas Perdida Probabilidad de esta Perdida


Posibles Condicional cantidad de peticiones Esperada
10 40 15% 6
11 20 20% 4
12 0 40% 0
13 30 25% 7.5
Perdida Esperada 17.5

Para un almacenamiento de 12 cajas se espera una pérdida de L17.5

Caso 4: En una acción de almacenamiento de de 13 cajas la pérdida esperada se calcula


multiplicando la perdida condicional de cada evento de ventas posibles (columna 2) por su
respectiva probabilidad de ocurrencia (columna 3) y sume los productos resultantes

Ventas Perdida Probabilidad de esta Perdida


Posibles Condicional cantidad de peticiones Esperada
10 60 15% 9
11 40 20% 8
12 20 40% 8
13 0 25% 0
Perdida Esperada 25

Para un almacenamiento de 13 cajas se espera una pérdida de L25

Conclusión:

La pérdida se minimiza al almacenar 12 cajas, este caso también pudo haber sido resuelto
adoptando un enfoque alternativo; maximizar la ganancia esperada (L50 recibidos por caja menos
L20 del costo por caja). La respuesta hubiera sido la misma: 12 cajas

45
Distribución Binomial

Una distribución de probabilidad ampliamente utilizada para el estudio de una variable aleatoria
discreta es la distribución binomial, ésta describe datos discretos, no continuos, resultantes de un
experimento denominado “Proceso de Bernoulli”.

Empleo del Proceso de Bernoulli


1. Cada ensayo tiene solo 2 resultados posibles: si o no, éxito o fracaso, verdadero o falso,
como por ejemplo el lanzamiento de una moneda, solamente se puede obtener 2
resultados, el lado A y el lado B.

2. La probabilidad del resultado de cualquier ensayo permanece fija con el tiempo. La


probabilidad de obtener el lado A de la moneda será siempre 0.5.

3. Los ensayos son estadísticamente independientes; es decir el resultado de un lanzamiento


no afecta al de cualquier otro lanzamiento.

Para utilizar la distribución binomial debemos identificar los siguientes elementos:

r = número de éxitos deseados


n = numero de ensayos efectuados
p = probabilidad de éxito
q = probabilidad de fracaso o sea 1 – p

Para calcular la distribución binomial utilice la función DISTR.BINOM

FUNCION DISTR.BINOM
Devuelve la probabilidad de una variable aleatoria discreta siguiendo una distribución binomial.
Utilice DISTR.BINOM en problemas con un número fijo de pruebas o ensayos, cuando los
resultados de un ensayo son sólo éxito o fracaso, cuando los ensayos son independientes y
cuando la probabilidad de éxito es constante durante todo el experimento. Por ejemplo,
DISTR.BINOM puede calcular la probabilidad de que dos de los próximos tres bebés que nazcan
sean hombres.

Sintaxis
DISTR.BINOM(núm_éxito;ensayos;prob_éxito;acumulado)
Núm_éxito es el número de éxitos en los ensayos.
Ensayos es el número de ensayos independientes.
Prob_éxito es la probabilidad de éxito en cada ensayo.
Acumulado es un valor lógico que determina la forma de la función. Si el argumento acumulado
es VERDADERO, DISTR.BINOM devuelve la función de distribución acumulada, que es la
probabilidad de que exista el máximo número de éxitos; si es FALSO, devuelve la función de masa
de probabilidad, que es la probabilidad de que un evento se reproduzca un número de veces igual
al argumento núm_éxito.

Observaciones
 Los argumentos núm_éxito y ensayos se truncan a enteros.
 Si el argumento núm_éxito, ensayos o prob_éxito no es numérico, DISTR.BINOM devuelve el
valor de error #¡VALOR!
 Si el argumento núm_éxito < 0 o si núm_éxito > ensayos, DISTR.BINOM devuelve el valor de
error #¡NUM!
 Si el argumento prob_éxito < 0 o si prob_éxito > 1, DISTR.BINOM devuelve el valor de error
#¡NUM!

46
Ejemplo
Una directora de una escuela primaria ha detectado que los alumnos llegan tarde a menudo, ha
estudiado el problema y ha llegado a la conclusión de que hay una probabilidad de 40% que un
alumno llegue tarde independientemente uno del otro. ¿Cuál es la probabilidad de que 0, 1, 2, 3, 4
o 5 estudiantes lleguen tarde simultáneamente?

r = 0 probabilidad de que 0 alumnos lleguen tarde


n = 5 número de alumnos con los que se desea realizar el estudio
p = 0.4 probabilidad de que los alumnos lleguen tarde
q = 0.6 probabilidad de que los alumnos no lleguen tarde

Utilice la función DISTR.BINOM completando los argumentos de la siguiente forma:

Núm_éxito = 0
Ensayos = 5
Prob_éxito = 0.4
Acumulado = falso

En este caso el valor obtenido


de 0.0778 o sea 7.78% quiere
decir que la probabilidad de que
0 alumnos lleguen tarde es del
7.78%

Para obtener la probabilidad de los demás números de ensayos o sea 1, 2, 3, 4, 5 únicamente


debemos sustituir estos valores en el argumento Núm_éxito. Los resultados a obtener son los
siguientes:

1 alumno 2 alumnos 3 alumnos 4 alumnos 5 alumnos


25.92% 34.56% 23.04% 7.68% 1.02%

Continuando con este ejemplo ¿Cuál es la probabilidad de que 3 estudiantes o menos lleguen
tarde simultáneamente? Para responder a esta interrogante debemos sumar los resultados
obtenidos para 0, 1, 2 y 3 alumnos, utilice la función DISTR.BINOM completando los argumentos
de la siguiente forma:

Núm_éxito = 3
Ensayos = 5
Prob_éxito = 0.4
Acumulado = verdadero

El Resultado obtenido de 91.30 % representa la probabilidad de que 3 estudiantes o menos lleguen


tarde, el cambio en el argumento Acumulado ingresando el valor “verdadero”, hace que sume las
probabilidades de 0, 1, 2 y 3 alumnos.

47
Distribución de Poisson

La distribución de Poisson es una distribución discreta de probabilidad, se emplea para describir


procesos que pueden ser descritos por una variable aleatoria discreta que asume valores enteros,
(0, 1, 2, 3, 4) como por ejemplo el número de llamadas que entran a un centro de llamadas, el
número de pacientes que llegan a un centro de atención médica o el número de vehículos que
llegan a una cabina de peaje.

Características de los Procesos que producen una Distribución de Poisson

1. El promedio de los datos puede estimarse a partir de datos anteriores.

2. Si dividimos las observaciones en periodos (intervalos) muy cortos de tiempo como


segundos, encontraremos lo siguiente

a. La probabilidad de que dos o más eventos sucedan en un intervalo de un segundo


es tan reducida que podemos asignarle valor cero.
b. El número de eventos que suceden en un determinado intervalo es independiente
de otro intervalo.

Para utilizar la distribución de poisson debemos identificar los siguientes elementos:

X = numero de ocurrencia
 = lambda, número medio de ocurrencia por intervalo de tiempo

Para calcular la distribución binomial utilice la función POISSON

FUNCION POISSON
Devuelve la distribución de Poisson. Una de las aplicaciones comunes de la distribución de
Poisson es la predicción del número de sucesos en un determinado período de tiempo, como por
ejemplo, el número de automóviles que se presenta a una zona de peaje en el intervalo de un
minuto.

Sintaxis
POISSON(x;media;acumulado)
X es el número de sucesos.
Media es el valor numérico esperado.
Acumulado es un valor lógico que determina la forma de la distribución de probabilidad devuelta.
Si el argumento acumulado es VERDADERO, POISSON devuelve la probabilidad de Poisson de
que un suceso aleatorio ocurra un número de veces comprendido entre 0 y x inclusive; si el
argumento acumulado es FALSO, la función devuelve la probabilidad de Poisson de que un suceso
ocurra exactamente x veces.

Observaciones
 Si el argumento x no es un entero, se trunca.
 Si los argumentos x o media no son numéricos, POISSON devuelve el valor de error
#¡VALOR!
 Si x ≤ 0, POISSON devuelve el valor de error #¡NUM!
 Si media ≤ 0, POISSON devuelve el valor de error #¡NUM!

48
Ejemplo

Los Archivos de la Dirección de Tránsito indican una media de 5 accidentes por mes en un cruce
considerado altamente peligroso. El número de accidentes esta distribuido conforme a la
Distribución de Poisson, la Dirección de Tránsito quiere calcular la probabilidad de que ocurran 0,
1, 2, 3 y 4 accidentes en un mes.

X = 0 numero de ocurrencia de accidentes cuya probabilidad se desea conocer


 = 5 número medio de accidentes por mes

Utilice la función POISSON completando los argumentos de la siguiente forma:

X = 0
Media = 5
Acumulado = falso

En este caso el valor obtenido


de 0.0067 o sea 0.67% quiere
decir que la probabilidad de que
0 accidentes ocurran es de
0.67%.

Para obtener la probabilidad de los demás números de accidentes 1, 2, 3, 4 únicamente debemos


sustituir estos valores en el argumento X. Los resultados a obtener son los siguientes:

1 accidente 2 accidentes 3 accidentes 4 accidentes


3.37% 8.42% 14.04 17.55%

Continuando con este ejemplo ¿Cuál es la probabilidad de que 2 accidentes o menos ocurran?
Para responder a esta interrogante debemos sumar los resultados obtenidos para 0, 1 y 2
accidentes, utilice la función POISSON completando los argumentos de la siguiente forma:

X = 2
Media = 5
Acumulado = verdadero

El Resultado obtenido de 12.46% representa la probabilidad de que ocurran 2 accidentes o menos,


el cambio en el argumento Acumulado ingresando el valor “verdadero”, hace que sume las
probabilidades de 0, 1 y 2 accidentes.

49
Distribución Normal

La distribución normal nos servirá para estudiar variables continuas.

Características de la Distribución Normal

1. La curva tiene un solo pico. Presenta una forma de campana.

2. La media se encuentra en el centro de la curva.

3. La mediana y la moda también se encuentran en el centro de la curva.

4. Las dos colas se extienden de manera indefinida y nunca tocan el eje horizontal

Media
Mediana
Moda
La DN es simétrica
alrededor de la
media

Los extremos se extienden


indefinidamente pero nunca
tocan el eje horizontal

Áreas bajo la curva normal

No importa cual sea la media y desviación standard para una distribución normal de probabilidades
el área total bajo la curva es de 1.00

1. Aproximadamente el 68% de todos los valores se encuentran en 1 desviación standard con


signo positivo y negativo respecto de la media.

2. Aproximadamente el 95% de todos los valores se encuentran en 2 desviaciones standard


con signo positivo y negativo respecto de la media.

3. Aproximadamente el 99.7% de todos los valores se encuentran en 2 desviaciones standard


con signo positivo y negativo respecto de la media.

Para comprender mejor estos enunciados observe las ilustraciones en la siguiente página.

50
Valores dentro de una desviación standard

16% 16%
68%
Del Área Del Área
Del Área

1 1
Desv. St. Desv. St.

Valores dentro de dos desviaciones standard

2.25% 2.25%
Del Área Del Área
95.5% Del Área

2 2
Desv. St. Desv. St.

Valores dentro de tres desviaciones standard

99.7% Del Área

.15% 0.15%
Del Área Del Área

3 3
Desv. St. Desv. St.

51
Para utilizar la distribución normal debemos identificar los siguientes elementos:

X = valor de la variable aleatoria


μ = media de la distribución de la variable aleatoria
б = desviación Standard
z = nùmero de desviaciones standard de x respecto a la media

Para calcular la distribución binomial utilice la función POISSON

DISTR.NORM
Devuelve la distribución normal para la media y desviación estándar especificadas. Esta función
tiene un gran número de aplicaciones en estadística, incluidas las pruebas de hipótesis.

Sintaxis
DISTR.NORM(x;media;desv_estándar;acum)
X es el valor cuya distribución desea obtener.
Media es la media aritmética de la distribución.
Desv_estándar es la desviación estándar de la distribución.
Acum es un valor lógico que determina la forma de la función. Si el argumento acum es
VERDADERO, la función DISTR.NORM devuelve la función de distribución acumulada; si es
FALSO, devuelve la función de masa de probabilidad.

Observaciones
 Si los argumentos media o desv_estándar no son numéricos, DISTR.NORM devuelve el
valor de error #¡VALOR!
 Si el argumento desv_estándar ≤ 0, la función DISTR.NORM devuelve el valor de error
#¡NUM!
 Si el argumento media = 0, desv_estándar = 1 y acumulado = VERDADERO, la función
DISTR.NORM devuelve la distribución normal estándar, DISTR.NORM.ESTAND.
 La ecuación para la función de densidad normal (acumulado = FALSO) es:

Ejemplo
Se ha diseñado un curso de capacitación para mejorar las habilidades de los supervisores, el curso
es autoaplicable. UN estudio anterior revela que el tiempo medio dedicado al curso es de 500
horas y una desviación standard de 100.

Caso 1
¿Cuál es la probabilidad de que un participante tarde más de 500 horas en el curso?

En la gráfica advertimos que la mitad del área bajo la curva está situada en uno u otro lado de la
media de 500. Así pues podemos deducir que la probabilidad es la mitad en la parte superior de la
distribución. O sea 0.5.

P (>500) =.5

500

52
Caso 2
¿Cuál es la probabilidad de que un participante tarde menos 400 horas en el curso?

P (<400) =?

400 500

Podemos responder a esta pregunta utilizando la función DISTR.NORM con los siguientes
argumentos:

X = 400
Media = 500
Desv_estándar = 100
Acum = Verdadero

En este caso el valor obtenido


de 0.1587 o sea 15.87%
quiere decir que la
probabilidad de que los
supervisores terminen el
curso en menos de de 400
horas es de 15.87%.

53
Caso 3
¿Cuál es la probabilidad de que un participante tarde más de 600 horas y menos de 700 en el
desarrollo del curso?

P (>600) y P (<700) =?

500 600 700

a. Para responder a esta pregunta primero debemos aplicar la función DISTR.NORM con los
siguientes argumentos:

X = 600
Media = 500
Desv_estándar = 100
Acum = Verdadero

Así obtendremos la probabilidad de que un supervisor desarrolle el curso en un tiempo menor


a 600 horas, el resultado es de 84.13%.

b. Segundo debemos aplicar la función DISTR.NORM con los siguientes argumentos:

X = 700
Media = 500
Desv_estándar = 100
Acum = Verdadero

Así obtendremos la probabilidad de que un supervisor desarrolle el curso en un tiempo menor


a 700 horas, el resultado es de 97.72%.

c. Tercero restaremos las probabilidades de desarrollo del curso menores de 600 horas de las
menores de 700.

97.72
- 84.13
13.59

Con esta operación encontramos la probabilidad del tramo que corresponde a las
probabilidades de que el curso se desarrollo entre 600 y 700 horas… 13.59%.

54
Elección de la correcta Distribución de Probabilidad

Si planeamos utilizar una distribución de probabilidad para describir una situación, debemos elegir
con cuidado la distribución correcta, necesitamos estar seguros de que no empleamos la
distribución de Poisson cuando es la binomial.

Recuérdese que la distribución binomial se aplica cuando el número de ensayos se fija antes de
iniciar el experimento y que cada ensayo es independiente y puede producir solo dos resultados.

Aun cuando la distribución normal es la única continua que hemos aplicado existen otras de gran
utilidad que podrán ser estudiadas en el siguiente modulo de este diplomado.

55
MODULO V
MUESTREO Y DISTRIBUCIONES MUESTRALES
Introducción
Las personas que van de compra prueban a menudo un poco de queso antes de adquirirlo. De un
pedazo deducen el sabor de un trozo mayor; de igual manera en el control de calidad de una línea
de producción de una fábrica de jabón, unas cuantas unidades son extraídas de cada lote de
producción para certificar que cumplen los stándares requeridos para su comercialización. En
ambas acciones estamos realizando muestreo.

Cuando revisamos los componentes de un conjunto realizamos una enumeración completa o


censo, si revisamos solo algunos realizamos un muestreo.

En estadística la palabra muestra se utiliza para describir una porción de un conjunto de


elementos; población son todos los elementos de ese conjunto.

Estadísticos y Parámetros

Matemáticamente podemos describir las muestras y poblaciones con medidas como media,
mediana, moda, desviación standard, cuando estos términos describen las características de una
población reciben el nombre de parámetros y cuando describen a una muestra reciben el nombre
de estadísticos.

Tipos de Muestreo

Se dispone de dos métodos para seleccionar muestras de poblaciones:

a. Muestreo no Aleatorio de Juicio: en este tipo de muestreo se usa el conocimiento y la opinión


personal para identificar los elementos de la población que van a incluirse en la muestra.

b. Muestreo Aleatorio o Probabilístico: en este tipo de muestreo todos los elementos de la


población tiene probabilidad de figurar en la muestra.

Muestreo Aleatorio

En una muestra aleatoria, sabemos qué posibilidades hay de que un elemento de la población
figure en la muestra, por eso podemos evaluar objetivamente las características de la población
que resultan de la muestra.

Tipos de Muestreo Aleatorio

a. Muestreo Aleatorio Simple: En un muestreo aleatorio simple las muestras se seleccionan


mediante métodos que permiten a cada elemento tener igual probabilidad de quedar incluido
en la muestra. Este tipo de muestreo es aplicable a poblaciones finitas es decir que poseen un
tamaño limitado. La infinita es aquella es aquella que teóricamente es imposible observar.

Ejemplo: deseamos seleccionar 10 alumnos de una población de 100, podemos asignar un


número a cada alumno, escribirlos en un pedazo de papel y luego introducirlos a una bolsa,
luego de agitarla se extraen 10 papeles, la muestra estará compuesta por los números de los
10 estudiantes que sean extraídos.

b. Muestreo Sistemático: en el muestreo sistemático los elementos se seleccionan con un


intervalo uniforme que se mide el tiempo, orden o espacio.

56
Ejemplo: para obtener una muestra de los hogares de una zona de viviendas, se selecciona la
vigésima cada, es decir se cuentan las viviendas de 1 a 19 y cada número 20 es la que
compondrá la muestra.

c. Muestreo Estratificado: para el muestreo estratificado dividimos la población en grupos


homogéneos relativos llamados estratos, luego recurrimos a uno de dos métodos:

 Seleccionamos una cantidad de elementos al azar en cada estrato.


 Damos un peso a cada estrato y de acuerdo a ello seleccionamos los elementos.

Ejemplo: una compañía farmacéutica desea realizar un estudio sobre un medicamento para
adultos y clasifica a los pacientes de acuerdo a su edad:

12 a 20 años 20%
21 a 40 años 35%
41 a 60 años 30%
61 años en adelante 15%
La compañía seleccionará su muestra de acuerdo al porcentaje de importancia de cada estrato
para su estudio, de este modo seleccionará 20% de su muestra del primer estrato, 35% del
segundo y así sucesivamente con los demás.

d. Muestreo por Conglomerados: en el muestreo por conglomerados dividimos la población en


grupos o conglomerados y luego seleccionamos una muestra aleatoria de cada uno de ellos.

Ejemplo: un equipo de investigación de mercados desea determinar por muestreo el número


promedio de televisores por familia y decide utilizar un mapa y dividir la ciudad por zonas,
luego extrae una muestra aleatoria de cada zona.

Distribuciones de Muestreo

Descripción
Toda distribución de probabilidad y de muestreo pueden describirse en parte mediante su media y
desviación standard.

Concepto del Error Standard

Debido a que existen diferencias en cada muestra y la población cabe esperar variabilidad entre las
medidas de ambas, a esa diferencia la denominaremos error por muestreo. La desviación standard
de la distribución de las medias muestrales mide el grado en que esperamos que las medias de
diferentes muestras varíen por este error del proceso de muestreo. Por consiguiente, la desviación
standard de la distribución de un estadístico muestral recibe el nombre de error standard del
estadístico

El error standard indica no solo el tamaño del error accidental que se ha cometido, si no que
además la exactitud que seguramente alcanzaremos si usamos un estadístico muestral para
estimar un parámetro de la población.

57
Cálculo del Error Standard de la Media.

Para conocer el error estándar de una media muestral respecto a la de una población infinita utilice
esta fórmula:

σ media = σ
√n

Donde: σ media = Error standard de la media


σ = Desviación Standard de la población
n = tamaño de la muestra

Ejemplo

Un banco calcula que sus cuentas individuales de ahorro tienen una distribución normal, con una
media de L2,000 y con una desviación standard de L600. Si el banco toma una muestra aleatoria
de 100 cuentas, ¿Cuál es la probabilidad de que la media se halle entre L1,900 y L2,050? Para
responder a esta pregunta debemos realizar las siguientes acciones:

a. Primero: calcular el error standard de la media. En este caso utilizamos la ecuación del cálculo
del error standard de la media para poblaciones infinitas.

σ media = 600
√ 100

σ media = 600
10

σ media = 60

b. Segundo: calcular los dos valores de z (área bajo la curva) utilizando la siguiente fórmula:

z= Media de la muestra - Media de la población


σ media
Para 1900

z = 1900 - 2000
60

z = -1.67 desviaciones standard de la media de una distribución normal standard

Para 1900

z = 2050 - 2000
60

z = 0.83 desviaciones standard de la media de una distribución normal standard

58
c. Tercero: encontramos la probabilidad correspondiente a 1.67 y 0.83, para ello utilizamos la
función DISTR.NORM.ESTAND

FUNCION DISTR.NORM.ESTAND
Devuelve la función de distribución normal estándar acumulativa. La distribución tiene una
media de 0 (cero) y una desviación estándar de uno. Use esta función en lugar de una tabla
estándar de áreas de curvas normales.

Sintaxis
DISTR.NORM.ESTAND(z)
Z es el valor para el cual desea obtener la distribución.

Observaciones
 Si el argumento z no es numérico, DISTR.NORM.ESTAND devuelve el valor de error
#¡VALOR!
 La ecuación para la función de densidad normal estándar es:

La función DISTR.NORM.ESTAND únicamente requiere un argumento, z que en este caso son


1.67 y 0.83.

Los valores a obtenidos son los siguientes:

Para 1900 cuyo z es 1.67  0.9525


Para 2050 cuyo z es 0.83  0.7697

Dado que la función DISTR.NORM.ESTAND devuelve la probabilidad acumulativa debemos


restar .5 a cada valor obtenido.
0.9525 0.7697
- 0.5000 -0.5000
0.4525 0.2697

Finalmente sumamos los dos valores obtenidos


0.4525
- 0.2697
0.7492

Conclusión: existe un 74.92% de que la media de la muestra esté comprendida entre 1900 y
2050. Para una mejor ilustración observe la gráfica de la siguiente página.

59
Área entre la media Área entre la media
y una z de -1.67 y una z de 0.83
=.4525 =.2967

Área Total
=.7492

1900 2000 2050

Muestreo de Poblaciones no Normales

Si una población está distribuida normalmente, las distribuciones muestrales de la media también
son normales. Sin embargo quienes toman decisiones deben trabajar con muchas poblaciones que
no son normales. Como reacciona la distribución muestral de la media cuando no es normal la
población de donde se extraen las muestras.

Ejemplo

Analicemos los datos referentes a la vida útil (en meses) de las llantas de cinco motocicletas:

Motocicleta Carlos Delia Elizabeth Francisco Gonzalo


Vida de las llantas 3 3 7 9 14

Media = 7.2 meses

La población es muy pequeña como para ser aproximada a una distribución normal, tomaremos
muestras en grupos de 3, calcularemos la media de la muestra, las enumeraremos y luego
calcularemos la media de la distribución muestral.

Muestra Dato 1 Dato 2 Dato 3 Media


EFG 7 9 14 10.00
DFG 3 9 14 8.67
DEG 3 7 14 8.00
DEF 3 7 9 6.33
CFG 3 9 14 8.67
CEG 3 7 14 8.00
CEF 3 7 9 6.33
CDF 3 3 9 5.00
CDE 3 3 7 4.33
CDG 3 3 14 6.67
Sumatoria 72.00
Media = 7.2 meses

Los cálculos muestran que, aun en caso en que la población no esté distribuida normalmente, la
media de la distribución de la muestral, sigue siendo igual a la media de la población.

60
Teorema del Límite central

El ejemplo anterior sugiere que:

a. La media de la distribución muestral de la media, será igual a la media poblacional,


prescindiendo del tamaño de la muestra.

b. Al ir creciendo el tamaño de la muestra, la distribución muestral de la media se acercará a la


normalidad.

La relación existente entre la forma de la distribución de la población y la forma de la distribución


muestral de la media recibe el nombre de teorema del límite central, este teorema es uno de los
mas importantes de la inferencia estadística, ya que garantiza que la distribución muestral de la
media se acerque a la distribución normal a medida que crece el tamaño de la muestra.

Diseño de Experimentos

Si queremos efectuar experimentos que produzcan resultados significativos en forma de


conclusiones útiles, tiene mucha importancia la manera de diseñarlos, a continuación los pasos
básicos para ello.

a. Objetivo: ya que es el punto de partida debe definirse en forma clara que es lo que se
pretende. En el caso de una compañía que produce baterías, uno de los objetivos puede
ser la medición del poder de arranque.

b. Que debe medirse?: Existen muchas variables a estudiar sin embargo la empresa debe
definir con claridad que variable estudiará, por ejemplo se puede medir el tiempo que
tardan las baterías en descargarse, el numero total de arranques que se requieren para
descargar la batería o el número de meses de vida útil, la variable a elegir dependerá del
objetivo definido.

c. Tamaño de la muestra: La empresa debe estar segura de elegir una muestra lo


suficientemente grande para apoyar las afirmaciones resultantes del experimento. Sin que
ello afecte en forma significativa los costos del experimento.

d. Realización del experimento: la empresa debe tener cuidado y efectuar el experimento en


condiciones controladas, es decir que no existan variables que afecten el resultado del
experimento.

e. Análisis de los datos: Los datos referentes a 20 pruebas de baterías son sometidos a
análisis, ¿los resultados reflejan ventajas significativas de la batería de la empresa frente a
la de la competencia? Si esta respuesta es positiva el resultado del experimento puede
incluirse en su publicidad.

61

También podría gustarte