Está en la página 1de 121

ANALISIS CUNTITATIVO I

DESARROLLO DE CLASES
LA IMPORTANCIA DE LA ESTADISTICA Y QUIEN LA UTILIZA.
Es comn en nuestro pas, cada vez que vamos a elecciones
presidenciales, diputados, alcaldes, or decir a ciertas personas, cual x
o y candidato tiene posibilidades de ganar la eleccin, en ese
momento, eventualmente presentar proyecciones de intencin de voto
al momento de practicarse las elecciones quien puede ganar, como x
candidato va perdiendo posibilidades de ganar o a la inversa. Otro
aspecto importante es, que en esas predicciones se habla de un
margen de error.

Nos hacemos las preguntas siguientes:


Qu quiere decir margen de error?
Quin realizo el sondeo?
A cuntas personas se entrevisto y cuantas Debi ser?
Es confiable el informe?

Esta es en esencia el uso de la estadstica, poder predecir un evento


futuro con cierto grado de certeza. Esto hace de la estadstica un gran
negocio.

En las casas de apuestas es comn el uso de la estadstica, para


poder inferir cuanto se puede pagar en una apuesta. Ustedes han odo
decir que x equipo su apuesta esta 10 a 1.

La estadstica abarca todos los campos de la actividad humana, como


cuantos hondureos seremos al 2020, cuantas mujeres, que se espera
de las variables macroeconmicas, probabilidad que un porcentaje de
la poblacin tenga cncer, las probabilidades de xito de un nuevo
producto, cantidad de consumidores, determinar el parque vehicular,
etc.

La palabra estadstica significa cosas diferentes para personas


diferentes, dependiendo de la actividad que realice. Un deportista, un
entrenador, el gerente de una compaa, el Banco Central de
Honduras, etc.

HACER VARIOS EJEMPLOS.

1
Existen tres tipos de mentiras: mentiras ordinarias, las grandes
mentiras y la estadstica, porque en la vida se dan varios fracasos
estadsticos si se usa incorrectamente. (Dar un ejemplo)

HISTORIA
Palabra italiana estatista que significa estadstica. Se empez a utilizar
entre los aos 1719-1772.

La estadstica oficial es tan vieja como la historia registrada


(levantamiento de censos) de poblacin y recursos. Es a travs del
tiempo que su usos se fue incorporando (Romanos, Babilonia, etc.)

SUBDIVISION DE LA ESTADISTICA
La estadstica se divide en dos grandes categoras:

Estadstica descriptiva. Supongamos que en esta clase se calcula la


calificacin promedio de uno de sus grupos. Lo que se esta evaluando
es el desempeo del grupo El proceso de estimacin de tal promedio
seria un problema concerniente a la estadstica inferencial. En este
caso se tendra que evaluar si las afirmaciones son verdaderamente
validas.

La Estadstica Inferencial. Se puede utilizar tambin como una rama


de la estadstica conocida como Teora de Decisiones. Es la toma de
decisiones en condiciones de incertidumbre.

AGRUPACION Y PRESENTACION DE DATOS PARA EXPRESAR


SIGNIFICADOS:TABLAS Y GRAFICAS
Los datos son obtenidos de cualquier cantidad de observaciones
relacionadas. Se puede recolectar informacin, de cuantos alumnos
asisten a clases todos los das y podemos llamar a esta informacin
como datos. La coleccin de datos se le cono ce como Conjunto de
Datos. Debe considerarse que un solo dato es un dato puntual.

COMO PODEMOS ORDENAR LOS DATOS


Para que los datos sean tiles, necesitamos organizar las
observaciones de modo que podamos distinguir patrones y llegar a
conclusiones lgicas.

2
En primera instancia es necesario aplicar tcnicas para tabular y
graficar para organizacin de datos y posteriormente mostraremos
como usar nmeros para describir datos.

RECOLECCION DE DATOS
Hay que seleccionar las observaciones de manera que todos los
grupos relevantes estn representados en los datos. Si se hace un
estudio de mercado, debe estar seguro de que el grupo seleccionado
incluya las personas que representan las distintas variables como nivel
de ingresos, raza, nivel educativo, vecindario, etc.

DAR EJEMPLOS

Los datos pueden provenir de observaciones reales o de registros


elaborados con otros propsitos. DAR EJEMPLOS.

Los datos pueden ayudar al responsable de la toma de decisiones,


sobre las posibles causas y los probables efectos que producir su
decisin.

Cuando los datos se ordenan de manera compacta y til, los


responsables de tomar decisiones pueden obtener informacin
confiable y le faciliten la toma de daciones inteligentes.

Se debe tener mucho cuidado de que los datos empleados estn


basados en suposiciones e interpretaciones correctas. Para poder
determinar la confiabilidad los autores sugieren que se haga uno las
siguientes preguntas:
1. De dnde vienen los datos? La fuente es tendenciosa? Es
posible que exista inters en proporcionar datos que conduzcan
a ciertas conclusiones ms que otra?
2. Los datos apoyan o contradicen otras evidencias que se
tienen?
3. Hace falta algunas evidencias cuya ausencia podra ocasionar
que se llegue a una conclusin diferente?
4. Cuntas observaciones se tienen? Representan a todos los
grupos que se desea estudiar?
5. La conclusin es lgica? Se ha llegado a conclusiones que los
datos no confirman?

3
Al final debemos determinar si los datos vale la pena usarlos o
debemos esperar y recabar mas informacin antes de actuar. Un
ejemplo clsico es enfocar la publicidad a segmentos de mercado que
no corresponden. DAR EJEMPLOS

DIFERENCIA ENTRE MUESTRAS Y POBLACIONES


Cuando se hace un estudio, se pueden recoger datos de una muestra
y utilizar la informacin para hacer inferencias sobre la poblacin que
representa esa muestra. En trminos generales la poblacin es
representada por el todo y una muestra es una fraccin significativa
del todo.

Estudiar las muestras es significativamente importante para describir


la poblacin EJEMPLOS.

Se debe considerar que el estudio de una muestra es ms sencillo que


el de una poblacin completa, en funcin de costo y tiempo. DAR
EJEMPLOS

Una poblacin es el conjunto de todos los elementos que estamos


estudiando, de la cual tratamos de sacar conclusiones. Debe estar
claro que elementos pertenecen o no a esta poblacin. Ejemplo: El
estudio se hace a mujeres, pero son todas o de terminado sector,
ingresos, casadas, etc.

Una muestra es una coleccin de algunos elementos de la poblacin,


no de toda. Pero esa muestra debe ser representativa de esa
poblacin. Una muestra representativa es buena en la medida que
represente relevantemente en las proporciones de la poblacin.

BUSQUEDA DE UN PATRON SIGNIFICATIVO EN LOS DATOS


Los datos se pueden organizar de diferentes maneras. Se pueden
simplemente recolectarlos y mantenerlos en orden. Si son numricos
podemos ordenarlos de mayor a menor o viceversa. Pero si nos
referimos a colores, sexo, etc. Tenemos que organizarlos de manera
diferente, tal vez alfabticamente.

La finalidad de organizarlos es poder determinar algunas


caractersticas de los datos recolectados, como, patrones evidentes,
frecuencia en que se repiten, etc.

4
Cuando ms informacin podamos obtener de la muestra, mejor
podremos entender la poblacin de la cual proviene, y mejor ser
nuestra toma de decisiones.

EJEMPLO DE DATOS SIN PROCESAR


La informacin obtenida, antes de organizarla y analizarse, se
denomina Datos sin Procesa, en vista que son no han sido manejados
mediante un mtodo estadstico.

ORDENAMIENTO DE DATOS EN ARREGLOS DE DATOS Y


DISTRIBUCION DE FRECUENCIAS

Supongamos que obtenemos los precios de la libra de azcar en el


mercado. La muestra que se obtuvo es la siguiente:
16.20 15.80 15.80 15.80 16.30 15.60
15.70 16.00 16.20 16.10 16.80 16.00
16.40 15.20 15.90 15.90 15.90 16.80
15.40 15.70 15.90 16.00 16.30 16.00
16.40 16.60 15.60 15.60 16.90 16.30

Observe que los datos recolectados son datos sin arreglar, y no


podemos sacar ninguna conclicion al respecto sobre los precios.

Si ordenamos los datos de una forma sencilla, ordenndolos de forma


ascendente podremos obtener algunas ventajas.

Procedemos a ordenarlos as:

15.20 15.70 15.90 16.00 16.20 16.40


15.40 15.70 15.90 16.00 16.30 16.60
15.60 15.80 15.90 16.00 16.30 16.80
15.60 15.80 15.90 16.10 16.30 16.80
15.60 15.80 16.00 16.20 16.40 16.90
Las conclusiones que podemos sacar son:
1. Podemos idntica fcilmente cual es el menor precio y cul es el
mayor. En este caso podemos decir que el menor precio es L
15.20 y el mayor precio es L. 16.90
2. Es fcil dividir los datos en secciones. La mitad de precios
inferiores de datos los precios estn entre L 15.20 y L 16.00. De
5
igual manera podemos dividirlos en tercios y los precios
inferiores estn entre L 15.20 y L 15.80 y as sucesivamente.
3. Podemos ver si algunos valores aparecen ms de una vez en el
arreglo. Se puede observar que 9 precios se repite ms de una
vez y cuales se repiten con mayor frecuencia.
4. Podemos observar la diferencia de precios en los datos
sucesivos. Por ejemplo entre el precio mayor y el menor. 16.90
15.20 = 1.70. Los precios fluctan en L 1.70 en el mercado.

En este caso estamos recolectando apenas 30 datos. Si la cantidad de


datos es bastante grande es sumamente incomodo analizarlos. Se
requiere resumir los datos sin que pierda su utilidad para la
interpretacin y la toma de decisiones. Cmo hacerlo?

LA DISTRIBUCION DE FRECUENCIAS
Una manera de compactar datos es mediante una Tabla de
Frecuencias o distribucin de frecuencias.

Estas son las existencias promedios de 20 tiendas de autoservicio en


millones de lempiras. Los datos estn ordenados de menor a mayor.
2.0 3.8 4.1 4.7 5.5
3.4 4.0 4.2 4.8 5.5
3.4 4.1 4.3 4.9 5.5
3.8 4.1 4.7 4.9 5.5

Para construir la tabla de frecuencias se debe seguir los siguientes


pasos:

1. Supongamos que construiremos 6 clases, donde el valor mayor


y el menor este comprendido.
2. Cada clase est comprendida entre un nmero mayor y menor. A
este se le conoce como intervalo de clase)
3. Luego determinamos con qu frecuencia los datos estn
comprendidos en cada clase.
El resultado es el siguiente cuadro:

6
Clase (grupo de valores Frecuencia (Numero de
parecidos de datos puntuales. observaciones que hay en cada
clase)
2.0 a 2.5 1
2.6 a 3.1 0
3.2 a 3.7 2
3.8 a 4.3 8
4.4 a 4.9 5
5.0 a 5.5 4
Que informacin podemos obtener se esta tabla:
1. Perdimos algo de informacin al construir la tabla de frecuencias.
No podemos saber cmo se repite puntualmente el 5.5.
2. Podemos observar que 8 tiendas tiene un promedio de
existencias entre 3.8 y 4.3.
3. No es usual encontrar existencias entre 2.6 y 3.1.
4. Las existencias entre 2.0 y 3.7 son las que no prevalecen.
5. Podremos construir diferentes tablas con cantidades de clases
diferentes.

DEFINICION DE DISTRIBUCION DE FRECUENCIAS RELATIVAS


En el ejercicio anterior aprendimos a construir una tabla de
frecuencias. Partiendo de ella podemos construir una tabla de
frecuencias relativas (fraccin o porcentaje)
Consideremos los siguientes pasos:
1. La suma de las frecuencias son igual a 1 o 100%
2. Se procede a dividir cada frecuencia entre el total de
frecuencias. Se obtiene la fraccin
3. Cada fraccin se multiplica x 100 y se obtiene el %.
4. Se obtiene el siguiente cuadro.

Clase Frecuencia(f) Fraccin % relativo


2.0 a 2.5 1 0.05 5
2.6 a 3.1 0 0.00 0.00
3.2 a 3.7 2 0.10 10
3.8 a 4.3 8 0.40 40
4.4 a 4.9 5 0.25 25
5.0 a 5.5 4 0.20 20
Totales 20 1.00 100

7
Podemos observar que las tiendas que tienen existencias entre 3.8 y
4.3 representan el 40% y as podemos hacer muchos anlisis.

Observaciones:
1. El nmero de clases uno lo determina, y para calcular el intervalo
se usa la siguiente frmula:
Numero mayornumero menor 5.52.0
Intervalo de clase = n+ 1 = 6+1 =
0.50 en el caso anterior

2. No hay traslape de nmeros entre las clases. En la distribucin


de frecuencias no es posible. La primera clase termina en 2.5 y
la siguiente comienza en 2.6
3. Si los datos son en base a 1 decimal las clases tendrn que ser
de 1 decimal.
4. Si los datos son enteros las clases debern ser enteros
generalmente.
5. Lo que determina los decimales es la aplicacin de la formula
anterior.

REPRESENTACION GRAFICA DE DISTRIBUCION DE


FRECUENCIAS
La distribucin de frecuencias puede graficarse en un diagrama de dos
dimensiones. El eje horizontal podemos mostrar los valores de la
variable (la caracterstica que estamos midiendo) y en el je vertical
colocaremos la frecuencia que tiene cada variable.

La tcnica que se utiliza es el Histograma

HISTOGRAMA
Son una serie de rectngulos, cuyo ancho es proporcional al rango de
los valores que se encuentran dentro de una clase y la altura es
proporcional al nmero de elementos que caen dentro de la clase. Si
las clases son iguales en su ancho, todas las barras tendrn el mismo
ancho.

Puede construirse un Histograma con las frecuencias relativas y la


figura ser igual, y solo cambiara el eje vertical que se expresara en

8
trminos de %. Se conoce como Histograma de Frecuencias
Relativas.

Frecuenci
Clase a
2.0 a 2.5 1
2.6 a 3.1 0
3.2 a 3.7 2
3.8 a 4.3 8
4.4 a 4.9 5
5.0 a 5.5 4

Chart Title
12

10

9
POLIGONOS DE FRECUENCIAS
Se Utiliza menos, pero es otra forma de presentar grficamente tanto
de frecuencias como frecuencias relativas. Son lo mismo que el
Histograma. Lo nico es que se traza una lnea usando como
referencia el punto medio de cada clase as:

Frecuenci
Punto Medio a
1.75 0
2.25 1
2.85 0
3.45 2
4.05 8
4.65 5
5.25 4
5.8 0

Frecuencia
9
8
7
6 Frecuencia
5
4
3
2
1
0
1 2 3 4 5 6 7 8

10
Observe que se introdujeron una clase antes y otra despus,
con un valor de cero para que la lnea toque el eje x en ambos
lados.
Los puntos medios son la suma del nmero mayor y nmero
menor dividido entre 2. Ejemplo: 2 + 2.5 = 4.5/2 = 2.25

Ventajas del Uso del Polgono


1. Es ms sencillo que su histograma correspondiente.
2. Bosqueja con ms claridad un perfil del patrn de los
datos.
3. El polgono se vuelve cada vez ms suave y parecido a
una curva conforme aumenta el nmero de clases y el
nmero de observaciones.

OJIVA
Una distribucin de frecuencias acumuladas nos permite ver
cuntas observaciones estn por encima de ciertos valore, en
lugar de hacer un mero registro del nmero de elementos que
hay dentro de los intervalos.
El procedimiento es construir una tabla de frecuencias
menores que y se muestra en la siguiente tabla:

Clase Frecuencia Acumulada

11
Menos que 2.5 0
Menos que 3.1 1
Menos de 3.7 1
Menos de 4.3 3
Menos de 4.9 11
Menos de 5.5 16
Menos de 6.00 20

Con esta tabla de distribucin de frecuencias acumulada se puede


hacer la grafica as:

Menor de 2.5 0
Menor de 3.1 1
Menor de 3.7 1
Menor de 4.3 3
Menor de 4.9 11
Menor de 5.5 16
Menor de 6.0 20
25

20

15

10

12
Observe que a partir de un inventario de 4.3 son ms las tiendas que
tienen un inventario mayor.

MEDIDAS DE TENDENCIA CENTRAL


En parte anterior aprendimos como se recolectan datos sin procesar y
como estos se ordenan en una forma lgica que nos permita ilustrar
tendencias o patrones de los datos, pero eso no basta es necesario
contar con medias ms exactas. En estos casos podemos usar los
nmeros que constituyen la estadstica sumaria para describir las
caractersticas del conjunto de datos.

Dos de estas caractersticas son de particular importancia para los


responsables de tomar decisiones: La tendencia Central y la
dispersin.

Tendencia Central. Se refiere a un punto medio de una distribucin.


Se les conoce como medidas de posicin.

La curva de distribucin puede tomar diferentes formas, y a cada una


de las curvas le corresponder un punto igual si est distribuida
normalmente, caso contrario el punto medio cambiara si la distribucin
tiene inclinacin para uno de los dos lados.

Observemos la siguiente grafica:

13
Observe que la distribucin A es no es igual a la Distribucin pero
estn perfectamente distribuidas, por lo tanto les corresponde igual
punto medio. Sin embargo la distribucin C el punto medio esta
sesgado hacia la derecha.

Dispersin. La dispersin se refiere a la separacin de los datos que


proporcionan informacin til: El sesgo y la curtosis.

El estudio de esto es no est incluida en el programa de estudio, es


necesario tener un conocimiento general de estos:

Sesgo. Los datos puntuales de un conjunto de datos pueden ser


simtricos o sesgados. La simtrica es cuando la lnea vertical divide
la distribucin en dos partes iguales. Cada parte es igual a la otra.
Esto se puede observar en las distribuciones A y B.

Sin embargo la grfica C son curvas sesgadas en vista que esta


inclinada hacia la derecha (positiva). Puede ser que si analizamos
estas curvas como inventario, a medida que avanza el tiempo se est
consumiendo el inventario. Ejemplo de grafica de 12 meses de un ao.

Curtosis. Cuando medimos la curtosis de una distribucin, estamos


midiendo que tan puntiaguda es. Si observamos las grafica A y B
podemos observar que la grfica A es ms puntiaguda, no obstante
que su media es igual.

14
UNA MEDIDA DE TENDENCIA CENTRAL: La Media Aritmtica.
Casi siempre cuando nos referimos a un promedio estamos hablando
de la Media Aritmtica. Ejemplo: el promedio de ingresos de una
persona en un ao, la temperatura promedio en el ao de una ciudad,
las notas promedio de la clase, etc.

Si observamos las ventas de una empresa durante el ao 2008 estas


fueron:
MILLONES
Mes Ene Feb Mar Abr May Jun Jul Agt Sep Oct Nov Dic
Valor 7 23 4 8 2 12 6 13 9 4 16 22

Podemos calcular la media de las ventas considerando que son datos


no agrupados o sea datos simples.

La frmula para el clculo considerando que son datos que


corresponden a la poblacin (datos totales) es:

x 7 +23+4 +8+2+12+6+ 13+9+ 4+16+ 22


=
N = 12 = 10.5

Observe lo siguiente:
= smbolo de la media de una poblacin.

x = suma de los valores de todas las observaciones o datos


N = nmero de elementos de la poblacin. Por eso N es mayscula

Para el clculo de la media de una muestra, el procedimiento es el


mismo, solo que la simbologa cambia. Observe que n es minscula.

x
X = n

CALCULO DE LA MEDIA A PARTIR DE DATOS AGRUPADOS


Una distribucin de frecuencias consta de datos agrupados en clases.
Como cada observacin cae dentro de una de las clases, no
conocemos el individual de cada observacin y es necesario calcular
el valor medio de los datos, el procedimiento es el siguiente:
1. Se encuentra el punto medio de cada clase.
15
2. Se multiplica ese punto medio por la frecuencia de cada clase.
3. Se suman todos los resultados anteriores.
4. La suma de estos valores se divide entre el total de las
observaciones o datos.
La frmula es la siguiente:

(f X x )
X = n

El siguiente ejemplo es los saldos de cuentas de ahorro, de una


muestra de 600 clientes:

Se elabora el cuadro siguiente:


Clase( L) Punto Frecuencia (f) F*x
Medio X
0 49.99 25.00 x 78 = 1,950
50.00 99.99 75.00 x 123 = 9,225
100.00 149.99 125.00 x 187 = 23.375
150.00 199.99 175.00 x 82 = 14,350
200.00 249.99 225.00 x 51 = 11,475
250.00 299.99 275.00 x 47 = 12,925
300.00 349.00 325.00 x 13 = 4,225
350.00 399.99 375.00 x 9 = 3,375
400.00 449.99 425.00 x 6 = 2,550
450.00 499.99 475.00 x 4 = 1,900
TOTALES 600 85,350
Ff (f * x)

85,350
X = = L 142.25 es la media de la muestra.
600

CODIFICACION
En los casos de no tener disponible una computadora y sea necesario
realizar las operaciones a mano, se puede simplificar el clculo de la
media aritmtica de datos agrupados, con la tcnica de Codificacin.
Podemos eliminar el problema de tener puntos medios muy grandes o
inconvenientes. La tcnica consiste en asignar enteros consecutivos
de valores pequeos, llamados cdigos, a cada uno de los puntos
medios. El entero 0 se le puede asignar a cualquier punto medio, o
sea a la mitad de la distribucin o el ms cercano al punto medio.
16
Ejemplo:
Clase Cdigo
1-5 -4
6-10 -3
11-15 -2
16-20 -1
21-25 0
26-30 1
31-35 2
36-40 3
41-45 4

La ubicacin del punto medio, cuando las clases son impares es mas
fcil.

Los estadsticos usan X0, para representar el punto medio al que se le


asigna el valor =, y al punto medio codificado.

Formula:
( f )
X = X0 + w n

Donde:
X = media de la muestra

X0 = valor del punto medio al que se le asigno el cdigo 0


W = Ancho numrico del intervalo de clase
= cdigo asignado a cada punto medio de la clase

f = frecuencia o numero de observaciones de cada clase


n = nmero total de observaciones de la muestra

17
Ejemplo de cuando las clases son un numero par (6)
Este caso es de un grupo de alumnos y sus edades.
Punto
Medio Cdigo Frecuenci
Clase (X) (u) a (f) U*f
0-7 3.5 -2 x 2 = -4
8-15 11.5 -1 x 6 = -6
16-23 19.5 0 x 3 = 0
=X0
24-31 27.5 1 x 5 = 5
32-39 35.5 2 x 2 = 4
40-47 43.5 3 x 2 = 6
total 20 5
f =n (u * f)
Desarrollo formula:

5
X = 19.5 + 8( 20 ) = 21.5 Si nos referimos a edades esta seria la
edad promedio de un grupo x.

VENTAJAS Y DESVENTAJAS DE LA MEDIA ARITMETICA


Ventajas:
1. Es un concepto muy familiar entre las personas.
2. Cada conjunto de datos tiene una media y es nica.
3. Es til para llevar a cabo procedimientos estadsticos que
permiten comparar varios conjuntos de datos.
Desventajas:
1. Si bien es cierto que toma todos los valores del conjunto, los
datos extremos tienden a distorsionarla.
2. En los casos que suceda de contar datos extremos, lo mejor es
eliminarlos.
3. Cuando la cantidad de datos es numeroso, es mejor usar datos
agrupados, que la convierte en una media aproximada.

18
4. Es imposible calcular la media cuando se tiene clases extremas
abiertas. Ejemplo menores de 10 o mayores de 50

MEDIA PONDERADA
Al calcular la Media Aritmtica se asume que los datos del conjunto
son iguales en importancia. En algunos casos es evidente que algunas
observaciones son ms importantes que otras. Ejemplo clsico son el
ndice acadmico de los alumnos, unas clases tienen un valor de 5
unidades valorativas y otras 4 unidades. Otro ejemplo son los
exmenes parciales que no tienen el mismo peso. Esto es lo que
considera la media ponderada, asignarle a cada observacin su valor
relativo.

Ejemplo:
Las notas de cada parcial estn valuadas en 25, 35 y 40%
respectivamente.

El alumno obtuvo las siguientes notas: 60%, 80% y 70%

Para obtener la nota final, se usa la media ponderada as:

Formula:

XW
X w =
W

Donde:

Xw = es la media ponderada.
X = es la observacin individual.
W = el peso o ponderacin asignada a cada observacin.

Calculo con la tabla siguiente:

Nota (X) Peso (w) xw


60 .25 15
80 .35 28
70 .40 28
Totales 1.00 71
La nota final del alumno es 71%. Esta es una nota bajo el mtodo de
media ponderada.

19
MEDIA GEOMETRICA
Muestra los cambios porcentuales de una serie de nmeros positivos.
Tiene aplicacin en los negocios y la economa, debido a que con
frecuencia se est interesado en establecer el cambio porcentual en
las ventas, en el producto nacional bruto o en cualquier serie
econmica.

La Media Geomtrica proporciona una medida precisa de un cambio


porcentual promedio en una serie de nmeros.

Un gerente desea establecer la tasa de crecimiento promedio de sus


ventas en base a los datos histricos que tiene. Considere que la tasa
de crecimiento del sector econmico es de 10%. En la siguiente tabla
estn los datos Histricos y como se calcula la tasa geomtrica:

Porcentaje sobre ao
AO VENTAS anterior
2004 50,000 -
2005 55,000 55/50 = 1.10
2006 66,000 66/55 = 1.20
2007 60,000 60/66 = 0.91
2008 78,000 78/60 = 1.30

Observe que los porcentajes son calculados dividiendo el ao que


estamos calculado, entre el ao inmediato anterior.
4 (1.10 )( 1.20 ) ( 0.91 ) (1.3) = 11.79
Teniendo los de cada ao podemos aplicarle la formula:

MG = 1.1179 o sea 11.79% promedio anual

Si hacemos el clculo con la media aritmtica nos da:

1.10+1.20+ 0.91+1.3
X = = 1.1275
4

Observe que en ambos casos se divide entre 4 porque el primer ao


solo sirve de base para calcular los siguientes aos.

20
Si usamos a media aritmtica para comprobar cul de los dos ndices
es ms exacto, calculamos:

50,000 X 1.1275 = L 56,375


56,375 X 1.1275 = 63,563
63,563 X 1.1275 = 71,667
71,667 X 1.1275 = 80,805
Si comparamos el ltimo resultado con el resultado real que fue de L
78,000, la diferencia es de L 80,805 78,000 = 2,805

Ahora usemos la media geomtrica


50,000 X 1.1179 = 55,895
55,895 X 1.1179 = 62,485
62,485 X 1.1179 = 69852
62,852 X 1.1179 = 78,088
Si lo comparamos con el resultado real tendremos 78,088 78,000 =
88.
Esto muestra que la media geomtrica es ms til en estos casos,
porque pondera los cambios en el tiempo. En el caso que la tasa de
crecimiento sea igual, se pude aplicar cualquiera de los mtodos.

Lo importante es que puedo seguir proyectando en los aos


subsiguientes:

Ejemplo:
Proyectar los aos 2009 y 2010 as:
2009 78,088 X 1.1179 = L 87,295
2010 87,295 X 1.1179 = 97,587

LA MEDIANA
Es diferente a las anteriores. La mediana es solo el valor del conjunto
de datos que mide la observacin central del conjunto. Es la
observacin que est ms centrada. La mitad estn por arriba de ella y
la otra mitad de datos estn por debajo ella.

Es en esencia la observacin de la mitad despus que se han


colocado los datos en una serie ordenada.

21
CALCULO DE LA MEDIANA A PARTIR DE DATOS NO
AGRUPADOS

n+1
Mediana = ( 2 )

Donde n = nmero
de elementos del arreglo

Ejemplo:
Los costos en millones de varios aos se muestran abajo:
45,52,56,67,67

La posicin del valor de la medina es:

5+ 1
Posicin de la Mediana = 2 = 3 o sea la tercera posicin es el
valor de L 56. Esa es la media de los costos de esos aos. Mediana =
56

Observe que la cantidad de datos es un nmero impar.

En el caso que los datos sean un nmero par los dos datos centrales
se suman y se dividen entre 2

Ejemplo:
35,45,52,56,67,67: La posicin de la Mediana es:

6 +1
Posicin de la Mediana = 2 = 3.5

El valor de la mediana ser la suma de los valores 3 y 4 dividido entre


2.

52+56
Mediana = 2 = 54

MEDIANA PARA DATOS AGRUPADOS

22
Para calcular la media de datos agrupados, se supone que las
observaciones en cada clase son iguales al punto medio de la clase.
Esto porque se hace el supuesto de que si bien algunos datos estarn
por arriba del punto medio, otros estarn por debajo de ese punto.
Basado en esto debe considerarse los puntos medios de cada clase y
sus respectivas frecuencias.

Formula:

n
f
Mediana = Lmd + ( 2 C
fmd

Donde:
Lmd = el lmite inferior de la clase de la mediana.
F = es la frecuencia acumulada de la clase que antecede a la clase de
la mediana.
F = la frecuencia de la clase mediana.
C = intervalo de la clase mediana.

La siguiente tabla muestra los jubilados por edades:

Edad (clase) f Frecuencia Acumulada


50-59 3 3
60-69 7 10
70-79 18 28
80-89 12 40
90-99 8 48
100-109 2 50

1. Acumular las frecuencias tal como se muestra en el cuadro


anterior.
2. Encontrar la clase mediana cuya frecuencia acumulada es mayor
o igual a n/2
3. Aplicar la formula.
Clase modal = n/2 = 50/2 = 25. La mayor frecuencia acumulada que
comprende a 25 es 28, por lo tanto la clase modal ser 70-79

23
50
10
Mediana= 70 + ( 2 )10 = 78.33
18

Se puede concluir que la mitad de los jubilados sern menores de 78


aos y al revs la otra mitad tendr una edad mayor a 78 aos.

Ventajas y Desventajas de la Mediana.


Ventajas
1. Los datos extremos no la afectan tanto como la media.
2. Es fcil de entender y se puede calcular a partir de cualquier tipo
de datos, incluso a partir de datos agrupados con clases
extremas abiertas, a menos que este entre una clase de
extremos abierto.
3. Podemos encontrarla la mediana incluso cuando nuestros datos
sean descripciones cualitativos como color, nitidez, en lugar de
nmero.
Desventajas
1. Ciertos procedimientos estadsticos son ms complejos que los
que utiliza la media aritmtica.
2. Debido a su posicin media, debe ordenarse los datos, para
hacer el clculo.
3. Si lo utilizamos como parmetro de la poblacin, la media es
ms fcil de usar.

LA MODA
Es diferente a la media, pero parecida a la medina. Es el valor que
ms se repite en el conjunto de datos.

Es importante organizar los datos, y es usual que algunos datos no se


repitan para ser el valor ms frecuente y es por eso que raramente se
usa.

Ejemplo:
Despus de organizar los datos estos se muestran como ejemplo de
viajes que hacen un grupo de personas:
1,1,2,2,4,4,5,5,6,6,7,7,8,12,15,15,15,19

La Moda para datos no agrupados es este caso es 15 porque se repite


3 veces.
24
En los casos que varios datos se repitan al igual, en este caso se dice
que la distribucin de datos tiene 2 modas. Se dice que es Bimodal.
En los casos que sean ms de dos, se dice que es Multimodal.

CALCULO DE LA MODA EN DATOS AGRUPADOS


Cuando los datos estn agrupados, se supone que la Moda est en la
clase que contiene el mayor nmero de elementos (frecuencia). Para
determinar en un solo valor para la Moda a partir de esa clase modal,
la frmula es:

d1
Mo = Lmo + ( d 1+d 2 )w

Donde:
Lmo = Lmite inferior de la clase modal.
d1 = Frecuencia de la clase que se encuentra inmediatamente menor
que ella.
d2 = frecuencia de la clase modal menos la frecuencia de la clase
inmediatamente mayor que ella.
W = Ancho del intervalo de la clase modal.

Ejemplo:
No.
Entregas 0-3 4-7 8-11 12 o mas
Frecuencia 6 8 1 5
Clase Modal
Si deseamos saber no solo la clase modal que es 4-7 entregas,
deseamos conocer La Moda, aplicamos la formula as:
86 2
Mo = 4 + ( ( 86 )+1 =4 + 0.6667 o 3 =4.667 entregas

VENTAS Y DESVENTAJAS DE LA MODA


Ventajas
1. Es igual a la medina, se puede utilizar como una posicin central
para los datos cualitativos como cuantitativos.
2. Los valores extremos no la afectan.
3. No importa el tamao de los datos y la dispersin de los mismos.

25
4. Se pueden usar no importa si alguno o ambos extremos estn
abiertos.
Desventajas
1. No se utiliza tan a menudo como la medina y la moda.
2. Muchas veces no existe una clase modal.
3. Es intil en la mayora de casos.
4. Cuanto tiene ms de una moda es difcil interpretarlos y
comprenderlo.

COMPARACION DE LA MEDIA, MEDIANA Y MODA


Cuando se trabaja con problemas estadsticos, debemos decidir qu
medida usar. Las distribuciones simtricas que solo contienen una sola
moda, siempre tienen el mismo valor para todas. Cualquiera.

En una distribucin con sesgo positivo (la derecha), la moda se


encuentra en el punto ms alto de la distribucin, la mediana est a la
derecha de la moda y la media se encuentra todava ms a la derecha
de la moda y mediana.

En una distribucin con sesgo negativo (izquierda), la mediana sigue


siendo el punto ms alto y est siempre entre la moda y la media.

En trminos generales no existe una regla para aplicar cualquier


medida de tendencia central

DISPERSION: PORQUE ES IMPORTANTE


Nos hemos referido anteriormente a la dispersin. Cuando aplicamos
una medida de tendencia central, solo tenemos una parte de las
caracterizas de los datos. Para aumentar nuestro entendimiento del
patrn de los datos, debemos medir su dispersin, separacin o
variabilidad.

Es importante medir la dispersin porque:


1. Proporciona informacin adicional que nos permite juzgar la
confiabilidad de nuestra medida de tendencia central. Si los
datos estn muy dispersos, la posicin central es menos
representativa de los datos, como un todo, que cuando estos se
agrupan ms cerca alrededor del a media.

26
2. Ya que existen problemas caractersticos para datos muy
dispersos, se debe ser capaz de reconocer esa dispersin
amplia para poder abordar el problema.
3. Quiz se desee comparar las dispersiones de diferentes
muestras.

Un analista financiero se preocupa cuando las utilidades se dispersan,


es decir a veces demasiado altas y otras demasiado bajas.

RANGOS: MEDIDAS DE DISPERSION UTILES.


La dispersin se puede medir en trmino de dos valore seleccionados
del conjunto de datos. Para efecto de clases se estudiaran las
medidas llamadas de distancia: el rango, el rango interfractil y el rango
intercuartil.

RANGO
Es la diferencia entre el valor ms alto y ms pequeo de los valores
observados.

Rango = Valor de la observacin mas grade valor de la observacin mas pequea


Ejemplo:

Las ventas ms altas de una empresa fue L 5,700,000 y la ms baja


es de L 3,400,00, entonces:

Rango = 5,700,000 3,400,000 = L 2,300,000

Es fcil de calcular y entender, pero su utilidad es muy limitad. Porque


ignora la naturaleza de la variacin y tiene una influencia los datos
extremos. En lo sucesivo puede registrar variaciones diferentes y si se
trata de distribuciones con extremos abiertos no es posible su clculo.

RANGO INTERFRACTIL
Es una distribucin de frecuencias, una fraccin o proporcin dada de
los datos cae en un fractil o debajo de este. La media por ejemplo, es
el fractil 0.5, porque la mitad del conjunto de datos es menor o igual a
ese valor. Ejemplo el 25% de los datos estar en el fractil 0.25.

Ejemplo:
Estos son los pagos al seguro social por mes:

27
Primer Tercio Segundo Tercio Ultimo Tercio
863 1,138 1,698
903 1,204 1,745
957 1,354 1,802
1,041 1/3 fractil 1,624 2/3 fractil 1,883 ultimo fractil

Al dividir la tabla anterior en tres fractiles, es porque deseamos


conocer el rango entre estos:

Podemos concluir que el 33.33% de los elementos estn en 1,041 o


debajo de este valor, el 66.66% restante estn arriba de 1,041. As
podemos hacer cualquier anlisis.

RANGO INTERCUARTIL
El rango Intercuartil mide aproximadamente que tan lejos de la medina
debemos ir en cualquiera de las dos direcciones antes de recorrer una
mitad de los valore del conjunto de datos.
1. Dividimos nuestros datos en cuatro parte (25% de los datos en
cada bloque)
2. Los valores ms altos de cada una de las cuatro partes.
3. El rango intercuartil es la diferencia entre los valores del primero
y el tercer cuartil.

Rango intercuartil = Q3 Q1

Ejemplo:
Los datos son los siguientes:
59 65 6768 71 72 75 79 81 83 85 87 88 91 92 93 94 95 100 100
Son 20 los datos y si los dividimos en cuatro partes, a cada cuartil ser
de 5 datos:
Esto quiere decir que los datos de cada cuartil sern:
1er Cuartil = 59,65,67,68,71
2do Cuartil = 72,75,79,81,83
3er Cuartil = 85,87,88,91,92
4to Cuartil = 93,94,95,100,100

Diferencia =Q3 Q1 = 92 71 = 21

El ejemplo es si dividimos los datos en cuartiles, pero uno puede


dividir los datos en cualquier forma.
28
Ejemplo si nos dicen sobre el dato 16, podemos decir que su valor es
93 y es un percentil 16/20 = 80

Supongamos que el rango = 20,300 = 16,700 millas


Rango intercuartil = Q3 Q1 = 12,700 8,100 = 4,600 millas

DISPERSION: MEDIDAS DE DESVIACION PROMEDIO


Es la dispersin que los datos estn con respecto a su medida de
tendencia central. Dos medidas son importantes: la varianza y la
desviacin estndar. Las dos proporcionan la distancia promedio de
cada observacin o dato del conjunto respecto a la media de
distribucin.

VARIANZA DE POBLACION
2
Cada poblacin tiene una varianza, su smbolo es (sigma
cuadrada)
1. Se calcula la media del conjunto.
2. Se resta la media y cada dato del conjunto.
3. Como algunos datos del inciso anterior resultan negativos, se
elevan al cuadrado estos para convertirlos en positivos.
4. La suma de todos estos valores son la varianza de la poblacin

Formula:
2
2 (xu) x2 2
= = - u
N N

Donde:
2 = varianza de la poblacin

X = elementos u observaciones.
= media de la poblacin.

N = nmero total de elementos de la poblacin


2
(xu)
= suma de todos los valores para calcular 2
N

29
Los resultados que se obtengan, estn expresados en las mismas
unidades de los datos. Ejemplo Lempiras al Cuadrado. Como se podr
comprender no es una medida fcil de comprender. Es necesario
hacer un cambio significativo a la varianza y para calcular una medida
til de la desviacin y que sea menos confusa. Esta medida se le
conoce como desviacin estndar y es la raz cuadrada de la varianza.
Esto nos dara como resultado las mismas unidades que los datos
originales.
Ejemplo:
El SANAA, realiza un anlisis del agua para encontrar impurezas en la
misma. Se extraen 15 muestras y los resultados fueron:
Desviacin
al Observaciones
Impurezas Media Desviacin Cuadrado al cuadrado (
(x) u=2.49/15 (x-u) (xu)2 x2 )
0.04 0.166 - -0.126 = 0.016 0.0016
0.06 0.166 - -0.106 = 0.011 0.0036
0.12 0.166 - -0.046 = 0.002 0.0144
0.14 0.166 - -0.026 = 0.001 0.0196
0.14 0.166 - 0.026 = 0.001 0.0196
0.15 0.166 - 0.016 = 0.000 0.0225
0.17 0.166 - 0.004 = 0.000 0.0289
0.17 0.166 - 0.004 = 0.000 0.0289
0.18 0.166 - 0.014 = 0.000 0.0324
0.19 0.166 - 0.024 = 0.001 0.0361
0.21 0.166 - 0.044 = 0.002 0.0441
0.21 0.166 - 0.044 = 0.002 0.0441
0.22 0.166 - 0.054 = 0.003 0.0484
0.24 0.166 - 0.074 = 0.005 0.0576
0.25 0.166 - 0.084 = 0.007 0.0625
2.49 0.051 0.4643
x (xu)2 x2

0.051
2 = = 0.0034
15

= 0.0034 = 0.058%

Si usamos la otra formula

2 0.4643
= = 0.0034
15

30
Independientemente de la formula el resultado es igual.

USO DE LA DESVIACION ESTANDAR


La desviacin estndar nos permite, con un buen grado de precisin,
donde esta localizados los valores de una distribucin de frecuencias
con relacin a la media. Usando el ejemplo anterior y basado en el
teorema del ruso P.L. Chebysheb, establece que independientemente
de la forma de la distribucin, al menos 75% de los valores caen
dentro de 2 desviaciones estndar a partir de la media de la

distribucin, y al menos 89% de los valores caen dentro de 3
desviaciones estndar a partir de la media.

Podemos medir aun con ms precisin el % de observaciones que


caen dentro de un rango especfico de una curva simtrica con forma
de campana.
1. Aproximadamente el 68% de los valores de la poblacin cae
dentro de 1 desviacin estndar.

2. Aproximadamente 95% de los valores estar dentro de 2
desviaciones estndar a partir de la media.

3. Aproximadamente 99% de los valores estar dentro de 3
desviaciones estndar a partir de la media.

Si analizamos el problema los 15 muestras de agua, tiene una


impureza de 0.166 y una desviacin estndar de 0.058%
El teorema nos dice nos dice que al menos el 75% de los valores (15 x
75% = 11 muestras estn entre 0.166 2(0.058) = 0.050 y 0.166 +
2(0.058) = 0.282. De hecho, 93% de las observaciones (14 de 15
muestras) estn en el intervalo. Ntese que la distribucin que la
distribucin es razonablemente simtrica y el 93% es muy secano al
95% terico para un intervalo de 2 desviaciones estndar a partir
de la media de una curva en forma de campana.

La desviacin estndar es til para describir cuanto se apartan las


observaciones individuales de una distribucin de la media misma.
Una medida que se conoce como Resultado Estndar nos da el
nmero de desviaciones estndar que una observacin en particular
ocupa por debajo o por encima de la media. Si x simboliza la

31
observacin, entonces el resultado estndar calculado a partir de los
datos de la poblacin es:

xu
Resultado estndar de la poblacin =

Donde:
x = observacin tomada de la poblacin
u = media de la poblacin
= desviacin estndar de la poblacin.

Supongamos una impureza de 0.108%


0.1080.166
Resultado estndar = 0.058 = -1

Una impureza observada del 0.28% tendra un resultado estndar de



2

0.2820.166
Resultado estndar = =2

Para finalizar podemos decir que una impureza del 0.282% se desva
de la media en 2(0.058) = 0.116 unidades, que es igual a + 2, en
trminos de del numero de desviaciones estndar alejado de la media.

CALCULO DE LA VARIANZA Y LA DESVIACION ESTANDAR


UTILIZANDO DATOS AGRUPADOS.

La frmula es:

xu
2
f x
2 2
= 2 = N - u
f


= 2

32
Ejemplo:
Punt Frecuenci
Clase o af f*x Media x- u (xu)2 f(
Medi xu2
o
700-799 750 4 3,000 1,250 -500 250,000 1,000,000
800-899 850 7 5,950 1,250 -400 160,000 1,120,000
900-999 950 8 7,600 1,250 -300 90,000 720,000
1,000-1,099 1,050 10 10,500 1,250 -200 40,000 400,000
1,100-1,199 1,150 12 13,800 1,250 -100 10,000 120,000
1,200-1,299 1,250 17 21,250 1,250 0 0 0
1,300-1,399 1,350 13 17,550 1,250 100 10,000 130,000
1,400-1,499 1,450 10 14,500 1,250 200 40,000 400,000
1,500-1,599 1,550 9 13,950 1,250 300 90,000 810,000
1,600-1,699 1,650 7 11,550 1,250 400 160,000 1,120,000
1,700-1,1,799 1,750 2 3,500 1,250 500 250,000 500,000
1,800-1,899 1,850 1 1,850 1,250 600 360,000 360,000
100 125,000 6,680,000

125,000
X2 = = 1,250 millones (media)
100

6,680,000
2 = = 66,800 millones (Varianza)
100

= 66,800 = 258.5 millones (Desviacin Estndar)

DESVIACION ESTANDAR DE UNA MUESTRA


Es lo mismo solo que se sustituye las letras donde se sustituye S2 a
2
, X auynN

Formula:

x X

x2 n X 2
s2 = 2 = - Varianza
n1 n1
f

S= s2 Desviacin estndar

33
Donde:
2
s = Varianza de la muestra

s = Desviacin estndar de la muestra


x = valor de cada una de las n muestras
x = media de la muestra

n-1 = Numero de observaciones de la muestra menos 1

Ejemplo:
Estos son los gastos en publicidad de una empresa
Gasto (x) x x x x
2

Media (
x-
x


863 1,351 -488 238,144 744,769


903 1,351 -448 200,704 815,409
957 1,351 -394 155,236 915,849
1,041 1,351 -310 96,100 1,083,681
1,138 1,351 -213 45,369 1,295,044
1,204 1,351 -147 21,609 1,449,616
1,354 1,351 3 9 1,833,316
1,624 1,351 273 74,529 2,637,376
1,698 1,351 347 120,409 2,883,204
1,745 1,351 394 155,236 3,045,025
1,802 1,351 451 203,401 3,247,204
1,883 1,351 532 383,024 3,545,689
1,593,770 23,496,182
x
x 2
x


1,593,770
s2 = = 144,888 miles de lempiras Varianza
11

s = 144,888 = 380.64 miles de lempiras Desviacin estndar

34
DISPERSION RELATIVA: EL COEFICIENTE DE VARIACION
La desviacin estndar es una medida absoluta de la dispersin que
expresa la variacin de las mismas unidades de los datos originales.
Si uno tiene los clculos de dos o ms conjuntos, estos no pueden ser
comparados.

Se requiere una medida relativa que nos proporcione una estimacin


de la magnitud de las desviaciones respecto a la magnitud de la
media. La unidad de medida es el % en vez de unidades de los datos
originales. La respuesta es el Coeficiente de variacin.

Formula:


Coeficiente de variacin de una poblacin = u (100)

Ejemplo:
Un tcnico A realiza 40 reparaciones con una desviacin estndar de
5. El tcnico B realiza 160 reparaciones con una desviacin estndar
de 15. Cul de los dos tcnicos muestran menos variabilidad?
Ambos realizan actividades diferentes
Para el tcnico A

5
Coeficiente de variacin = 40 (100) = 12.5% de variacin

Para el tcnico B

15
Coeficiente de variacin = 160 (100) = 9.4 % de variacin

El tcnico a tiene una variacin absoluta menor, pero tiene una


variacin relativa menor.

ANALISIS EXPLORATORIO DE DATOS (AED)

35
Una de las tcnicas ms tiles del anlisis exploratorio, la grfica de
tallo y hoja, resuelve este problema de manera muy efectiva.
Proporciona el orden de calificaciones de los elementos del conjunto
de datos y la forma de distribucin.

Son las notas de alumnos:


79 78 78 67 76 87 85 73 66
99 84 72 66 57 94 84 72 63
51 48 50 61 71 82 93 100 89

Se construye la tabla de frecuencias:

40-49 1
50-59 3
60-69 5
70-79 8
80-89 6
90-99 3
Mayor 99 1

Para producir una grfica de tallos y hoja, se hace una lista vertical del
primer nmero de cada una de las clases.

4
5
6
7
8
9
10

Despus se dibuja una lnea vertical a la derecha de los tallos y se


listan las hojas (el siguiente digito para cada tallo) a la derecha de la
lnea en el orden en que aparecen el conjunto de datos originales.
4| 8
5| 710
6| 76631
7| 98863221
8| 754429
9| 943
36
10| 0

Por ltimo se ordenan todas las hojas en cada rengln en el orden de


clasificacin

4| 8
5| 017
6| 136
7| 12236889
8| 244579
9| 349
10| 0

Cada rengln de la grfica de tallos y hoja obtenida corresponde a un


tallo, y cada valor en ese tallo es una hoja. El rengln 9| 3 4 9, significa
que hay tres elementos en este conjunto de datos que comienzan con
9 (93,94 y 99). Si se gira este cuadro lo que muestra es un histograma.

ANALISIS CUANTITATIVO I
2DO PARCIAL
PROBABILIDAD
Fue aplicada en los juegos de azar, y posteriormente en el estudio de
problemas sociales y econmicos. Las compaas de seguros que
surgen en el siglo XIX, requera de un conocimiento preciso sobre los
riesgos de perdidas, con el fin de calcular las primas.

Medio siglo despus, muchos centros de aprendizaje estaban


estudiando la probabilidad como herramienta para el entendimiento de
los fenmenos sociales. En la actualidad, la teora matemtica de la
probabilidad es la base de las aplicaciones estadsticas, tanto en
investigaciones sociales como la teora de las decisiones.

Desde el momento que actuamos bajo incertidumbre, la toma de


decisiones requiere de la teora de probabilidades, sea no algo muy
complejo. Todos los das omos que existe un 70% de probabilidad que

37
llueva, que x equipo tiene ms probabilidades de ganar, que un
candidato tiene 60% de preferencias en las elecciones, etc.

No olvidemos que vivimos en un mundo incapaz de predecir el futuro


con total certidumbre. Es por eso que nos lleva a estudiar y utilizar la
teora de probabilidad. Aprendemos a organizar la informacin y
considerarla de manera sistemtica, seremos capases de reconocer
muestras suposiciones, comunicar nuestro razonamiento a otras
personas y tomar una decisin ms solida que la que tomaramos si
solo diramos palos a ciegas.

TERMINOLOGIA BASICA EN PROBABILIDAD


En general la teora de probabilidad, es que algo pase o no. La
probabilidad se expresa como fraccin (,,,) o como un decimal
(0.167, 0.500, 0.889) que estn entre 0 y 1. Tener una probabilidad de
cero significa que algo nunca va suceder, y 1 que siempre va a
suceder.

UN EVENTO. Es una o ms posibilidades de hacer algo. La posibilidad


de lanzar una moneda, si cae cara es un evento, si cae cruz es otro
evento. Elegir un estudiante entre diez que externe una opinin, la
posibilidad de tener un accidente de trnsito, etc.

UN EXPERIMIENTO. La actividad que origina uno de dichos eventos,


se conoce como experimento. Es un experimento de lanzar una
moneda Cul es la probabilidad del evento cara? Y desde luego, si la
moneda no est cargada y tiene la misma probabilidad de caer en
cualquiera de los dos lados (sin probabilidad de caer parada),
podemos responder, que la probabilidad es 2 o 0.5. Al conjunto de
todos los posibles resultados de un experimento se le llama espacio
muestral del experimento. Es el de lanzar una moneda, el espacio
muestra es:

S = {cara, cruz}

El experimento de sacar una carta, en un espacio muestral de 52


cartas, o la probabilidad de tomar un avin a tiempo, las posibilidades
de conseguir un trabajo. La preocupacin es la posibilidad o
probabilidad de que ciertos eventos sucedan.

38
EVENTOS MUTUTUAMENTE EXCLUYENTES. Se dice que los
eventos son mutuamente excluyentes si uno de ellos puede tener
lugar a un tiempo. En la moneda solo hay dos resultados posibles,
cara y cruz. En cualquier lanzamiento obtendremos una cara o una
cruz, nunca ambos. Igual sucede si el nacimiento de un hijo, este
puede ser hembra o varn. Se deduce que en estos casos son
eventos mutuamente excluyentes. Lo fundamental es contestarse
Pude ocurrir dos o ms de tales eventos al mismo tiempo? Si la
respuesta es afirmativa, los eventos no son mutuamente excluyentes.

LISTA COLECTIVAMENTE EXHAUTIVA. Cuando una lista incluye


todos los eventos que pueden resultar de un experimento, se dice que
la lista es colectivamente exhaustiva. La lista de posibles candidatos a
la presidencia no es colectivamente exhaustiva si no se conoce si
habr candidaturas independientes, pero una vez conocidos todos los
candidatos es colectivamente exhaustiva.

TIPOS DE PROBABILIDADES.
Existen 3 maneras bsicas de clasificar las probabilidades, stas
representan planteamientos conceptuales bastante diferentes para el
estudio de la teora de probabilidad, los expertos no se ponen de
acuerdo sobre cul es el planteamiento ms apropiado. Empecemos
definiendo
1. El planteamiento clsico.(probabilidad)
2. El planteamiento de frecuencia relativa.
3. El planteamiento subjetivo.

PROBABILIDAD CLASICA
El planteamiento clsico define la probabilidad de que un evento
ocurra como:

Probabilidad de un evento =
Numero de resultados enlos que se presenta elevento
numero total de resultados posibles

Se debe destacar el hecho de que, con el fin de que la formula anterior


sea vlida, cada uno de los resultados debe ser igualmente posible.
Esta es una manera bastante complicada de definir algo que nos
puede parecer intuitivamente obvio, pero podemos utilizar la definicin
para escribir los ejemplos de lanzamiento de la moneda y de los dados
39
de una manera simblica. Primero plantearemos la pregunta Cul es
la probabilidad de obtener una cara en un solo lanzamiento? Como

1
P (cara) = 2 = 0.5 = 50% donde 1 es el de obtener cara; el dos es
todos los posibles resultados.

Sabemos que un dado tiene 6 caras, numeradas de 1 a 6

P (1) = 0.16666=16.67 donde 1 es la pobabilidad e obtener un uno y


6 son los posibles resultados CS= {1,2,3,4,5,6 } .

A la probabilidad clsica se le denomina probabilidad a priori, porque


podemos establecer los resultados posibles a priori, sin necesidad de
realizar un evento. En lugar de experimentos podemos llegar a
conclusiones, basados en el razonamiento lgico.

Limitaciones del planteamiento. Tiene serios problemas cuando


intentamos aplicarla a problemas de tomas de decisiones menos
predecibles, como en la administracin. Encontrar una comida x en un
viaje a un lugar inhspito. La clsica presupone un mundo con
simetra. Nuestro mundo es asimtrico, o sea llenos de problemas,
desordenada, etc.

FRECUENCIA RELATIVA DE PRESENTACION


Si nos hacemos preguntas ms complejas como Si salgo de la
universidad a las 9 pm, a qu hora llegare a mi casa? Las respuestas
pueden ser mltiples, dependiendo de lo que suceda en el camino. Es
difcil emitir una respuesta por adelantado, sin hacer algo de
experimentacin, sobre cules son las probabilidades.

En la actualidad, este planteamiento se le llama frecuencia relativa de


presentacin de un evento y define la probabilidad como:
1. La frecuencia relativa observada de un evento durante un gran
nmero de intentos o;
2. La fraccin de veces que un evento se presenta a la larga,
cuando las condiciones son estables.
Los eventos pasados se convierten en una probabilidad.
Determinamos que tan frecuentemente ha sucedido algo en el pasado
40
y usamos una cifra para predecir la probabilidad de que suceda de
nuevo en el futuro.

HACER EJERCICIO

Si se lleva un registro cada vez que llego a la casa, encontrare que


existe una hora que se da con mayor frecuencia, dentro de la
inestabilidad que muestre una grfica se la realizo.

DAR UN EJEMPLO DE GRAFICA.

Una segunda caracterstica de las probabilidades por la frecuencia


relativa de presentacin de un evento se vuelve estable conforme la
cantidad de llegadas a mi casa son registradas, y el grado de precisin
se vuelva ms constante. Esta precisin no es definitiva, porque
tenemos que contar con el tiempo y costo que implica tener ms
observaciones.

Hacer una encesta de qu candidato ganara las prximas elecciones,


no le garantizan ganar, porque las personas pueden cambiar de
opinin.

Para tener una probabilidad ms precisa se requiere de una


evaluacin con un nmero suficiente de resultados.

PROBABILIDAD SUBJETIVA
Est basada en las creencias de las personas que efectan la
estimacin de probabilidades. Se define como la probabilidad
asignada a cada evento por parte de un individuo, basado en las
evidencias que tenga disponible. Esta evidencia puede presentarse en
forma de frecuencias relativas de presentacin d eventos pasados o
pude tratarse de una creencia mediata. Ejemplo clsico es cuando
salen las candelillas, se dice que comienzan las lluvias. Es
ampliamente flexible que los otros conceptos analizados
anteriormente. El tomador de decisiones puede hacer uso de cualquier
evidencia que tenga a mano y mezclarla con los sentimientos
personales sobre la situacin.

Se debe usar esta, cuando sucede una nica vez o el nmero de


veces es muy reducido.

41
REGLAS DE PROBABILIDAD
La mayora de los administradores que utilizan la probabilidad se
preocupan por dos condiciones:
1. El caso en que un evento u otro se presente.
2. La situacin en que dos o ms eventos se presenten al mismo
tiempo.

Ejemplos de la situacin 1.
Cul es la probabilidad que realizar mi boda el viernes y hay estado
de sitio a partir de las 9pm?
Cul es la probabilidad que se realice el examen el prximo domingo,
en las actuales condiciones?

Existen varias condiciones para que se de este evento.

Existen algunos mtodos para determinar las respuestas a estas


preguntas bajo una variedad de condiciones.

Algunos smbolos, definiciones y reglas de uso comn


Smbolos para una probabilidad marginal. En la teora de
probabilidades, utilizamos smbolos para simplificar la presentacin de
ideas.

P(A) = la probabilidad de que el evento A suceda

Una probabilidad sencilla quiere decir que solo un evento puede


llevarse a cabo. Se le conoce como Probabilidad Marginal o
Incondicional. En las elecciones del 29 de noviembre existen 6
candidatos. Cualquiera puede calcular la probabilidad de que 1
candidato sea electo:

1
P (Ganar) = 6 = 0.16666 = 16.67% al no conocerse la intencin de
boto, ni se tiene percepcin que suceder.

42
Se tiene la certeza porque los eventos son mutuamente excluyentes,
es decir solo un candidato puede ser electo.

El diagrama de Venn puede ilustrar esto:

Evento

Evento Evento Evento Evento

A B A B

Dos eventos mutuamente Dos eventos no


Excluyentes Excluyentes
(a) (b)
Observe que el caso A, existen dos conjuntos que no tienen elementos
en comn, por lo tanto o es A o es B, por eso son mutuamente
excluyentes. Si observamos el caso b, los dos conjuntos se
interceptan, por lo tanto hay elementos de ambos conjuntos que son
comunes. Este caso es tratado en la siguiente regla.

REGLA DE LA ADICION PARA EVENTOS MUTUAMENTE


EXCLUYENTES.
Algunas veces estamos interesados en la probabilidad de una cosa u
otra suceda. Si estos dos eventos son mutuamente excluyentes,
podemos expresar que esta regla est usando la regla de adicin para
eventos mutuamente excluyentes y se expresa as:

P (A o B) = la probabilidad de que A o B suceda

Supongamos que ninguno de los candidatos alcanza los votos


necesarios para ganar, y la ley establece que se realizara una
segunda ronda con los dos candidatos ms botados. En este caso y
considerando al inicio del proceso de votacin, la probabilidad de que
1
1 candidato ser electo es de 6 , pero cul es la probabilidad de que
2 pases a la segunda ronda seria:

43
1 1 2
P (A o B) = 6 + 6 = 6 = 0.3333 = 33.33%

Si calculamos una vez ms la probabilidad de que sucedan dos o ms


eventos. El tamao de una familia de un pueblo es necesario conocer
la probabilidad que cada familia tenga 4, 5, 6 o ms miembros.

P (4, 5,6 o ms) = P (4) +P (5) + P (6 o ms)= 0.15+0.10+0.05) = 0.30

Observe algo interesante, como caso especial que, para cualquier


evento A, tenemos que ste suceda o no suceda. De modo que los
eventos A y no A son mutuamente excluyentes y exhaustivos.

Otra forma de calcular la probabilidad de algo suceda o no, podemos


hacerlo as:

Cul es la probabilidad que los restantes candidatos no sean


electos?
Sabemos que la suma de todas las probabilidades es igual a 1 o
100%, entonces:

P (2, 3, 4, 5, 6) = P(no 1) + P (A) = 1 esto es igual a decir P (no 1) = 1


P (1)
Por lo tanto:

1 5
P (no 1) = 1 - 6 = 6 = 0.83333 o 83.33%

REGLA DE ADICION PARA EVENTOS QUE NO SON


MUTUAMENTE EXCLUYENTES.
Si dos eventos no son mutuamente excluyentes, es posible que se
presenten al mismo tiempo. Este caso requiere modificar la regla de
adicin.

Supngase que el candidato electo pueda ser una mujer

Probabilidad de que A suceda Probabilidad que A y C sucedan


juntos

44
P (A o B) = P (A) + P (B) P (AB)

Probabilidad de que se presente A o B Probabilidad que suceda B


Cuando A y B no son mutuamente excluyentes

Un naipe tiene 52 cartas, distribuidos en 4 ajuares (corazn negro,


corazn rojo, trbol y diamante) es decir 13 cartas de cada ajuar.

Cul es la probabilidad que sea as y corazn?

4
La probabilidad que sea as 52
13
La probabilidad que sea corazn 52
1
La probabilidad que sea as y corazn 52

4 13 1 16 4
P (A o B) = 52 + 52 - 52 = 52 = 13

PROBABILIDADES BAJO CONDICIONES DE INDEPENDENCIA


ESTADISTICA
Cuando se presentan 2 eventos, el resultado del primero puede, o no
tener efecto en el resultado del segundo. Esto es, los eventos pueden
ser dependientes o independientes. Comenzaremos con los que son
estadsticamente independientes, es decir, aquellos en donde la
presentacin de uno no tiene efecto sobre la probabilidad de la
presentacin de cualquier otro. Existen tres tipos de probabilidades
que se presentan bajo la independencia estadstica.

1. Marginal.(probabilidad)
2. Conjunta.
3. Condicional.

PROBABILIDAD MARGINAL BAJO CONDICIONES DE


INDEPENDENCIA ESTADISTICA.
Una probabilidad marginal o incondicional, es la probabilidad simple de
presentacin de un evento. Al lazar una moneda no cargada las
45
probabilidades son .50 para cara y cruz respectivamente. No importa
cuntos lanzamientos se realicen, la probabilidad ser siendo igual, no
importa los resultados anteriores. Cada lanzamiento es nico y no hay
manera de conectarlo con ningn otro. Es por eso que es un evento
estadsticamente independiente de los resultados de cualquier otro
lanzamiento de moneda.

PROBABILIDAD CONJUNTA BAJO CONDICIONES DE


INDEPENDENCIA ESTADISTICA.
La probabilidad de que dos o ms eventos independientes se
presenten juntos o en sucesin es producto de sus probabilidades
marginales. Matemticamente se describe como:

P (AB) = P (A) x P (B)


Donde P (AB) = probabilidad de que los eventos A y B se presenten
juntos o en sucesin; se le conoce como probabilidad marginal.
P (A) = probabilidad marginal de que se presente el evento A
P (B) = probabilidad marginal de que se presente el evento B
La probabilidad de que en dos lanzamientos se tenga cara seria:
P (H1H2) = probabilidad de H1 x Probabilidad de H2 = 0.5 x 0.5 = 0.25
La probabilidad que en dos lanzamientos consecutivos obtenga A es
0.25, por ser estadsticamente independientes. As sucesivamente 3 o
ms lanzamientos se va multiplicando 0.50 x n veces.

Si una moneda estuviera cargada, donde al lanzar la moneda sea cara


su probabilidad es 0.80, entonces en 2 lanzamientos seria su
probabilidad sera:

P (H1H2) = (0.80 x 0.80) = 0.64 = 64%

Observe que los resultados no suman 1, porque no se toma en cuenta


los dos posibles resultados: En este caso la probabilidad de que sea
cruz los dos lanzamientos es 1 0.64 = 0.36.

El siguiente rbol de probabilidades ejemplariza el resultado:


0.25
0.5 P(H) = 0.505
01255
P(H)=0.5 5 P(H) = 0.5 P(H)= 0.5
0.25
5
0.125

46
P(H)=0.5
P(T)= 0.5 0.5.
5
Esta red muestra los cambios que experimenta la probabilidad a media
de se proyecta un nuevo lanzamiento.

El P(H)= 0.5 es la probabilidad conjunta de obtener una de las dos


cara en cada lanzamiento. El P(H 1) para cada una de las posibilidades
en el segundo lanzamiento es la probabilidad marginal y as
sucesivamente en cada lanzamiento adicional.

PROBABILIDAD CONDICIONAL BAJO INDEPENDENCIA


ESTADISTICA
La probabilidad condicional se escribe como:

P(B/A) = P(B)

La probabilidad de que se presente el evento B, dado que el evento A


se ha presentado.

Para eventos estadsticamente independientes, la probabilidad


condicional de que suceda el evento B dado que el evento A se ha
presentado es simplemente la probabilidad de B.

Pareciera ser contradictorio, pero recuerde que son estadsticamente


independientes, solo est condicionado a que el evento A s de, para
que el evento B cumpla su condicin.

En el caso de las monedas seria:

P(CARA/CRUZ) = P(CARA) = 0.5

El primer resultado no tiene nada que ver con el segundo evento.

PROBABILIDAD BAJO CONDICIONES DE DEPENDENCIA


ESTADISTICA
La dependencia estadstica existe cuando la probabilidad de que se
presente algn evento dependiendo o se ve afectada por la

47
presentacin de algn otro. Los tipos son al igual que los
independientes:
1. Condicional
2. Conjunta
3. Marginal

PROBABILIDAD CONDICIONAL BAJO DEPENDENCIA


ESTADISTICA
La probabilidad condicional y conjunta bajo condiciones de
dependencia estadstica es ms complicada que la probabilidad
marginal en estas mismas circunstancias. Se analiza primero las
probabilidades condicionales, ya que la probabilidad conjunta se ilustra
mejor si utilizamos la probabilidad condicional como base.

Ejemplo 1:
En una caja hay 10 bolas distribuidas as:

Tres son de color y tienen puntos


Una es de color y tiene franjas
Dos son grises y tienen puntos
Cuatro son grises y tiene franjas
Donde:
Color ( C )
Gris (G)
Con Puntos (D)
Con franjas (S)
La probabilidad de sacar cualquier bola es de 0.10 al ser 10 bolas con
igual probabilidad de ser elegida.

La probabilidad de sacar una bola de color es (3 + 1)*0.10 = 0.40


La probabilidad de sacar una bola gris = (2 +4) * 0.10 = 0.60
La probabilidad de sacar una de color y tiene puntos = 3 x 0.10 = 0.30
La probabilidad de que tengan puntos = (3+2) * 0.10 = 0.50
La probabilidad de que tenga puntos y rayas = (3+1+2+4) = 1.0

Ejemplo 2:
Cuando utilizamos el ejemplo de las bolas de color y grises,
respondemos a las preguntas, Cul es la probabilidad de P(D|G), es
decir que de las bolas grises tengan puntos y P(S|G), que de las grises
tengan franjas?

48
Donde:
D = Son grises y tienen puntos
G = grises
P( DG ) 0.2 1
Solucin: P(D/G) = P (G) = 0.6 = 3

Donde:
SG = grises y tiene franjas
G = Grises
P( SG) 0.4 2
P(S/G) = P(G) = 0.6 = 3

Se debe considerar que si la bola que sali es gris solo es posible con
franjas o puntos.

Ejemplo No. 3
Calcule P(G|D) y P(C|D)
P(GD) 0.2
P(G|D) = P(D) = 0.5 = 0.4

P( CD) 0.3
P(C|D) = P(D) = 0.5 = 0.6

Total 1.0

Ejemplo No. 4

P(CS) 0.4
P(C|S) = P(S) = 0.5 = 0.8

Total 1.0

PROBABILIDAD CONJUNTA BAJO CONDICIONES DE


DEPENDENCIA ESTADISTICA
Hemos mostrado que la frmula para calcular la probabilidad
condicional bajo dependencia estadstica es:
P(BA)
P(B|A) = P( A)

49
Si de esta ecuacin despejamos P(BA) mediante una multiplicacin,
obtendremos la frmula para probabilidad conjunta bajo condiciones
de dependencia estadstica.

Probabilidad conjunta de los Probabilidad de que suceda


el evento B
Eventos B y A se presentan al mismo dado que ya se present
A
Tiempo o en sucesin.

P(BA) = P(B|A) x P(A)

Probabilidad de que se presente el evento A

Observe que esta frmula no es P(BA) = P(B) x P(A) y en trminos


de color (C), gris (G), con puntos (D) y con franjas (S), tendremos
P(CD) = P(C|D) x P(D)
O P(CD) = 0.6 x 0.5 = 0.3. Aqu 0.6 es la probabilidad de obtener una
bola de color, dado que sta tiene puntos (calculada en el ejemplo 3
anterior y 0.5 es la probabilidad de obtener una bola con puntos
(tambin calculada en el ejemplo 3)

El resultado, P(CD) = 0.3 puede verificarse en los datos originales en


la que llegamos a la probabilidad por inspeccin: tres bolas de q0 son
de color y con puntos.

P(CS) = P(C|S) x P(S) = 0.2 x 0.5 = 0.1


P(GD) = P(G|D) x P(D) = 0.4 x 0.5 = 0.2
P(GS) = P(G|S) x P(S) = 0.8 x 0.5 = 0.4

PROBABILIDAD MARGINAL BAJO CONDICIONES DE


DEPENDENCIA ESTADISTICA.

Las probabilidades marginales en condiciones de dependencia


estadstica se calculan mediante la suma de las probabilidades de
todos los eventos conjuntos en los que se presenta el evento sencillo.
En el ejemplo anterior, podemos calcular la probabilidad marginal del

50
evento bola de color mediante la suma de la probabilidad de los
eventos conjuntos en los que aparece una bola de color.

P(C) = P(CD) + P(CS) = 0.3 + 0.1 = 0.4

De manera parecida, la probabilidad marginal del evento bola dris se


puede calcular sumando la probabilidad de los dos eventos conjuntos
en los que aparece una bola de color.

P(G) = P(GD) + P(GS) = 0.2 + 0.4 = 0.6

Igualmente, podemos calcular la probabilidad marginal del evento bola


con puntos mediante la suma de las probabilidades de los eventos
conjuntos en los que se tiene una bola con puntos.

P(D) = P(CD) + P(GD) = 0.3 + 0.2 = 0.5

Y por ltimo, la probabilidad marginal de un evento bola con franjas se


puede calcular mediante la suma de las probabilidades de los eventos
conjuntos en los que se presenta una bola con franjas:

P(S) = P(CS) + P(GS) = 0.1 + 0.4 = 0.5

Estos resultados pueden inspeccionarse en la tabla original.

Resumen de las formulas desarrolladas.

Sugerencia: distinga entre probabilidad condicional y


probabilidad conjunta mediante el uso cuidadoso de los trminos
dado que y ambos y P(A|B) es la probabilidad de que A ocurra
dado que ocurra B y P(AB) es la probabilidad de que amos, A y B
ocurran. La probabilidad de que ocurra A, sucede B o no.

Formula bajo Formula bajo


Tipo de Probabilidad independencia dependencia
Smbolo estadstica estadstica
Margina P(A) P(A) Suma de las
probabilidades de
los eventos
conjuntos en los que
A ocurre
Conjunta P(AB) P(A) x P(B) P(A|B) x P(B)
O P(BA) P(B) x P(A) P(B|A) x P(A)

51
Condicional P(A|B) P(B) P(BA)
O P(A|B) P(A)
P( A)

P( AB)
P(B)

REVISION DE LAS ESTIMACIONES ANTERIORES DE


PROBABILIDADES: TEOREMA DE BAYES.
En el mundo de los negocios se presenta la incertidumbre, por ejemplo
si el negocio seguir comportndose de forma similar, porque pueden
presentarse situaciones no controladas.

Las probabilidades son alteradas despus que uno obtiene


informacin adicional. Las nuevas probabilidades se conocen como
probabilidades revisadas o posteriores. Como estas pueden revisarse
en la medida que hay ms informacin, la teora de las probabilidades
adquiere una gran importancia para la toma de decisiones.

Fue Tomas Bayes quien formul este concepto. La frmula bsica para
la probabilidad condicional en circunstancias de dependencia es:

P(BC )
P(B|A) = P( A) se conoce como teorema de Bayes.

El teorema de Bayes ofrece un potente mtodo estadstico para


evaluar nueva informacin y revisar nuestras estimaciones anteriores
(basado solo en informacin limitada) de la probabilidad de que las
cosas se encuentren en un estado o en otro. Si es utilizado de
manera correcta, se hace innecesario reunir grandes cantidades
de datos en un periodo grande con el fin de tomar mejores
decisiones, basadas en las probabilidades.

CALCULO DE PROBABILIDADES POSTERIORES


Supongamos que tenemos al nacer un nio (sesgado) en un hospital.
La mitad de estos fueron varones y se presenta 40% de veces o sea
0.4 (de 100 nacimientos 40 fueron varones. La otra mitad de estas

52
fueron mujeres y se presenta el 70% de las veces (de 100 nacimientos
70 fueron mujeres. Si se espera el siguiente nacimiento el resultado es
una mujer. Cul es la probabilidad de que el siguiente nacimiento sea
varn? Sabiendo que el nacimiento de un nio puede ser varn o
mujer, podemos contestar incorrectamente que la probabilidad es de
1
2 , pero podemos hacer una mejor estimacin. Para responder a la

pregunta de manera correcta, debe construirse una tabla:

Probabilidad del P(Sexo| evento P(Sexo, evento


Evento evento elemental elemental*
Elemental elemental
Varn 0.5 0.4 0.4 x 0.5=0.20
Mujer 0.5 0.7 0.7x0.5=0.35
1.0 0.55
* Se utiliza la coma para separar los eventos conjuntos. Podemos
poner junta letras individuales para indicar, sin que haya confusin,
eventos conjuntos (AB), pero al poner juntas palabras completas,
produciramos eventos de apariencia extraa (sexo evento
elemental), que podra ocasionar confusin.

Si observamos la 3era columna la suma no es el resultado 1.0,


simplemente porque la probabilidad condicional del nacimiento de un
nio, est dada es la realidad de lo que sucedi. Lo que se hace es
ajustar la probabilidad de cada uno de acuerdo al evento realizado. As
podemos calcular la probabilidad si:

Probabilidad varon 0.20


P(varn) = Probabilidad conjunta = 0.55 = 0.364 o 36.4%

Probabilidad mujer 0.35


P(mujer) = Probabilidad conjunta = 0.55 = 0.636 o 63.6%

La ltima columna nos muestra la probabilidad de que el nio que


nace tiene una probabilidad de 0.20 y que sea mujer es 0.35 y la
probabilidad conjunta es de 0.55, es la probabilidad marginal de un
nacimiento.

53
Con la informacin adicional, hemos sido capaces de alterar o revisar
nuestra estimacin anterior de probabilidad.

La suma de las probabilidades de los eventos elementales (de que el


nio sea varn y mujer) es 1.0, por tener solo 2 sexos. Las dos clases
de sexo constituyen una lista mutuamente excluyente y colectivamente
exhaustiva.

PROBABILIDAD POSTERIOR CON MS INFORMACION


Si al revisar los resultados de un evento, necesitamos obtener
informacin adicional, esto requerira de realizar los eventos otras
veces, pero la toma de decisiones se torna ms complicada y lleva
ms tiempo.

Supongamos que deseamos realizarlo, el siguiente cuadro muestra los


clculos:
Probabilida
P1(sexo | P2( sexo| P(2 sexo,
Evento d del
evento evento evento
Element evento
elemental) elemental) elemental)
al elemental
0.16x0.5=
Varn 0.5 0.4 0.16
0.080
Mujer 0.5 0.7 0.49 0.49x0.5=0.245
P(2
1.0
bola)=0.325
Nota: la tercera columna es la segunda elevada al cuadrado. Ejemplo
0.4 x 0.4 = 0.16 y 0.7 x 0.7 = 0.49
Podemos obtener informacin adicional sobre los nacimientos.
Supongamos que realizo nuevamente el evento Cul es la
probabilidad de el nio que nazca sea varn?

La tabla anterior muestra los resultados, con una nueva columna, de la


realizacin del segundo evento. As que despus de realizarlo, la
probabilidad de que sea varn es de 8% y la probabilidad de que sea
mujer es de 24.5%

Ahora podremos ser capaces de calcular la probabilidad de que el nio


que nazca sea varn o mujer as:

54
Probabilidad varon 0.08
P(varn) = Probabilidad Conjunta = 0.325 = 0.246 o 24.6%

Probabilidad Mujer 0.245


P(mujer) = Probabilidad Conjunta = 0.325 = 0.754 0 75.4%
Esto se debe que si uno observa en un hospital da a da cambia la
cantidad de nacimientos, en algunos casos nacen mas varones y otros
ms mujeres o en cantidades similares. Hay factores que producen
este fenmeno.

UN PROBLEMA RELACIONADO CON TRES ELEMENTOS DE


INFORMACION
Supongamos que una cajera de banco el 85% de las operaciones es
correcta cuando tiene un ambiente tranquilo, pero cuando esta
presionada solo alcanza un 35% de operaciones incorrectas. La
experiencia indica que el 75% de las veces tiene un ambiente
tranquilo. Cul es la probabilidad que la cajera tenga operaciones
correctas? El cuadro siguiente muestra los clculos.

P(evento,
Evento P(evento) P(ambiente|evento) P(3|evento)
3)
0.6141 x
Correctas 0.75 0.85 0.6141 0.75 =
0.4606
0.0429 x
Incorrectas 0.25 0.35 0.0429 0.25 =
0.0107
1.0 0.4713
Nota. La segunda columna se eleva al cubo = 0.85 x 0.85 x 0.85 =
0.6141

Podemos calcular la probabilidad que el siguiente da, realice


operaciones correctas:

Probabilidad correcta 0.4606


P(correcta) = Probabilidad conjunta = 0.4713 = 0.977 = 97.7%

55
Probabilidad correcta 0.0107
P(incorrecta) = probabilidad conjunta = 0.4713 = 0.023 = 2.3%

La probabilidad cambio de 75% a 97.7% basado en tres das de


operaciones.

PROBABILIDADES POSTERIORES CON RESULTADOS


INCONSISTENTES.
Muchas veces se tiene resultados inconsistentes. La siguiente tabla
muestra 5 resultados distintos:

P(evento P(evento,sbbbb
Evento P(S|evento) P(sbsss|evento)
) )
.
0.07830x0.75 =
Correcta 0.75 0.85 85x0.15x0.85x0.8
0.05873
5x.85 = 0.07830
Incorrect 0.35x0.65x0.35x0. 0.00975x0.25 =
0.25 0.35
a 35x0.35 = 0.0095 0.00244
P(sbsss) =
0.06117

Probabilidad correcta 0.05873


P(correcta) = probabilidad conjunta = 0.06117 = 0.9601 o 96%

VALOR ESPERADO
CONBINACION DE PROBABILIDADES Y VALORES MONETARIOS
Esto es aplicable ms a productos perecederos.
Ejemplo:
Una caja de frambuesas cuesta L 20 y el vendedor recibe L 50 por ella.
Este no puede especificar el nmero de cajas que un cliente en
cualquier da dado, pero su anlisis de registros pasados ha producido
la informacin que se presentan en la siguiente tabla:

Probabilidad de
Nmero de das de
Ventas Diarias ventas de cada
venta
cantidad
10 15 0.15
11 20 0.20
12 40 0.40

56
13 25 0.25
Totales 100 1.00

El vendedor en ese tipo de productos puede sufrir dos tipos de


perdidas:
1. Perdidas por obsolescencia. Producto que se daa
2. Perdidas de oportunidad. Por no tener existencia.

En el siguiente cuadro muestra las perdidas condicionales. Cada valor


en ella est condicionado a un nmero especfico de cajas que se
encuentran en existencia y a un nmero especfico de solicitudes. Los
valores que se tienen es esta tabla incluyen no solamente las perdidas
por las frutas descompuestas, sino tambin las que se derivan de los
ingresos perdidos cuando el vendedor no es capaz de suministrar un
pedido.

Opciones de existencia
Posibles
Peticiones
10 11 12 13
de
frambuesas
10 L0 L 20 L 40 L 60
11 30 0 20 40
12 60 60 30 0

Cuando el nmero de cajas en existencia en un da cualquiera es igual


al nmero de cajas solicitadas, el vendedor no sufre ninguna perdida.

Si miramos la primera fila de la matriz podemos construirla as:

Si la peticin es de 10 cajas y la existencia es de 10, no pierde nada.


Si la peticin es de 10 cajas y la existencia es de 11, perdera 1 o sea
L 20
Si la peticin es de 10 cajas y la existencia es de 12, perdera 2 o sea
L 40
Si la peticin es de 10 cajas y la existencia es de 13, perdera 3 o sea
L 60

As sucesivamente se hace con cada fila, para determinar las prdidas


que tendra.

57
Las perdidas condicionales de la siguiente tabla, se toma la primera
columna de la tabla anterior si se tiene una existencia de 10, 11, 12, 13
cajas de frambuesa. En la segunda columna se anota la perdida
condicional que tendra, o sea la segunda columna de la tabla anterior.
La tercera columna se anota la probabilidad o sea la ltima columna
del primer cuadro y la ltima columna (perdida condicional) ser la
multiplicacin de la perdida condicional por la probabilidad que se
tengan estas solicitudes.

Se procede a calcular la perdida esperada por niveles de existencia.

Se se tiene una existencia de 10 cajas


Probabilidad
de que se
tengan
Posibles Perdida estas Perdida
solicitudes condicional solicitudes Esperada.
10 0 X 0.15 = 0.00
11 30 X 0.20 = 6.00
12 60 X 0.40 = 24.00
13 90 X 0.25 = 22.50
1.00 52.50
Con existencia de 10 cajas, la perdida mnima estimada seria de L
52.50

Si se tiene una existencia de 11 cajas.


Probabilidad
de que se
tengan
Posibles Perdida estas Perdida
solicitudes condicional solicitudes Esperada.
10 20 X 0.15 = 3.00
11 0 X 0.20 = 0.00
12 30 X 0.40 = 12.00
13 60 X 0.25 = 15.00
30.00
Con existencia de 11 cajas la prdida mnima seria de L 30.00

58
Si se tiene una existencia de 12 cajas
Probabilidad
de que se
tengan
Posibles Perdida estas Perdida
solicitudes condicional solicitudes Esperada.
10 40 X 0.15 = 6.00
11 20 X 0.20 = 4.00
12 0 X 0.40 = 0.00
13 30 X 0.25 = 7.50
17.50
Con 12 cajas de existencia la perdida mnima seria de L 17.50

Si se tiene una existencia de 13 cajas


Probabilidad
de que se
tengan
Posibles Perdida estas Perdida
solicitudes condicional solicitudes Esperada.
10 60 X 0.15 = 9.00
11 40 X 0.20 = 8.00
12 20 X 0.40 = 8.00
13 0 X 0.25 = 0.00
25.00
Al tener una existencia de 13 cajas, las perdidas mnimas serian de L
25.00

La menor perdida esperada mnima seria con un nivel de existencia de


12 cajas con L 17.50 de perdida.

CALCULO DE GANACIAS CONDICIONALES

GANACIA MAXIMA

Probabilidad de cada
Ventas Diarias No. De das que se venden nmero que se venda

59
10 15 0.15
11 20 0.20
12 40 0.40
13 25 0.25

Tabla de ganancias condicionales:


Posibles Inventarios
Demanda Posible 10 Cajas 11 Cajas 12 Cajas 13 cajas
10 300 280 260 240
11 300 330 310 290
12 300 330 360 340
13 300 330 360 390

Si se almacena 10 cajas cada da, la ganancia esperada es de L 300.00


Si se almacena 11 cajas cada da, la ganancia esperada es de L 322.50
Si se almacena 12 cajas cada da, la ganancia esperada es de L 335.00
Si se almacena 13 cajas cada da, la ganancia esperada es de L 327.50

Ganancia esperada al tener 10 cajas de inventario


Tamao del Probabilidad
mercado en Ganancia del tamao Ganancia
cajas Condicional del mercado esperada
10 300 X 0.15 = 45
11 330 X 0.20 = 60
12 330 X 0.40 = 120
13 330 x 0.25 = 75
1.00 300

Ganancia esperada al tener 11 cajas de inventario


Tamao del Probabilidad
mercado en Ganancia del tamao Ganancia
cajas Condicional del mercado esperada
10 280 X 0.15 = 42.00
11 330 X 0.20 = 66.00
12 330 X 0.40 = 132.00
13 330 x 0.25 = 82.50
1.00 322.50

Ganancia esperada al tener 12 cajas de inventario


Tamao del Probabilidad
mercado en Ganancia del tamao Ganancia
cajas Condicional del mercado esperada
10 260 X 0.15 = 39.00
11 310 X 0.20 = 62.00
12 360 X 0.40 = 144.00
13 360 x 0.25 = 90.00
1.00 335.00

60
Ganancia esperada al tener 13 cajas de inventario
Tamao del Probabilidad
mercado en Ganancia del tamao Ganancia
cajas Condicional del mercado esperada
10 240 X 0.15 = 36.00
11 290 X 0.20 = 58.00
12 340 X 0.40 = 136.00
13 390 x 0.25 = 97.5
1.00 327.50

61
TERCER PARCIAL
DISTRIBUCION DE PROBABILIDADES

DISTRIBUCION BINOMIAL
Una distribucin de probabilidad de variable aleatoria discreta
ampliamente utilizada en la distribucin Binomial. Es una variedad de
procesos de inters para los administradores. Los datos discreto, no
continuos, que son resultados de un experimento conocido como
proceso de Bernoulli. El xito o fracaso de las solicitudes de empleo,
entrevistados para pruebas de aptitudes, puede ser descrito como un
proceso Bernoulli. Si medimos la duracin de focos mediante una
escala continua de tiempo y no se podra clasificar como una
distribucin Binomial.

USO DEL PROCESO DE BERNOULLI.


Se puede utilizar el lanzamiento de la moneda y el proceso puede ser
descrito as:

1. Cada intento (cada lanzamiento, es este caso) tiene solamente


dos resultados posibles: cara o cruz, si o no, xito o fracaso.
2. La probabilidad del resultado de cualquier intento permanece fijo
con respecto al tiempo. Al no estar alterada la probabilidad de
ambas es 0.5, independientemente del nmero de veces que se
lance la moneda.
3. Los intentos son estadsticamente independientes, es decir, el
resultado de un lanzamiento no afecta el resultado de cualquier
otro.

Cada proceso Bernoulli tiene su propia probabilidad caracterstica. Si


se considera, siete dcimas partes de todas las personas que soliciten
cierto tipo de trabajo, aprueben el examen de aptitud. Digamos que, en
este caso, la probabilidad caracterstica es de 0.7, pero podramos
describir el resultado del examen como de Bernoulli solo si tenemos la
certeza de que la fraccin de los que aprueban el examen (0.7)
permanece constante en el tiempo. Desde luego que las

62
caractersticas del proceso de Bernoulli tambin deben cumplirse.
Cada examen tendra que tener solamente dos resultados (xito o
fracaso) y los resultados de cada prueba deberan ser
estadsticamente independientes.

Para la evaluacin el smbolo p representa la probabilidad de tener


xito (0.70) y el smbolo q (q = 1-p) es la probabilidad que resulte un
fracaso (0.30). Para presentar un cierto nmero de xitos, se utiliza el
smbolo r, y para representan el nmero total de intentos o de ensayos
se utiliza el smbolo n. En las situaciones que se analiza, el nmero de
ensayos esta fijo desde antes de empezar el experimento.

Si calculamos la probabilidad de obtener dos caras en tres


lanzamientos de una moneda no alterada, y expresamos los valores
de la forma siguiente:

p = probabilidad caracterstica o probabilidad de tener xito = 0.5


q = 1-p = probabilidad de fracaso (1-0.5) = 0.5
r = nmero de xitos deseados = 2
n = nmero de intentos hechos = 3

n! r nr 3!
pq
Probabilidad de r xitos en n intentos = f ! ( nr ) ! = 2 ! ( 32 ) !

0.5
1
)( 0.5 )

3x 2x 1
= ( 2 x 1 ) (1 x 1) (0.25)(0.5) = 0.375

Por lo tanto existe la probabilidad de 0.375 o 37.5% de obtener dos


caras en tres lanzamientos de una moneda no alterada.

Otro ejemplo es cada 10 refrescos 8 estn bien llenados, si queremos


obtener la probabilidad de 3 refrescos de 6 estn llenos
correctamente:

p = 0.8
q = 0.2
r=3

63
n=6

6! 0.8
Probabilidad de r xitos de n intentos = 3 ! ( 63 ) ! ( (0.2)3
3
0.08192

= 8.19%

Este problema sustituye al rbol de probabilidades que se vio


anteriormente.
Si se utiliza el rbol de probabilidades con datos muy extensos, sera
difcil, por lo que este proceso simplifica los clculos.

ALGUNAS PRESENTACIONES GRAFICA DE LA DISTRIBUCION


BINOMIAL
Hasta este momento solo hemos aprendido a utilizar la formula, y los
posibles resultados pueden mostrarse grficamente:

La probabilidad de que un empleado llegue tarde es de 0.4. Se desea


representar grficamente la probabilidad que 0, 1, 2, 3 0 4 empleados
lleguen simultneamente tarde.

0 !(50) 0.4 5
P(0) = 5! 0 ( 0.6
! ( ) = 0.07776

5! 0.4 0.6
P(1) = 0! ( 51 ) ! (
1 (

4 = 0.2592

5! 0.4 0.6
P(2) = 0! ( 52 ) ! (
2 (

3 = 0.3456

5! 0.4 0.6
P(3) = 3 ! ( 53 ) ! ( 3 ( 2=0.2304

5! 0.4 0.6
P(4) = 4 ! ( 54 ) ! ( 4 ( 1 = 0.0768

64
5! 0.4 0.6
P(5) = 5 ! ( 55 ) ! ( 5 ( 0 = 0.01024

0.4

0.35

0.3

0.25

0.2

0.15

0.1

0.05

0
1 2 3 4 5 6

Note que a medida que cambia p y q se ubican a cada lado de la


distribucin. Si observamos La grafica anterior tiende a subir y luego a
bajar y bajo esta situacin podemos hacer las siguientes afirmaciones:

1. Cuando p es pequeo (0.1) la distribucin Binomial esta sesgada


hacia la derecha.
2. Conforme p aumenta (0.3), el sesgo es menos notable
3. Cuando p = 0.5, la distribucin Binomial es simtrica
4. Cuando p es mayor que 0.5, la distribucin esta sesgada hacia la
izquierda.
5. La probabilidad para 0.3, por ejemplo, son las mismas para 0.7,
excepto que los valores de p y q estn invertidos. Esto se aplica
a cualquier pareja de valores.
Note que a medida aumenta n, se forma una campana.

USO DE TABLAS BINOMIALES


Resulta un tanto prolongado calcular las probabilidades Binomial
cundo n es un numero grande. Afortunadamente, podemos utilizar la
Tabla 3 del apndice para determinar con rapidez la probabilidad
Binomial.

65
Cul es la probabilidad de que 8 de 15 votantes liberales en el
padrn electoral no pueda votar en las elecciones, si la probabilidad de
que cualquier individuo no pueda votar es de 0.30, y si las personas
decidan de manera independiente si votan o no?
Lo primero es determinar los elementos de este problema en notacin
de distribucin Binomial:
n = 15 nmero de demcratas en el padrn electoral
p = 0.30 probabilidad de que cualquier individuo vote.
r = 8 nmero de individuos que no van a votar

Como son 15 ensayos, se busca en la tabla correspondiente a n=15.


Como la probabilidad de que un individuo no vote es 0.30. Nos
desplazamos despus hacia debajo de la columna hasta que estamos
opuestos a la columna r =8 en donde tenemos la respuesta 0.0348.
Esta es la probabilidad

El diseo de la tabla se muestra as:


n
r Probabilidad (p)
0.19 0.20 0.23 0.24 0.25 0.30 .n
15 0.0348
8

Supngase que no se ha podido encontrar la probabilidad de que ocho


o ms votantes empadronados no boten. Podramos haber buscado
en la columna de 0.30 y sumar las probabilidades desde 8 hasta el
fondo de la columna, de esta manera:
8 0.0348
9 0.0116
10 0.0030
11 0.0006
12 0.0001
13 0.0000
Total 0.0501

La respuesta es que la probabilidad de que 8 o ms votantes


empadronados no voten es de 0.0501.

Igual situacin se hace cuando se solicita de 8 o menos, solo que la


suma es la inversa.
66
MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERCION PARA LA
DISTRIBUCION BINOMIAL.
Analizamos el concepto de valor esperado o media de una distribucin
de probabilidades. La distribucin Binomial tiene un valor esperado o
media (u) y una desviacin estndar ( ); veremos la forma en que
ambas medidas estadsticas se pueden calcular.

Simblicamente se puede representar la media de una distribucin


Binomial como:

u = np
donde:
n = nmero de ensayos.
P = probabilidad de tener xito

Podemos calcular la desviacin estndar de una distribucin Binomial


con la frmula:
= npq

n = nmero de ensayos
p = probabilidad de xito
q = probabilidad de fracaso = 1-p

Una fbrica produce el 20% de unidades defectuosas. Podemos


calcular la media y la desviacin estndar si se toma una muestra de
10 unidades as:

u = np = (10)(0.2) = 2 es la media

= npq = (10 )( 0.20 ) (0.80) = 1.265 desviacin estndar

CUMPLIMIENTO DE LAS CONDICIONES PARA EMPLEAR EL


PROCESO DE BERNOULLI
Usar la distribucin Binomial, se debe estar seguro que cumpla con las
3 condiciones necesarios, especialmente la 2 y 3. La 2 establece que
cualquier intento la probabilidad debe ser fija, situacin difcil de

67
cumplir y la 3 que sea estadsticamente independiente, es decir, que el
resultado de un evento no dependa del resultado de otros.

LA DISTRIBUCION DE POISSON
Existen muchas distribuciones de probabilidades discretas, pero el
anlisis se centra en la Binomial y la Poisson.
Se utiliza para describir ciertos tipos de procesos, entre los que se
encuentran la distribucin de las llamadas telefnicas a un
conmutador, las solicitudes de pacientes que requieren un servicio, los
automviles que llegan a una caseta de peaje. Todos tiene en comn
que pueden ser descritos mediante una variable aleatoria discreta que
toman valores enteros (0, 1 ,2, 3, ..n)

CARACTERISTICAS DE LOS PROCESOS QUE PRODUCEN UNA


DISTRIBUCION DE PROBABILIDAD DE POISSON
El nmero de vehculos que pasan por una caseta de peaje en una
hora pico, ilustra las caractersticas de la distribucin de
probabilidades de Poisson.

1. El promedio (media) del nmero de vehculos que llegan por


hora pico puede estimarse a partir de datos sobre trfico que se
tengan disponibles.
2. Si dividimos la hora pico en periodos (intervalos) de un segundo
cada uno, encontramos que las siguientes afirmaciones son
verdaderas:
a. La probabilidad de que exactamente un vehculo llegue a
una caja por segundo es muy pequea y es constante para
cada intervalo de un segundo.
b. La probabilidad de que dos o ms vehculos lleguen en un
intervalo de un segundo es tan pequea que le podemos
asignar el valor cero.
c. El nmero de vehculos que llegan en un intervalo dado de
un segundo es independiente del momento en que dicho
intervalo se presenta en la hora pico.
d. El nmero de llegadas en cualquier intervalo de un
segundo no depende del nmero de llegadas en cualquier
otro intervalo de un segundo.

68
Se puede generalizar a partir del ejemplo de una caseta de peaje y
aplicar esta caracterstica a otros procesos. Si estos nuevos procesos
cumplen con las mismas condiciones, entonces podemos utilizar la
distribucin de probabilidad de Poisson para describirlos.

CALCULO DE LA PROBABILIDAD DE POISSON UTILIZANDO LA


TABLA 4TA. DEL APENDICE DEL LIBRO.

La probabilidad de Poisson, como se mostro, tiene que ver con ciertos


procesos que pueden ser descritos por una variable aleatoria discreta.
Generalmente, la letra x representa a esta variable discreta y pude
tomar valores enteros (0, 1, 2, 3, .n). Se utiliza la mayscula X para
representar la variable aleatoria, y la minscula x para sealar un valor
especifico que dicha variable puede tomar. La probabilidad de tener
exactamente x ocurrencias de Poisson se calcula con la frmula:

x X e
P(x) = x!

Lambada (el nmero medio de presentaciones por e o 2.71828 (base de los logaritmos
Intervalos de tiempo) elevada a la x potencia neperianos o naturales) elevados a la
Lambada potencia negativa

x
Xe
P(x) = x!

Probabilidad de tener exactamente x ocurrencias factorial

El siguiente ejercicio se refiere a la seguridad de una intercesin


peligrosa. Las estadsticas indican 5 accidentes por mes. Se quiere
encontrar la probabilidad de que ocurra ningn accidente y 2
accidentes.

Que no ocurra ningn accidente

69
5


e
P(x) = = 0.00674

5

Que ocurra 2 accidentes


5


P(2) = 2(e5) = 0.08425

Igual situacin se presenta si queremos saber que probabilidad hay


que ocurra 2 o menos accidente:
P(0) = 0.00674
P(1) = 0.03370
P(2) = 0. 08425
TOTAL 0.12469
BUSQUEDA DE PROBABLIDADES DE POISSON UTILIZANDO LA
TABLA 4b DEL APENDICE.
Es utilizar la tabla 4a en las mismas condiciones que la tabla de
distribucin Binomial.

Se puede realizar la misma grafica con los datos.

Ejemplo:
X= nmero de P(x) = Probabilidad de tener exactamente este
accidentes nmero de accidentes.
0 0.00674
1 0.03370
2 0.08425
3 0.14042
4 0.17552
5 0.17552
6 0.14627
7 0.10448
8 0.06530
9 0.03628
10 0.01814
70
11 0.00824
TOTAL 0.99486 probabilidades de tener de 0 a 11
accidentes.
0.00514 probabilidad de tener 12 o mas accidentes
TOTAL 1.00000

Chart Title
12

10

Al igual que la distribucin Binomial, las mayores probabilidades estn


dadas de 5 y 6 accidentes.

LA DISTRIBUCION POISSON COMO UNA APROXIMACION DE LA


DISTRIBUCION BINOMIAL.
Si deseamos ahorrarnos tiempo y deseamos calcular las distribuciones
Binomial de probabilidades, podemos utilizar la distribucin Poisson.
Esta puede ser razonablemente aproximada a la Binomial, pero solo
bajo ciertas condiciones. Esto se da cuando n es grande y p es
pequea o sea cuando el nmero de ensayos es grande y la
probabilidad es pequea. Esto es cuando n es igual o mayor que 20 y
p es igual o menor a 0.05.

La sustitucin de la formula queda as:


x np
(np) X e
P(x) = x!

Ejemplo:

71
En un hospital hay 20 aparatos para dilisis y que la probabilidad de
que cualquiera de las maquinas no funcione bien durante un da
cualquiera es de 0.02. Cul es la probabilidad de que exactamente
tres maquinas estn fuera de servicio?
3 (20 X 0.02)
(20 X 0.02) X e
P(3) = 3! = 0.00715 Probabilidad por Poisson

20! 0.2 0.98


P(3) = 3 ! ( 203 ) ! ( 3 ( 17 = 0.0065 Probabilidad Binomial

Se puede ver que la diferencia entre ambas es muy pequea, de solo


10% de error.

LA DISTRIBUCION NORMAL: DISTRIBUCION DE UNA VARIABLE


ALEATORIA CONTINUA.
Las anteriores han sido anlisis de las distribuciones de probabilidades
discretas. Esta sirve para analizar distribuciones de variables que
pueden asumir cualquier valor.

La distribucin normal es conocida tambin como distribucin


gaussina.

Son dos las razones fundamentales para que la distribucin normal


ocupe un lugar predominante en la estadstica:
1. Su propiedad la hace aplicable a un gran nmero de situaciones
en la que es necesario hacer inferencia mediante la toma de
muestras.
2. Casi se ajusta a la distribucin de frecuencias reales observadas
en muchos fenmenos, incluyendo caractersticas humanas
(peso, altura, coeficiente intelectual), resultados de procesos
fsicos (dimensiones y rendimientos, y muchas medidas de
inters para los administradores, tanto pblicos como privados.

CARACTERISTICAS DE LA DISTRIBUCION NORMAL DE


PROBABILIDADES
1. La curva solo tiene un pico; por lo tanto, es unimodal. Tiene la
forma de campana.

72
2. La media de una poblacin distribuida normalmente cae en el
centro de la curva normal.
3. Debido a la simetra de la distribucin normal de probabilidad, la
mediana y la moda de la distribucin estn en el centro; en
consecuencia, para la curva normal, la mediana, la media y la
moda tienen el mismo valor.
4. Las dos colas de distribucin normal de probabilidad se
extienden indefinidamente y nunca tocan el eje horizontal (desde
luego es difcil de mostrarlo grficamente)

La siguiente grafica muestra estas caractersticas:


Curvas de frecuencia para la distribucin normal de probabilidades
Curvas de

La mayor parte de poblaciones reales no se extienden de manera


indefinida en ambas direcciones: pero para estas poblaciones, la
distribucin normal es una aproximacin conveniente. No hay una sola
curva normal. Para definir una distribucin normal de probabilidades
necesitamos definir nicamente dos parmetros: la media (u) y la
desviacin estndar ( ). La siguiente tabla, cada una de las
poblaciones esta descrita solamente por la media y su desviacin
estndar, y cada una tiene una curva normal especifica.
DIFERENTES DISTRIBUCIONES NORMALES DE
PROBABILIDADES
Su
Naturaleza de la poblacin Su media desviacin
estndar

73
Ingresos anuales de los empleados
de una planta L 17,000 L 1,000
anuales
Longitud de viguetas estndar 8 8 0.05
Contaminacin del aire en 750 partculas
partculas en una comunidad 2,500 por milln
partculas
Ingreso per cpita de un pas en
desarrollo L 1,400 L 300
Delitos violentos por ao en una 8,000 900
ciudad
La siguiente grafica muestra tres distribuciones normales de
probabilidades, cada una de las cuales tiene la misma media, pero
diferentes desviaciones estndar. Aunque estas curvas difieren en
apariencia, las tres son curvas normales.

La siguiente grafica muestra una familia de curvas normales, todas


con la misma desviacin estndar, pero con diferentes medias.

74
Por ltimo, en la siguiente grafica podremos ver 3 distribuciones
normales de probabilidades, con medias diferentes y desviaciones
estndar diferentes:

AREAS BAJO LA CURVA NORMAL


No importa cules sean los valores de u y para una distribucin de
probabilidades normal, el rea bajo la curva es 1.00, de manera que
podemos pensar en el rea bajo la curva, como si fueran
probabilidades. Matemticamente es verdad que:

1. Aproximadamente el 68% de todos los valores de una poblacin


normalmente distribuida se encuentra dentro de 1 desviacin
estndar de la media.
2. Aproximadamente el 95.5% de todos los valores de una
poblacin normalmente distribuida se encuentra dentro de 2
desviaciones estndar de la media.

75
3. Aproximadamente el 99.7% de todos los valores de una
poblacin distribuida normalmente se encuentra a 3
desviaciones estndar.

GRAFICA PARA UNA DESVIACION ESTANDAR

GRAFICA PARA 2 DESVIACIONES ESTANDAR

2 2

GRAFICA PARA 3 DESVIACIONES ESTANDAR

76
3 3

Es de hacer notar que en las aplicaciones que se hacen de la


distribucin normal de probabilidades implican intervalos exactamente
iguales Qu hacemos en estos casos? La existencia de tablas
estadsticas est construida para estas situaciones. Las tablas indican
porciones del rea bajo la curva normal que estn contenidas dentro
de cualquier nmero de desviaciones estndar (ms o menos) a partir
de la media.

No es posible construir ni necesario tener una tabla distinta para cada


curva normal posible. E lugar de ello podemos utilizar una distribucin
de probabilidades normal estndar para encontrar reas bajo cualquier
curva normal. Con las tablas se determina el rea o la probabilidad de
que las variables aleatorias distribuidas normalmente estn dentro de
cierta distancia a partir de la media. Estas distancias estn definidas
en trminos de desviacin estndar.

USO DE TABLAS DE DISTRIBUCION DE PROBABILIDADES


NORMAL ESTANDAR

La tabla 1 del apndice del libro se muestra el rea bajo la curva


normal entre la media y cualquier variable aleatoria distribuida.
Observe en esta tabla la localizacin de la columna identificada como
z. El valor de z se calcula:

77
xu
z=

x = valor de la variable aleatoria que nos preocupa.


u = media de la distribucin de la variable aleatoria.
= Desviacin estndar de la distribucin.

z = Numero de desviaciones estndar que hay desde x a la media de


distribucin.

Porque utilizar z en vez nmero de desviaciones estndar?


Las variables aleatorias distribuidas normalmente tienen muchas
unidades distintas de medicin (lempiras, kilogramos, horas, etc.).

La tabla est organizada en trminos de unidades estndar, o valores


de z. Da los valores de nicamente la mitad del rea bajo la curva
normal, en vista que los datos estn distribuidos normalmente y una
parte es igual a la otra.

Datos para ejemplos: El programa para entrenamiento de docentes,


es un sistema auto administrado, por lo que cada docente requiere
diferentes cantidades de horas para terminarlo. Un estudio revela que
los participantes anteriores, requirieron de 500 horas en promedio, con
una desviacin estndar de 100 horas.

Ejemplo No. 1. Cul es la probabilidad de que un participante


elegido al azar requiera ms de 500 horas?

La siguiente figura muestra que la mitad del rea de la curva est a


ambos lados de la media de 500 horas. Por lo tanto, podemos deducir
que la probabilidad de que la variable aleatoria tome un valor mayor a
500 horas es de 0.5.

u=200 P(>500)= 0.5


78
Ejemplo 2. Cul es la probabilidad de que un candidato elegido al
azar se tome entre 500 y 650 horas?

Nos interesa conocer el valor z de 650 horas:

xu 650500
z= = 100 = 1.5 desviaciones estndar

Si buscamos en la tabla 1 del apndice del libro, encontramos una


probabilidad de 0.4332 por lo tanto la probabilidad de que un
candidato escogido al azar requiere entre 500 y 650 horas para
terminar el programa es de 43%.

Ejemplo de la tabla
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08
1.5 o.4332
Note que se usa la columna 0.00 por no estimar ningn margen de
error.

La grafica es:

79
U=500
650
P(50
0 a 600)

Ejemplo No. 3. Cul es la probabilidad de que un candidato elegido


al azar se tome ms de 700 horas en completar el programa?

Esta situacin es diferente. Sabemos que despus de 500 horas la


probabilidad es de 0.5. Necesitamos calcular la probabilidad de 700 y
luego restrsela de 0.5 as:
700500
z(700) = 100 = 2 desviaciones estndar.

En la tabla 2 desviaciones estndar con 0.00 de error es 0.4772

Como la probabilidad de ser mayor de 500 es 0.5 y la probabilidad de


que sea mayor de 700, a la probabilidad total se le resta la
probabilidad que no ocurra de 500 a 700.
Probabilidad total 0 .5000
-Probabilidad de 500 a 700 0.4772
Probabilidad que se tarde ms de 700 horas 0.0228 = 2.28%

80
La grafica es:

u = 500
700
P(m
s de 700 = 0.0228

Ejemplo No. 4 Supongamos que se desea conocer la probabilidad


que se tarde entre 550 horas y 650 horas?

En este caso primero debo conocer la probabilidad de 650 horas y


despus conocer la probabilidad de 550 horas. Como la de 550 est
comprendida en la probabilidad de 650 horas, debemos restarlas.

650500
P(650) = 100 = 1.5 desviaciones estndar.

En la tabla su valor es 0.4332, luego para

550500
P(550) = 100 = 0.5 desviaciones estndar

En la tabla es 0.1915

Entonces:

81
P(650 550) = 0.4332 0.1915 = 0.2417

La probabilidad de completar el curso entre 550 horas y 650 horas es


24.17%

La Grafica se muestra as:

u =500 550
650
P(550-
650=0.2417
Ejemplo No. 5. Cul es la probabilidad de que un candidato elegido
al azar se tomara menos de 580 horas para completar el curso?

Sabemos que de 500 a menos la probabilidad es de 50%, luego nos


falta conocer la probabilidad de 500 a 580, luego que la conocemos,
tenemos que sumarlas as:

580500
z(580) = 100 = 0.8 desviaciones estndar.

En la tabla toma el valor de 0.2882

Entonces,

82
z(0 580) = 0.2881 + 0.5 = 0.7881

La probabilidad de que el escogido este entre 0 y 580 horas es de


78.81%

u= 500 580

Ejemplo no. 6 Cul es la probabilidad de que el candidato elegido al


azar se tome entre 420 y 570 horas?

Aqu el problema es singular. Ambos lados tiene una probabilidad de .5

En primer lugar encontrar la probabilidad de 420 y luego encontrar la


probabilidad de 570 y sumarlas.

570500
P(570) = 100 = 0.7 desviaciones estndar.

En la tabla el valor es 0.2580

420500
P(420) = 100 = - 0.8

83
En la tabla es 0.2881

Entonces,

P(420-500) = 0.2580 + 0.2881 = 0.5461

La probabilidad que se tarden entre 420 y 580 horas es de 54.61%

LIMITACIONES DE LA DISTRIBUCION NORMAL DE


PROBABILIDADES

Una de las reglas es que nunca toca el eje horizontal, y significa que
siempre existir una probabilidad aunque sea muy pequea de que la
variable aleatoria tome un valor grande y por consiguiente muy alejado
de la media como por ejemplo una persona que pese 2,000 kilogramos
y esto significa que las desviaciones estndar serian muy grades (50)
y tendra una probabilidad de 250 ceros justo despus del punto
decimal, pero debemos estar claros que podemos asignar valores
imposibles en la prctica.

LA DISTRIBUCION NORMAL COMO UNA APROXIMACION DE LA


DISTRIBUCION BINOMIAL

Aunque la distribucin normal es continua, resulta interesante hacer


notar que algunas veces puede utilizarse para aproximar
distribuciones discretas.

Supongamos que nos gustara saber la probabilidad de obtener 5, 6, 7


u 8 en 10 lanzamientos de una moneda no alterada. Utilicemos la tabla
3, podremos encontrar la probabilidad de la siguiente manera:
P(r = 5, 6, 7 u 8) = 0.2461 + 0.2051 + 0.1172 + 0.0439 = 0.6123
Al usar los factores de correccin de continuidad, vemos que la
probabilidad Binomial de obtener 5, 6, 7 u 8 caras pude ser
1
aproximada por el rea bajo la curva normal entre 4.5 y 8.5. Los 2

que se restaron y sumaron son el factor de ajuste Si calculamos los


valores de z de 4.5 y 8.5:

84
4.55
Ax = 1.581 = -0.32 desviacin estndar.
En la tabla es 0.1255
8.55
Ax = 1.581 = 2.21 desviacin estndar.
Si sumamos los dos nos dara 0.1255 + 0.4864 = 0.6119
SELECCIN DE LA DISTRIBUCION DE PROBABILIDADES
CORRECTAS
Se debe escoger con cuidado. Recuerde que aplicar la distribucin de
probabilidades Binomial es cuando el nmero de ensayos es fijo y que
cada ensayo es independiente y pude tener dos resultados
mutuamente excluyentes (xito, fracaso, etc.)

Aunque la distribucin normal es la nica continua, debemos conocer


que existen otras distribuciones continuas tiles. Estas se estudiaran
en la asignatura continua.

INTRODUCCION AL MUESTREO
Algunas veces es posible y practico examinar a cada persona o
elemento de la poblacin que deseamos describir. Esta accin se
conoce enumeracin completa o censo. Se recurre al muestreo
cuando no es posible o medir todos los elementos de la poblacin.

Los especialistas en estadstica usan la palabra poblacin para


referirse no solo a personas sino a los elementos que han sido
escogidos para su estudio. Los especialistas en estadstica emplean la
palabra muestra para describir una porcin escogida de la poblacin.

ESTADISTICA Y PARAMETROS
Matemticamente, podemos describir muestras y poblaciones al
emplear mediciones como la media, la mediana, la moda y la
desviacin estndar. Cuando estos trminos describen las
caractersticas de una muestra, se denominan estadsticas. Cuando
describen las caractersticas de una poblacin, se llama parmetros.
Una estadstica es una caracterstica de una muestra y un parmetro
es una caracterstica de una poblacin.

Supongamos que la estatura media de los estudiantes de esta


universidad es de 1.65 metros. En este caso 1.65 es una caracterstica

85
de la poblacin (todos los alumnos) y se puede considerar como
parmetro. Pero si tomas como muestra los alumnos de la Facultad de
Ciencias Econmicas podemos decir que es una caracterstica de la e
de alumnos de la facultad de Ciencias Econmicas. En este caso sera
una estadstica. Si consideramos que esta muestra es una estimacin
exacta de la estatura promedio de toda a universidad, podemos usar la
estadstica de muestra, para estimar el parmetro de la poblacin
estudiantil universitaria, sin tener que mediar a todos la poblacin
estudiantil.

Los especialistas en estadstica emplean literal letras latinas


minsculas para representar estadstica de muestras. Y literales
griegas o latinas maysculas para representar parmetros de la
poblacin. El siguiente cuadro muestra la simbologa a emplear:
Poblacin Muestra
Definicin Coleccin de elementos Parte o porcin de la poblacin
considerados. seleccionada para su estudio
Caractersticas Parmetros Estadsticas
Smbolos Tamao de la poblacin = N Tamao de la Muestra = n
Media de la poblacin = u
Muestra de la Poblacin = X
Desviacin estndar de la
Desviacin estndar de la muestra = s
poblacin =

TIPOS DE MUESTREO
Existen des mtodos para seleccionar muestras de una poblacin:
1. El muestreo no aleatorio o de juicio.
2. El muestreo aleatorio o de probabilidades.
En el probabilstico, todos los elementos de la poblacin tienen la
oportunidad de ser escogidos para la muestra. El muestreo de juicio,
se emplea el conocimiento y la opinin personal para identificar a los
elementos de la poblacin que deben incluirse en la muestra.

Un muestreo de juicio se hace con los que uno considera especialistas


de la poblacin. Un ejemplo, hacer una encuesta de cmo mejor
determinada rea de estudios de la carrera, no escoger una muestra
de todos los docentes de la carrera, ms bien de los especialistas
reconocidos de esta rea. En algunos casos la muestra de juicio se
emplea como gua o muestra tentativa para como tomar una muestra
aleatoria ms adelante. Una muestra aleatoria no puede ser afectada
con muestras de juicio. Lo importantes es tener presente que una
86
muestra por juicio es acosta de perder un grado de importancia de
representatividad, la comodidad puede cobrar un precio muy alto.

MUESTRAS SESGADAS.
Para ejemplarizar, lo que sucede con los periodistas en los problemas
actuales. Debo consultar a determinados periodistas para mostrar una
opinin de la poblacin. Definitivamente la muestra de opinin estar
sesgada, basada en la inclinacin que tienen la mayora de
periodistas. Igual situacin se presenta si yo quiero formarme una
opinin poltica, basado en lo que externan las personas que escuchan
determinado programa. Normalmente quienes escuchan esa emisora,
son los que quieren or lo que esperan. Definitivamente esta sera una
muestra sesgada.

MUESTREO ALEATORIO
En una muestra aleatoria o de probabilidad conocemos las
posibilidades de que un elemento de la poblacin se incluya o no en la
muestra. Como resultado de lo anterior, es posible determinar
objetivamente las estimaciones de las caractersticas de la poblacin
que resultan de una muestra dada, es decir, se puede describir
matemticamente que tan objetivas son las estimaciones
correspondientes. Comencemos a analizar este proceso introduciendo
cuatro mtodos del muestro aleatorio.

1. Muestreo aleatorio simple.


2. Muestreo sistemtico.
3. Muestreo estratificado.
4. Muestreo de racimos.

MUESTREO ALEATORIO SIMPLE


El muestreo aleatorio simple selecciona muestras mediante mtodos
que permitan que cada posible muestra tenga una igual probabilidad
de ser seleccionado y que cada elemento de la poblacin total tenga
una oportunidad igual de ser incluido en la muestra. Un ejemplo es
que tengo que seleccionar 2 estudiantes de una poblacin finita de 4
que tengo presente. N indica cuantos elementos hay en la poblacin.
Ciertamente, si muestreamos sin remplazar al estudiante, pronto
agotaremos el pequeo grupo de la poblacin. Si muestreamos con
remplazo (eliminamos el alumno escogido antes de escoger el
segundo), la misma persona puede ser escogida por segunda vez.

87
La siguiente tabla muestra la probabilidad de seleccionar dos
estudiantes de una poblacin de 4 alumnos:

Estudiantes A, B, C y D
Muestras posibles de dos personas: AB, AC, AD, BC, BD, CD
La probabilidad de extraer esta muestra de dos personas debe ser
1
P(AB) = 6
1
P(AC) = 6
1
P(AD) = 6 solo hay dos muestras posibles de dos

personas
1
P(BC) = 6
1
P(BD) = 6
1
P(CD) = 6

3 1
P(A) = P(AB) + P(AC) + P(AD) = 6 = 2

Una poblacin infinita es aquella en la que es tericamente imposible


observar todos los elementos. Muchas poblaciones parecen ser
excesivamente grandes realmente no existe una poblacin realmente
infinita de objetivos fsicos. Despus de todo, con recursos y tiempos
ilimitados, podemos enumerar cualquier poblacin finita, incluso los
granos de arena de las costas de Honduras. En trminos prcticos,
entonces, utilizaremos el trmino poblacin infinita cuando hablemos
de una poblacin que no podra enumerarse en un periodo razonable
de tiempo. De esta manera, utilizamos el concepto terico de
poblacin infinita como una aproximacin de una poblacin finita
enorme., como se uso el concepto terico de variable continua con
una aproximacin de una variable aleatoria discreta que pudiera
asumir muchos valores estrechamente cercanos.

88
COMO HACER UN MUESTREO ALETORIO.
La forma ms fcil de seleccionar una muestra de manera aleatoria es
mediante el uso de nmeros aleatorios. Se pude generar programada
para resolver nmeros o mediante una tabla de nmeros aleatorios,
que, propiamente, debera llamarse Tabla de Dgitos Aleatorios.

La siguiente tabla parcial muestra un ejemplo:


1581922396 2068577984 8262130892 8374856049 4637567488
0928105582 7295088579 9586111652 7055508767 6472382934
4112077556 3440672486 1882412963 684012006 0933147914

Esta tabla es muy limitada pero nos permite ejemplarizar:

Supngase que tengo que escoger de 100 empleados 10. Como es de


2 dgitos, me remito a la tabla y voy escogiendo de la primera columna
los diez posibles candidatos, tomando de la primera columna los dos
primeros dgitos y estos seria: 15, 09, 41. Como se agot la tabla hacia
abajo, procedo a escoger los siguientes dos dgitos, estos seria: 81, 28
y 12, y continuo con los siguientes dos dgitos as: 92, 10, 07 y por
ultimo para completar los diez seria de los otros dgitos: 23.

Otra forma es por ejemplo, poner todos los nombres en un recipiente y


seleccionar los diez sacando uno por uno.

MUESTREO SISTEMATICO
En el muestreo sistemtico, los elementos son seleccionados de la
poblacin dentro de un intervalo uniforme que se mide con respecto al
tiempo, al orden o al espacio. Si tuviera la lista de alumnos de la
carrera escogera aleatoriamente el primero con el nmero 20 y as
sucesivamente 40, 60, etc.

En el muestreo sistemtico, existe un problema de introducir un error


un error en el muestreo. Por ejemplo que si los ordenamos por cdigo,
pudiera ser que lleguen al momento de la matricula los ms afines a
determinado conocimiento que deseo saber.

Pero tiene sus ventajas, este mtodo puede requerir menos tiempo y
un costo menor.

MUSTREO ESTRATIFICADO
89
Para utilizar el muestreo estratificado, dividimos la poblacin en grupos
relativamente homogneos, llamados estratos. Despus se utiliza
cualquiera de los dos planteamientos: o se selecciona aleatoriamente,
en cada estrato, el nmero especfico correspondiente a la proporcin
de la poblacin de cada estrato, o se extrae el mismo nmero de cada
estrato y despus ponderamos los resultados considerando la
proporcin que el estrato representa de la poblacin.

El muestreo estratificado resulta muy til, cuando la poblacin ya est


dividida en grupos de diferentes tamaos y se desea tomar en cuenta
esta decisin.

La ventaja de las muestras estratificadas es que, cuando se disea


adecuadamente, refleja de manera ms precisa las caractersticas de
la poblacin de la cual fue elegida, en comparacin con otro tipo de
muestras.

MUESTREO DE RACIMOS
En el muestreo de racimo dividimos la poblacin en grupos, o racimos,
y luego seleccionamos una muestra aleatoria de estos racimos,
asumiendo que cada uno de ellos es representativo de la poblacin.
Por ejemplo establecer el promedio de televisores por casa en una
ciudad grande, podemos usar un mapa de la ciudad para dividir el
territorio en manzanas y luego escoger un cierto nmero de estas
(racimos) para entrevistar a los habitantes. Un muestreo de racimos
bien diseado puede producir una muestra mas precisa a un costo
considerable menor que un muestreo aleatorio simple.

Se puede usar el mtodo estratificado cuando cada grupo tiene una


pequea variacin dentro de si mismo, pero hay una amplia variacin
de un grupo de otro.

Caso contrario se usa el muestreo de racimos, cuando hay variaciones


considerables dentro de cada grupo, pero los grupos son
considerablemente similares entre s.

BASE DE LA INFERENCIA ESTADISTICA: EL MUESTREO


ALEATORIO SIMPLE

90
El maestreo sistemtico, el estratificado y el de racimos intentan
aproximarse al muestreo aleatorio simple. Todos son mtodos que han
sido desarrollados por su precisin, su economa o su factibilidad.

El principio del muestreo aleatorio simple son la base de la inferencia


estadstica, es decir, del proceso de hacer inferencia acerca de
poblaciones a partir de informacin contenida en muestras.

DISEO DE EXPERIMENTOS.
En el desarrollo de la clase, en las probabilidades se habla de
experimento. Se defini que evento como uno o ms resultados
posibles de hacer algo, y un experimento como la actividad que
tendra como resultado tales eventos.

Planeacin de experimentos. Si queremos resultados significativos,


es necesario un buen diseo de estos experimentos, basado en lo
visto anteriormente.

Fases del diseo experimental. Solo se proporciona una idea


general, por ser un tema complejo.

Objetivo. Es el punto de partida. Si se quiere probar determinada


situacin, hay que identificar las caractersticas principales que me
garantice una determinada caracterstica de calidad (tiempo de vida,
tamao, peso, costo, et.)

Lo que se medir. La caracterstica que deseamos medir tambin se


le conoce la variable de respuesta. Si deseo medir el peso de un
producto, este sera la variable a medir. Si deseo medir la preferencia
de un producto, tambin es la variable a medir.

Tamao de la muestra. La muestra debe ser lo suficientemente


grande para validar lo que afirmamos o confirmar un supuesto. A
mayor tamao de la muestra, esta situacin disminuye la posibilidad
de un error.

Conduccin del experimento. Las condiciones deben ser


controlables, se debe estar seguro de estar midiendo lo requerido,
evitando distorsiones. La preferencia de un candidato debe ser el tema
central y evitar distorsionar la situacin con preguntas dirigidas.

91
Anlisis de datos. Todo resultado debe estar sujeto a una hiptesis
(en el trascurso del siguiente curso) Prueba de Hiptesis.

Reaccin a las afirmaciones experimentales. Constantemente


omos afirmaciones basados en estudios realizados, como, El tabaco
produce cncer, basado no en experimentos, ms bien en estudios
estadsticos realizados. Como demos reaccionar ante tales
afirmaciones. Por lo general el consumidor debe ser un tanto
escptico.

Otras opciones abiertas. Ante un grado de preocupacin sobre la


percepcin del consumidor, si fuera el caso, es un efectivo control
sobre la variable que se est midiendo, pero no garantizan realmente
la solucin de un problema, si fuera el caso. En vez de invertir
recursos en intentos de eliminar variaciones experimentales, se elige
una ruta completamente diferente. Lo que sigue como es posible
lograr lo anterior.

EXPERIMENTOS FACTORIALES.
Se plantea la fabricacin de dos bateras de carro, identificadas como
A y B, sometidas a tres pruebas. 1) Temperatura, 2) edad del motor, 3)
condiciones del cable de la batera. Podemos introducir el concepto de
experimentos factoriales usando esta notacin:

H = temperatura caliente N= motor nuevo G= Cable nuevo


C = temperatura fra O=motor viejo W=cable desgastado

Es natural que existan ms condiciones en cada una de las variables,


pero para efecto del ejercicio, se simplifica.

Tenemos 2 posibles temperaturas, 2 posibles estado de motores y dos


posibles condiciones de los cables. Esto significa que hay 2x2x2x2 =
16 combinaciones posibles.
Con todas estas posibles combinaciones podemos elaborar la
siguiente tabla:
Condicin Condicin
Prueba Bateras Temperatura del motor del cable
1 A H N G
2 A H N W
92
3 A H O G
4 A H O W
5 A C N G
6 A C N W
7 A C O G
8 A C O W
9 B H N G
10 B H N W
11 B H O G
12 B H O W
13 B C N G
14 B C N W
15 B C 0 G
16 B C 0 W
Logro de mayor eficiencia en el diseo experimental
Con el ejercicio anterior y con cuatro factores, se requieren 16
pruebas, para compartir todos los niveles con todos los factores. Si se
requiere comprobar las mismas dos bateras con 5 niveles de
temperatura, 4 condiciones de motor y tres mediciones de condiciones
de cable de batera, se necesitan 2x5x4x3 = 120 pruebas para un
experimento factorial completo.

Los especialistas han reducido en nmero de casos como este.


Imagnese una compaa que desea comprobar el consumo de un
dentfrico en cuatro ciudades, con cuatro tipos de empaques y cuatro
pautas de publicidad. Un anlisis factorial completo seria 4x4x4 = 64
pruebas. Si hacemos una planificacin adecuada, podemos hacerlo
con menos pruebas, 16 para ser precisos.

Usemos la notacin:
A = Ciudad 1 I = Empaque 1 1 = Pauta publicitaria 1
B = Ciudad 2 II = Empaque 2 2 = Pauta publicitaria 2
C = Ciudad 3 III = Empaque 3 3 = Pauta publicitaria 3
D = Ciudad 4 IV = Empaque 4 4 = Pauta Publicitaria 4

Con base a esto podemos hacer el siguiente diseo:

Pauta publicitaria
1 2 3 4

93
I C B D A
II B C A D
III D A B C
IV A D C B
Empaques Ciudades

INTRODUCCION A LAS DISTRIBUCIONES DE MUESTREO


En las clases anteriores se introdujo el concepto de utilizar datos de
muestras, para calcular estadsticos como la media y la desviacin
estndar. Hemos visto como tomar muestras de una poblacin. Las
estadsticas resultantes para cada muestra no necesariamente serian
iguales, y lo ms probable es que varen de una muestra a otra.

Si se toma una muestra de 10 mujeres de 25 aos residentes en una


ciudad de 100,000 habitantes (una poblacin infinita, de acuerdo con
la terminologa que se ha planteado. Al calcular la estatura media y la
desviacin estndar correspondiente en cada una de estas muestras,
veramos rpidamente que la media y la desviacin estndar de cada
muestra serian diferentes. Una distribucin de probabilidad de
todas las medias posibles de las muestras en una distribucin de
las medias de las muestras. Los especialistas en estadstica la
conocen como distribucin de muestreo de la media.

Tambin es posible obtener una distribucin de muestreo de una


proporcin. Si determinamos la fraccin de pinos infectados de
escarabajos en muestras de 100 rboles, escogidos de un bosque
muy grande. Hemos tomado un gran nmero de tales muestras de 100
elementos. Si trazamos una distribucin de probabilidades de las
proporciones posibles de rboles infectados en todas estas muestras,
obtenemos una distribucin de las proporciones de las muestras.
En estadstica, a esto se conoce como distribucin de muestreo de
proporciones (fraccin de rboles infectados)

Descripcin de las distribuciones de muestreo. Cualquier


distribucin de probabilidad (o cualquier distribucin de muestreo)
puede ser descrita parcialmente por su media y su desviacin
estndar.

El siguiente cuadro muestra los ejemplos de poblaciones, muestras,


estadsticas de muestreo y distribucin de muestreo.
94
Estadstica de Distribucin
Poblacin Muestra muestreo de muestreo
Agua de un rio Recipientes con Nmero medio de Distribucin de
10 galones de partes de mercurio muestreo de la
agua por milln de media.
partes de agua.
Todos los equipos Grupo de 5 Estatura media. Distribucin de
profesionales de jugadores. muestreo de la
basquetbol media.
Todas las partes 50 partes Proporcin Distribucin de
producidas por un defectuosa muestreo de la
proceso de proporcin.
fabricacin.

Cada uno de los casos, la distribucin de muestreo de la media puede


ser descrita parcialmente por su media y su desviacin estndar, lo
mismo que por la distribuciones.

Concepto de error estndar. En vez de decir la desviacin estndar


de la distribucin de las medias de la muestra para describir una
distribucin de medias de la muestra, los especialistas en estadstica
se refieren al error estndar de la media. Igual situacin la
desviacin estndar de la distribucin de proporciones se les
denomina error estndar de la proporcin. El termino error estndar
se utiliza porque da a entender un significado especifico. Un ejemplo
ayudara a explicar el porqu de su nombre. Deseamos conocer sobre
la estatura de los estudiantes universitarios. Podemos tomar una serie
de muestras y calcular la estatura media de cada muestra. Es
improbable que las medias de las muestras sean iguales, es de
esperarse que se muestre una variabilidad entre ellas. En estadstica
eso se conoce como error de muestreo debido al azar, debido
nicamente a los elementos que decidimos escoger para las muestras.

La desviacin estndar de la distribucin de medias de las muestras


mide el grado hasta el cual es esperar que varen las medias de las
diferentes muestras, debido a este error cometido en el proceso de
muestreo.

El error estndar mide no solo el tamao del error al azar que se ha


cometido, sino tambin la probable precisin que puede obtenerse al
utilizar una estadstica de muestra para estimar un parmetro de

95
poblacin. Un error pequeo, constituye una buena estimacin de la
media de la poblacin, o al contrario indica que esta ampliamente
dispersa.

Un uso del error estndar.


Para poder establecer que los estudiantes de una universidad obtiene
mejores calificaciones que otras, pareciera ser una afirmacin
bastante clara, por lo tanto es una mejor propuesta de matricula.

Pero siempre que usemos pruebas, tenemos que considerar el error


estndar. Esto nos dara que tan grande tendra que ser la diferencia
en las calificaciones de una universidad para que fuera
estadsticamente significativa. Si fuera un anuncio no ofrece datos;
solo afirma que sus egresados lo hacen mejor.

DISTRIBUCION DE MUESTREO A DETALLE


Se ha visto una serie de conceptos, y es necesario no solo
comprenderlos conceptualmente, sino aprenderlos a manejarlos de
manera operacional.

Base conceptual para muestrear distribuciones. Las siguientes


graficas nos permiten comprender las distribuciones de muestreo

La grafica nuestra los Conceptos de distribucin de poblacin,


distribuciones de muestra y distribucin de muestreo.
a)

96
b)

Ahora bien, si pudiramos tomar las medias de todas las


distribuciones de muestra y producir una distribucin de estas medias,
se veran as:
c)

97
X

La distribucin de muestreo de la media:


Esta distribucin es la distribucin de todas las medias de muestra y
tiene:

X media de la distribucin de muestreo de las medias


=

conocida como mu X barra subndice

X = error estndar de la media (desviacin estndar de la


distribucin de muestreo de la media) conocida como sigma X barra
subndice

Base Conceptual para muestrear distribuciones


La figura anterior fue dividida en 3 secciones a) b) y c). La figura a)
ilustrauna distribucin de poblacin . Esta tiene una media (mu) y
una desviacin
estndar (sigma).

Supongamos que tomamos 10 muestras. Para cada muestra


tendramos que calcular la media y la desviacin estndar para cada
una de las muestras (grafica b). Cada muestra tendra su propia media

( X y su propia desviacin estndar (s). Ninguna de las medias de la
muestra individual seria la misma que la media de la poblacin, pero
tenderan a estar cerca de la media de la poblacin, pero raramente
quedaran en ese valor.

98
La grafica c) ilustra la distribucin de todas las muestras, conocida
como distribucin de muestreo de la media. Esta tendra su propia

media X y su propia desviacin o error estndar X

La grafica c) es un ejemplo de este tipo. Basado en lo anterior los


especialistas han diseado frmulas que permiten estimar las
caractersticas de estas distribuciones tericas del muestreo, haciendo
innecesarias la recoleccin de grandes nmeros de muestras. Los
responsables de la toma de decisiones, solo requieren una muestra de
la poblacin, calculan la estadstica para esta muestra y de esta
infieren algo sobre los parmetros para toda la poblacin.

Muestreo de poblaciones normales


Se extrae una muestra de una poblacin normalmente distribuida con
una media de 100 y una desviacin estndar de 25, y comenzamos a
extraer muestras de cinco elementos, y calculamos sus medias. La
primera media podra ser 95, la segunda 105, la tercera 101. Igual
oportunidad hay de que la media de la muestra este por encima o por
debajo de la media poblacional (100). Debido a que se est
promediando 5 elementos para obtener cada media, se promediaran
hacia abajo valores muy grandes de la muestra y hacia arriba valores
muy pequeos.

Si se aumenta el tamao de la muestra de 5 a 20. Esto no cambiara la


desviacin estndar de los elementos de la poblacin original, pero
con una muestra de 20, se incrementa el efecto de promediar en cada
muestra y podra esperarse, incluso, una dispersin menor entre las
cuentas de ahorro individuales estn normalmente distribuidas con
una media de L 2,000 y una desviacin estndar de L 600. Si el banco
toma una muestra aleatoria de 100 cuentas, Cul es la probabilidad
de que la media de la muestra caiga entre L 1,900 y L 2,050?

Primero hay que calcular el error estndar de la media. Utilizaremos la


ecuacin para el error estndar de la media pensando que la
poblacin es infinita (posteriormente se ver sobre poblaciones finitas)


Error estndar de la media X = n

99
Donde:
= desviacin estndar de la poblacin

n = tamao de la muestra.

L 600
= 100 = L 60 error estndar de la media
Luego utilizamos la tabla no. 1 de los valores de z y la ecuacin de
clculo de z y podremos calcular la probabilidad de que la media de la
muestra se encuentre entre L 1,900 y L 2,050.

x L 1,900L 2,000
z(1,900) = x = 60 = 1.67 desviacin estndar
de la media de una distribucin de probabilidad normal estndar.

l 2,050l 2,000
z(2,050) = l 60 = 0.83 desviacin estndar de la
media de una distribucin de probabilidad normal estndar.

En la Tabla 1, los valores serian 0.425 y o.2967 y su suma seria


0.7492

Muestreo con poblaciones no normales


Como tratar poblaciones que no estn distribuidas normalmente

Teorema del lmite central


La media de la distribucin de muestreo de la media ser igual a la
media de la poblacin, sin importar el tamao de la muestra, incluso si
la poblacin no es normal. Al incrementar el tamao de la muestra, la
distribucin de la media se acercara a la normalidad, sin importar La
forma de la distribucin de la poblacin.

La relacin entre la forma de la distirbucion de la poblacin y la forma


de la distribucin de muestreo se denomina teorema del limie central.
Es el mas importante de toda la inferencia estadstica, pues asegura
que la distribucin de muestreo de la media se aproxima a la
normalidad al incrementarse el tamao de la muestra. Una muestra no
necesariamente debe ser muy grande para que el muestreo se
acerque a lo normal. Lo importante es que se puede hacer inferencia
100
con respecto a los parmetros de poblacin, sin saber sobre la forma
de la distribucin de frecuencia de esa poblacin ms que lo que
podemos obtener de la muestra.

Una distribucin tiene una media de L 19,000 y una desviacin


estndar de L 2,000. Si se extrae una muestra aleatoria de 30 cajeros
Cul es la probabilidad de que sus ganancias promedien L 19,750

Primero hay que calcular el error estndar de la media de la


desviacin estndar de la poblacin, as:

2,000
x
= n = 30 = L 365.16 error estndar de la media

Para utilizar la tabla 1 debemos encontrar el valor de z

19,75019,000
z= 365.16 = 2.05 desviaciones estndar de la media de una
distribucin normal estndar de probabilidad.

Las areas serian 0.4798 y como la mitad del area es 0.5, podemos
calcular la probabilidad as:
o.5 0.4798 = 0.0202 es la probabilidad que el ingreso promedio sea
mayor a L 19,500.

Una consideracin operacional en el muestreo: la relacin entre el


tamao de la muestra y el error estndar
Si la dispersin disminuye, los valores tomados por la media de la
muestra tienden a agruparse ms cercanamente alrededor se .

Cuando n= 10

100
x
= 10 31.63 error estndar de la media

Y cuando n = 100

101
100

= 100 = 10 error estndar de la media

Se puede ver que a medida que aumenta el tamao de la muestra el


error estndar tiende a disminuir.

Ahora si la poblacin es finita la frmula es:

20
x N1
= n x

El nuevo trmino que aparece al lado derecho de la ecuacin se


conoce como multiplicador de poblacin finita.

Estamos interesados en una poblacin de 20 compaas textiles del


mismo tamao, todas estas fbricas experimentan una produccin
excesiva de trabajo. Nuestro estndar indica que la desviacin
estndar de la distribucin de la produccin anual es igual a 75
empleados. Si muestreamos 5 compaas textiles, sin remplazo, y
deseamos calcular el error estndar de la media, as:


=
75
5 x 205
201 = 29.8 error estndar de la media de la

poblacin finita.

ANALISIS DE ARBOL DE DECISIONES


Es el modelo grafico de un proceso de decisin. Podemos introducir
probabilidades al anlisis de decisiones complejas que involucran
muchas opciones y condiciones futuras que no se conocen, pero que
pueden especificarse en un conjunto de probabilidades que no se
conocen.

Ejemplo:
Se recibe una oferta de una cadena de hoteles para operar en
invierno, garantizando una ganancia de L 45,000; por otro lado, ha
estado considerando la renta de equipo de fabricacin de nieve para la
temporada. Si renta el equipo, la estacin podra operar a tiempo

102
completo, sin importar la cantidad de nieve que caiga. Si decide usar
nieve fabricada para completar las nevadas naturales, su ganancia de
la temporada ser L 120,000, menos el costo de rentar y operar el
equipo de fabricacin de nieve. El costo de operacin ser de L 10,000
si cae ms de 40 pulgadas de nieve natural, L 50,000 si cae entre 20 y
40 pulgadas y L 90,000 si cae menos de 20 pulgadas
Distribucin de nevadas y ganancias
Cantidad de nieve Ganancias Probabilidad ocurrencia
Ms de 40 pulgadas 120,000 0.4
De 20 a 40 pulgadas 40,000 0.2
Menos de 20 pulgadas -40,000 0.4

Dejar que la cadena opere


L 45,000

0.4 >40 de nieve


L 120,000

L 40,000
Opere ella 0.2 20-40 de nieve
L 40,000
Sin fabricar nieve
58,000
0.4 <20 de nieve
L -40,000

L 98,000
L 58,000

Operar ella L 58,000

Con fabricacin de nieve

L 18,000
El administrador tiene 3 alternativas:
a) Darla en arrendamiento y tendra una ganancia de L 45,000
b) Operar ella sin fabricacin de nieve, sus posibles resultados
estn dados en la tabla.
c) Operar ella con fabricacin de nieve.

Tenemos que e todas las alternativas ambas alternativas as:


1. Si da en administracin su ganancia seria de L 45,000
2. Si ella opera la estacin y no usa equipo de fabricacin de
nieve, su ganancia esperada seria
103
Nivel de nieve Ganancia Probabilidad Ganancia esperadas
Ms de 40 120,000 0.4 48,000
De 20 a 40 40,000 0.20 8,000
Menos de 20 -40,000 0.40 -16,000
Ganancias esperadas 40,000

3. En el caso de nieve con ms de 40 pulgadas:


(Utilidad esperada costo renta costo operacin) x probabilidad
(120,000 12,000 10,000) 0.4 = L 39,200

En el caso de 20 a 40 pulgadas
(120,000 12,000 50,000) x 0.2 = L 11,600

En el caso de menos de 20 pulgadas:


(120,000 12,000 90,000) x 0.4 = L 7,200

Resumen:
Mas de 40 L 39,200
De 20 a 40 11,600
Menos de 20 7,200
Total ganancia esperada 58,000

ESTIMACIONES
Constantemente estamos haciendo estimaciones, quien ganara las elecciones,
podre cursar la asignatura, etc.

En el mundo de los negocios, es igual, necesitamos hacer estimaciones rpidas, y


pueden afectar la organizacin de manera tan seria.

Al final se cuenta con la esperanza de que las estimaciones, se hacer que se


acerque lo ms posible a la realidad. Es la toma de decisiones sobre cierto grado
de certidumbre.

Lo que se busca es la racionalizacin de las decisiones sin contar con la


informacin pertinente completa y con un alto grado de incertidumbre sobre el
futuro que nos depara.

La teora de las probabilidades que hemos visto, son la base de la inferencia


estadstica, que nos permite manejar la incertidumbre en la toma de decisiones.

La carrera necesita estimar el nmero de matriculados en las diferentes


asignaturas para poder estimar el nmero de horas profesor que necesita.

104
Tipos de estimaciones
En trminos generales, uno puede realizar dos tipos de estimaciones, la puntual y
la por intervalos.

La puntual es solo un nmero que se utiliza para estimar un parmetro de


poblacin desconocida. Si mediante un anlisis de una muestra representativa, se
logra establecer que el promedio de personas en una familia son 5, podemos
afirmar que las familias hondureas tiene en promedio 5 miembros. Es un nico
nmero, por lo tanto es una estimacin puntual.

Generalmente una estimacin puntual es a menudo insuficiente, basado en que el


resultado es correcto o incorrecto, y no se sabe que tan correcto es la afirmacin o
que tan confiables es.

Una estimacin por intervalos es rango de valores que se utiliza para estimar un
parmetro de la poblacin. Un ejemplo tpico, es cuando un estudiante dice que la
nota que estima obtener esta entre un 60 y 70%. Es muy probable que dentro de
eses rango este acertado.

Estimador y estimaciones
Cualquier estadstico de la muestra que se utilice para estimar un parmetro de la
poblacin se conoce como estimador, es decir un estimador es un estadstico de
vla muestra utilizado para estimar un parmetro poblacional. La media de la
muestra x puede ser un estimador se la media de la poblacin , y la
proporcin de la muestra se pude utilizar como un estimador de la proporcin de la
poblacin. Tambien es posible aplicar el rango de la poblacin.
El siguiente ejemplo ilustra lo anterior.
Poblacin en que Parmetro de Estadstico de la Estimacin que
estamos poblacin que muestra que realizamos
interesados deseamos estimar utilizaremos como
estimador
Alumnos de la Promedio de los Promedio de 56% de
carrera de que aprueban alumnos que aprobacin por
administracin aprueban por ao.
periodo
Poblacin que Proporcin de Proporcin de la 64% de los
estudian en la U mujeres en la muestra de 500 estudiantes son
muestra mujeres

Criterios para seleccionar un buen estimador


1. Insesgado. Lo que se busca es que la distribucin muestral de las medias de las
muestras tomadas en la misma poblacin es igual a la media de la poblacin,
misma. Esto es factible si, en promedio, tiende a tomar valores que estn arriba
del parmetro de la poblacin que se est estimando con la misma frecuencia y la

105
misma extensin con las que tiende a asumir valores abajo del parmetro
poblacional que se est estimando.

2. Eficiencia. Se refiere al tamao del error estndar del estadstico. Si se


comparan dos estadsticos de una muestra del mismo tamao y tratamos de decir
cul de ellas es un estimador ms eficiente. Se debe escoger el estadstico que
tenga menor error estndar o menor desviacin estndar de la distribucin
muestral.

3. Consistencia. Si al aumentar el tamao de la muestra, se tiene casi la certeza


de que el valor del estadstico, se aproxima bastante al valor del parmetro
poblacional. Se vuelve ms confiable al tener mayor tamao de muestra ms
grandes. Si es consistente, se perder el tiempo.

4. Suficiencia. Si se utiliza tanta informacin de la muestra que ningn otro


estimador puede extraer informacin adicional acerca del parmetro de poblacin
que se est estimando.

ESTIMACIONES PUNTUALES
La media de la muestra x es el mejor estimador de la media de la poblacin. Es
insesgada, consistente, eficiente y siempre y cuando el tamao de la muestra sea
lo suficientemente grande, su distribucin muestral puede ser aproximada por
medio de la distribucin normal.

Si se conoce la distribucin muestral de x podemos obtener cualquier


conclusin a partir de ella.

Un ejemplo prctico es la preferencia de un grupo de personas (muestra) sobre la


preferencia sobre x perfume, podemos afirmar que toda la poblacin tiene la
misma preferencia sobre dicho perfume.

La frmula para la estimacin puntual es la que vimos en el contenido del primer


parcial as:

x
x
= n

Al usar la media de la muestra, x como un estimador, la estimacin puntual de


la media de la poblacin ser la misma.

Estimacin puntual de la varianza y la desviacin estndar de la poblacin


Tambin se vio en la primera unidad del programa y como recordatorio, la frmula
es:

106
xx

2
s2 =

Estimacin puntual de la proporcin de la poblacin


La proporcin de unidades de una poblacin dada que tiene una caracterstica
particular se denota por p. Si conocemos la proporcin de unidades de una
muestra que tiene las mismas caractersticas (denotadas por ^p podemos
utilizar este como un estimador de p y que tiene todas las caractersticas
deseables como insesgada, consistente, eficiente y suficiente.

Si a travs de la muestra estimamos que el 0.08 de la muestra usa una marca


especifica de perfume, podemos estimar que el mismo porcentaje de la poblacin
usa esa marca.

Un ejemplo simplifica la compresin de este tema.

La comisin de instalaciones deportivas, estudia la posibilidad de ampliar la


capacidad del Estadio Nacional, pero requiere conocer el promedio de personas
que asisten al mismo, as como la variabilidad de este nmero. Los datos que se
muestran abajo son las asistencias en miles a 9 eventos, que fueron
seleccionados al azar. Calcule la media puntual y la varianza de la poblacin de la
que se tom la muestra. La capacidad actual es de 30,000 personas.

8.8 14.0 21.3 7.9 12.5 20.6 16.3 14.1 13.0


2
x = 8.82 + 14.02 + 21.32 + 7.92 + 12.52 + 20.62 + 16.32 + 14.12 +

13.02 = 2,003.65

x = (8.8+14+21.3+7.9+12.5+20.6+16.3+14.1+13 = 128.5

N=9
128.5
x
= x/n = 9 = 14,278 personas

14.278

2 1 2 2
s = ( x -n x )= 2 = 21,119 personas
n1
2,003.659

107
No hay necesidad de ampliar las instalaciones.

Estimaciones de intervalo: Conceptos bsicos.


Si decidimos tomar una muestra es conocer alguna caracterstica de la poblacin.
La estimacin puntual que vimos es uno de los mtodos, pero tambin existe la
estimacin por intervalos. Esto significa que podemos describir un rango de
valores dentro del cual es posible que este el parmetro de la poblacin.

El jefe de la carrera de administracin, desea estimar los aos promedio de


graduacin de los alumnos de la carrera. Se seleccion una muestra aleatoria de
200 graduados y de los archivos se obtuvo el promedio de aos que resulto de 8
aos.

Podemos utilizar la estimacin puntual. Pero existe la incertidumbre de esta


estimacin, es decir, una afirmacin sobre el intervalo dentro del cual es probable
que este la media de la poblacin desconocida. Para proporcionar tal afirmacin,
necesitamos encontrar el error estndar de la media.

Si seleccionamos y graficamos un nmero grande de medias de muestra de una


poblacin, la distribucin de estas medias se aproxima a una curva normal.
Supongamos que el tamao de nuestra muestra es suficientemente grande para
poder explicar el teorema central del lmite.

Para medir la dispersin de nuestras medias mustrales, podemos utilizar la


siguiente frmula:

1.5
x
= n = 200 = 0.071

Supongamos que la desviacin estndar de la poblacin es de 1.5 aos

Ahora podemos informar al jefe de la carrera que la permanencia de un estudiante


x
estar entre x = 8 0.071 = LS = 8.071 aos y LI = 7.929 aos

Probabilidad de que el verdadero paramento poblacional caiga dentro de la


estimacin del intervalo.
Como lo vimos anteriormente, que porciones especficas bajo la curva normal
estn localizadas entre ms o menos cierto nmero de desviaciones estndar a
partir de la media.

La probabilidad es de 0.955 que la media de la muestra de los aos de


permanencia de los 200 graduados estn entre 2 errores estndar de la media
de la poblacin. Tericamente si seleccionamos 1,000 muestras al azar y luego

108
construimos un intervalo de 2 errores estndar alrededor de la media de cada
muestrea, cerca de 955 de estos intervalos incluirn a la media de la poblacin

Nuestra mejor estimacin sobre la permanencia de los alumnos de la carrera, con


los siguientes niveles de confianza:

Con un 68% de nivel de confianza sern 8 1(0.071) = LS= 8.071 y LI = 7.929


aos
Con un 95.5% de nivel de confianza ser 82(.071) = LS= 8.142 LI = 7.858 aos
Con un 99.7 de nivel de confianza ser 83(0.71) = LS = 8.213 y 7.787 aos

Ejemplo:
Un estudiante, est interesado en comprar un auto usado. Selecciona 125
anuncios al azar, y establece que el precio promedio de esta muestra es de $
3,250. El conoce que la desviacin estndar de los precios es de $ 615.
a) Establezca una estimacin por intervalos para el precio promedio de un
automvil de manera que el estudiante tenga una seguridad del 68.3% de que la
media de la poblacin est dentro de este intervalo.
b) Establezca una estimacin de intervalo para el precio promedio de un auto de
modo que el estudiante tenga el 95.5% de certeza que la media de la poblacin
est dentro de este intervalo.

615
x x
= 615 n= 125 = 3,250 = n = 125 = 55.01
x x
a) = 3,250 55.01 = LS 3,194.99 y LI 3,305.01 A UNA
DESVIACION ESTANDAR

b) x 2 x = 3,250 2(55.01) = LS = 3,139.98 y LI 3,360.02

ESTIMACION DE INTERVALO E INTERVALOS DE CONFIANZA


Cuando utilizamos estimaciones de intervalo no nos limitamos a 1, 2, 3 errores
estndar. La tabla 1 1.64 errores estndar, por ejemplo, incluyen
aproximadamente el 90% del rea bajo la curva y, as, 0.4495 del rea de ambos
lados de la media es una distribucin normal, y as sucesivamente.

En estadstica, la probabilidad que asociamos con un una estimacin de intervalo


se conoce como nivel de confianza. Esta probabilidad indica que tanta confianza
tenemos de que la estimacin de intervalo incluya al parmetro poblacional. Una
probabilidad ms elevada implica mayor confianza porque el rango se ampla.

Los ms frecuentemente usados son 90, 95 y 99%

Si tenemos un nivel de confianza de que la media de la poblacin de ingreses de


personas que viven en Tegucigalpa estn entre 8,000 24,000, entonces el rango

109
es de 8,000 24,000. Este es nuestro intervalo de confianza. Por lo general lo
expresamos en trminos de errores estndar, ms que con valores numricos.

Relacin entre nivel de confianza e intervalo de confianza


El usar un alto nivel de confianza produce intervalos de confianza grandes, dando
estimaciones bastante imprecisas

Uso del muestreo y estimacin de intervalos de confianza


Hemos hablado de un gran nmero de medias muestrales de una poblacin. En la
prctica, a menudo es difcil o costoso tomar ms de una muestra de una
poblacin. Con base a una sola muestra estimamos el parmetro poblacional.
Debemos tener cuidado al interpretar los resultados.

CALCULO DE ESTIMACIONES DE INTERVALOS DE LA MEDIA A PARTIR DE


MUESTRAS GRANDES
Un fabricante desea estimar la vida til de un repuesto en condiciones normales.
El fabricante ha establecido que la desviacin estndar de la vida til es de 6
meses. Supongamos que seleccionamos una muestra aleatoria de 100 repuestos.
Y obtuvimos los siguientes resultados:

N= 100 Tamao de la muestra


x = 21 meses Media de la muestra
= 6 meses Desviacin estndar de la poblacin

Se pide una estimacin de intervalo con un nivel de confianza de 95% y la muestra


mayor a 30, de manera que el teorema central del limite nos permite usar la
distribucin normal

6
x
= n = 100 = 0.6 meses

Como el nivel de confianza es 95%, las tablas muestran solo el 50% de la


distribucin, la probabilidad esta en 95/2 = 47.5% de probabilidad. Buscando en la
tabla esta probabilidad est a 1.96 desviaciones estndar entonces:

x
+ 1.96 x = 21 + 1.96(0.6) = 22.18 meses LIMITE SUPERIOR DE
CONFIANZA
x x
- 1.96 = 21 - 1.96(0.6) = 19.82 meses LIMITE INFERIR DE
CONFIANZA

Cuando no se conoce la desviacin estndar de la poblacin.


Una estimacin ms compleja, por no conocer la desviacin estndar de la
poblacin

110
Se nos pide estimar el ingreso medio anual de 700 familias que viven en
determinado lugar. Se extrae una muestra de 50 persona escogidas al azar.

N = 50 tamao de la muestra
x = L 11,800

S = L 950 desviacin estndar de la muestra


Parte del problema es que desconocemos la desviacin estndar de la poblacin.
Es necesario partir de la desviacin estndar de la muestra para estimar la
desviacin estndar de la poblacin as:

^
=s= (xx )2
N1

El valor de L 950 es nuestra estimacin de la desviacin estndar de la poblacin.


El smbolo para representarla es (sigma gorro)
^

Ahora podemos estimare el error estndar de la media. Como tenemos un tamao


de poblacin finita y la muestra constituye ms del 5% de la poblacin,
utilizaremos la frmula para derivar el error estndar de la media de poblaciones
finitas:

x
=
^
n X N N
N1 =
950
50 X 70050
7001 = L 129.57

Como se pide un nivel de confianza de 90%, se busca en la tabla 90/2 = 0.45 y las
desviaciones estndar es 1.64 errores estndar

As podemos calcular los rangos as:

x ^ x
+ 1.64 = 11,800 + 1.64(129.57) = L 12,012.50 LIMITE DE
CONFIANZA SUPERIOR
x - 1.64 ^ x = 11,800 - 1.64(129.57) = L 11,587.50 LIMITE DE CONFIANZA

INFERIR

CALCULO DE ESTIMACIONES DE INTERVALO DE LA PROPORCION A


PARTIR DE MUESTRAS GRANDES
Normalmente se utilizan las muestras para estimar la proporcin de ocurrencia de
un evento en una poblacin. Se puede estimar mediante un procedimiento de
muestreo, el ndice de desempleo, tambin, las dos frmulas para derivar la media
y la desviacin estndar de la distribucin Binomial.

111
Como vimos la Binomial trabaja con datos discretos, no continuos y las frmulas
que utilizamos para encontrar la media y la desviacin estndar de la misma son:

= np

= npq

Donde:
N= nmero de ensayos o intentos
P= probabilidad de xito
Q= probabilidad de falla (1-p)

Tericamente, la distribucin Binomial es la correcta a utilizar en la distribucin de


intervalos de confianza para estimar una proporcin de la poblacin.

Debido a que el clculo Binomial es tedioso, el clculo de intervalos es


complicado. Si tomamos en cuenta que a medida que la muestra aumenta, la
distribucin Binomial se aproxima a una distribucin normal apropiada, que
podemos utilizar para aproximar la distribucin muestral. Los tcnicos
recomiendan que en la estimacin, n sea lo suficientemente grande para que tanto
np como nq sean al menos 5 cuando se utiliza la distribucin normal, como
sustituta de la Binomial.

La proporcin de xito de una muestra podemos expresarla como ^p . Debemos

modificar la frmula para derivar la media de la distribucin de muestreo de la


proporcin de xito. En palabras = np muestra que la media de la distribucin
Binomial es igual al producto del numero de 3ensayos, n, por la probabilidad de
obtener un xito; esto es, np es igual al numero medio de xitos. Para cambiar
este nmero de xitos a la proporcin de xitos, dividimos np entre n y obtenemos
un solo valor de p. La media, que se encuentra al lado izquierdo de la ecuacin se
p
convierte en , es decir, en la media de la distribucin de muestreo de la
proporcin de xito.

p =p

Igual situacin podemos derivar la frmula de la desviacin estndar que podemos


aplicar en la estimacin de intervalos as:

p
= pq
n

112
Si hacemos una investigacin de que los alumnos vengan el viernes a recibir
clases, Tomando una pequea muestra aleatoria de 75 alumnos y encontramos
que el 0.4 de ellos estn interesados en recibir clases los viernes. Los resultados
son:
n = 75 Tamao de la muestra
^p = 0.4 Proporcin de los que vendran los viernes
q^ = 0.6 Proporcin de los que no vendrn

Utilizando un intervalo de confianza de 99%, procedemos a encontrar el error


estndar de la proporcin as:


^
p q^ ( 0.4 ) (0.6)
^ p
= n = 75 = 0.057 error estndar estimado de la proporcin

Con un nivel de confianza de 99%, usando la tabla buscamos la probabilidad 99/2


es igual a 0.495 y localizamos este nmero en la tabla y podemos establecer que
representa 2.58 desviaciones estndar de la media.

As podemos encontrar los intervalos de confianza de este problema:

^p + 2.58 ^ p = 0.4 + 2.58(0.057) = 0.547 LIMITE SUPERIOR DE CONFIANZA

^p - 2.58 ^ p = 0.4 - 2.58(0.057) = 0.253 LIMITE INFERIOR DE CONFIANZA

Podemos decir que con un nivel de confianza de 99% creemos que la proporcin
de la poblacin estudiantil que desea clases el viernes esta entre 0.253 y 0.547.

ESTIMACION DE INTERVALOS CON LA DISTRIBUCION T


Cuando de trabaja con un tamao de muestra menor de 30, en este caso la
distribucin normal no es la adecuada.

Para estos casos existe la distribucin T, pero no solo se requiere que el tamao
de muestra sea 30 o menos, adems se requiere que la desviacin estndar se
desconozca. Adems de lo anterior debemos suponer que la poblacin es normal
o aproximadamente normal.

Grados de Libertad
Se afirma que existe una distribucin t diferente para cada tamao de la muestra,
es decir existe una distribucin t distinta para cada uno de los grados de libertad

Lo que estamos tratando de decir que los grados de libertad es el nmero de


valores que podemos escoger libremente.

113
Si consideramos que a+b, tiene una media de 18, tanto a y b pueden asumir
cualquier valor, siempre y cuando sumen 36/2 = 18

Si sabemos que a = 10, podemos calcular el valor de b as:

10+ b
2 = 18 por lo tanto b = 26

Cuando hay dos elementos en una muestra y conocemos su media muestral,


entonces somos libres de especificar solo uno de los elementos, para que el otro
este supeditado que al sumarlos y dividirlos entre 2 sea igual a la media muestral.
En lenguaje estadstico podemos definir que tenemos 1 grado de libertad.

Si tenemos 7 elementos en la muestra y sabemos que la media de ellos es 16.

En este caso tenemos la libertad de asignar valores a 7-1 = 6, porque el 7mo


elemento depender de los valores que asuma los otros 6, de tal manera que al
sumarlos y dividirlos entre 7, el resultado ser 16.

Podemos definir que los grados de libertad sern gl = n -1

Uso de la tabla de distribucin t


Es la tabla No. 2, difiere de su construccin, difiere en su construccin que la tabla
z. La tabla t es ms compacta y muestra valores de t solo para algunos
porcentajes (10%, 5%, 2% y 1%). Debido a que hay una distribucin t para cada
uno de los grados de libertad, esta sera muy grande y solo comprende los que
ms se utilizan.

La segunda diferencia de la tabla t no se concentra en la probabilidad de que el


parmetro de poblacin que se est estimando se encuentre dentro del intervalo
de confianza. En lugar de ello, mide la probabilidad de que el parmetro de
poblacin que estamos estimando no est dentro de nuestro intervalo de
confianza(es decir la probabilidad que este fuera).

Supongamos que hacemos una estimacin con un nivel de confianza de 90%,


para buscar en la tabla seria 100-90 = 10% que es la probabilidad de error,
denotado con el smbolo .

La tercera situacin es que se debe especificar los grados de libertad que se


manejan.

La UNAH desea estimar los intervalos de consumo de energa y quiere estar con
un 95% seguro que el consumo de energa media, se encuentra dentro de dicho
intervalo. Si utilizamos la distribucin t, porque el tamao de la muestra es menor

114
que 30, no se conoce la desviacin estndar de la poblacin y se considera que la
poblacin es aproximadamente normal. Los datos son:

n= 10 meses Tamao de la muestra


gl = 10-1 = 9 Grados de libertad
x = 11,400 Kw Media de la muestra

s = 700 Kw Desviacin estndar de la muestra

^ = s = 700 KW

Estimacin de la desviacin estndar de la media de la poblacin infinita

^ 700
^ x
= n = 10 = 221.38 KW error estndar estimado de la media de

una poblacin infinita.

Buscando en la tabla 2 en la columna de 0.05 (100%-95%) y en el regln de 9


grados de libertad encontramos que el valor t es 2.262.

Podemos establecer los lmites de confianza as:

x ^ x
+ 2.262 = 11,400 + 2.262(221.38) = 11,901 KW
x ^ x
- 2.262 = 11,400 2.262(221.38) = 10,899 KW

Se puede afirmar un un nivel de confianza de 95% que el consumo medio mensual


de energa esta entre 11,901 y 10,899 KW

TAMAO DE LA MUESTRA EN ESTIMACION


En todos los ejercicios nos hemos referido al tamao de la muestra Qu tan
grande debe ser la muestra? Ni tan pequea ni tan grande en funcin de obtener
un estimado confiable si es muy pequea y muy grande por su costo.

Tamao de la muestra para estimar una media


La UNAH est estimando el ingreso anual de los estudiantes de ltimo ao. Se
sabe por experiencia, que la desviacin estndar de los ingresos anuales de la
poblacin completa (1,000 estudiantes) es alrededor de L 1,500. Que tan grande
debe ser la muestra que debe tomar la universidad con el fin de estimar el ingreso
anual de estudiantes graduados en ao pasado, dentro de ms o menos L 500 y
con un nivel de confianza de 95%.

x
Si z = 500 entonces z = 1.96

115
x
Entonces 1.96 =500

500
x
Y = 1.96 = L 255 error estndar de la poblacin

Si recordamos

x
= n podemos sustituir los valores conocidos

1,500
255 = n

Por lo tanto n = 34.6 alumnos

Por lo tanto el tamao de la muestra debe ser 36 alumnos

Tamao de la muestra para estimar la proporcin


Son muy similares a los empleados para estimar una media de la poblacin.

Se desea cambiar el modelo de evaluacin. Nos gustara tener un tamao de


muestra que nos permita tener una certeza del 90% de que estamos estimando la
proporcin verdadera de la poblacin de 40,000 estudiantes a favor del nuevo
sistema de evaluacin, mas menos 0.02

El primer paso es buscar en la Tabla el valor de z correspondiente al nivel de


confianza de 90%. Este valor es de 1.64 errores estndar a partir de la media.
Queremos que nuestra estimacin este dentro de 0.02

p
Si z = 0.02

Y z = 1.64

p
Entonces 1.64 = 0.02

p
Procedemos a sustituir el valor que se tiene para

1.64 pq
n = 0.02

Encontramos que pq = 0.0001488

116
pq
Entonces n= 0.00014884

Necesitamos encontrar el valor de p y q

Si p = 0.50 y q= 0.5

Podemos encontrar n

( 0.5 ) ( 0.5)
N= 0.00014884 = 1,680 estudiantes Tamao de la muestra

Generalmente cuando no se conoce la proporcin lo ms conservador es 0.5 para


cada uno.

El tamao de la muestra puede variar dependiendo del valor que asuma p

Ejemplo de que p = 0.2

Entonces el tamao de la muestra ser:

( 0.2 ) (0.8)
0.00014884 = 1075 alumnos

Cada vez que p sea menor o mayor de 0.5 el tamao de la muestra ser menor.
Por lo tanto usar 0.5 es donde se obtiene el tamao de muestra mayor.

RESUMEN DE FORMULAS
BINOMIAL
n!
pr q nr Probabilidad de r xitos en n intentos
r ! ( nr ) !

Donde:
r = nmero de xitos deseados
n = nmero de intentos realizados
117
p = probabilidad de tener xito
q = probabilidad de fallar (1-p)

MEDIA DE UNA DISTRIBUCION BINOMIAL


= np

DESVIACION DE UNA DISTRIBUCION BINOMIAL


= npq

PROBABILIDAD QUE UNA VARIABLE ALEATORIA


DEISCRETA SE PRESENTE EN UNA DISTRIBUCION
POISSON

X X E
P(X) = X!

= La probabilidad de tener x ocurrencias

e = 2.71828

PROBABILIDAD DE POISSON COMO UNA APROXIMACION


A LA DISTRIBUCION BINOMIAL
x np
(np) X e
P(x) = x!

ENCONTRAR UNA PROBABILIDAD EN LA TABLA 1


xu
z=

Donde:

118
X = valor de la variable aleatoria en la cual estamos
interesados

u = media de la distribucin de esta variable aleatoria


= desviacin estndar de esta distribucin

Z = nmero de desviaciones estndar desde x hasta la media


de la distribucin

RESUMEN DE FORMULAS PARA LIMITES DE CONFIANZA


EN LA ESTIMACION DE LA MEDIA Y LA PROPORCION

Estimacin de u (La media de la poblacin)

Cuando la (desviacin estndar de la poblacin se


conoce)

Si la poblacin es finita y n/N > 0.05 la frmula que se


aplica es:

Limite Superior = x

+ z n X N n
N 1

Lmite Inferior = x

- z n X N n
N 1

Si la poblacin es infinita o n> 0.05



x
Limite Superior = + z n


x
Limite Superior = - z n

Cuando (la desviacin estndar de la poblacin) se


desconoce

Cuando n (tamao de la muestra) es mayor que 30


119
Si la poblacin es finita

Limite Superior = x
^
+ z n X N n
N 1

Lmite Inferior = x
^
- z n X N n
N 1

Si es infinita
^
x
Limite Superior = + z n

^
x
Lmite Inferior = - z n

Cuando n (tamao de la muestra) es 30 o menos y la


poblacin es normal o aproximadamente normal.
^
x
Lmite Superior = + t n

^
x
Lmite Inferior = - t n

Los gl (grados de libertad es n-1

Estimacin de p (la proporcin de la poblacin) cuando


n (el tamao de la muestra) es mayor de 30

Solo se aplica a poblaciones infinitas

^ p
= pq
n

+ z p
^p ^
Limite Superior =

120
Lmite Inferior = ^p - z p
^

121