Está en la página 1de 80

CENTRO DE ESTUDIOS AVANZADOS DE LAS

AMRICASLICENCIATURA EN NEGOCIOS
Cuatrimestre

INTERNACIONALES

ESTADSTICA Y
PROBABILIDAD

ESTADSTICA Y PROBABILIDAD

ANTOLOGA

Esta reproduccin se realiza para uso interno exclusivo como un apoyo a los profesores y alumnos del Centro de Estudios Avanzados
de las Amricas y no persigue fines de lucro, la compilacin est hecha por personal de la institucin y supervisada por el
representante legal de la misma en estricto apego a la Ley Federal de derechos de autor; por ello, y en apego al ttulo 5, captulo
3, artculos 123, 124, 125, 126, 127 y 128 a la pgina ltima en esta compilacin se menciona para dar crdito al autor original de
la obra as como a la casa editorial que la ha publicado, en concordancia con esta idea se sugiere de manera amplia al lector de esta
antologa y si as lo considera conveniente adquiera la obra original pues esta reproduccin solo tiene un fragmento de la misma

CENTRO DE ESTUDIOS AVANZADOS DE LAS AMRICAS


Ro Tber 12 Col. Cuauhtmoc, Del. Cuauhtmoc c.p. 06500
Mxico D.F. Tel. 52 07 91 01
Mxico, 2008

Tabla de contenido
UNIDAD 1

UNIDAD 6

NOCIONES FUNDAMENTALES DE ESTADSTICA

DISTRIBUCIONES DE PROBABILIDAD

Clasificacin de Estadstica

Discreta
UNIDAD 7
DISTRIBUCIONES DE PROBABILIDAD
Discreta

UNIDAD 2

55

63

ESTADSTICA DESCRIPTIVA
Distribucin de Frecuencias

U N I DAD

UNIDAD 8
DISTRIBUCIN NORMAL.
Continua

MEDIDAS DE TENDENCIA CENTRAL


Estadstica Descriptiva

71

26
UNIDAD 9

UNIDAD 4

TEORA BSICA DEL MUESTREO.

MEDIDAS DE DISPERSIN

Muestreo

Estadstica Descriptiva

78

35
UNIDAD 10

UNIDAD 5

ESTIMACIN E INTERVALOS DE CONFIANZA

PRINCIPIOS DE PROBABILIDAD

Intervalos de confianza

Probabilidad

93

42
BIBLIOGRAFA

101

UNIDAD

1. NOCIONES FUNDAMENTALES
DE ESTADSTICA
Estadstica descriptiva e
inferencial
Concepto de variable
Aplicaciones de la estadstica

ESTADSTICA

Introduccin

La palabra "estadstica" suele utilizarse bajo dos significados distintos, a


saber:
1 Como coleccin de datos numricos.- Esto es el significado ms
vulgar de la palabra estadstica. Se sobrentiende que dichos datos
numricos han de estar presentados de manera ordenada y sistemtica.
Una informacin numrica cualquiera puede no constituir una
estadstica, para merecer este apelativo, los datos han de constituir un
conjunto coherente, establecido de forma sistemtica y siguiendo un
criterio de ordenacin.
Tenemos muchos ejemplos de este tipo de estadsticas. El Anuario
Estadstico publicado por el Instituto Nacional de Estadstica, El Anuario
de Estadsticas del Trabajo,
2 Como ciencia.- La Estadstica es una rama de la matemtica que se
refiere a la recoleccin, estudio e interpretacin de los datos obtenidos
en un estudio. Es aplicable a una amplia variedad de disciplinas, desde
la fsica hasta las ciencias sociales, ciencias de la salud como la
Psicologa y la Medicina, y usada en la toma de decisiones en reas de
negocios e instituciones gubernamentales.
En este significado, La Estadstica estudia el comportamiento de los
fenmenos de masas. Como todas las ciencias, busca las caractersticas
generales de un colectivo y prescinde de las particulares de cada
elemento. As por ejemplo al investigar el sexo de los nacimientos,
iniciaremos el trabajo tomando un grupo numeroso de nacimientos para
obtener despus la proporcin de varones. Es muy frecuente
enfrentarnos con fenmenos en los que es muy difcil predecir el
resultado; por ejemplo, no podemos dar una lista de las personas que
van a morir a una cierta edad, o el sexo de un nuevo ser hasta que
transcurra un determinado tiempo de embarazo,
Por lo tanto, el objetivo de la Estadstica es hallar las regularidades que
se encuentran en los fenmenos de masa.
La Estadstica cuenta con procedimientos para recoger, organizar y
presentar informacin acerca de un problema determinado, y con
mtodos para establecer la validez de las conclusiones obtenidas a
partir de la informacin recogida.
CLASIFICACIN DE LA ESTADISTICA
La Estadstica se clasifica en: Estadstica descriptiva y Estadstica
Inferencial.
La Estadstica descriptiva, se encarga de los mtodos de recoleccin,
descripcin, visualizacin y resumen de datos originados a partir de los
fenmenos en estudio. Los datos pueden ser resumidos numrica o

grficamente. Ejemplos bsicos de descriptores numricos son: la media


y la desviacin estndar. Resmenes grficos incluyen varios tipos de
figuras y grficos.
La Estadstica descriptiva presenta la informacin en forma cmoda,
utilizable y comprensible.
La Estadstica Inferencial se dedica a la generacin de los modelos,
deducciones y predicciones asociadas a los fenmenos en cuestin
teniendo en cuenta lo aleatorio e incertidumbre en las observaciones. Se
usa para modelar patrones en los datos y extraer inferencias acerca de
la poblacin de estudio, es decir, se ocupa de la generalizacin de esa
informacin haciendo deducciones acerca de las poblaciones.
POBLACIN Y DATOS.
Al aplicar estadstica a un problema cientfico, industrial o social, se
comienza con un proceso o poblacin a ser estudiado. Esta puede ser
una poblacin de personas en un pas, de granos cristalizados en una
roca o de bienes manufacturados por una fbrica en particular durante
un periodo dado. Tambin podra ser un proceso observado en varios
instantes y los datos recogidos de esta manera constituyen una serie de
tiempo.
Por razones prcticas, en lugar de compilar datos de una poblacin
entera, usualmente se estudia un subconjunto seleccionado de la
poblacin, llamado muestra. Datos acerca de la muestra son recogidos
de manera observacional o experimental. Los datos son entonces
analizados estadsticamente lo cual sigue dos propsitos: descripcin e
inferencia.
La poblacin puede ser segn su tamao de dos tipos:
Poblacin finita: cuando el nmero de elementos que la forman es finito,
por ejemplo el nmero de alumnos de un centro de enseanza, o grupo
clase.
Poblacin infinita: cuando el nmero de elementos que la forman es
infinito, o tan grande que pudiesen considerarse infinitos. Como por
ejemplo si se realizase un estudio sobre los productos que hay en el
mercado. Hay tantos y de tantas calidades que esta poblacin podra
considerarse infinita.
CLASIFICACIN DE VARIABLES
Los datos pueden ser de muy diversos tipos, por lo que los podemos
clasificar en dos grandes clases:
Variables Cuantitativas.
Variables Cualitativas, Atributos o nominales.
Las variables cuantitativas son las que se describen por medio de
nmeros, como por ejemplo el peso, Altura, Edad, Nmero de Alumnos
A su vez este tipo de variables se puede dividir en dos subclases:

Cuantitativas discretas. Aquellas a las que se les puede asociar un


nmero entero, es decir, aquellas que por su naturaleza no admiten un
fraccionamiento de la unidad, por ejemplo nmero de hermanos,
pginas de un libro, etc.
Cuantitativas continuas: Aquellas que no se pueden expresar mediante
un nmero entero, es decir, aquellas que por su naturaleza admiten que
entre dos valores cualesquiera la variable pueda tomar cualquier valor
intermedio, por ejemplo peso, tiempo. etc.
No obstante en muchos casos el tratamiento estadstico hace que a
variables discretas las trabajemos como si fuesen continuas y viceversa.
Los atributos son aquellos caracteres que para su definicin precisan de
palabras, es decir, no le podemos asignar un nmero. Por ejemplo Sexo
Profesin, Estado Civil, etc.
NIVELES DE MEDICIN
Hay cuatro tipos de mediciones o escalas de medicin en estadstica.
Los cuatro tipos de niveles de medicin (nominal, ordinal, intervalo y
razn) tienen diferentes grados de uso en la investigacin estadstica.
Las medidas de razn, en donde un valor cero y distancias entre
diferentes mediciones son definidas, dan la mayor flexibilidad en
mtodos estadsticos que pueden ser usados para analizar los datos. Las
medidas de intervalo tienen distancias interpretables entre mediciones,
pero un valor cero sin significado (como las mediciones de coeficiente
intelectual o temperatura en grados Celsius). Las medidas ordinales
tienen imprecisas diferencias entre valores consecutivos, pero un orden
interpretable para sus valores. Las medidas nominales no tienen ningn
rango interpretable entre sus valores.
La escala de medida nominal, puede considerarse la escala de nivel ms
bajo. Se trata de agrupar objetos en clases. La escala ordinal, por su
parte, recurre a la propiedad de orden de los nmeros. La escala de
intervalos iguales est caracterizada por una unidad de medida comn y
constante. Es importante destacar que el punto cero en las escalas de
intervalos iguales es arbitrario, y no refleja en ningn momento ausencia
de la magnitud que estamos midiendo. Esta escala, adems de poseer
las caractersticas de la escala ordinal, permite determinar la magnitud
de los intervalos (distancia) entre todos los elementos de la escala. La
escala de coeficientes o Razones es el nivel de medida ms elevado y se
diferencia de las escalas de intervalos iguales nicamente por poseer un
punto cero propio como origen; es decir que el valor cero de esta escala
significa ausencia de la magnitud que estamos midiendo. Si se observa
una carencia total de propiedad, se dispone de una unidad de medida
para el efecto. A iguales diferencias entre los nmeros asignados
corresponden iguales diferencias en el grado de atributo presente en el
objeto de estudio.

APLICACIONES
En la actualidad, Mxico se encuentra en un proceso de apertura e
internacionalizacin, por tal motivo es de suma importancia estar
inmerso a travs de diferentes tratados comerciales con diferentes
pases, creando con esto nuevas oportunidades de negocios. La
Estadstica es una rama de la ciencia en pleno desarrollo y cuya
aplicacin en todos los mbitos de la sociedad ampla las posibilidades
de integracin en el mundo laboral. La Estadstica en los negocios ha
tenido crecientes, continuas e innovadoras aplicaciones de sus mtodos
en esta rea y una constante investigacin en Estadstica se lleva a cabo
a partir de problemas que surgen en diversas reas de los Negocios
como Investigacin de Mercados, Finanzas, Administracin de Riesgos,
entre otras.
En los negocios y la industria la Estadstica esta presente, por ejemplo,
en la fabricacin de productos ayudando a incrementar la satisfaccin de
los clientes aplicando tcnicas de control de calidad y mejorando los
procesos de produccin, de bienes y servicios o el sustento de toma de
decisiones en las empresas de los ms diversos giros. En el rea de
Mercadotecnia permite el diseo de experimentos para determinar la
viabilidad de los productos en el mercado, y predice la respuesta de los
consumidores ante su venta. En el rea de Economa, se ha logrado el
desarrollo de indicadores e ndices economtricos. Estudios de
comportamiento de mercado, de la bolsa y anlisis de inversiones.
Empleo de estadstica actuarial de riesgos y seguros. En consultora
trabajando en proyectos con las ms importantes empresas del pas en
diferentes reas. En Ingeniera utilizando tcnicas de optimizacin que
minimicen costos de produccin y maximicen la eficiencia, detectando
posibles problemas de fabricacin.

UNIDAD

2.

ESTADSTICA DESCRIPTIVA
Distribucin de frecuencias
Representaciones grficas

Para estudiar el comportamiento de un fenmeno se requiere


informacin y Cmo recopilarla?
1)
Por medio de encuestas (interrogatorio oral o escrito que se aplica
a varias personas acerca del problema).
2)
Por medio del registro de las observaciones que se hacen de l.
DISTRIBUCIN DE FRECUENCIAS

DESCRIPCIN DE
LOS DATOS
La informacin obtenida debe presentarse en forma organizada. Cmo?
Se puede utilizar una distribucin de frecuencias (o tambin llamada
tabla de frecuencias), en donde se asocia a cada dato o subgrupo de
datos (llamado intervalo de clase o clase) una frecuencia (nmero de
observaciones que corresponden a cada dato o a cada grupo de datos).
La presentacin de los datos puede hacerse en forma ordenada, si son
datos:
Cualitativos

Cuantitativos

- Forma
mayor).

- Orden alfabtico
- Escribir, primero el que
ms se repite, luego el que
sigue y as sucesivamente.

creciente

(menor

al

- Forma decreciente (mayor al


menor)

EJEMPLO:
A) Se pregunt a un grupo de alumnos de Ingeniera Industrial su
materia preferida.
Distribucin de frecuencia
Respuestas obtenidas
datos
frecuencia
Administracin

Ingeniera Econmica

Ingeniera Industrial
Investigacin
operaciones.

11
de

Matemticas

12

Probabilidad y Estadstica

10

Total

50

N=

Observaste que los datos se colocaron en orden alfabtico?


B)
Se pregunt a un grupo de alumnos su estatura en centmetros.

Distribucin de frecuencia
Respuestas obtenidas

datos

152

163

154

170

164

154

166

151

163

162

168

168

172

170

160

152

161

158

165

165

151

161

157

154

160

155

158

158

170

169

168

155

155

156

162

162

166

168

160

156

157

158

160

161

162

163

164

165

166

168

169

170

172

Tot N = 35

Observaste que los datos al ser cuantitativos se ordenaron en forma


creciente?
Pero, cundo los datos son cuantitativos y se presentan ms de 15
valores diferentes, se recomienda resumir la informacin? Y cmo?
Acomodndolos en grupos (llamados clases o intervalos de clase).

Grupos
(clases)

Frecuencia

151-155

156-160

161-165

166-170

11

171-175

N=

Los grupos deben formarse


de igual tamao.
(tamao de clase : c)
El total de grupos o clases
no deben ser menor a 5 ni
mayor a 15

35

10

A los lmites extremos de cada clase se les llama lmite Inferior y lmite
superior de clase respectivamente. En la clase 151, ese es el lmite
inferior y 155 es el lmite superior.
Marca de clase es el punto medio de cada clase y se obtiene sumando
los lmites de clase y dividindolos entre dos.
El tamao o anchura de clase es la diferencia entre los lmites de clase.
Por ejemplo:
En la distribucin de frecuencias anterior se tiene:

Clases
LI LS

Marcas de
Clase X

151-155

153

156-160

158

161-165

163

166-170

11

168

171-175

173

Tamao
de Clase
c=4

N=35
Pero, cmo se calcula el tamao de clase? Cmo saber cuntas clases
se deben manejar?
Para determinar el nmero de clases ptimo, existe una regla que
sugiere utilizar como el nmero de clases el menor nmero (k) tal que k 2
sea mayor que el nmero de observaciones.
En el ejemplo anterior hay 35 observaciones (N=35).
Dos elevado a la quinta potencia es 32.
Entonces debemos tener al menos 5 clases. Eventualmente utilizaramos
6.
Para determinar el tamao, intervalo o amplitud de clase, que
generalmente debe ser el mismo, y deben cubrir al valor menor y al
mayor, se recomienda el uso la siguiente expresin:

11

H L
k

En donde H es el valor mayor observado, L es el menor y k es el nmero


de clases.
Para el ejemplo anterior: H= 172, L= 151 y k=5, entonces tenemos:

172 151
4.2
5

En el ejemplo se us 4. Si en lugar de 4.2 se hubiese tenido 4.5 o ms se


hubiera redondeado a 5.
Tambin se pueden hallar:
Frecuencias acumuladas.- la suma de cada frecuencia con la frecuencia
de la clase contigua superior.
Frecuencias relativas.- Dividiendo cada frecuencia entre el nmero total
de observaciones y multiplicndolas por l00 para tenerlas en forma de
porcentaje.
Frecuencias relativas acumuladas.- La suma de cada frecuencia relativa
con la frecuencia relativa de la clase contigua superior. Tambin se
pueden obtener dividiendo cada frecuencia acumulada entre el total de
frecuencias por l00.

Entonces en nuestro ejemplo tenemos:

Clases

frecuenc
ia

Frecuenci
a
acumulad
a

151-155

12

Frecuencia
relativa (%)

Frecuencia
relativa
acumulada
(%)

(6/35)100=

(6/35)100=

17.1

17.1

156-160

14

(8/35)100=
22.9

(14/35)100=
40

161-165

23

(9/35)100=
25.7

(23/35)100=
65.7

166-170

11

34

(11/35)100=
31.4

(34/35)100=
97.1

171-175

35

(1/35)100= 2.9

(35/35)100=
100

Y para qu nos sirven estas frecuencias?


Para contestar preguntas tales como:
1) Cuntos alumnos tienen estatura entre 156 y 160 centmetros?
R = Se busca en la columna de frecuencia y la respuesta es 8.
2) Cuntos alumnos tienen estatura de l65 o menos?
R = Se busca en la columna de frecuencia acumulada y la respuesta
es 23.
3) Qu porcentaje de alumnos tienen estatura entre 166 y 170
centmetros?
R = Se busca en la columna de frecuencia relativa y la respuesta es
31.4%.
4) Qu porcentaje de alumnos tienen estatura menor o igual que l60?
R = Se busca en la columna de frecuencia relativa acumulada y la
respuesta es 40%.
PRESENTACIN DE LA INFORMACIN A TRAVS DE GRFICAS.
En dos grupos de una escuela se realiz un examen de matemticas y
los resultados se presentaron de la manera siguiente:
Reporte de calificaciones del Grupo1
Calificacin

Frecuencia

13

14

10

Total

40

Reporte de calificaciones del Grupo2

Cul de los dos reportes te pareci mejor y porqu?


Realmente se observa mejor la grfica, llama ms la atencin y se
puede interpretar mejor y ms rpido. Es por ello que se utilizan las
grficas para la representacin de la informacin. Existen una serie de
grficas como son:
-DIAGRAMA DE BARRAS GRFICA DE BARRAS.
-HISTOGRAMA.
-POLGONO DE FRECUENCIAS.
14

-GRFICA CIRCULAR O GRFICA DE PASTEL.


-PICTOGRAMA.
-OJIVA POLGONO DE FRECUENCIAS ACUMULADAS.
-OJIVA PORCENTUAL POLGONO DE FRECUENCIAS RELATIVAS
ACUMULADAS.

DIAGRAMA DE BARRAS
Se utilizan rectngulos separados, que tienen como base a cada uno de
los datos y como altura la frecuencia de ese dato.
Ejemplo: En la siguiente tabla se muestra el total de vacunas aplicadas
durante el verano de l991 en un estado de la Repblica Mexicana.

Datos
(vacunas)
BCG

frecuencia
(en miles)

Frecuencia
relativa
(%)
(redondeado)

47

17

111

41

DPT

73

27

SARAMPION

41

15

272

100

SABIN

TOTAL

15

El diagrama de barras o grfica de barras suele elaborarse con algunas


variantes; por ejemplo, se pueden utilizar lneas en vez de rectngulos
barras, lneas horizontales en vez de verticales.
Si se tienen datos cuantitativos se grafica en el eje de las x los valores
centrales (marcas de clase), cuyas alturas son proporcionales a sus
frecuencias. As en la distribucin de frecuencias de las alturas de 35
alumnos se tiene:

HISTOGRAMA.
Se utiliza para datos cuantitativos representados en distribuciones de
frecuencia. La grfica son rectngulos verticales unidos entre s, en
16

donde sus lados son los lmites reales inferior y superior de clase y cuya
altura es igual ala frecuencia de clase.
Con la distribucin de frecuencia anterior se tiene:

POLGONO DE FRECUENCIAS:
Consiste en una serie de segmentos que unen los puntos cuyas abscisas
(valores de x) son los valores centrales de cada clase y cuyas ordenadas
(valores de y) son proporcionales a sus frecuencias respectivas.

17

GRFICA CIRCULAR:
Se forma al dividir un crculo en sectores circulares de manera que:
a)
Cada sector circular equivale al porcentaje
correspondiente al dato o grupo que representa.
b)
La unin de los sectores circulares forma el crculo y la
suma de sus porcentajes es 100.

Datos
(vacunas)
BCG

Frecuencia
en miles

Frecuencia
relativa(%)

Grados
(redondeados
)

47

17

.17 x 360 = 61

111

41

.41 x
148

DPT

73

27

.27 x 360 = 97

SARAMPION

41

15

.15 x 360 =54

SABIN

18

360

TOTAL

272

100

360

PICTOGRAMA:
Se utiliza un dibujo relacionado con el tema, para representar cierta
cantidad de frecuencias.
Este tipo de grfica atrae la atencin por los dibujos, pero la desventaja
es que se lee en forma aproximada.
Ejemplo:
En una biblioteca de una escuela se tienen los siguientes libros:
Libros

frecuencia

Biologa

25

Matemticas

30

Fsica

43

19

Qumica

20

Filosofa

10

Total

128

OJIVA O POLGONO DE FRECUENCIAS ACUMULADAS:


Una grfica de distribucin de frecuencias acumuladas es llamada una
ojiva. Se trazan los lmites reales inferiores (lmite inferior menos 0.5)
contra las frecuencias acumuladas.

OJIVA PORCENTUAL POLGONO DE FRECUENCIAS RELATIVAS


ACUMULADAS.
Se trazan los lmites reales superiores contra las frecuencias relativas
acumuladas.

20

UNIDAD

3. Medidas de tendencia

central
Media
Mediana
Moda

MEDIDAS DE TENDENCIA CENTRAL


Al describir grupos de observaciones, con frecuencia se desea describir
el grupo con un solo nmero. Para tal fin, desde luego, no se usar el
valor ms elevado ni el valor ms pequeo como nico representante,
ya que solo representan los extremos ms bien que valores tpicos.
Entonces sera ms adecuado buscar un valor central. Las medidas que
describen un valor tpico en un grupo de observaciones suelen llamarse
medidas de tendencia central. Es importante tener en cuenta que estas

21

medidas se aplican a grupos ms bien que a individuos. Un promedio es


una caracterstica de grupo, no individual.
Entre las medidas de tendencia central tenemos: La media, la mediana,
la moda y los percentiles.
MEDIA
La medida de tendencia central mas ampliamente usada es la media
aritmtica, usualmente abreviada como media promedio.
La media aritmtica de un conjunto de n valores es el resultado de la
suma de todos ellos dividido entre n.
Propiedades de la media aritmtica
1. Puede ser calculada en distribuciones con escala de razn y de
intervalo.
2. Todos los valores son incluidos en el cmputo de la media.
3. Una serie de datos solo tiene una media.
4. Es una medida muy til para comparar dos o ms poblaciones.
5. Es la nica medida de tendencia central donde la suma de las
desviaciones de cada valor respecto a la media es igual a cero. Por lo
tanto podemos considerar a la media como el punto de balance de una
serie de datos.
Desventajas de la media aritmtica
1. Si alguno de los valores es extremadamente grande o
extremadamente pequeo, la media no es el promedio apropiado para
representar la serie de datos.
2. No se puede determinar si en una distribucin de frecuencias hay
intervalos de clase abiertos.
Las siguiente expresin es til para el clculo de la media con datos
agrupados (tablas de frecuencia) y datos no agrupados.

xi representa el valor de la variable o en su


caso la marca de clase.
Ejemplo 1: La familia Castro es propietaria de cuatro autos. Los
siguientes datos corresponden al kilometraje de cada uno de ellos:
56,000 23,000 42,000 73,000
Encuentre la media aritmtica del kilometraje de los autos:
= (56,000 + + 73,000)/4 = 48,500
El ejemplo anterior es con datos no agrupados. Para calcular la media se
han utilizado todos los datos, por esta razn se representa a la media
con la letra . En caso de trabajar con una muestra de los datos se
representar la media con x .
Ejemplo 2: La siguiente tabla muestra los resultados de una muestra de
10 cines en una gran rea metropolitana, que cont el nmero total de

22

pelculas en exhibicin la ltima semana. Calcule el nmero medio de


pelculas en exhibicin.

Pelculas
cartelera

en

Frecuencia (f)

Marca de clase (X)

(f)(X)

13

46

10

79

24

10 12

11

11

13 15

14

42

Total

fX 89
X

8.9
n
10

f x= 89

10

El anterior es un ejemplo con datos agrupados (distribucin de frecuencia)


Otros mtodos para calcular la media son:
Media geomtrica:
La media geomtrica de N observaciones es la raz de ndice N del
producto de todas las observaciones. La representaremos por G.

Solo se puede calcular si no hay observaciones negativas. Es una


medida estadstica poco o nada usual.
Media armnica:
La media armnica de N observaciones es la inversa de la media de las
inversas de las observaciones y la denotaremos por H

23

Al igual que en el caso de la media geomtrica su utilizacin es bastante


poco frecuente.
MEDIANA
La mediana es el valor central de la variable, es decir, supuesta la
muestra ordenada en orden creciente o decreciente, el valor que divide
en dos partes la muestra.
Para calcular la mediana debemos tener en cuenta si la variable es
discreta o continua.
Clculo de la mediana en el caso discreto:
Tendremos en cuenta el tamao de la muestra.
Si N es Impar hay un trmino central el trmino,
la mediana.
Si N es Par, hay dos trminos centrales,
media de esos dos valores

x n x n+2
,
2 2

x n +1
2

ser el valor de

la mediana ser la

Veamos un ejemplo.

N par

N Impar

1,4,6,7,8,9,12,16,20, 24,25,27 N=12


x n 12
x
14
= =6, n+2 = =7
2
2
2
2

1,4,6,7,8,9,12,16,20,
N=13
x n +1 14
= =7
2
2

Trminos Centrales el 6 y 7= 9 y 12

Trminos Centrales el 7 =12

Me =

9+12
=10.5
2

24,25,27,30

Me=12

Clculo de la mediana en el caso continuo:


Si la variable es continua, la tabla vendr en intervalos, por lo que se
calcula de la siguiente forma:

24

Nos vamos a apoyar en un grfico de un histograma de frecuencias


acumuladas.

De donde la mediana vale:


N
f acumulada antesde l a clase mediana
2
Me=Linferior +
(c )
f clase mediana
c es la amplitud del intervalo
Vemoslo por medio de un ejemplo.
Supongamos los pesos de un grupo de 50 personas se distribuyen de la
siguiente forma:

Intervalo de clase

Frecuencia

Frecuencia acumulada

45 hasta 55

55 hasta 65

10

16

65 hasta 75

19

35 >25

75 hasta 85

11

46

85 hasta 95

50
N=50

25

Como el tamao de la muestra es N=50, buscamos el intervalo en el que


la Frecuencia acumulada es mayor que 50/2=25, que en este caso es el
3 y aplicamos la frmula anterior.
Linferior =65
f acumuladaantes dela clase mediana=16
f acumuladade laclase mediana =19
c = 75 65 = 10
Luego la Mediana ser
50
16
2
Me=65+
( 10 )=69.74
19
MODA
MODA.- La moda es el valor de la variable que tenga mayor frecuencia
absoluta, la que ms se repite, es la nica medida de centralizacin que
tiene sentido estudiar para una variable cualitativa, pues no precisa la
realizacin de ningn clculo.
Por su propia definicin, la moda no es nica, pues puede haber dos o
ms valores de la variable que tengan la misma frecuencia siendo esta
mxima. En cuyo caso tendremos una distribucin bimodal o polimodal
segn el caso.
Ejemplo 5: Las calificaciones de 10 estudiantes son: 81, 93, 84, 75, 68,
87, 81, 75, 81, 87
Dado que 81 es el dato que aparece con ms frecuencia, ste es la
moda.
Cuando se desea hacer el clculo de la moda para distribuciones
cuantitativas continuas tendremos que:

26

Apoyndonos en el grfico podemos llegar a la determinacin de una


expresin para la Moda que es:
Mo=Lclase modal +

f clase modalf intervalo superior a la clase modal


(fclase modal f
)( fclasemodal f
intervalo superior ala clasemodal

intervaloinferior a la clase modal

(c )

Veamos su clculo mediante un ejemplo, para ello usaremos los datos


del apartado anterior

Intervalo de clase

Frecuencia

Frecuencia acumulada

45 hasta 55

55 hasta 65

10

16

65 hasta 75

19

35

75 hasta 85

11

46

85 hasta 95

50
N=50

Lclase modal=65
f clase modal=19
f intervalo superior ala clase modal =10
f intervalo inferior a la clase modal=11
c = 75 65 = 10
Mo=65+

1910
( 10 )=70.29
( 1910 ) (1911)

27

UNIDAD

4. Principales medidas de

dispersin
Rango
Desviacin media
Varianza
Desviacin estndar

MEDIDAS DE DISPERSIN
Hasta el momento hemos estudiado los valores centrales de la
distribucin, pero tambin es importante conocer si los valores en
general estn cerca o alejados de estos valores centrales, es por lo que
surge la necesidad de estudiar medidas de dispersin.

28

RANGO
Se define como la diferencia existente entre el valor mayor y el menor
de la distribucin. Lo notaremos como R. Realmente no es una medida
muy significativa en la mayora de los casos, pero indudablemente es
muy fcil de calcular. Rango.- Dato mayor menos dato menor.
DESVIACIN
Desviacin: Es la diferencia que se observa entre el valor de la variable y
la media aritmtica. La denotaremos por di .
No es una medida, son muchas medidas, pues cada valor de la variable
lleva asociada su correspondiente desviacin, por lo que precisaremos
una medida que resuma dicha informacin.
La primera solucin puede ser calcular la media de todas las
desviaciones, es decir, si consideramos como muestra la de todas las
desviaciones y calculamos su media. Pero esta solucin no es la
adecuada ya que siempre el resultado da cero, pues las desviaciones
positivas se contrarrestan con las negativas.

Para resolver este problema, tenemos dos caminos:


Tomar el valor absoluto de las desviaciones. Desviacin media
Elevar al cuadrado las desviaciones. Varianza.
DESVIACIN MEDIA
Es la media de los valores absolutos de las desviaciones, y la
denotaremos por dm.

Ejemplo: Los pesos de una muestra de canastas con libros en una


librera (en libras) son:
103, 97, 101, 106, 103
Encuentre el rango y la desviacin media.
Rango = 106 97 = 9
Para la desviacin media el primer paso es encontrar la media:

29

X 510

102
n
5

La desviacin media es:

MD

X X

103 102 ... 103 102

n
1 5 1 4 5

2.4
5

VARIANZA
Es la media de los cuadrados de las desviaciones, y la denotaremos por
o tambin por

Aunque tambin es posible calcularlo como:

Este estadstico tiene el inconveniente de ser poco significativo, pues se


mide en el cuadrado de la unidad de la variable, por ejemplo, si la
variable viene dada en cm. La varianza vendr en cm2.
Ejemplo:
Las edades de la familia Gonzlez son:
2, 18, 34, 42
Cul es la varianza poblacional?

X 96
24
n 4
( X ) 2 2 24 2 ... 42 24 2

N
4
944

236
4

30

DESVIACIN TPICA
Es la raz cuadrada de la varianza, se denota por Sx o

x.

Este estadstico se mide en la misma unidad que la variable por lo que


se puede interpretar mejor.
Ejemplo:
Calcule la desviacin estndar o tpica del ejemplo anterior:

2 236 15 .36
La frmula para la varianza muestral para datos agrupados es:
(fX ) 2
2

fX

n 1

donde f es la frecuencia de clase y X es la marca de clase.


Ejemplo: Obtn la varianza y la desviacin estndar de la siguiente
tabla:
Pelculas
en
cartelera

Frecuenc
ia

Frecuenc Marca f x
ia
de clase
acumula (x)
da

( fx )
n

13

1(2)2=4

(1x2)=2

46

2(5)2=50

(2x5)=10

79

3(8)2=192

(3x8)=24

10 12

11

1(11)2=121

(1x11)=11

31

13 15

s2

fX

Total

3
2

10

10

(fX )
n
n 1

14

3(14)2=588

(3x14)=42

955

(89)2/10=792.1

955 792 .1
18 .1
10 1

Varianza:
Desviacin estndar:
s= 18.1=4.25
INTERPRETACIN Y USOS DE LA DESVIACIN ESTNDAR
Regla emprica: Se aplica solamente en una distribucin de frecuencias
simtrica, con forma de campana:
Aproximadamente 68% de las observaciones estarn entre ms
una y menos una s desde la media;
Aproximadamente 95% de las observaciones se encontrarn entre
ms dos y menos dos s desde la media;
Prcticamente todas las observaciones se hallarn entre ms tres
y menos tres s a partir del valor medio.
COEFICIENTE DE VARIACIN
Es un estadstico de dispersin que tiene la ventaja de que no lleva
asociada ninguna unidad, por lo que nos permitir decir entre dos
muestras, cual es la que presenta mayor dispersin. La denotaremos por
C.V.

Ejemplo:
Un estudio sobre los bonos pagados y los aos de servicio de varios
empleados se muestra en la siguiente tabla:

Bonos pagados

32

Aos de servicio

Media

$200.00

20 aos

Desviacin estndar

$40.00

2 aos

Coeficiente de variacin

CV

40
(100 ) 20 %
200

CV

2
(100 ) 10 %
20

UNIDAD

PRINCIPIOS DE
PROBABILIDAD
Introduccin
Probabilidad clsica de frecuencia
relativa y subjetiva
Reglas para el clculo de
probabilidades
5.

33

PROBABILIDAD

Introduccin
Muchos de los eventos que ocurren en la vida diaria no pueden ser
predichos con exactitud desde antes por diversas razones, pues la
mayora de los hechos estn influidos por factores externos. Adems,
existen aquellos sucesos que estn directamente influidos por el azar, es
decir, por procesos en los que no se est seguro de lo que va a ocurrir.
Sin embargo, la probabilidad nos permite acercarnos a esos sucesos y
estudiarlos, ponderando las posibilidades de su ocurrencia y
proporcionando mtodos para tales ponderaciones.
Precisamente, algunos de esos mtodos proporcionados por la
probabilidad nos llevan a descubrir que algunos sucesos tienen una
mayor o menor probabilidad de ocurrir que la ponderacin asignada a
travs del sentido comn. Nuestros sentidos, la informacin previa que
poseemos, nuestras creencias o posturas, nuestras inclinaciones, son
algunos de los factores que intervienen para no permitirnos hacer
ponderaciones reales y sistemticas. La probabilidad nos permitir
estudiar los eventos de una manera sistemtica y ms cercana a la
realidad, retribuyndonos con informacin ms precisa y confiable y, por
tanto, ms til para las disciplinas humanas.
EVENTOS
Cuando se realiza un experimento, que es cualquier proceso que
produce un resultado o una observacin, se van a obtener un conjunto
de valores. A este conjunto de valores que puede tomar una variable se
le denomina espacio muestral.
Por ejemplo: Si se tiene un dado cualquiera, el espacio muestral (EM) es
EM = {1,2,3,4,5,6}.
Si existen ms de una variable, el espacio muestral est formado por las
combinaciones de valores de cada una de las variables.
Si tomamos un subconjunto cualquiera del espacio muestral tenemos lo
que se denomina un evento, y si ste consta de un solo elemento
entonces es un evento elemental.
34

Como se puede uno imaginar, existen eventos que siempre, no importa


el nmero de experimentos o su situacin, ocurren, y en cambio existen
otros que nunca ocurren. Los que siempre ocurren son los eventos
seguros, y los que nunca son los eventos imposibles.
Sin embargo, no todos los resultados son al azar, pues si un experimento
es cualquier proceso entonces los resultados pueden tomar cualquier
tipo de valor. Por esta razn, se define como experimento aleatorio al
proceso en el que no se pueden predecir con certeza la ocurrencia de
sus eventos, con excepcin del seguro o del imposible. Hay que hacer la
observacin que esta definicin habla en trminos generales y no
especficamente sobre algn experimento en particular.
A aqulla variable que est asociada a un experimento de este tipo se le
denomina variable aleatoria.
En cambio, a un experimento no aleatorio se le denomina experimento
determinstico.
DEFINICIN DE PROBABILIDAD
A travs de la historia se han desarrollado tres enfoques conceptuales
diferentes para definir la probabilidad y determinar los valores de
probabilidad:
El enfoque clsico
Dice que si hay x posibles resultados favorables a la ocurrencia de un
evento A y z posibles resultados desfavorables a la ocurrencia de A, y
todos los resultados son igualmente posibles y mutuamente excluyente
(no pueden ocurrir los dos al mismo tiempo), entonces la probabilidad de
que ocurra A es:
nmero de resultados asociados con el evento A
P(A)=
nmero total de resutlados posibles
El enfoque clsico de la probabilidad se basa en la suposicin de que
cada resultado sea igualmente posible.
Este enfoque es llamado enfoque a priori porque permite, (en caso de
que pueda aplicarse) calcular el valor de probabilidad antes de observar
cualquier evento de muestra.
Ejemplo:
Si tenemos en una caja 15 piedras verdes y 9 piedras rojas. La
probabilidad de sacar una piedra roja en un intento es:
El enfoque de frecuencia relativa
Tambin llamado Enfoque Emprico, determina la probabilidad sobre la
base de la proporcin de veces que ocurre un evento favorable en un
nmero de observaciones. En este enfoque no ese utiliza la suposicin
previa de aleatoriedad. Porque la determinacin de los valores de
probabilidad se basa en la observacin y recopilacin de datos.
Ejemplo:

35

Se ha observado que 9 de cada 50 vehculos que pasan por una esquina


no tienen cinturn de seguridad. Si un vigilante de transito se para en
esa misma esquina un da cualquiera Cul ser la probabilidad de que
detenga un vehculo sin cinturn de seguridad?
La probabilidad es de 9/50=0.18
Tanto el enfoque clsico como el enfoque emprico conducen a valores
objetivos de probabilidad, en el sentido de que los valores de
probabilidad indican a largo plazo la tasa relativa de ocurrencia del
evento.
El enfoque subjetivo
Dice que la probabilidad de ocurrencia de un evento es el grado de
creencia por parte de un individuo de que un evento ocurra, basado en
toda la evidencia a su disposicin. Bajo esta premisa se puede decir que
este enfoque es adecuado cuando slo hay una oportunidad de
ocurrencia del evento. Es decir, que el evento ocurrir o no ocurrir esa
sola vez. El valor de probabilidad bajo este enfoque es un juicio
personal.
Concepto de Probabilidad
Se define como clculo de probabilidad al conjunto de reglas que
permiten determinar si un fenmeno ha de producirse, fundando la
suposicin en el clculo, las estadsticas o la teora.
EL VALOR DE LA PROBABILIDAD
El valor ms pequeo que puede tener la probabilidad de ocurrencia de
un evento es igual a 0, el cual indica que el evento es imposible, y el
valor mayor es 1, que indica que el evento ciertamente ocurrir.
EVENTOS
MUTUAMENTE
EXCLUYENTES

EXCLUYENTES

EVENTOS

NO

Dos o ms eventos son mutuamente excluyentes o disjuntos, si no


pueden ocurrir simultneamente. Es decir, la ocurrencia de un evento
impide automticamente la ocurrencia del otro evento (o eventos).
Ejemplo:
Al lanzar una moneda solo puede ocurrir que salga cara o sello pero no
los dos a la vez, esto quiere decir que estos eventos son excluyentes.
Dos o ms eventos son no excluyentes, o conjuntos, cuando es posible
que ocurran ambos. Esto no indica que necesariamente deban ocurrir
estos eventos en forma simultnea.
Ejemplo:
Si consideramos en un juego de domino sacar al menos un blanco y un
seis, estos eventos son no excluyentes porque puede ocurrir que salga el
seis blanco.
REGLAS DE LA ADICIN

36

Las reglas de la Adicin expresan que la probabilidad de ocurrencia de al


menos dos sucesos A y B es igual a:
P(A o B) = P(A) U P(B) = P(A) + P(B) si A y B son mutuamente excluyente
P(A o B) = P(A) + P(B) P(A y B) si A y B son no excluyentes
Siendo: P(A) = probabilidad de ocurrencia del evento A
P(B) = probabilidad de ocurrencia del evento B
P(A y B) = probabilidad de ocurrencia simultanea de los eventos A y B
Ejemplos:
1. Eventos mutuamente excluyentes: Una mquina automtica tiene
bolsas de plstico que contienen frijoles, brcoli y otras verduras.
Aunque se procur que todas las bolsas tuvieran el mismo peso, algunas
tienen un peso ligeramente menor y otras un peso ligeramente mayor.
Una revisin de 4 000 bolsas arroj los siguientes resultados:
PESO

EVENTO

Peso ms bajo

Nmero de
paquetes
100

Peso correcto

3600

Peso ms alto

300
4000

Probabilidad
de ocurrencia
100/4000=0.02
5
3600/4000=0.9
0
300/4000=0.07
5
1.00

Cul es la probabilidad de que un paquete determinado tenga un peso


ligeramente ms bajo?
P(A o C) = P(A) U P(C) = P(A) + P(C)=0.025+0.075=0.10
2. Eventos no excluyente: Cul es la probabilidad de que una carta
escogida al azar de una baraja americana sea un rey o un corazn?

CARTA
Rey
Corazn
Rey
corazones

PROBABILIDA
EXPLICACIN
D
DE
OCURRENCIA
P(A)=4/52
Hay 4 reyes en una baraja de 52 cartas
P(B)=13/52
Hay 13 corazones en una baraja de 52
cartas
de P(A y B)=1/52
Hay 1 rey de corazones en una baraja
de 52 cartas

37

P(A o B) = P(A) + P(B) P(A y B)=

4 13 1 16
+ = =0.3077
52 52 52 52

Un diagrama de Venn representa estos resultados:


Corazones

Reyes

Ambos

EVENTOS INDEPENDIENTES

Dos o ms eventos son independientes cuando la ocurrencia o noocurrencia de un evento no tiene efecto sobre la probabilidad de
ocurrencia del otro evento (o eventos). Un caso tpico de eventos
independiente es el muestreo con reposicin, es decir, una vez tomada
la muestra se regresa de nuevo a la poblacin donde se obtuvo.
Ejemplo:
Lanzar al aire dos veces una moneda son eventos independientes por
que el resultado del primer evento no afecta sobre las probabilidades
efectivas de que ocurra cara o sello, en el segundo lanzamiento.
EVENTOS DEPENDIENTES
Dos o ms eventos sern dependientes cuando la ocurrencia o noocurrencia de uno de ellos afecta la probabilidad de ocurrencia del otro
(u otros). Cuando tenemos este caso, empleamos entonces, el concepto
de probabilidad condicional para denominar la probabilidad del evento
relacionado. La expresin P(A|B) indica la probabilidad de ocurrencia del
evento A s el evento B ya ocurri.
Se debe tener claro que A|B no es una fraccin.
P(A|B) = P(A y B)/P(B) o P(B|A) = P(A y B)/P(A)
Ejemplo:
Un estudio de la lealtad hacia una compaa de sus ejecutivos. La
pregunta que se les hizo fue, si otra compaa le ofreciera un puesto
igual ligeramente mejor al que tiene ahora, se quedara en la
compaa? Las repuestas de 200 ejecutivos se clasificaron de acuerdo
con su tiempo de servicio en la compaa. Cul es la probabilidad de
seleccionar un ejecutivo de la compaa que sea leal y que tenga ms
de 10 aos de servicio?
TIEMPO DE SERVICIO
LEALTAD
Menos de un 1-5
6-10
Ms de 10 Tot
ao
aos
aos
aos
al
38

Se
quedara
No
se
quedara

10

30

75

120

25

15

10

30

80
200

P(A | B) = P(A y B) / P(B) o P(B | A) = P(A y B) / P(A)=


120 75
9000
=
=0.375
200 120
24000

( )( ) (

REGLAS DE MULTIPLICACIN
Se relacionan con la determinacin de la ocurrencia conjunta de dos o
ms eventos. Es decir la interseccin entre los conjuntos de los posibles
valores de A y los valores de B, esto quiere decir la probabilidad de que
ocurran conjuntamente los eventos A y B es:
P(A y B) = P(A B) = P(A) P(B) si A y B son independientes
P(A y B) = P(A B) = P(A) P(B|A) si A y B son dependientes
Ejemplos:
1. Eventos independientes: Se lanzaron dos monedas. Cul es la
probabilidad de que las dos monedas caigan en sol?
P(A y B) = P(A B) = P(A) P(B)= (1/2)(1/2)=0.25
2. Eventos dependientes: Suponga que hay diez rollos de pelcula en una
caja, se sabe que tres estn defectuosos. Se toman dos rollos de la caja,
uno despus del otro. Cul es la probabilidad de que ambos sean
defectuosos?
P(A y B) = P(A B) = P(A) P(B|A)=(3/10)(2/9)=0.07
TEOREMA DE BAYES
El Teorema de BAYES se apoya en el proceso inverso al que hemos visto
en el Teorema de la Probabilidad Total:
Teorema de la probabilidad total: a partir de las probabilidades del
suceso A (probabilidad de que llueva o de que haga buen tiempo)
deducimos la probabilidad del suceso B (que ocurra un accidente).
Teorema de Bayes: a partir de que ha ocurrido el suceso B (ha ocurrido
un accidente) deducimos las probabilidades del suceso A (estaba
lloviendo o haca buen tiempo?).
La frmula del Teorema de Bayes es:
P(A B)=

P ( A1 ) P(BI A 1)
P ( A1 ) P ( BI A 1 ) +P ( A 2 ) P (BI A 2)

Vamos a explicar la frmula con un ejemplo.

39

El parte meteorolgico ha anunciado tres posibilidades para el fin de


semana:
a) Que llueva: probabilidad del 50%.
b) Que nieve: probabilidad del 30%
c) Que haya niebla: probabilidad del 20%.
Segn estos posibles estados meteorolgicos, la posibilidad de que
ocurra un accidente es la siguiente:
a) Si llueve: probabilidad de accidente del 20%.
b) Si nieva: probabilidad de accidente del 10%
c) Si hay niebla: probabilidad de accidente del 5%.
Resulta que efectivamente ocurre un accidente y como no estbamos en
la ciudad no sabemos que tiempo hizo (llovi, nev o hubo niebla). El
teorema de Bayes nos permite calcular estas probabilidades:
Las probabilidades que manejamos antes de conocer que ha ocurrido un
accidente se denominan "probabilidades a priori" (lluvia con el 50%,
nieve con el 30% y niebla con el 20%).
Una vez que incorporamos la informacin de que ha ocurrido un
accidente, las probabilidades del suceso A cambian: son probabilidades
condicionadas P (A/B), que se denominan "probabilidades a posteriori".
Vamos a aplicar la frmula:
a) Probabilidad de que estuviera lloviendo:
( 0.5 ) (0.2)
P(A B)=
=0.714
( 0.5 )( 0.2 ) + ( 0.3 )( 0.1 ) + ( 0.2 ) (0.05)
La probabilidad de que efectivamente estuviera lloviendo el da del
accidente (probabilidad a posteriori) es del 71,4%.
b) Probabilidad de que estuviera nevando:
( 0.3 ) (0.1)
P(A B)=
=0.214
( 0.5 )( 0.2 ) + ( 0.3 )( 0.1 ) + ( 0.2 ) (0.05)
La probabilidad de que estuviera nevando es del 21,4%.
c) Probabilidad de que hubiera niebla:
( 0.2 ) ( 0.05)
P(A B)=
=0.071
( 0.5 )( 0.2 ) + ( 0.3 )( 0.1 ) + ( 0.2 ) (0.05)
La probabilidad de que hubiera niebla es del 7,1%
Otro ejemplo.
En una etapa de la produccin de un artculo se aplica soldadura y para
eso se usan tres diferentes robots. La probabilidad de que la soldadura
sea defectuosa vara para cada uno de los tres, as como la proporcin
de artculos que cada uno procesa, de acuerdo a la siguiente tabla.

40

ROBOT

DEFECTUOSOS
A
B
C

0.03
0.04
0.05

ART. PROCESADOS
45%
30%
25%

Tomamos al azar una pieza y resulta ser defectuosa, calcula la


probabilidad de que haya sido producida por el robot B?
( 0.3 ) (0.04)
P(B D)=
=0.316
( 0.45 )( 0.03 )+ ( 0.3 )( 0.04 ) + ( 0.25 ) (0.05)
Qu robot tiene la mayor probabilidad de haber producido la pieza
defectuosa?
( 0.45 ) (0.03)
P(A D)=
=0.355
( 0.45 )( 0.03 )+ ( 0.3 )( 0.04 ) + ( 0.25 ) (0.05)
( 0.25 ) (0.05)
P(C B)=
=0.329
( 0.45 )( 0.03 )+ ( 0.3 )( 0.04 ) + ( 0.25 ) (0.05)
El robot con mayor probabilidad de haber producido la pieza defectuosa
es el robot A.
DIAGRAMA DE RBOL
Supongamos que en el problema de los robots seleccionamos una pieza
al azar y queremos calcular la probabilidad de que sea defectuosa.
Para calcular la probabilidad de que la pieza elegida sea defectuosa, P
(D), por la propiedad de la probabilidad total,
P (D)=P(A) P (D A)+P (B) P (D B)+P(C) P (D C)=
(0.45)(0.03)+ (0.30) (0.04)+ (0.25) (0.05)=0.038
Con un diagrama de rbol tenemos:
0.03
D
A
0.45

0.097
0.04

N
D

0.30 B
0.25

0.96
0.05
0.95

N
D
N

AXIOMAS DE LA PROBABILIDAD
Recordemos primero que las frecuencias relativas de una distribucin
tenan las siguientes propiedades:
Las frecuencias relativas son mayores o iguales que cero.
La frecuencia relativa del espacio muestral es igual a la unidad.
41

Si dos eventos son mutuamente excluyentes, es decir que no ocurren


simultneamente, entonces la frecuencia relativa de su unin es la suma
de las frecuencias relativas de cada uno.
Tomando en cuenta que la probabilidad de un evento, de acuerdo a la
definicin ya expuesta, es la frecuencia relativa cuando se aumenta el
tamao de la muestra, se tienen lo siguiente.
Si E es un evento de un espacio muestral S y P(E) es la probabilidad de
E, entonces se satisfacen los axiomas de la probabilidad:
0 P(E) 1.
P(S) = 1.
Si E1, E2, ... , En son eventos mutuamente excluyentes, entonces

6. DISTRIBUCIONES DE
PROBABILIDAD: DISCRETAS
UNIDAD

42

Concepto de distribucin de
probabilidad para variables
discretas
Media, varianza y desviacin
estndar de una distribucin de
probabilidad
Anlisis combinatorio

DISTRIBUCIONES DE
PROBABILIDAD

VARIABLES ALEATORIAS
Se denominan variables porque cambian de valor y aleatorias porque su
valor depende del azar, es impredecible. Las variables aleatorias pueden
ser discretas y continuas.
Variable discreta: Es aquella que slo puede tomar valores enteros.
Variable continua: Es aquella que puede tomar cualquier valor en algn
intervalo.
Cuando una de estas variables aleatorias toma diversos valores, la
probabilidad asociada a cada uno de tales valores puede ser organizada
como una distribucin de probabilidad.
Las distribuciones de probabilidad pueden representarse a travs de una
tabla, una grfica o una frmula, en donde a la regla de correspondencia
se le denomina funcin de probabilidad.
Consideraremos las distribuciones de probabilidad para variables
discretas.
Por ejemplo: Consideremos a la variable aleatoria X como la cantidad de
guilas observadas cuando se lanzan dos volados. El espacio muestral
43

es el conjunto {AA, AS, SA, SS} y se puede ver que la variable X puede
tomar como valores 0, 1 y 2.
Calculando las probabilidades tenemos:
P (de no observar guilas) = P (SS) = P(X=0) =
P (de observar una guila) = P (SA AS) = P (X=1) = 2/4
P (de observar dos guilas) = P (AA) = P(X=2) =
Si ahora se organizan estos resultados con el siguiente formato

X
0
1
2

P (X=x)

Se podr explicar por qu se usa el nombre "distribucin de


probabilidad". E incluso, con esta informacin se puede construir una
grfica de barras o un histograma como el que sigue:

Las propiedades de las distribuciones de variables discretas son dos:


0 P(X=x) 1.
P(X=x) = 1, o que es lo mismo: la suma de todas las probabilidades de
los eventos posibles de una variable aleatoria es igual a la unidad.
Hay que hacer notar que estas propiedades se enuncian suponiendo que
conocemos el valor de la probabilidad, pero en la realidad esto no
ocurre, es decir que no sabemos la probabilidad y lo que se hace es
trabajar con estimaciones. Precisamente esto nos lleva a modelos
tericos que estiman los resultados, los principales son los que a
continuacin se presentan.
44

MODELOS DE DISTRIBUCIONES DE PROBABILIDAD DE VARIABLES


DISCRETAS
Uniforme: Es la distribucin donde todos los eventos elementales tienen
la misma probabilidad. Por ejemplo: tirar un dado, donde la funcin
P(X=x)=1/6 para valores de x=1, 2, 3, 4, 5,6.
Binomial: Es la que maneja la distribucin de la probabilidad de obtener
cierta cantidad de xitos al realizar una cantidad de experimentos con
probabilidad de xito constante y con ensayos independientes.
Geomtrica: Es la distribucin de la probabilidad de realizar cierto
nmero de experimentos antes de obtener un xito.
Hipergeomtrica: Es similar a la binomial, pero con un tamao de
muestra grande en relacin al tamao de la poblacin. La funcin de
Excel que proporciona sus valores es DISTR.HIPERGEOM
De Poisson: Es la distribucin de la probabilidad de que ocurra un evento
raro en un periodo de tiempo, un espacio o un lugar.
MEDIA Y DESVIACIN ESTNDAR DE UNA DISTRIBUCIN DE
PROBABILIDAD PARA VARIABLES DISCRETAS
En una distribucin de frecuencias para datos agrupados se calculaba la
media utilizando la frmula:

Tambin puede expresarse como:

Si consideramos que la definicin de probabilidad de un evento P(X) es


el cociente de la frecuencia entre el nmero total de eventos, la media
de una distribucin de probabilidad de una variable discreta es:
Por ejemplo: Consideremos la variable X del ejemplo de guilas
observadas en dos lanzamientos de monedas. Es decir, X tal que su
distribucin de probabilidad
sea:
X
0
1

P (X=x)

45

Entonces, para calcular su media m se realiza:

Similarmente, la varianza se defini como:

Haciendo un tratamiento anlogo al anterior tenemos que

para que, finalmente, la varianza de una distribucin de probabilidad de


una variable discreta sea:
Consecuentemente, la desviacin estndar de una distribucin de
probabilidad de una variable discreta es:

Por ejemplo: Considerando la misma distribucin de probabilidad que en


el ejemplo anterior, su desviacin estndar se calcula:

DISTRIBUCIONES
CONTINUAS

DE

PROBABILIDAD

PARA

VARIABLES

Hasta el momento se han considerado las distribuciones de probabilidad


para variables discretas, donde se poda asignar el valor que toma la
funcin de probabilidad cuando la variable aleatoria tomaba un valor en
concreto. Sin embargo, al considerar las variables continuas se
encuentra uno el problema de que, lo ms probable, los datos que se
puedan recabar no sean completamente exactos, o dos o ms de ellos
no coincidan, por lo que se tienen que trabajar en intervalos y, en ese
momento, modelar una funcin se convierte en un problema serio.
Sin embargo, se pueden realizar aproximaciones y describir la
probabilidad a travs de modelos tericos de probabilidad cuya grfica

46

es una lnea continua, a diferencia de las variables discretas que le


corresponde un histograma.
ANLISIS COMBINATORIO
En ocasiones el trabajo de enumerar los posibles sucesos que ocurren en
una situacin dada se convierte en algo difcil de lograr o, simplemente,
tedioso. El anlisis combinatorio, o clculo combinatorio, permite
enumerar tales casos o sucesos y as obtener la probabilidad de eventos
ms complejos.
En el caso de que existan ms de un suceso a observar, habra que
contar el nmero de veces que pueden ocurrir todos los sucesos que se
desean observar, para ello se utiliza el principio fundamental de
conteo:
Si un suceso se puede presentar de n1 formas, y otro se puede presentar
de n2 formas, entonces el nmero de formas en que ambos sucesos
pueden presentarse en ese orden es de n1n2.
En otras palabras, basta multiplicar el nmero de formas en que se
pueden presentar cada uno de los sucesos a observar.
En el anlisis combinatorio se definen las permutaciones, con o sin
repeticin, y las combinaciones.
PERMUTACIONES (U ORDENACIONES) CON REPETICIN
Las permutaciones son tambin conocidas como ordenaciones, y de
hecho toman este nombre porque son ordenaciones de r objetos de n
dados.
Por ejemplo: Sea A = {a, b, c, d}, cuntas "palabras" de dos letras se
pueden obtener?
Se pide formar permutaciones u ordenaciones de 2 letras, cuando el
total de letras es 4. En este caso r =2 y n =4.
Las "palabras" formadas son: aa, ab, ac, ad, ba, bb, bc, bd, ca, cb, cc, cd,
da, db, dc, dd. En total son 16.
En general, si se toman r objetos de n, la cantidad de permutaciones u
ordenaciones con repeticin obtenidas son:
ORnr = nORr = n r
PERMUTACIONES (U ORDENACIONES) SIN REPETICIN
En este caso, a diferencia del anterior, se realizan ordenaciones de r
objetos de n dados atendiendo a la situacin de cada objeto en la
ordenacin. Su representacin ser Pnr nPr.
En general, si se toman r objetos de un total de n, la cantidad de
permutaciones

47

Pnr = nPr =
Por ejemplo: Sea el mismo conjunto A = {a, b, c, d}, cuntas
ordenaciones sin repeticin se pueden obtener?
Lo que resulta es: ab, ac, ad, ba, bc, bd, ca, cb, cd, da, db, dc. Son 12 en
total.
COMBINACIONES
Es una seleccin de r objetos de n dados sin atender a la ordenacin de
los mismos. Es decir, es la obtencin de subcojuntos, de r elementos
cada uno, a partir de un conjunto inicial de n elementos. La denotaremos
con C n r, n C r
.
Por ejemplo: Si tomamos el mismo conjunto A = {a, b, c, d}, cuntos
subconjuntos de 2 elementos cada uno se pueden obtener?
Hacindolos se obtienen: {a,b}, {a,c}, {a,d}, {b,c}, {b,d}, {c,d}. Son
seis los subconjuntos.
En general, si de n objetos dados se hacen combinaciones de r objetos
cada una, el nmero de combinaciones obtenidas son:
C nr = nC r =
o, que es lo mismo,
C nr = nC r =
En donde n =(n-1)(n-2)8n-3) 1
Ejemplo:
Calcular 5 =(5)(4)(3)(2)(1)=120

UNIDAD

48

7. DISTRIBUCIONES DE
PROBABILIDAD

Distribucin Binomial
Distribucin de Poisson

Un modelo es una simplificacin de la realidad. Un modelo probabilstico


es un modelo matemtico que describe el comportamiento de una
variable aleatoria. Es una funcin que depende de los valores de la
variable aleatoria, y de otras cantidades que caracterizan a una
poblacin en particular y que se denominan parmetros del modelo.
En el proceso de modelacin es necesario seguir los siguientes pasos:
1. Seleccionar el modelo ms apropiado.
2. Ajustar el modelo (calcular el valor de sus parmetros).
3. Verificar el modelo.
4. Decidir su aceptacin o volver al paso 1.
Para ejecutar el paso 1, podemos optar por una amplia gama de
modelos de probabilidad, desarrollados para representar distintos tipos
de variables y diferentes fenmenos aleatorios. Por lo tanto, el problema
se reduce a elegir el modelo ms apropiado para el caso en estudio.
Para ejecutar el paso 2, es necesario recopilar una muestra
representativa de la poblacin en estudio y calcular las cantidades
necesarias como para evaluar los parmetros del modelo.
LA DISTRIBUCIN BINOMIAL
Esta distribucin describe una variedad de procesos de inters para los
administradores y describe datos discretos, no continuos, que son
resultado de un experimento conocido como proceso de Bernoulli.
Podemos describir el proceso de Bernoulli de la manera siguiente:
49

1. Cada intento tiene slo dos resultados posibles.


2. La probabilidad del resultado de cualquier intento permanece fijo
con respecto al tiempo.
3. Los intentos son estadsticamente independientes.
Frmula binomial:
P(x)=n C x (p)x (1-p)n-x
Ejemplo: Cada da American Airlines viaja de Pittsburgh a Pensilvania.
Supongamos que la probabilidad de que un vuelo se retrase es de 0.20.
Cul es la probabilidad de que ninguno de los vuelos se retrase el da
de hoy? Cul es la probabilidad de que uno de los vuelos se retrase el
da de hoy?
P=0.20
n =5
x se refiere a xito, o sea x = 0 (ningn vuelo se atrase)
P (0) = 5C0 (0.2)0 (1-0.20)5-0 = (1)(1)(0.3277)=0.3277
5!
5!
=
=1
5C0 =
0! (50)! 5 !
Nota:
Recuerda que cualquier cantidad elevada a la cero es igual a la unidad.
0 =1
Para:
P=0.20
n =5
x se refiere a xito, o sea x = 1 (un vuelo se atrase)
P (1) = 5 C1 (0.2)1 (1-0.20)5-1 = (5)(0.20)(0.4096)=0.4096
5!
5!
=
=5
5C 1=
1 !(51)! 4 !
Distribucin de probabilidad binomial para P=0.20 y n =5

0.4
0.3
0.2
0.1
0

Generalizaciones:
Cuando p es pequea (0,1), la distribucin binomial est sesgada
hacia la derecha.
Cuando p aumenta (0,3 por ejemplo), el sesgo es menos notable.
50

Cuando p = 0,5, la distribucin binomial es simtrica.


Cuando p es mayor que 0,5, la distribucin est sesgada hacia la
izquierda.
Las probabilidades para 0,3, por ejemplo, son las mismas para 0,7,
excepto que los valores de p y q estn invertidos. Esto es cierto
para cualquier pareja de valores p y q complementarios.

MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIN PARA LA


DISTRIBUCIN BINOMIAL.
La distribucin binomial tiene un valor esperado o media y una
desviacin estndar.

= n
2
Varianza: = n
Valor esperado o media:

CUMPLIMIENTO
BERNOULLI.

DE

LAS

CONDICIONES

DEL

PROCESO

DE

Necesitamos ser cuidadosos en el uso de la distribucin binomial de la


probabilidad y asegurar que se cumplen las tres condiciones necesarias,
en particular las condiciones 2 y 3. La condicin 2 requiere que la
probabilidad del resultado de cualquier intento permanezca fija en el
tiempo. La condicin 3 requiere que los ensayos o intentos de un
proceso de Bernoulli sean estadsticamente independientes, es decir,
que el resultado de un intento no puede afectar de ningn modo el
resultado de cualquier otro intento.
LA DISTRIBUCIN DE POISSON.
La distribucin de Poisson se utiliza para describir cierto tipo de
procesos, entre los que se encuentran la distribucin de llamadas
telefnicas que llegan a un conmutador, la demanda (necesidades) de
los pacientes que requieren servicio en una institucin de salud, las
llegadas de camiones a una caseta de cobro y el nmero de accidentes
registrados en una cierta interseccin de calles. Estos ejemplos tienen
en comn un elemento: pueden ser descritos mediante una variable
aleatoria discreta que toma valores enteros (0, 1, 2...).
CARACTERSTICAS DE LOS PROCESOS QUE PRODUCEN UNA
DISTRIBUCIN DE PROBABILIDAD DE POISSON.
1. El promedio (la media) del nmero de eventos que se producen
por hora, puede estimarse a partir de datos que se tengan
disponibles.

51

2. Si dividimos la hora pico en periodos (intervalos) de un segundo


cada uno, encontraremos que las siguientes afirmaciones son
verdaderas:
La probabilidad de que exactamente un evento ocurra por
segundo es muy pequea y es constante para cada intervalo de un
segundo.
La probabilidad de que dos o ms eventos ocurran en un intervalo
de un segundo es tan pequea que le podemos asignar un valor
cero.
El nmero de eventos que ocurren en un intervalo de un segundo
es independiente del tiempo en que dicho intervalo se presente en
la hora pico.
El nmero de eventos en un intervalo de un segundo no depende
del nmero de ocurrencias en cualquier otro intervalo de un
segundo.
CLCULO DE LA PROBABILIDAD DE POISSON.
La letra X por lo general representa a una variable discreta y puede
tomar valores enteros. Utilizamos la letra X para representar a la
variable aleatoria y la letra x para sealar un valor especfico que esta
variable pueda tomar. La probabilidad de tener exactamente x
presentaciones en una distribucin de Poisson se calcula con la frmula:
x e
P ( x )=
x!

es el nmero medio de ocurrencias(xitos) durante un intervalo


especfico de tiempo.
x es el nmero de ocurrencias (xitos)
e es la constante 2.71828
Ejemplo: Supongamos que Mexicana de Aviacin es raro que pierda el
equipaje. Algunos vuelos tienen una maleta perdida; en unos casos se
pierden dos maletas y es muy raro que se pierdan tres o ms. En una
muestra aleatoria de 1000 vuelos se perdieron 300 maletas. La media
aritmtica de maletas prdidas es de 0.3 (se encuentra dividiendo
300/1000). Si el nmero de maletas perdidas sigue una distribucin de
Poisson con =0.30. Cul es la probabilidad de no perder ninguna
maleta?
0.3

P (0) (0.3)0
0.7408
x e

=
x!
En el 74% de los vuelos no habr maletas perdidas.

52

En el siguiente cuadro se muestran las probabilidades para diferentes


valores de x.
X
P(x)
0
0.7408
1
0.2222
2
0.0333
3
0.0033
4
0.0003
5
0.0000

LA DISTRIBUCIN DE POISSON COMO UNA APROXIMACIN A LA


DISTRIBUCIN BINOMIAL.
La distribucin de Poisson puede ser una razonable aproximacin a la
binomial, pero slo bajo ciertas condiciones. Tales condiciones se
presentan cuando n es grande y p es pequea, esto es, cuando el
nmero de ensayos es grande y la probabilidad binomial de tener xito
es pequea. La regla que utilizan con ms frecuencia los estadsticos es
que la distribucin de Poisson es una buena aproximacin de la
distribucin binomial cuando n es igual o mayor que 20 y p es igual o
menor que 0,05. En los casos en que se cumplen estas condiciones,
podemos sustituir la media de la distribucin binomial (n) en lugar de la
media de la distribucin de Poisson ().
El uso de una distribucin para aproximar a otra es una prctica
bastante comn en probabilidad y estadstica. La idea consiste en
buscar situaciones en las que una distribucin (como la de Poisson),
cuyas probabilidades son relativamente fciles de calcular, tiene valores
que se encuentran razonablemente cercanos a las de otra distribucin
(como la binomial) cuyas probabilidades implican clculos ms
complicados.
RECOMENDACIONES PRCTICAS:

Frente a un problema concreto, analice detenidamente todas sus


caractersticas, y al elegir el modelo apropiado, verifique que se
cumplan todos los supuestos del mismo.
Habitese a utilizar las tablas provistas por la bibliografa para
calcular probabilidades. Ahorrar tiempo y evitar errores de
clculo.
No olvide emplear la distribucin de Poisson a la binomial en
aquellos casos en que p es pequeo y n es grande.

53

Para calcular probabilidades acumuladas, del tipo P(X > x), P(X <
x) o P(x < X < x), tambin existen valores tabulados en textos
especializados.
En el caso de variables aleatorias discretas, es importante
diferenciar si la probabilidad deseada incluye o no el valor
particular de la variable. Es decir, que P(X > x) no es lo mismo que
P(X > x) y P (X < x) es distinto de P(X < x).

8. DISTRIBUCIN NORMAL
54

Concepto de distribucin continua


de probabilidad
Distribucin normal
Distribucin normal estandarizada,
clculos de reas bajo la curva

DISTRIBUCIN
NORMAL

LA DISTRIBUCIN NORMAL: DISTRIBUCIN DE UNA VARIABLE


ALEATORIA CONTINUA.
La variable puede tomar cualquier valor que est en un intervalo de
valores dado, y la distribucin de probabilidad es continua.
Las razones bsicas de la importancia de la distribucin normal son:
1. Tiene algunas propiedades que la hacen aplicable a un gran
nmero de situaciones en las que es necesario hacer inferencias
mediante la toma de muestras. La distribucin normal es una til
distribucin de muestreo.
2. La distribucin normal casi se ajusta a las distribuciones de
frecuencias reales observadas en muchos fenmenos, incluyendo
caractersticas humanas (pesos, alturas), resultados de procesos
fsicos (dimensiones y rendimientos) y muchas otras medidas de
inters para los administradores.
CARACTERSTICAS
PROBABILIDAD.

DE

LA

DISTRIBUCIN

55

NORMAL

DE

1. La curva tiene un solo pico; por tanto, es unimodal. Tiene forma de


campana.
2. La media de una poblacin distribuida normalmente cae en el
centro de su curva normal.
3. Debido a la simetra de la distribucin normal de probabilidad, la
mediana y la moda se encuentran tambin en el centro; en
consecuencia, para una curva normal, la media, la mediana y la
moda tienen el mismo valor.
4. Los dos extremos de la distribucin normal de probabilidad se
extienden indefinidamente y nunca tocan el eje horizontal.

La mayor parte de las poblaciones reales no se extienden de manera


indefinida en ambas direcciones; pero en estas poblaciones, la
distribucin normal es una aproximacin conveniente. No hay una sola
distribucin normal, sino una familia de curvas normales. Para definir
una distribucin normal de probabilidad necesitamos definir slo dos
parmetros: la media y la desviacin estndar.
La curva normal puede describir un gran nmero de poblaciones,
diferenciadas solamente por la media, la desviacin estndar o por
ambas.
REAS BAJO LA CURVA NORMAL.
No importa cules sean los valores de y para una distribucin de
probabilidad normal, el rea bajo la curva es 1,00, de manera que
podemos pensar en reas bajo la curva como si fueran probabilidades.
Matemticamente:

56

1. Aproximadamente el 68% de todos los valores de una poblacin


normalmente distribuida se encuentran dentro de + 1 desviacin
estndar de la media.
2. Aproximadamente 95,5% de todos los valores de una poblacin
normalmente distribuida se encuentran dentro de + 2
desviaciones estndar de la media.
3. Aproximadamente 99,7% de todos los valores de una poblacin
normalmente distribuida se encuentran dentro de + 3
desviaciones estndar de la media.
Las tablas estadsticas indican porciones del rea bajo la curva normal
que estn contenidas dentro de cualquier nmero de desviaciones
estndar (ms, menos) a partir de la media.
No es posible ni necesario tener una tabla distinta para cada curva
normal posible. En lugar de ello, podemos utilizar una distribucin de
probabilidad normal estndar para encontrar reas bajo cualquier curva
normal. Con esta tabla podemos determinar el rea o la probabilidad de
que la variable aleatoria distribuida normalmente est dentro de ciertas
distancias a partir de la media. Estas distancias estn definidas en
trminos de desviaciones estndar.
Para cualquier distribucin normal de probabilidad, todos los intervalos
que contienen el mismo nmero de desviaciones estndar a partir de la
media contendrn la misma fraccin del rea total bajo la curva para
cualquier distribucin de probabilidad normal.
REAS BAJO LA CURVA NORMAL.

El rea total bajo la curva normal ser de 1.00 por lo cual podemos
considerar que las reas bajo la curva son probabilidades.
DEFECTOS DE LA DISTRIBUCIN NORMAL DE PROBABILIDAD.
57

Los extremos de la distribucin normal se acercan al eje horizontal, pero


nunca llegan a tocarlo. Esto implica que existe algo de probabilidad
(aunque puede ser muy pequea) de que la variable aleatoria pueda
tomar valores demasiado grandes. No perderemos mucha precisin al
ignorar valores tan alejados de la media. Pero a cambio de la
conveniencia del uso de este modelo terico, debemos aceptar el hecho
de que puede asignar valores empricos imposibles.
DISTRIBUCIN DE PROBABILIDD NORMAL ESTNDAR
Existe una familia de distribuciones normales. Cada una de las
distribuciones puede tener una media distinta o una desviacin estndar
distinta. Por tanto, el nmero de distribuciones normales es ilimitado.
Es posible utilizar un solo miembro de la familia de las distribuciones
normales para todos los problemas en los que se aplica la distribucin
normal. La que tiene una media de cero y una desviacin de uno y se le
conoce como distribucin normal estndar. Todas las distribuciones
pueden convertirse a distribuciones normal estndar restando la media
de cada observacin y dividendo entre la desviacin estndar.
Primero se convierte o estandariza, la distribucin real a una distribucin
normal utilizando un valor z.
En trminos de una frmula:
x
z=

Ejemplo:
Los ingresos semanales de los gerentes medios tienen una distribucin
aproximadamente normal con una media de 1000 dlares y una
desviacin estndar de 100 dlares Cul es el valor z para un ingreso x
de 1100 dlares?Para uno de 900 dlares?
11001000
z=
=1
100
9001000
z=
=-1
100
El valor de 1 indica que un ingreso semanal de $1100.00 para un
gerente medio est una desviacin estndar arriba de la media. El valor
de -1 indica que un ingreso semanal de $900.00 para un gerente medio
est una desviacin estndar abajo de la media.
LA DISTRIBUCIN NORMAL COMO UNA APROXIMACIN DE LA
DISTRIBUCIN BINOMIAL.
Aunque la distribucin normal es continua, resulta interesante hacer
notar que algunas veces puede utilizarse para aproximar a
distribuciones discretas.

58

La aproximacin normal a la distribucin binomial resulta muy


conveniente, pues nos permite resolver el problema sin tener que
consultar grandes tablas de la distribucin binomial. Pero se necesita
tener algo de cuidado al utilizar esta aproximacin, que es bastante
buena, siempre que n y n( sean al menos de cinco.
IDENTIFICACIN DEL MODELO APROPIADO.
La seleccin depende, entre otros, de los siguientes factores:
Un adecuado anlisis del problema considerado: qu tipo de
variable se estudia, qu fenmeno se desea modelar, etc.
Los resultados de la descripcin de los datos disponibles: forma de
la distribucin, propiedades de la variable.
La disponibilidad y manejo de un buen nmero de modelos de
probabilidad que permitan describir diferentes tipos de
situaciones.
Una vez identificado el modelo apropiado, hay que calcular sus
parmetros, en base a las observaciones que se dispongan de la
variable en estudio.
Si planeamos utilizar una probabilidad para describir una situacin,
debemos escoger con cuidado la correcta. La distribucin binomial se
aplica cuando el nmero de ensayos est fijo antes de que empiece el
experimento, y cada ensayo es independiente y puede tener slo dos
resultados mutuamente excluyentes. Al igual que la distribucin
binomial, se aplica cuando cada ensayo es independiente de los dems.
Pero, aunque la probabilidad de Poisson se aproxima a cero despus de
los primeros valores, el nmero de valores posibles es infinito. No se
conoce el lmite de dos resultados mutuamente excluyentes. En ciertas
condiciones, la distribucin de Poisson se puede utilizar como
aproximacin de la binomial, pero no siempre es posible hacerlo. Todas
las suposiciones que conforman la base de una distribucin deben
cumplirse, si la intencin del uso de dicha distribucin es producir
resultados significativos.

UNIDAD

59

9. TEORA BSICA DEL MUESTREO


Diferentes tipos de muestreo
Etapas de un estudio por
muestreo
Distribuciones muestrales

TEORA BSICA
DEL MUESTREO

Actividad en la que se toman ciertas muestras de una poblacin de


elementos. El muestreo es importante porque a travs de l podemos
hacer anlisis de diversas situaciones de una empresa o de algn campo
de la sociedad.
Un estadstico es una medida usada para describir alguna caracterstica
de una muestra, tal como una media aritmtica, una mediana o una
desviacin estndar de una muestra.
Una parmetro es una medida usada para describir alguna caracterstica
de una poblacin, tal como una media aritmtica, una mediana o una

60

desviacin estndar de una poblacin. El proceso de estimacin en


inferencia estadstica puede ser descrito como el proceso de estimar un
parmetro a partir del estadstico correspondiente, tal como usar una
media muestral
Distribucin en el muestreo: Cuando el tamao de la muestra (n) es ms
pequeo que el tamao de la poblacin (N), dos o ms muestras pueden
ser extradas de la misma poblacin. Un cierto estadstico puede ser
calculado para cada una de las muestras posibles extradas de la
poblacin. Una distribucin del estadstico obtenido de las muestras es
llamado la distribucin en el muestreo del estadstico. Por ejemplo, si la
muestra tiene 2 elementos y la poblacin 3 elementos (A, B, C), es
posible extraer 3 muestras ( AB, BC Y AC) de la poblacin. Podemos
calcular la media para cada muestra. Por lo tanto, tenemos 3 medias
mustrales para las 3 muestras. Las 3 medias mustrales forman una
distribucin. La distribucin de las medias es llamada la distribucin de
las medias mustrales, o la distribucin en el muestreo de la media. De
la misma manera, la distribucin de las proporciones (o porcentajes)
obtenida de todas las muestras posibles del mismo tamao, extradas de
una poblacin, es llamada la distribucin en el muestreo de la
proporcin.
Error Estndar: La desviacin estndar de una distribucin, en el
muestreo de un estadstico, es frecuentemente llamada el error estndar
del estadstico. Por ejemplo, la desviacin estndar de las medias de
todas la muestras posibles del mismo tamao, extradas de una
poblacin, es llamada el error estndar de la media. De la misma
manera, la desviacin estndar de la poblacin de todas las muestras
posibles del mismo tamao, es llamada el error estndar de la poblacin.
La diferencia entre los trminos "desviacin estndar" y "error de
estndar" es que la primera se refiere a los valores originales, mientras
que la ltima est relacionada con valores calculados. Un estadstico es
un valor calculado, obtenido con los elementos incluidos en una
muestra.
Error muestral o error de muestreo La diferencia entre el resultado
obtenido de una muestra (un estadstico) y el resultado que deberamos
haber obtenido de la poblacin (el parmetro correspondiente) se llama
el error muestral o error de muestreo. Un error de muestreo usualmente
ocurre cuando no se lleva a cabo la encuesta completa de la poblacin,
sino que se toma una muestra para estimar las caractersticas de la
poblacin. El error muestral es medido por el error estadstico, en
trminos de probabilidad, bajo la curva normal. El resultado de la media
indica la precisin de la estimacin de la poblacin basada en el estudio
de la muestra. Mientras ms pequeo es el error muestral, mayor es la
precisin de la estimacin. Deber hacerse notar que los errores
cometidos en una encuesta por muestreo, tales como respuestas
inconsistentes, incompletas o no determinadas, no son considerados

61

como errores mustrales. Los errores no mustrales pueden tambin


ocurrir en una encuesta completa de la poblacin.
MTODOS DE SELECCIN DE MUESTRAS.

Una muestra debe ser representativa si va a ser usada para estimar las
caractersticas de la poblacin. Los mtodos para seleccionar una
muestra representativa son numerosos, dependiendo del tiempo, dinero
y habilidad disponibles para tomar una muestra y la naturaleza de los
elementos individuales de la poblacin. Los mtodos de seleccin de
muestras pueden ser clasificados de acuerdo a:
El nmero de muestras tomadas de una poblacin dada para un
estudio y
La manera usada en seleccionar los elementos incluidos en la muestra.
Los mtodos de muestreo basados en los dos tipos de clasificaciones son
expuestos en seguida.
MTODOS DE MUESTREO CLASIFICADOS DE ACUERDO CON EL
NMERO DE MUESTRAS TOMADAS DE UNA POBLACIN.
Bajo esta clasificacin, hay tres tipos comunes de mtodos de muestreo.
Estos son, muestreo simple, doble y mltiple.
Muestreo simple
Este tipo de muestreo toma solamente una muestra de una poblacin
dada para el propsito de inferencia estadstica. Puesto que solamente
una muestra es tomada, el tamao de muestra debe ser lo
suficientemente grande para extraer una conclusin. Una muestra
grande muchas veces cuesta demasiado dinero y tiempo.
Muestreo doble
Bajo este tipo de muestreo, cuando el resultado del estudio de la
primera muestra no es decisivo, una segunda muestra es extrada de la
misma poblacin. Las dos muestras son combinadas para analizar los
resultados. Este mtodo permite a una persona principiar con una
muestra relativamente pequea para ahorrar costos y tiempo. Si la
primera muestra arroja un resultado definitivo, la segunda muestra
puede no necesitarse.
Por ejemplo, al probar la calidad de un lote de productos
manufacturados, si la primera muestra arroja una calidad muy alta, el
lote es aceptado; si arroja una calidad muy pobre, el lote es rechazado.
Solamente si la primera muestra arroja una calidad intermedia, ser
necesaria la segunda muestra. Un plan tpico de muestreo doble puede
ser obtenido de la Military Standard Sampling Procedures and Tables for
Inspection by Attributes, publicada por el Departamento de Defensa y
tambin usado por muchas industrias privadas. Al probar la calidad de
un lote consistente de 3,000 unidades manufacturadas, cuando el
nmero de defectos encontrados en la primera muestra de 80 unidades
62

es de 5 o menos, el lote es considerado bueno y es aceptado; si el


nmero de defectos es 9 o ms, el lote es considerado pobre y es
rechazado; si el nmero est entre 5 y 9, no puede llegarse a una
decisin y una segunda muestra de 80 unidades es extrada del lote. Si
el nmero de defectos en las dos muestras combinadas (incluyendo 80
+ 80 = 160 unidades) es 12 o menos, el lote es aceptado si el nmero
combinado es 13 o ms, el lote es rechazado.
Muestreo mltiple
El procedimiento bajo este mtodo es similar al expuesto en el muestreo
doble, excepto que el nmero de muestras sucesivas requerido para
llegar a una decisin es ms de dos muestras.
MTODOS DE MUESTREO CLASIFICADOS DE ACUERDO CON LAS
MANERAS USADAS EN SELECCIONAR LOS ELEMENTOS DE UNA
MUESTRA.
Los elementos de una muestra pueden ser seleccionados de dos
maneras diferentes:
a. Basados en el juicio de una persona.
b. Seleccin aleatoria (al azar)
Muestreo de juicio
Una muestra es llamada muestra de juicio cuando sus elementos son
seleccionados mediante juicio personal. La persona que selecciona los
elementos de la muestra, usualmente es un experto en la medida dada.
Una muestra de juicio es llamada una muestra probabilstica, puesto que
este mtodo est basado en los puntos de vista subjetivos de una
persona y la teora de la probabilidad no puede ser empleada para medir
el error de muestreo, Las principales ventajas de una muestra de juicio
son la facilidad de obtenerla y que el costo usualmente es bajo.
Muestreo Aleatorio
Una muestra se dice que es extrada al azar cuando la manera de
seleccin es tal, que cada elemento de la poblacin tiene igual
oportunidad de ser seleccionado. Una muestra aleatoria es tambin
llamada una muestra probabilstica. Son generalmente preferidas por los
estadsticos porque la seleccin de las muestras es objetiva y el error
muestral puede ser medido en trminos de probabilidad bajo la curva
normal. Los tipos comunes de muestreo aleatorio son el muestreo
aleatorio simple, muestreo sistemtico, muestreo estratificado y
muestreo de conglomerados.
Muestreo aleatorio simple
Una muestra aleatoria simple es seleccionada de tal manera que cada
muestra posible del mismo tamao tiene igual probabilidad de ser
seleccionada de la poblacin. Para obtener una muestra aleatoria simple
cada elemento en la poblacin debe tener la misma probabilidad de ser
seleccionado. El plan de muestreo puede no conducir a una muestra
aleatoria simple. Por conveniencia, este mtodo pude ser reemplazado

63

por una tabla de nmeros aleatorios. Cuando una poblacin es infinita,


es obvio que la tarea de numerar cada elemento de la poblacin es
imposible. Por lo tanto, ciertas modificaciones del muestreo aleatorio
simple son necesarias. Los tipos ms comunes de muestreo aleatorio
modificado son sistemtico, estratificado y de conglomerados.
Muestreo sistemtico.
Una muestra sistemtica se obtiene cuando los elementos son
seleccionados en una manera ordenada. La manera de la seleccin
depende del nmero de elementos incluidos en la poblacin y el tamao
de la muestra. El nmero de elementos en la poblacin es, primero,
dividido por el nmero deseado en la muestra. El cociente indicar si
cada dcimo, cada onceavo, o cada centsimo elemento en la poblacin
va a ser seleccionado.
El primer elemento de la muestra es seleccionado al azar. Por lo tanto,
una muestra sistemtica puede dar la misma precisin de estimacin
acerca de la poblacin, que una muestra aleatoria simple cuando los
elementos en la poblacin estn ordenados al azar.
Muestreo Estratificado
Para obtener una muestra aleatoria estratificada, primero se divide la
poblacin en grupos, llamados estratos, que son ms homogneos que
la poblacin como un todo. Los elementos de la muestra son entonces
seleccionados al azar o por un mtodo sistemtico de cada estrato. Las
estimaciones de la poblacin, basadas en la muestra estratificada,
usualmente tienen mayor precisin (o menor error muestral) que si la
poblacin entera es muestreada mediante muestreo aleatorio simple. El
nmero de elementos seleccionado de cada estrato puede ser
proporcional o desproporcional al tamao del estrato en relacin con la
poblacin.
Muestreo de conglomerados.
Para obtener una muestra de conglomerados, primero se divide la
poblacin en grupos que son convenientes para el muestreo. En seguida,
se selecciona una porcin de los grupos al azar o por un mtodo
sistemtico. Finalmente, se toman todos los elementos o parte de ellos
al azar o por un mtodo sistemtico. Bajo este mtodo, aunque no todos
los grupos son muestreados, cada grupo tiene una igual probabilidad de
ser seleccionado. Por lo tanto la muestra es aleatoria.
Una muestra de conglomerados, usualmente produce un mayor error
muestral (por lo tanto, da menor precisin de las estimaciones acerca de
la poblacin) que una muestra aleatoria simple del mismo tamao. Los
elementos individuales dentro de cada "conglomerado" tienden
usualmente a ser iguales. Por ejemplo la gente rica puede vivir en el
mismo barrio, mientras que la gente pobre puede vivir en otra rea. No
todas las reas son muestreadas en un muestreo de reas. La variacin
entre los elementos obtenidos de las reas seleccionadas es, por lo
tanto, frecuentemente mayor que la obtenida si la poblacin entera es

64

muestreada mediante muestreo aleatorio simple. Esta debilidad puede


reducirse cuando se incrementa el tamao de la muestra de rea.
El incremento del tamao de la muestra puede fcilmente ser hecho en
el rea. Los entrevistadores no tienen que caminar demasiado lejos en
una pequea rea para entrevistar ms familias. Por lo tanto, una
muestra grande puede ser obtenida dentro de un corto perodo de
tiempo y a bajo costo en un rea determinada.
Por otra parte, una muestra de conglomerados puede producir la misma
precisin en la estimacin que una muestra aleatoria simple, si la
variacin de los elementos individuales dentro de cada conglomerado es
tan grande como la de la poblacin.
Muestreo aleatorio
Consideremos una poblacin finita, de la que deseamos extraer una
muestra. Cuando el proceso de extraccin es tal que garantiza a cada
uno de los elementos de la poblacin tengan la misma oportunidad de
ser incluidos en dicha muestra, denominamos al proceso de seleccin
muestreo aleatorio.
El muestreo aleatorio se puede plantear bajo dos puntos de vista:
Sin reposicin de los elementos;
Con reposicin.
Muestreo aleatorio sin reposicin
Consideremos una poblacin E formada por N elementos. Si observamos
un elemento particular, e E en un muestreo aleatorio sin reposicin se
da la siguiente circunstancia:
La probabilidad de que e sea elegido en primer lugar es 1/N
Si no ha sido elegido en primer lugar (lo que ocurre con una
probabilidad de (N-1)/N), la probabilidad de que sea elegido en el
segundo intento es de 1/(N-1).
en el (i+1) simo intento, la poblacin consta de N-i elementos,
con lo cual si e no ha sido seleccionado previamente, la
probabilidad de que lo sea en este momento es de 1/(N-i).
Si consideramos una muestra de n N elementos, donde el orden en la
eleccin de los mismos tiene importancia, la probabilidad de eleccin de
una muestra

cualquiera es

65

Lo que corresponde en el sentido de la definicin de probabilidad de


Laplace a un caso posible entre las VN, n posibles n-uplas de N elementos
de la poblacin.
Si el orden no interviene, la probabilidad de que una muestra

sea elegida es la suma de las probabilidades de elegir una cualquiera de


sus n-uplas, tantas veces como permutaciones en el orden de sus
elementos sea posible, es decir

Muestreo aleatorio con reposicin


Sobre una poblacin E de tamao N podemos realizar extracciones de n
elementos, pero de modo que cada vez el elemento extrado es repuesto
al total de la poblacin. De esta forma un elemento puede ser extrado
varias veces. Si el orden en la extraccin de la muestra interviene, la
probabilidad de una cualquiera de ellas, formada por n elementos es:

Si el orden no interviene, la probabilidad de una muestra cualquiera,


ser la suma de la anterior, repitindola tantas veces como manera de
combinar sus elementos sea posible. Es decir,
Sea n1 el nmero de veces que se repite cierto elemento e1 en la
muestra;
Sea n2 el nmero de veces que se repite cierto elemento e2;
Sea nk el nmero de veces que se repite cierto elemento ek,
de modo que
la muestra es

. Entonces la probabilidad de obtener

66

es decir,

El muestreo aleatorio con reposicin es tambin denominado muestreo


aleatorio simple, que como hemos mencionado se caracteriza por que
cada elemento de la poblacin tiene la misma probabilidad de ser
elegido, y
las observaciones se realizan con reemplaza miento. De este
modo, cada observacin es realizada sobre la misma poblacin (no
disminuye con las extracciones sucesivas).
Sea X una variable aleatoria definida sobre la poblacin E, y f(x) su ley
de probabilidad.

En una muestra aleatoria simple, cada observacin tiene la distribucin


de probabilidad de la poblacin:
Adems todas las observaciones
independientes, es decir

de

la

variable

aleatoria

son

TABLAS DE NMEROS ALEATORIOS: LOTERA NACIONAL


Un ejemplo de una tabla de nmeros aleatorios consiste en la lista de los
nmeros de Lotera Nacional premiados a lo largo de su historia, pues se

67

caracterizan por que cada dgito tiene la misma probabilidad de ser


elegido, y su eleccin es independiente de las dems extracciones.
Un modo de hacerlo es el siguiente. Supongamos que tenemos una lista
de nmeros aleatorios de k=5 cifras (00000-99.999), una poblacin de
N=600 individuos, y deseamos extraer una muestra de n=6 de ellos. En
este caso ordenamos a toda la poblacin (usando cualquier criterio) de
modo que a cada uno de sus elementos le corresponda un nmero del 1
al 600. En segundo lugar nos dirigimos a la tabla de nmeros aleatorios,
y comenzando en cualquier punto extraemos un nmero t, y tomamos
como primer elemento de la muestra al elemento de la poblacin:

El proceso se repite tomando los siguientes nmeros de la tabla de


nmeros aleatorios, hasta obtener la muestra de 10 individuos.
Las cantidades

pueden ser consideradas como observaciones de una variable aaleatoria


U, que sigue una distribucin uniforme en el intervalo [0,1]

MTODO DE MONTECARLO
El mtodo de Montecarlo es una tcnica para obtener muestras
aleatorias simples de una variable aleatoria X, de la que conocemos su
ley de probabilidad (a partir de su funcin de distribucin F). Con este
mtodo, el modo de elegir aleatoriamente un valor de X es siguiendo su
ley de probabilidad:
1. Usando una tabla de nmeros aleatorios se toma un valor u de una
variable aleatoria
.
2. Si X es continua, tomar como observacin de X, la cantidad x=F-1(u).
En el caso en que X sea discreta se toma x como el percentil
de X,
es decir el valor ms pequeo que verifica que
.

68

Este proceso se debe repetir n veces para obtener una muestra de


tamao n.
Ejemplo
Si queremos extraer n=10 muestras de una distribucin N(0, 1)
podemos recurrir a una tabla de nmeros aleatorios de k=5cifras, en las
que observamos las cantidades (por ejemplo)

A partir de ellas podemos obtener una muestra de


una tabla de la distribucin normal:

Nmeros aleatorios

Muestra

Muestra
xi = F-1(ui)

ti
76.293

0'76

0'71

31.776

0'32(=1-0'68)

-0'47

50.803

0'51

0'03

71.153

0'71

0'55

20.271

0'20(=1-0'80)

-0'84

33.717

0'34(=1-0'66)

-0'41

17.979

0'18(=1-0'82)

-0'92

52.125

0'52

0'05

41.330

0'41(=1-0'59)

-0'23

69

usando

95.141

0'95

1'65

Obsrvese que como era de esperar, las observaciones xi tienden a


agruparse alrededor de la esperanza matemtica de
. Por otra parte, esto no implica que el valor medio de la muestra sea
necesariamente
. Sin embargo como sabemos por el teorema de
Fisher que

su dispersin con respecto al valor central es pequea, lo que implica


que probablemente el valor medio estar muy prximo a 0, como se
puede calcular:

Obsrvese que si el problema fuese el inverso, donde nicamente


conocisemos las observaciones xi y que el mecanismo que gener esos
datos hubiese sido una distribucin normal de parmetros desconocidos,
con
obtenida hubisemos tenido una buena aproximacin del
``parmetro desconocido''
. Sobre esta cuestin volveremos ms
adelante al abordar el problema de la estimacin puntual de parmetros.

70

UNIDAD

10
10. ESTIMACIN E INTERVALOS
DE CONFIANZA
Caractersticas
Determinacin del intervalo de
confianza para la media, el total
y la proporcin
Muestras grandes.
Distribucin normal
Muestras pequeas

ESTIMACIN E
INTERVALOS DE
CONFIANZA

71

INTERVALO DE CONFIANZA.
El tema a desarrollar es intervalo de Confianza y haciendo referencia a
Richard I. Levin & David S. Rubin, en su libro de Estadstica para
Administradores, establecen el concepto de Intervalo de Confianza de
la siguiente forma:
Intervalo de valores que tiene designada una probabilidad que incluya el
valor real del parmetro de poblacin.
Para entender mas claramente este concepto, es necesario comentar de
inicio otros que al estar relacionados con el, facilitan su comprensin.
Algunos de estos conceptos a revisar son:
Estimacin.
Estimacin Puntual.
Estimacin de intervalo.
Nivel de confianza.
Limites de confianza
ESTIMACIN
Aprecio y valor que se da y en que se tasa y considera algo. || 2. Der. La
que se realiza en ciertos tributos para determinar el valor de la base
imponible.
Este es el concepto que podemos encontrar en un diccionario. Pero es
adems un concepto que en nuestra vida diaria aplicamos de forma
recurrente.
Todo el mundo hace estimaciones. Para cruzar una calle, y vemos venir
un auto, estimamos la velocidad de este y la distancia que hay entre
nosotros y el automvil a fin de decidir si esperamos a cruzar o
echaremos a correr para cruzar la calle.
Implcito esta en este ejemplo una de la razones para hacer
estimaciones como administradores, jefes o lideres de equipo: Tomar
decisiones en base a un clculo, una estimacin.
Los administradores deben hacer estimaciones rpidas, el resultado de
estas incide en la organizacin por medio de la decisin tomada a partir
de la estimacin. Se hacen estimaciones en:

Una universidad para determinar el nivel de inscripciones ao con


ao.
En un bur de crdito, a fin de determinar si un cliente puede
terminar de pagar su deuda en un determinado tiempo, a partir de
sus hbitos de crdito previos, lo que vendra a ser el historial.
Para fijar presupuestos, con base a informacin del pasado.

72

En cada uno de estos casos se esta tratando de inferir, saber algo de


una poblacin a partir de una muestra, como tomadores de decisiones,
nos veremos muchas veces forzados a tomar decisiones confiando en
nuestro instinto en nuestros presentimientos, pero lo ideal cada uno en
su posicin, seria que estas decisiones estuvieran tomadas a partir de la
disposicin de informacin y aplicar conocimientos de estadstica para
desempearnos mejor.
Concluimos de inicio para el Concepto de Estimacin que las razones
para su aplicacin son las siguientes:
1. Con el fin de tomar decisiones racionales, para el beneficio de la
organizacin.
2. Inferir algo, acerca a partir de la informacin de la muestra., a partir
de mtodos con precisin razonable, todo este proceso debe ser capaz
de proveer de informacin para desempearnos de la mejor manera en
la toma de decisiones.
Existen dos tipos de estimacin, en lo que se refiere a una poblacin.
Estimacin puntual.
Estimacin de Intervalo.
Este ltimo concepto nos ayudara a entender el concepto objetivo de
nuestra exposicin que es Intervalo de Confianza.
ESTIMACIN PUNTUAL
Una estimacin puntual es un solo nmero que se utiliza para estimar un
parmetro (dato) de poblacin desconocido.
Ejemplo: El jefe de una Universidad estara haciendo una estimacin
puntual al afirmar: Para el siguiente ao escolar por nuestros datos
actuales se indica que en la materia de Filosofa y letras tendremos 350
estudiantes.
La afirmacin es similar a lanzar una moneda al aire: o es cierta o es
falsa, solo tiene dos opciones. Por lo tanto una estimacin puntual
resulta a menudo insuficiente, debido a que solo tiene dos opciones: es
correcta o esta equivocada. Adems si se nos dice que el jefe de
departamento esta equivocado en su estimacin, se generarla la
siguiente pregunta. Que tan distante esta la estimacin de la real? Es
decir que estimacin de error posee. No es lo mismo decir que la
estimacin esta errada por 10 estudiantes que por 90, la diferencia lo
establece un concepto: CONFIABILIDAD.
Ejemplo de Estimacin Puntual: La media de la muestra es un estimador
de la media de la poblacin confiable, sobre todo cuando la muestra es
lo suficientemente grande. Pero es una estimacin puntual pues solo
arroja un resultado.
Para explicarlo, aun cuando ya es un tema visto, haremos revisin de la
formula:
73

X = x
Donde: x, es la sumatoria de todos los elementos de la muestra.
n
Y n, es el numero de elementos.
Observemos el ejemplo de una compaa de suministros clnicos que
produce jeringas hipodrmicas desechables. Cada jeringa viene en una
envoltura estril que a su vez viene empacada en grandes cajas de
cartn corrugado. Debido a la forma en que empacan las jeringas en las
cajas de cartn, estn manejan una cantidad de contenido diferente,
debido a que las jeringas se venden por pieza, la compaa necesita una
estimacin del nmero de pieza que hay por caja, para propsitos de
facturacin.
Se tomo la muestra aleatoria de 35 cajas, y se registro el nmero de
jeringas contenido en dicha muestra:
101

103

112

102

98

97

93

105

100

97

107

93

94

97

97

100

110

106

110

103

99

93

98

106

100

112

105

100

114

97

110

102

98

112

99

Utilizando la formula, tendremos: 3570/35=102 jeringas.


As pues al usar la media de la muestra, como nuestro estimador, la
estimacin puntual de la media es de 102 jeringas.
La conclusin a la que llegaramos con el anterior ejemplo seria:
As al usar la media de la muestra como un estimador, la estimacin
puntual de la jeringa hipodrmica desechable es de 102 jeringas por
caja. El precio de fabricacin es bastante bajo (alrededor de 25
centavos), de modo que tanto el comprador como el vendedor
aceptaran esta estimacin puntual como la base para hacer la
facturacin, y el fabricante puede ahorrarse tiempo y el gasto de contar
cada una de las jeringas contenidas en las cajas.
El propsito de tomar muestras es para conocer mas acerca de una
poblacin, ya sea, los estudiantes de ingreso al prximo ciclo escolar, o
el total de un embarque de jeringas hipodrmicas, como en el ejemplo
anterior, cuyo anlisis parti de una muestra de 35 cajas.
Para hacerlo, podemos basarnos en estimaciones puntuales, como lo es
la media de la muestra, o con Estimaciones de intervalo, nuestro
siguiente tema.

74

ESTIMACIN DE INTERVALO.Una estimacin de Intervalo, describe un intervalo de valores dentro del


cual es posible que este un parmetro de poblacin.
Dentro de sus caractersticas encontramos:
Dentro de las estimaciones de Intervalo, se maneja un concepto
adicional, que implica la incertidumbre que acompaara dicha
estimacin.
Una afirmacin acerca del intervalo dentro del cual es probable
que este la media de poblacin desconocida.
Para proporcionar dicha afirmacin, se necesita encontrar el error
estndar de la media.
Para explicarlo mejor nos apoyaremos en el siguiente ejemplo:
Suponga que el director de investigaciones de mercado de una fbrica
de refacciones automotrices necesita hacer una estimacin de la vida
promedio de las bateras para automvil que su compaa produce. Se
selecciona una muestra aleatoria de 200 bateras, se registro en nombre
de los propietarios de los automviles y su direccin, de la misma
manera se entrevisto a estas personas con respecto a la duracin de la
batera de su automvil. Despus de realizar la aplicacin de la formula
de la media de la muestra, tenemos como resultado: 36 meses de vida
promedio.
Si se utiliza la estimacin puntual de la media de la muestra como el
mejor estimador de la media de la poblacin se informara que la vida
media de las bateras de la empresa es de 36 meses.
Pero supongamos que el director tambin conocer acerca de la
incertidumbre que probablemente acompaara a la estimacin, es decir
una afirmacin acerca del intervalo dentro de lo cual es posible que este
la media de la poblacin desconocida. Eso se determina calculando el
error estndar de la media.
Para esto se utiliza la formula de clculo de error estndar de la media:

x=
n
Donde es la desviacin estndar y n el nmero de observaciones.
Supongamos que previamente se hizo el clculo de la desviacin
estndar de las 200 bateras, y se ha determinado que es de 10 meses.
Utilizando dicho dato y la formula que indicamos en el recuadro anterior.
Resultara as: =0.707 meses
Ahora se puede concluir que la estimacin de la vida til de un las
bateras de la compaa es de 36 meses, y el error estndar que
acompaa a dicha estimacin es .707. En otras palabras, la vida til real
para todas las bateras puede estar en alguna parte de esta estimacin
de intervalo comprendida entre 35.293 y 36.707 meses.

75

Nos hemos acercado ya entonces al concepto inicial de la exposicin,


Intervalo de confianza, a fin de entender Estimacin de Intervalo,
marcando su diferencia con
Estimacin Puntual.
Recordemos el concepto de Richard I. Levin & David S. Rubin, en su libro
de Estadstica para Administradores, establecen el concepto de
Intervalo de Confianza de la siguiente forma:
Intervalo de valores que tiene designada una probabilidad que incluya el
valor real del parmetro de poblacin.
Porque hacemos esto, para entender el concepto de Nivel de confianza
de un Intervalo, esto es la probabilidad de que el verdadero parmetro
de la estimacin este dentro de la estimacin de intervalo.
Es decir apoyndonos en el ejemplo de las 200 bateras, cuantas de
estas caeran dentro del intervalo en donde se encuentra la media de la
muestra., con los limites que hemos establecidos con la formula de Error
estndar de la media.
NIVEL DE CONFIANZA.En la estadstica la probabilidad que asociamos o relacionamos con una
estimacin de intervalo es conocida como Nivel de Confianza.
Que tanta confianza tenemos que la estimacin que hicimos de un
intervalo, incluya la mayor parte de la muestra, es decir los casos
analizados.
Analicemos un caso prctico:
Considere por ejemplo el caso de un cliente de una tienda de
electrodomsticos que pregunta sobre el tiempo de espera para la
entrega de una lavadora de ropa nueva. En la tabla se aprecia las
preguntas que el cliente puede hacer y las probables respuestas. Si se
observa se puede ver que existe una relacin directa entre el nivel de
confianza y el intervalo de confianza de cualquier estimacin.
Pregunta del

Respuesta del

Nivel de

Cliente

Empleado.

Confianza

Llegara la lavadora Tengo la certeza de Mayor a


en un ao?
Me entregaran la

ello.
Estoy casi seguro

lavadora dentro de

de que llegara en

un mes?
Me entregaran la

un mes.

lavadora en una
semana?

99%
Al menos
95%

Estoy bastante

Alrededor

seguro.

de 80%

76

Intervalo de
Confianza
Implicado
Un ao.

Un mes

Una semana

Me entregaran la No tengo la certeza Cerca de


lavadora maana? de poder hacerlo.
Llegara la lavadora Hay una mnima
antes de que llegue posibilidad de poder
a casa?

40%
Cerca de

lograrlo.

1%

Un da

Una hora.

Se nota que cuando el intervalo de confianza es ms amplio o


extenso, como en el caso de la entrega que tarda un ao, la
estimacin toma un valor muy poco real, a pesar de que el
administrador le da un nivel de confianza de 99% a dicha
estimacin.
A medida que el cliente estable un intervalo mas estrecho (el
tiempo de entrega), el administrador de la tienda consiente un
nivel de confianza mas bajo, llegara la lavadora antes que llegue
yo a casa?, la estimacin de confianza tiene un nivel muy bajo
(1%).
Encontramos de esta forma el intervalo de confianza del anterior
ejemplo:
N.C.

Intervalo

Mayor a 99%

Un ao.

Al menos
95%

Un mes

LIMITES DE CONFIANZA.A menudo el intervalo de confianza se expresa en trminos de errores


estndar, ms que con valores numricos. De la siguiente forma.
x 1.64 x en la que:
x + 1.64 x = limite superior del intervalo.
x - 1.64 x = limite inferior del intervalo.
A estos lmites se les conoce como limites de Confianza del intervalo de
Confianza. (LIC)

BIBLIOGRAFA
-

Larios Osorio, Vctor. Probabilidad. Mxico, 1999.

77

Lind, Douglas A.
Estadstica aplicada a los negocios
y la
economa. Mxico, Mc. Graw Gill, 2005
Lind, Marchal, Mason. Estadstica para administracin y economa.
Mxico, Alfa omega, 2006
Newbold, P. Estadstica para los negocios y la Economa. Mxico,
Pearson, 2005
Rodas, Olger. Teora bsica del Muestreo. Mxico, 2003.
Stevenson, J. William Estadstica para administracin y economa.
Mxico, Alfa omega, 2006
Universidad de Mlaga. Muestreo Aleatorio. Mxico, 2002.
Vega Trujillo, Mara del Pilar. Distribucin de Frecuencias. Mxico,
2005.
Zadu, Ins. Distribuciones de Probabilidad. Mxico, 2004.

78

También podría gustarte