Está en la página 1de 53

1


PUBLICACIONES SIASW - MEXICO
2015

Indice general

1. Introduccion
1.1. Que es estadstica? . . . . . . . . . . . . . . . . . . . . . . . . . . .
y la muestra . . . . . . . . . . . . . . . . . . . . . . .
1.2. La poblacion
1.3. Estadstica descriptiva e inferencial . . . . . . . . . . . . . . . . . .

1
1
1
2

2. Estadstica descriptiva
2.1. Variables y Datos . . . . . . . . . . . . . . . .
2.1.1. Tipos de variables . . . . . . . . . . . .
de datos con graficas . . . . . . .
2.2. Descripcion
2.2.1. Graficas para datos cualitativos . . . .
2.2.2. Graficas para datos cuantitativos . . .
de datos con medidas numericas
2.3. Descripcion
2.3.1. Media, mediana y moda . . . . . . . .
estandar . . . .
2.3.2. Varianza y desviacion

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

5
. 5
. 6
. 7
. 7
. 9
. 15
. 15
. 17

3. Probabilidad
3.1. Espacio muestral y eventos . . . .

3.2. Algebra
de eventos . . . . . . . .
3.3. Axiomas de probabilidad . . . . .
3.4. Espacios de probabilidad discreta
3.5. Independencia . . . . . . . . . .
3.6. Probabilidad condicional . . . . .

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

23
23
26
26
28
29
30

4. Variables aleatorias y esperanza


4.1. Variables aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2. Distribuciones de probabilidad . . . . . . . . . . . . . . . . . . . .
4.3. Valor esperado de una variable aleatoria . . . . . . . . . . . . . . .

35
35
39
40

5. Distribuciones especiales
5.1. Distribuciones de probabilidad discretas . . . . . . . . . . .
de probabilidad binomial . . . . . .
5.1.1. La distribucion
de probabilidad de Poisson . . . . .
5.1.2. La distribucion
de probabilidad Hipergeometrica . .
5.1.3. La distribucion
5.2. Distribuciones de probabilidad continuas . . . . . . . . . .
de probabilidad uniforme continua .
5.2.1. La distribucion
de probabilidad exponencial . . . .
5.2.2. La distribucion
de probabilidad normal . . . . . . .
5.2.3. La distribucion

43
43
43
46
47
48
48
48
48

III

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.


1. Introduccion

Contenido
1.1. Que es estadstica? . . . . . . . . . . . . . . . . . . . . . . . . .

y la muestra . . . . . . . . . . . . . . . . . . . . .
1.2. La poblacion

1.3. Estadstica descriptiva e inferencial . . . . . . . . . . . . . . .

Objetivo: Comprender el concepto de estadstica y conocer cual es su objetivo.


y muestra. Se mencionaran
Panorama general: Se define estadstica, poblacion
los procedimientos usados en estadstica descriptiva y estadstica inferencial.

1.1.

Que es estadstica?

momento, la gran mayora de la gente emplea tecnicas estadstiEn algun


cas. Esto se puede observar, por ejemplo, en la cantidad de dinero que se asigna
para el consumo diario, en los procesos de ingeniera y negocios, y en los resultados de las elecciones presidenciales. Las tecnicas estadsticas son de gran

importancia en las situaciones practicas de este tipo. El desarrollo teorico


para
comprender estas tecnicas es tratado en este texto.
La estadstica se define como una rama de las matematicas que trata con
analisis, interpretacion
y presentacion
de masas de datos numerila coleccion,
cos(Webster New Collegiate Dictionary). Stuard y Ord (1991) declaran: La estadstica es una rama del metodo cientfico que se ocupa de los datos obtenidos
contando o midiendo las propiedades de poblaciones. Rice (1995), comentan y aplicaciones estadsticas, declara que la estadstica
do sobre experimentacion
esta esencialmente interesada de procedimientos para el analisis de datos, es sentido vago tengan un caracter aleatorio.
pecialmente datos que en algun

1.2.

y la muestra
La poblacion

La poblacion es el cuerpo grande de medidas o datos y es el interes principal, y la muestra es un subconjunto seleccionado de e ste. Por ejemplo, podemos
tener todos los habitantes de un estado dado, o todas las televisiones produ pasado por un fabricante en particular, o todos los hogares en
cidas en el ano

una comunidad dada. En tales casos, tratamos de conocer acerca de la poblacion


y de examinar un subgrupo de sus elementos.
mediante la eleccion
1

CAPITULO
1. INTRODUCCION

Aunque en la mayora de los casos estamos interesados ante todo en la po e sta puede ser difcil o imposible de enumerar. Por ejemplo, imagnese
blacion,
poder registrar la preferencia presidencial de cada uno de los votantes registrados en Mexico ! En su lugar, tratamos de describir o predecir el comportamiento
de la poblacion en base de la informacion obtenida de una muestra representativa a
partir de la poblacion.
Las palabras muestra y poblacion tienen dos significados para la mayora de

las personas. Por ejemplo, al leer en los periodicos


que cierta encuesta esta basada en una muestra de 1823 personas. Presumiblemente, a cada persona entrevistada se le hace una pregunta en particular, y la respuesta de esa personas
en la muestra. Es la muestra el conjunto de 1823
representan una medicion
personas o lo es las 1823 respuestas que dan?
Cuando usamos el lenguaje estadstico, distinguimos entre entre el conjunto de objetos en los cuales las mediciones son tomadas y las propias mediciones.
Para el experimentador, los objetos en los cuales son tomadas las mediciones
son llamados unidades experimentales. El estadstico llama a la muestra de estudio elementos de la muestra.

1.3.

Estadstica descriptiva e inferencial

Cuando se presenta un conjunto de medidas por primera vez, ya sea de una


se necesita encontrar una manera de organizar y resumuestra o una poblacion,
mirlas. La rama de la estadstica que ordena, analiza y representa un conjunto de
medidas o datos es llamada estadstica descriptiva. El analisis consta de calcular,
a partir de los datos, medidas de tendencia central con el objetivo de observar
el comportamiento de los datos respecto a estos valores centrales. La represen de los datos es mediante tablas y graficas. As, la estadstica descriptiva
tacion
consiste en procedimiento usados para resumir y describir caractersticas importantes de un conjunto de medidas.
entera, solo
se necesita sacar
Si el conjunto de medidas es de la poblacion
conclusiones basada en la estadstica descriptiva. Sin embargo, podra ser de completa.
masiado costoso o demasiado tiempo para enumerar a la poblacion
una muestra de la poblacion.
Al
Por esta u otras razones, se puede tener solo


1.3. ESTADISTICA
DESCRIPTIVA E INFERENCIAL

en general.
observar la muestra, se desea responder cuestiones de la poblacion
La rama de la estadstica que trata con estos problemas es llamada estadstica
inferencial.
La estadstica inferencial consiste en procedimientos usados para hacer infe a partir de la informacion
contenida
rencias sobre caractersticas de la poblacion

en una muestra de esta poblacion.


El objetivo de la estadstica inferencial es realizar inferencias (esto es, sacar
conclusiones, hacer predicciones, tomar decisiones) sobre caractersticas de la
mediante la informacion
contenida en una muestra.
poblacion
de experimento
En general, el estudio de la estadstica se ocupa del diseno

o encuestas por muestreo para obtener una cantidad especfica de informacion

en hacer una inferencia


a un costo mnimo y el uso optimo
de esta informacion
El objetivo de la estadstica es hacer una inferencia acerca
acerca de una poblacion.
de una poblacion basada en informacion contenida en una muestra de esa poblacion
y proporcionar una medida de bondad asociada a la inferencia.

CAPITULO
1. INTRODUCCION

Ejercicios
Tecnicas basicas
o muestra? Para ca1.1 Poblacion
da una de las siguientes situaciones,
de interes, el
identificar la poblacion
objetivo inferencial
a Se quiere estimar la propor de neumaticos de automovi
cion
les con la banda de rodadura
entre todos los
sin proteccion
neumaticos fabricados por una

a especfica durante el
compan
de produccion
actual.
ano
b Un cientfico medico quiere es promedio de
timar la duracion
tiempo hasta la recurrencia de
una enfermedad determinada.
c Un ingeniero electrico quiere de promedio
terminar si la duracion
de vida de transistores de cierto
tipo es mayor a 500 horas.

2. Estadstica descriptiva

Contenido
2.1. Variables y Datos . . . . . . . . . . . . . . . . .
2.1.1. Tipos de variables . . . . . . . . . . . . .
de datos con graficas . . . . . . .
2.2. Descripcion
2.2.1. Graficas para datos cualitativos . . . . .
2.2.2. Graficas para datos cuantitativos . . . .
de datos con medidas numericas
2.3. Descripcion
2.3.1. Media, mediana y moda . . . . . . . . .
estandar . . . . .
2.3.2. Varianza y desviacion

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

. 5
. 6
. 7
. 7
. 9
. 15
. 15
. 17

Objetivo: Describir un conjunto de datos mediante tablas de frecuencias, graficas y medidas numericas, dependiendo el tipo de variable que es medida.

de una variable y unidad experimental.


Panorama general: Se da la definicion
Se hace uso de tablas de frecuencias, graficos y medidas numericas para describir los resultados al medir una variable de interes en una unidad experimental.

2.1.

Variables y Datos

Presentaremos algunas tecnicas para poder realizar estadstica descriptiva,


de un conjunto de mediciones
es decir, se presentan tecnicas para la descripcion
tanto de muestras como de poblaciones. Primero, debemos definir que se entiende por mediciones o datos y categorizarlos. Describiremos los datos mediante
de los datos, y
graficas, que nos ayudaran a describir la forma de la distribucion
cantidades numericas. Iniciamos introduciendo algunos conceptos importantes.
Una variable es una caracterstica que cambia o vara con el tiempo para
Por ejemplo, la edad de una
diferentes individuos u objetos bajo consideracion.
persona cambia con el tiempo y cambia de persona a persona. Otros ejemplos
son la estatura y el peso.
Una unidad experimental es el individuo u objeto sobre el cual una variable
es medida. Cuando una variable es medida sobre un conjunto de unidades experimentales resulta un conjunto de mediciones o datos. Aqu, por unidad expe
o un unico

rimental resulta una unica


medicion
valor de los datos. Por ejemplo,
en e ste.
el tiempo en realizar un proyecto o la inversion
(o dato) es generada por cada unidad experimental en la colecSi una medicion
completa (todos los individuos u objetos en las cuales se miden las variacion
bles), el conjunto de datos resultante constituye la poblacion de interes. As, la
poblacion es el conjunto de medidas interes para el investigador y la muestra es

un subconjunto de medidas seleccionadas de la poblacion.


5

CAPITULO
2. ESTADISTICA
DESCRIPTIVA

Un dato univariado resulta cuando una variable es medida en una unica


unidad de experimental. Por ejemplo, si medimos la temperatura corporal de
100 personas.

Un dato bivariado resulta cuando dos variables son medidas en una unica
y duracion
de 15 prounidad experimenta. Por ejemplo, si se mide la inversion
yectos.
Un dato multivariado resulta cuando tres o mas variables son medidas en

la estauna unica
unidad experimental. Por ejemplo, si medimos la profesion,
tura, edad y el sexo de una persona resulta un medida multivariada.

2.1.1.

Tipos de variables

Las variables se puede clasificar en una de dos categoras: cualitativas o


cuantitativas.
Las variables cualitativas miden una cualidad o caracterstica en cada unidad experimental. Las variables cuantitativas miden una cantidad o un monto
numerico en una unidad experimental.
Las variables cualitativas con frecuencia son llamadas datos categoricos debido a que se pueden categorizar conforme a clases similares o diferentes. Por
ejemplo:

Color de los ojos.

Profesion.

Las variables cuantitativas producen datos numerico, las cuales las representaremos por la letra X. Por ejemplo:

X = Numero
de habitantes.
X = Volumen de agua en una botella.

Las variables cuantitativas se clasifican en discretas o continuas. Una variable


puede adquirir un numero

discreta solo
finito o contable (correspondientes a

los numeros
naturales, X = 0, 1, 2, ...) de valores y una variable continua puede
adquirir muchos valores de manera infinita correspondientes a los puntos de
un intervalo (por ejemplo, 0 < X < ).
La Figura 2.1 describe los tipos de datos que tenemos definidos.

DE DATOS CON GRAFICAS

2.2. DESCRIPCION

Datos

Cualitativas

Cuantitativas

Discretos

Continuos

Figura 2.1: Tipos de datos

2.2.

de datos con graficas


Descripcion

de los datos dependera del tipo de variable, cualitativa o


La descripcion
cuantitativa.

2.2.1.

Graficas para datos cualitativos

Supongamos que se han recolectado los datos. Podemos resumir los datos mostrando los valores de variables medidas y la frecuencia con la que han
ocurrido construyendo tablas estadsticas, que pueden ser usadas para mostrar
de datos.
graficamente los datos como una distribucion
Cuando la variable es cualitativa, la tabla estadstica es una lista de las categoras consideradas con una medida de con que frecuencia ha ocurrido cada
valor.
Tablas de frecuencias y graficas

Se denomina frecuencia al numero


de datos de cada categora, es decir, el

numero
de veces que aparece un determinado valor de la variable. Consideremos un conjunto de datos que consiste de n valores. Si f es la frecuencia de un
f /n es llamada su frecuencia relativa. Esto
valor en particular, entonces la razon
de los datos
es, la frecuencia relativa de un conjunto de valores es la proporcion
que tienen ese valor,

Frecuencia relativa =

frecuencia
.
n

La lista de las categoras con la frecuencia o frecuencia relativa correspondiente es llamada tabla de frecuencias o tabla de frecuencias relativas, respectivamente; ambas son tablas estadsticas.

CAPITULO
2. ESTADISTICA
DESCRIPTIVA

Los datos de un tabla de frecuencias los podemos representar de manera


grafica mediante un grafico de lneas, que grafica las distintas categoras en el eje
horizontal e indica su frecuencia por las alturas de las lneas verticales. Si en las
lneas en un grafico de lneas se agrega un espesor, la grafica es llamada grafica
de barras (ver Figura 2.2).

Ejemplo 2-1
Se tiene una lista de 11 proyectos, donde cada proyecto tiene ciertas especifica de lo que se hara, plazo estimado, inversion,
etc.
ciones tales como: descripcion
Podemos categorizar cada proyecto en: Servicio, Rescate, Seguimiento y Taller.
La Tabla 2.1 muestra la frecuencia de cada tipo de proyecto en una comunidad
del Pas, de donde se observa que, el tipo de proyecto con menor frecuencia
son de Seguimiento y Taller mientras que el de mayor frecuencia es de Rescate. La Tabla 2.2 muestra frecuencia relativa de cada categora de los proyectos.


Tipo de proyecto

Frecuencia

Rescate

Seguimiento

Servicio

Taller

Tabla 2.1: Tipos de proyectos

0 1 2 3 4 5 6

frecuencia

grafica para la tabla de frecuencias.


La Figura 2.2 muestra la representacion

Rescate

Seguimiento

Servicio

Tipos de proyectos
Figura 2.2: Frecuencias de la Tabla 1

Taller

DE DATOS CON GRAFICAS

2.2. DESCRIPCION
Tipo de proyecto

Frecuencia Relativa

Rescate

0.45454545

Seguimiento

0.09090909

Servicio

0.36363636

Taller

0.09090909
Tabla 2.2: Frecuencias Relativas

grafica de las categoras meTambien se puede realizar una representacion


diante un grafico de pastel, un grafico circular que muestra el porcentaje de las
mediciones de cada categora, donde
porcentaje = 100 frecuencia relativa.

Categoras

Frecuencia

Frecuencia Relativa

Porcentaje

Rescate

0.45454545

45.454545 %

Seguimiento

0.09090909

9.090909 %

Servicio

0.36363636

36.363636 %

Taller

0.09090909

9.090909 %

Tabla 2.3: Tabla estadstica para la grafica de pastel del ejemplo 2-1.

Rescate 45%

Seguimiento 9%
Taller 9%

Servicio 36%

Figura 2.3: Grafica de pastel de la Tabla 2.3.

2.2.2.

Graficas para datos cuantitativos

Las variables cuantitativas miden un monto o cantidad en cada unidad ex puede tomar un numero

perimental. La variable es discreta si solo


finito o nu-

CAPITULO
2. ESTADISTICA
DESCRIPTIVA

10

merable de valores. La variable es continua si puede asumir un numero


infinito
de valores correspondientes a puntos en un intervalo.
Para los datos cuantitativos tambien podemos utilizar graficas de barras y
graficas circulares. La grafica de barras usa la altura de la barra para mostrar

la cantidad en una categora particular, y el grafico circular muestra como


la
cantidad total esta distribuida entre las categoras.

Graficas de lneas
Cuando una variable cuantitativa es registrada con el tiempo en intervalos de tiempo igualmente espaciados (tales como diariamente, semanalmente,
mensualmente o de manera anual), el conjunto de datos forma un serie de tiempo. Los datos de series de tiempo son presentados con mayor eficiencia en una
grafica de lneas con el tiempo como eje horizontal. Estos graficos son utilizados
o tendencia.
para mostrar una patron

Ejemplo 2-2

Realizar una grafica de lneas de la tabla de registro del numero


de habitantes
de 1950 a 1990.
en Mexico en los anos

Ano
Habitantes (millones)

1950
25.7

1960
34.5

1970
48.2

1980
66.8

1990
81.2

Tabla 2.4: Numero de habitantes en Mexico.

Habitantes (millones)

La variable cuantitativa habitantes es medida en cinco intervalos


Solucion.
de tiempo, creando una serie de tiempo que podemos graficar con una grafica de

lneas. Los intervalos de tiempo son marcados en el eje horizontal y el numero


de
habitantes es marcado en el eje vertical, Los puntos de los datos son resaltados
y estan conectados por segmentos de lneas para formar el grafico de lneas de
la Figura 2.4.
80
70
60
50
40
30
1950

1960

1970

1980

1990

Aos

Figura 2.4: Grafico de lneas de la Tabla 2.4

DE DATOS CON GRAFICAS

2.2. DESCRIPCION

11

Polgono de frecuencias

de distinSi el conjunto de datos tienen un numero


relativamente pequeno
tos valores es conveniente presentarlos en una tabla de frecuencias. Por ejemplo,
la Tabla 2.5 es una tabla de frecuencias para datos que consiste del salario mensual de 40 estudiantes graduados recientemente de ingeniera electrica. La Tabla
2.5 nos dice, entre otras cosas, que el salio mas bajo de $5,000 es recibido por
cuatro de los graduados, mientras que el salio mas alto de $15,000 es recibido

fue $9,000 y es recibido


por un unico
estudiante. El salario inicial mas comun
por 10 de los estudiantes.
Salario inicial

Frecuencia

10

10

11

12

13

14

15

Tabla 2.5: Tabla de frecuencias del salario inicial mensual

Otro tipo de grafico usado para representar una tabla de frecuencias es el


polgono de frecuencias, el cual grafica las frecuencias de las diferentes categoras
en el eje vertical, y entonces conecta los puntos graficados con lneas rectas.

Frecuencia

10
8
6
4
2
0
5

10

11

12

13

14

Salario inicial
Figura 2.5: Polgono de frecuencias de la Tabla 2.5

15

CAPITULO
2. ESTADISTICA
DESCRIPTIVA

12

Histogramas y ojivas

Para algunos conjuntos de datos el numero


de valores distintos es tambien
dividir los valores en grupos o intervalos de clase,
grande. Para tales casos, es util

y entonces graficar el numero


de valores de los datos que caen en cada interva
entre
lo de clase. El numero
de intervalos de clase debe ser una compensacion
acerca de los valores
(1) elegir pocas clases a un costo de perder informacion
reales en una clase y (2) elegir muchas clases, que se traducira en las frecuencias
para un patron
que sea discernible.
de cada clase siendo demasiado pequenas

Aunque de 5 a 10 intervalos de clase son tpicos, el numero


aproximado es sub
jetivo, y por supuesto , podemos probar numeros
diferentes de intervalos de
clase para ver cuales de las graficas resultantes parece ser mas revelador de los
aunque no esencial, elegir intervalos de clase de igual longitud.
datos. Es comun,

3997

49

419

980

3111

3061

2203

426

4999

74

19

1249

2650

4597

2254

54

234

119

99

2979

3771

4507

2250

79

349

59

899

3314

2524

4857

2203

53

444

89

999

399

1285

4543

2203

282

321

74

1249

2000

2491

4579

4133

40

199

709

2979

179

1606

4819

2964

74

149

989

3314

299

4905

4579

450

51

589

39

579

499

2507

1685

4904

39

299

74

199

1497

1666

4293

2595

41

Tabla 2.6: La compra en pesos de 80 personas en un supermercado

Los puntos finales de un intervalo de clase son llamados lmites de clase.


Adoptaremos la convencion de inclusion de extremo izquierdo, la cual estipula que
un intervalo de clase su extremo izquierdo pero no su punto lmite en el extremo
derecho. As, por ejemplo, el intervalo de clase 10-20 contiene todos los valores
que son mayores que o igual a 10 y menores que 20.
La Tabla 2.6 presenta la compra de 80 personas. Una tabla de frecuencias
de clase para los datos de la Tabla 2.6 es presentada en la Tabla ??. Los intervalos
de clase son de longitud 500, con el primero iniciando en 0.
Una grafica de barras de los datos de la clase, con las barras colocadas adyacentes entre s, es llamado un histograma. El eje vertical de un histograma puede
representarse la frecuencia de clase o la frecuencia de clase relativa; en el pri
mer caso el grafico es llamado un histograma de frecuencia y en este ultimo
un histograma de frecuencia relativa. La Figura 2.6 presenta un histograma de
frecuencia de los datos en Tabla 2.7.

DE DATOS CON GRAFICAS

2.2. DESCRIPCION

13

Frecuencia

(Numero
de valores de los datos en
Intervalo de Clase

el intervalo)

0-500

34

500-1000

1000-1500

1500-2000

2000-2500

2500-3000

3000-3500

3500-4000

4000-4500

4500-5000

10

35
25
15
0 5

Nmero de ocurrencia

Tabla 2.7: Una Tabla de Frecuencia de Clase

10

15

20

25

30

35

40

45

50

Compras en unidades de 100 pesos

Figura 2.6: Un histograma de frecuencia de la Tabla 2.7

Algunas veces estamos interesados en el trazo de un grafico de una frecuencia acumulada (o frecuencia relativa acumulada). Un punto en el eje horizontal
de tal grafico representa un valor posible de los datos; su trazo vertical corres
de los datos cuyos valores son
pondiente proporciona el numero
(o proporcion)
menores que o iguales a e ste. Una grafica de frecuencia relativa acumulada de
los datos de la Tabla 2.7 esta dada en la Figura 2.7. Podemos concluir de la figura que 100 por ciento de los datos son menores a 5000, aproximadamente 50
por ciento son menores o iguales a 1000, aproximadamente un poco mas del 80
por ciento son menores que o iguales a 4000 y as sucesivamente. Un grafico de
frecuencias acumuladas es llamado una Ojiva, esto es que, permite ver cuantas
observaciones se encuentran por encima o debajo de ciertos valores, en lugar de

solo exhibir los numeros


asignados a cada intervalo.

CAPITULO
2. ESTADISTICA
DESCRIPTIVA

14

1.0
0.8
0.6
0.4
0.2
0.0
0

1000

2000

3000

4000

5000

Compras
Figura 2.7: Un grafico de frecuencia acumulada

Grafico de tallo y hoja


y de taUna manera eficiente de organizar un conjunto de datos pequeno,
moderado, es utilizar un grafico de tallo y hoja. Tal grafico se obtiene all
mano
dividir cada valor de los datos en dos partes. su hoja y su tallo. Por ejemplo,

si los datos son todos numeros


de dos dgitos, entones podramos dejar que la
parte del tallo de un valor de los datos sea su dgito de las decenas y dejar que
la hoja sea su dgito de las unidades. As, por ejemplo, el valor 59 es expresado
como
Tallo Hoja
5
9
y los dos valores de datos 57 y 59 pueden ser representados como
Tallo
5

Hoja
7, 9

Ejemplo 2-3
La Tabla 2.8 da 35 cantidades de temperaturas medidas en grados Celsius en
diferentes localidades del pas. Estos datos son representadas en la siguiente
grafica de tallo y hoja.
1
2
3
4

9.0, 9.8
3.1, 4.1, 5.3, 5.8, 6.2, 9.0, 9.5
0.0, 1.0, 2.4, 3.6, 3.7, 4.8, 5.0, 5.2, 6.0
0.0, 0.3, 1.0, 1.5, 2.1, 2.4


DE DATOS CON MEDIDAS NUMERICAS

2.3. DESCRIPCION
Localidad

Grados Celsius

Localidad

Grados Celsius

19.0

13

23.1

24.1

14

30.0

40.0

15

19.8

25.3

16

40.3

32.4

17

41.0

25.8

18

29.0

26.2

19

31.0

33.6

20

29.5

34.8

21

33.7

10

35.2

22

42.4

11

41.5

23

36.0

12

35.0

24

42.1

15

Tabla 2.8: Tabla de frecuencias del salario inicial mensual

2.3.

de datos con medidas numericas


Descripcion

Utilizaremos medidas numericas calculadas por una muestra o una pobla de datos. Estas medidas son llamadas parametros cuando son asociados a la
cion
de datos y son llamados estadsticos cuando son calculados a partir de
poblacion
datos muestrales.

2.3.1.

Media, mediana y moda

Introducimos algunos estadsticos usados para describir la parte central de


un conjunto de datos. Estos estadsticos son llamados medidas centrales o medidas
de centro.
La media o media aritmetica es el promedio aritmetico de un conjunto de
datos. As, la media o promedio aritmetico de un conjunto de n datos es la suma
de todos estos datos dividida por n.

Usaremos la letra griega minuscula


(mu) para referirnos a la media poblacional y el smbolo x (x barra) para referirnos a la media muestral.
Supongamos que tenemos un conjunto de datos que consisten de n valores
numericos, x1 , x2 , ..., xn , de la variable X. La media de estos datos es
x =

x1 + x2 + + xn
n

CAPITULO
2. ESTADISTICA
DESCRIPTIVA

16

corta como
o en notacion
x =

n
X

xi /n.

i=1

Ejemplo 2-4
de 10 aspirantes a
Las siguientes cantidades son los registros de una evaluacion
una gerencia:
84, 80, 77, 82, 79, 85, 81, 83, 78, 76.
Encontrar la media muestral de estos registros.
La media de los registros es:
Solucion.
84 + 80 + 77 + 82 + 79 + 85 + 81 + 83 + 78 + 76
10
= 80.5

x =

La media muestral x es usada como un estimador de la media poblacional desconocida .


Una segunda medida de tendencia central es la mediana. Ordenamos los
al mas grande. Si n es impar,
valores de un conjunto de n datos del mas pequeno
(n + 1)/2, y si n es par, es
entonces la mediana muestral es el valor en la posicion
el promedio de los valore en las posicione n/2 y n/2 + 1.

Ejemplo 2-5
Consideremos la siguiente tabla de frecuencia de edades de miembros de una

orquesta sinfonica
de jovenes
adultos.

Edad

Frecuencia

15

16

17

11

18

19

14

20

13

Encontrar la mediana muestral.

DE DATOS CON MEDIDAS NUMERICAS

2.3. DESCRIPCION

17

Puesto que hay 54 valores de los datos, se sigue que cuando los datos
Solucion.
se colocan en un orden creciente, la mediana es el promedio de los valores en
las posiciones 27 y 28. As, la mediana muestral es 18.5


La media muestral y la mediana muestral son estadsticos utiles


para describir

la tendencia central de un conjunto de datos, grandes y pequenos.


La moda muestral es la categora que ocurre con la mayor frecuencia o valor
valor que ocurra con mas frecuende X de mayor frecuencia. Si no hay un solo
cia, entonces todos los valores que se producen con la mas alta frecuencia son
llamados valores modales. Cuando los datos en una variable continua tienen que
ser agrupados como en un histograma de frecuencias o histogramas de frecuencias relativas, la clase de mayor frecuencia es llamada la clase modal y el punto
medio es la moda.

Ejemplo 2-6
La siguiente tabla de frecuencias da los valores obtenidos en 40 lanzamientos
de un dado.
Valor del dado

Frecuencia

Encontrar la moda muestral.


La moda muestral es 1, el valor de mayor ocurrencia.
Solucion.


2.3.2.

estandar
Varianza y desviacion

Podemos observar que los conjuntos de datos pueden tener el mismos cen o propagacion de los datos destro con distinto aspecto, debido a la distribucion

de el centro. Presentaremos algunos estadsticos que describan la propagacion


o variabilidad de los valores de los datos.

CAPITULO
2. ESTADISTICA
DESCRIPTIVA

18

El rango R de un conjunto de n datos es definido como la diferencia entre el


Por ejemplo, el rango de los valores de
dato mas grande y el dato mas pequeno.
la Tabla 2.8 es 42.4 19.0 = 23.4.
Mediremos la variabilidad mediante la distancia entre cada dato (medi Si las distancias son grandes, la variabilidad o propagacion
y la media x.

cion)
La desviacion de un dato,
sera mayor que si las distancias sean mas pequena.
Los datos a la derecha de la media
digamos xi , respecto de la media x es (xi x).
producen desviaciones positivas y los datos a la izquierda de la media producen
desviaciones negativas.
sobre la
Las desviaciones de un conjunto de datos contienen informacion
variabilidad de los datos. Es natural considerar el promedio de las desviaciones
como una medida numerica de la variabilidad de los datos, el problema es que
la suma de las desviaciones es cero. Una alternativa es considerar el promedio
del valor absoluto de las desviaciones. Sin embargo, vamos a considerar la suma
de los cuadrados, de donde surgira una medida llamada varianza.
Usaremos el smbolo s2 para una varianza muestral y el smbolo 2 para
una varianza poblacional.
de N datos es el promedio de los cuadrados
La varianza de una poblacion
de las desviaciones de los datos respecto a la media y es denotada por 2 . Esto
es, si x1 , x2 , ..., xN son los valores de un conjunto de N datos, entonces
2 =

n
X

(xi )2 /(N ).

i=1

La varianza de una muestra de n datos es la suma de los cuadrados de las


desviaciones de los datos respecto a la media x y es dividida por (n 1), y es
denotada por 2 . Esto es, si x1 , x2 , ..., xn son los valores de un conjunto de n datos,
entonces
n
X
2 /(n 1).
s2 =
(xi x)
i=1

Por razones tecnicas divide la suma de los cuadrados de las desviaciones por
n 1, en lugar de n.

Ejemplo 2-7
Encontrar la varianza muestral de los conjuntos de datos A y B dados abajo.
A : 3, 4, 6, 7, 10

B : 20, 5, 15, 24

Como la media muestral para el conjunto de datos A es x = (3 + 4 + 6 +


Solucion.
7 + 10)/5 = 6, se sigue que su varianza muestral es
s2 = [(3)2 + (2)2 + (1)2 + 02 + 12 + 42 ]/4 = 7.5

DE DATOS CON MEDIDAS NUMERICAS

2.3. DESCRIPCION

19

La media muestral para el conjunto de datos B es tambien 6; su varianza muestral es


s2 = [(26)2 + (1)2 + 92 + (18)2 ]/3 360.67
As, ambos conjuntos de datos tienen la misma media muestral, existe una mayor variabilidad en los valores del conjunto B que en el conjunto A.

Una alternativa para el calculo de la varianza muestral s2 es mediante la siguien
te formula
P
P 2 ( xi ) 2
xi
n
s2 =
n1
P
P
donde xi2 es la suma de los cuadrados de los datos y ( xi )2 es el cuadrado
P 2
de la suma de los datos. Para encontrar ( xi ) necesitamos el cuadrado de cada
dato y entonces sumarlos todos juntos.
La desviacion estandar muestral, s, de un conjunto de datos es igual a la raz
estandar es medida con las
cuadrada positiva de la varianza, s2 . La desviacion
mismas unidades como los datos.

Ejemplo 2-8
estandar de los conjuntos A y B del Ejemplo 2-7.
Calcular la desviacion
Los conjuntos A y B tienen varianzas iguales a 7.5 y 360.67, respecSolucion.
estandar para el conjunto A es s 2.74, para el
tivamente. As, la desviacion
conjunto B es s 19.


CAPITULO
2. ESTADISTICA
DESCRIPTIVA

20

Ejercicios
de los conceptos
Comprension
2.1 Unidades experimentales Identificar las unidades experimentales en las
cuales las siguientes variables son medidas:
a. Genero de un estudiante.

d. Numero
de consumidores en una
encuesta de 1000 que consideran
importante el etiquetado nutricional de los productos.

Tecnicas basicas

b. Numero
de errores en un examen
parcial.
c. Edad de un paciente con cancer.
d. Color de un carro entrando a un
estacionamiento.
2.2 Cualitativas o cuantitativas Identificar cada una de las variables como
cuantitativa o cualitativa:
a. Cantidad de tiempo que se necesita para armar un rompecabezas
sencillo.

b. Numero
de estudiantes en un
de clases de primer grado.
salon
de un poltico rec. Clasificacion
cien elegido (excelente, bueno,
regular, malo).
d. Estado en el que una persona vive.

2.4 Cincuenta personas estan


agrupadas en cuatro categoras A, B, C

y D. El numero
de personas que caen
en cada categora se muestra en la siguiente tabla:

Categora
A
B
C
D

Frecuencia
11
14
20
5

a. Cual es la unidad experimenta?


b. Quel esta midiendo la variable?
c. Construir una grafica de pastel
para describir los datos.
d. Construir una grafica de barras
para describir los datos.

2.3 Discreto o continuo? Identificar


las siguientes variables cuantitativas

como
discretas o continuas:

e. Cual es la proporcion de las personas que estan en las categoras


B, C o D?

en una a rea particular


a. Poblacion
de Mexico.

f. Cual es el porcentaje de las personas que no estan en la categora B?

b. Peso del periodico


recuperado

por reciclaje en un unico


da.
c. Tiempo para completar un examen de sociologa.

2.5 Construir una grafica de tallo y hoja para estas 50 mediciones:

DE DATOS CON MEDIDAS NUMERICAS

2.3. DESCRIPCION
3.1
4.5
2.9
2.7
3.8
5.1
2.5
3.6
4.3
5.6

4.9
3.5
2.1
4.0
6.2
1.8
3.6
6.1
5.7
4.9

2.8
3.7
3.5
4.4
2.5
5.6
5.1
4.7
3.7
4.2

3.6
4.1
4.0
3.7
2.9
2.2
4.8
3.9
4.6
3.1

2.5
4.9
3.7
4.2
2.8
3.4
1.6
3.9
4.0
3.9

a. Describir la forma de la distribu de los datos. Se puede ver


cion
valor atpico?
algun
b. Usar el grafico de tallo y hoja
para encontrar las observaciones

mas pequenas.
c. Encuentra las octava y novena
observaciones mas grandes.
2.6 En referencia al Ejercicio 2.5. Construir un histograma de frecuencias relativas para los datos.
a. Aproximadamente, cuantos intervalos de clase se deben usar?
b. Suponer que se decide usar intervalos que inician en 1.6 con longitud de clase igual a .5 (es decir,
de 1.6 a 2.1, 2.1 a 2.6) Construir
un histograma de frecuencias relativas para los datos.
de las mediciones
c. Que fraccion
son menores que 5.1?
de las mediciones
d. Que fraccion
son mayores que 3.6?

1
2
2
0

2
1
2
1

1
1
1
2

0
0
1
1

21

2
0
0
1

a. Construir un histograma de frecuencias relativas para los datos.


de las mediciob. Que proporcion
nes son mayores que 1?
de las medicioc. Que proporcion
nes son menores que 2?
es seleccionada
d. Si una medicion
al azar de las 20 mediciones mostradas, cual es la probabilidad de
que sea un 2?
2.8 Resultados de los examenes
Los resultados de los examenes en una
prueba de 100 puntos se registraron
para 20 estudiantes:
61
63
94
87

93
86
89
68

91
82
67
65

86
76
62
75

55
57
72
84

a. Usar una grafica apropiada para


describir los datos.
b. Describir la forma y la localiza de los resultados.
cion
es
c. La forma de la distribucion
para
inusual? Hay alguna razon
de los resulque la distribucion
tados tenga tal forma?

2.9 Se tiene n = 5 mediciones;


e. Comparar el histograma de fre- 0,5,1,1,3. Calcular la media, la mediacuencias relativas con el grafico na y la moda.
de tallo y hoja del Ejercicio 2.5.
las formas son similares?
2.10 Se tiene n = 10 mediciones;
puede 3,5,4,6,10,5,6,9,2,8.
2.7 Una variable discreta solo
tomar los valores 0,1 o 2. Un conjunto
de 20 mediciones en esta variable se

a. Calcular x.
muestra aqu:
b. Encontrar m.

CAPITULO
2. ESTADISTICA
DESCRIPTIVA

22

forma de esta distribucion?


c. Encontrar la moda.
2.12 Se tiene n = 5 mediciones:

2.11 Starbucks El numero


de tiendas 2,1,1,3,5.
de cafe Starbucks en 18 ciudades a menos de 20 millas de la Universidad Riverside de California se muestran en la

a. Calcular la media, x.
siguiente tabla (www.starbucks.com).
b. Calcular la varianza, s2 , usando

la formula
dada por la defini16 7 2
6 4

cion.
1 7 1
1 1
estandar
c. Encontrar la desviacion
3 2 11 1
s.
5 1 4 12
a. Encontrar la media, la mediana y
la moda.
b. Comparar la media y la mediana.
Que se puede decir acerca de la

d. Encontrar s2 y s, usando la

formula
para calcularlas. Comparar los resultados con aquellos
encontrados en la parte b y c.
e. Encontrar en rango.

3. Probabilidad

Contenido
3.1.
3.2.
3.3.
3.4.
3.5.
3.6.

Espacio muestral y eventos . . . .

Algebra
de eventos . . . . . . . . .
Axiomas de probabilidad . . . . .
Espacios de probabilidad discreta
Independencia . . . . . . . . . . .
Probabilidad condicional . . . . .

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

23
26
26
28
29
30

Objetivo: Comprender los conceptos basicos de probabilidad y asignar la probabilidad de un evento.


Panorama general: Se dan los conceptos de espacio muestral, evento y probabi de la probabilidad a un
lidad. Se da un conjunto de tecnicas para la asignacion
evento.
El termino probabilidad es utilizado como medida para la ocurrencia de un
evento futuro y es muy importante en distintas a reas de trabajo, donde se generan observaciones que no se pueden predecir con certeza.
Es claro que el concepto de probabilidad es utilizado en distintas a reas del
conocimiento como fsica, biologa, sociologa o ingeniera.
Nuestro interes principal es acerca de experimentos cuyos posibles resultados no son predecibles con certeza. El fin es sacar conclusiones acerca de una
de objetos mediante la realizacion
de un experimento.
poblacion

3.1.

Espacio muestral y eventos

Iniciamos definiendo un experimento como un proceso mediante el cual se


(o medicion),

obtiene un observacion
las cuales pueden o no ser valores numericos. Por ejemplo,
Mediciones diariamente de lluvia.
Lanzar una moneda y observar la cara que aparece.
de un examen.
Registro de la calificacion
El resultado de un experimento realizado es llamado evento simple, denotado por la letra A con un subindice.
El conjunto de todos los posibles resultados de un experimento aleatorio es
llamado el espacio muestral del experimento y es denota por S.
23


CAPITULO
3. PROBABILIDAD

24

Se llama espacio muestral discreto si consiste de un numero


finito o infinito
contable de resultados posibles.
de posibles resultados de un experimento, esto
Un evento es una coleccion
es, cualquier subconjunto del espacio muestral S ( incluyendo S mismo). Si el

evento consiste de un unico


resultado se llama evento simple.
Sea A un evento. Si el resultado s del experimento esta contenido en A, entonces decimos que A ha ocurrido.

Ejemplo 3-1
Supongamos que se lanza una moneda. El espacio muestral para este experimento es S = {cara00 , sello00 }, los eventos simples son:
E1 : Cae cara
E2 : Cae sello
Los resultados de la moneda, cara y sello, se denotaran por las letras c y s,
respectivamente. As, se puede escribir S = {c, s}.


Ejemplo 3-2

Supongamos que se lanza un dado y se observa el numero


que aparece en la
cara superior. El espacio muestral para este experimento es S = {1, 2, 3, 4, 5, 6} y
los eventos simples son
E1 : Observar un 1

E3 : Observar un 3

E5 : Observar un 5

E2 : Observar un 2

E4 : Observar un 4

E6 : Observar un 6

Sin embargo, se pueden tener otros eventos tales como:

A: Observar un numero
impar

B: Observar un numero
menor o igual que 4
As, podemos escribir S = {E1 , E2 , E3 , E4 , E5 , E6 }, A = {E1 , E3 , E5 } y B =
{E1 , E2 , E3 , E4 }.

Para cualesquiera dos eventos A y B de un espacio muestral S, definimos
nuevos eventos:
de A y B, escrita AB, consiste de todos los resultados que
union: La union
se encuentran en A o en B o en ambos A y B:
A B = {s S|s A o s B}.
Esto es, el evento A B ocurrira si cualquiera de los dos A o B ocurren.

3.1. ESPACIO MUESTRAL Y EVENTOS

25

de A y B, escrita A B, consiste de todos los


interseccion: La interseccion
resultados que estan en ambos A y B:
A B = {s S|s A y s B}.
Esto es, el evento A B ocurrira si A y B ocurren.

Ejemplo 3-3
Consideremos el Ejemplo 3-2. Entonces,
A B = {E1 , E2 , E3 , E4 , E5 }.
A B = {E1 , E3 }.

El complemento de un evento A, escrito Ac , consiste de todos los resultados
en el espacio muestral S que no estan en A:
Ac = {s S|s < A}.
si A no ocurre.
Esto es, Ac ocurrira si y solo
Nos referimos a un evento que no puede ocurrir como el evento nulo y lo
resultado. Luego, A B =
denostamos por . As, se refiere al evento de ningun
, implica que los eventos A y B no pueden ambos ocurrir, entonces A y B se
dicen ser mutuamente excluyentes.
resultado, se sigue que S c = .
Puesto que el experimento debe suceder algun
de union
e interseccion
de eventos definidos en un mismo
La definicion

espacio muestral se puede extender a mas de dos eventos. Definimos la union


de los eventos A1 , A2 , ..., An como el evento que consiste de todos los resultados
i = 1, 2, ..., n, y se denotara por A1 A2 , , ..., An o
que existen en Ai , para algun
ni Ai :
i = 1, 2, ..., n}.
ni Ai = {s S|s Ai para algun
de los Ai ocurre cuando al menos uno de los eventos Ai ocurre.
Esto es, la union
de los eventos A1 , A2 , ..., An como el
De manera similar, se define la interseccion
evento que consiste en los resultados que existen en todos los eventos Ai , con
i = 1, 2, ..., n, y se denotara por A1 A2 , ..., An o ni Ai :
ni Ai = {s S|s Ai para todo i = 1, 2, ..., n}.
Para cualesquiera dos eventos A y B, si todos los resultados que estan en
A tambien estan en B, entonces se dice que A esta contenido en B y se escribe
A B. Si A B y B A, entonces se dice que A y B son iguales y se escribe A = B.


CAPITULO
3. PROBABILIDAD

26

3.2.

Algebra
de eventos

Las operaciones de uniones, intersecciones y complementos entre eventos


damos algunas propiedades entre opeobedecen ciertas reglas. A continuacion
raciones de eventos.
Para cualesquiera tres eventos A, B y C, definidos en un espacio muestral S,
tenemos:
1. Conmutatividad
AB = BA
AB = BA
2. Asociatividad
A (B C) = (A B) C
A (B C) = (A B) C
3. Leyes distributivas
A (B C) = (A B) (A C)
A (B C) = (A B) (A C)
4. Leyes de DeMorgan
(A B)c = Ac Bc
(A B)c = Ac Bc

3.3.

Axiomas de probabilidad

Dado un espacio muestral S, estamos interesados en asignar probabilidades a eventos, complemento de eventos, uniones de eventos e intersecciones de
de eventos que incluya las
eventos. As que, debemos considerar una coleccion
combinaciones de estos eventos.
Continuamos de manera formal con el problema importante de asignar
una probabilidad al resultado de un experimente y, de manera mas general, a
un evento. Hablaremos de la probabilidad P (A) asignada a un evento A. Aqu,

P (A) corresponde a la frecuencia relativa de A, en un numero


muy grande de
repeticiones independientes de un experimento.
Desde un punto de vista matematico, supondremos que para cada evento A

de un experimento que tiene un espacio muestral S, existe un numero,


denotado
por P (A), que satisface los siguientes axiomas:
Axioma 1. Para cualquier evento definido sobre S, P (A) 0.
Axioma 2. P (S) = 1.

3.3. AXIOMAS DE PROBABILIDAD

27

de eventos mutuamente excluyentes


Axioma 3. Para cualquier sucesion
A1 , A2 , ... (es decir, eventos para los que Ai Aj =, cuando i , j),
P (
i Ai ) =

Ai .

Como consecuencia de estos axiomas se tienen los siguientes resultados.


R1. P (Ac ) = 1 P (A).
R2. P () = 0.
R3. Si A = A1 A2 An y A1 , A2 , ..., An son mutuamente excluyentes,
entonces
n
X
P (A) =
P (Ai ).
i=1

En particular si A = S, el espacio muestral, entonces


P (A1 ) + P (A2 ) + + P (An ) = 1.
R4. Para dos eventos A y B,
P (A) = P (A B) + P (A Bc ).
R5. Si A B, entonces P (A) P (B).
R6. Para cualquier evento A, P (A) 1.

Ejemplo 3-4
Una bola se extrae aleatoriamente de una caja que contiene 6 bolas rojas, 4
bolas blancas y 5 bolas azules. Determinar la probabilidad de que sea (a) roja,
(b) blanca, (c) azul, (d) no roja y (e) roja o blanca.
(a) Denotese

Solucion.
por R, B y A los eventos a extraer una bola roja, blanca y
azul, respectivamente. Entonces
P(R) =

maneras de elegir una bola roja


6
2
=
=
maneras de elegir una bola
6+4+5 5

(b) P(B) =

4
4
=
6 + 4 + 5 15

(c) P(A) =

5
5
1
=
=
6 + 4 + 5 15 3

(d) P(no roja) = P(R) = 1 R = 1

2 3
=
5 5

(e) P(R B) = P(A) = 1 P(A) = 1

1 2
=
3 3



CAPITULO
3. PROBABILIDAD

28

3.4.

Espacios de probabilidad discreta

Consideremos que el espacio muestral S es discreto. Tomamos a F como


el conjunto que consiste de todos los subconjunto de S y asignamos las proba
bilidades de la siguiente manera. Sea S = {s1 , s2 , ...} y sean p1 , p2 , ..., numeros
no
negativos cuya suma es 1. Si A es cualquier subconjunto de S, definimos
P (A) =

pi .

si A

En particular,
P ({si }) = pi .
Esto es, la probabilidad de un evento A se calcula mediante la suma de las probabilidades de los eventos simples en A.

En el caso especial, si S = {s1 , s2 , ..., sn } y pi = 1/n, i = 1, 2, ..., n, en este caso,


P (A) =

N (A)
.
N (S)

En palabras, si asumimos que cada resultado de un experimento es igualmente


probable de ocurrir, entonces la probabilidad de cada evento A se calcula con

tando el numero
de resultados favorables entre el numero
total de resultados.

Ejemplo 3-5
Supongamos que se lanzan dos monedas equilibradas y se registran los resultados. Encontrar la probabilidad de observar exactamente un sello.
Realizamos la lista de los eventos simples en el espacio muestral. Las
Solucion.
letras c y s significan que se observa una cara o un sello, respectivamente, en
un lanzamiento de una moneda. Debido a que las monedas estan equilibradas,
cualquiera de los eventos simples es tan probable como cualquier otro. Puesto
que la suma de los cuatro eventos simple debe ser 1, cada uno debe tener probabilidad P (Ei ) = 1/4. Los eventos simples en el espacio muestral se muestran
en la tabla ?? , junto con sus probabilidades igualmente probables. Para encontrar
P (A) = P (observar exactamente un sello), necesitamos encontrar todos los eventos simples que resulten en el evento A; a saber, E2 y E3 :
P (A) = P (E2 ) + P (E3 )
= 1/4 + 1/4
= 1/2.

3.5. INDEPENDENCIA

29

Evento

Primer lanzamiento

Segundo lanzamiento

P (Ei )

E1
E2
E3
E4

c
c
s
s

c
s
c
s

1/4
1/4
1/4
1/4

Tabla 3.1: Eventos simples y sus probabilidades del Ejemplo 3-5.

El calculo de la probabilidad de un evento


1 Lista de todos los eventos simples en el espacio muestral.
2 Asignar una probabilidad apropiada a cada evento simple.
3 Determinar cuales eventos simples caen en el evento de interes.
4 Sumar las probabilidades de los eventos simples que caen en el
evento de interes

3.5.

Independencia

Ahora estamos interesados en asignar probabilidades de ocurrencia de even


tos dada alguna informacion.

sobre la ocurrencia o no
Sean A y B dos eventos. Si se tiene informacion
evento B y no cambian las posibilidades de ocurrencia del
ocurrencia de algun
evento A, entonces se dice que los eventos A y B son independientes. As, A es
independiente de B si P (A B) = P (A)P (B) (la ocurrencia de B no cambia las posibilidades de la ocurrencia de A) y si P (A Bc ) = P (A)P (Bc ) (si la no ocurrencia
de B no cambia las posibilidades de la ocurrencia de A). Sin embargo, la primera
implica la segunda, por lo que llamaremos al evento A independiente
condicion
si P (A B) = P (A)P (B).
del evento B si y solo
En general, consideramos que mas de dos eventos, digamos los eventos Ai
con i I y el conjunto {i1 , ..., ir } de indices distintos, son independientes si una
relativa a uno o mas de los eventos Ai1 , ..., Air no cambian las posibideclaracion
lidades de ocurrencia acerca de cualquiera de los eventos restantes. Esto es, los
si para toda coleccion
finita de {i1 , ..., ir } de indices
Ai son independientes si y solo
distintos en I, tenemos
P (Ai1 Ai2 Air ) = P (Ai1 )P (Ai2 ) P (Air ).
En particular, para que los eventos A1 , A2 y A3 sean independientes se debe
tener que

P (A1 A2 A3 A4 ) = P (A1 )P (A2 )P (A3 )P (A4 )


CAPITULO
3. PROBABILIDAD

30
y ademas,

P (A1 A2 ) = P (A1 )P (A2 )


P (A1 A3 ) = P (A1 )P (A3 )
P (A2 A3 ) = P (A2 )P (A3 )
Tambien se puede considerar el complemento de cada evento, por ejemplo, si se
considera Ac3 se tiene
P (A1 A2 Ac3 ) = P (A1 )P (A2 )P (Ac3 )
P (A1 Ac3 ) = P (A1 )P (Ac3 )
P (A2 Ac3 ) = P (A2 )P (Ac3 )

Ejemplo 3-6
Se lanzan dos monedas y se observan los resultados. Definir estos eventos:
A: Cara en la primer moneda
B: Sello en la segunda moneda
Los eventos A y B son independientes?
De ejemplos previos se sabe que S = {cc, cs, sc, ss}. Usar estos cuatro
Solucion.
eventos simples para encontrar
1
1
1
, P (B) = y P (A B) = .
2
2
4
  
1 1
1
Puesto que P (A)P (B) =
= , tenemos que P (A)P (B) = P (A B) y los
2 2
4
eventos deben ser independientes.
P (A) =

3.6.

Probabilidad condicional

sobre la ocurrencia o no ocuSean A y B dos eventos. Si se tiene informacion


evento B y cambian las posibilidades de ocurrencia del evento
rrencia de algun
A, entonces hay ausencia de independencia en los eventos A y B. El concepto de

probabilidad condicional proporciona una medida cuantitativa de la alteracion


de las posibilidades de ocurrencia. Si el evento B ha ocurrido, entonces el resto
de los eventos del espacio muestral son descartados, y el evento B sera considerado como un nuevo espacio muestral. Ahora, con el fin de que el evento A
ocurra es necesario que se tenga como ocurrencia un resultado que este en el
evento A como en el evento B, es decir, en A B. Por lo tanto, la probabilidad
condicional de un evento A dada la ocurrencia de un evento B sera igual a la
probabilidad del evento A B relativa a la probabilidad del evento B, esto es,
P (A|B) =
siempre que P (B) > 0.

P (A B)
P (B)

3.6. PROBABILIDAD CONDICIONAL

31

Ejemplo 3-7
en general, existe 51 % de hombres y 49 % de
Supongamos que en la poblacion
de hombres y mujeres daltonicos

mujeres, y que la proporcion


se muestra en la
tabla de abajo:

Daltonico
(A)

No daltonico
(Ac )
Total

Hombres (B)
.04
.47
.51

Mujeres (Bc )
.002
.488
.49

Total
.042
.958
1.00

y se encuentra que es un homSi una persona es sacada al azar de esta poblacion

bre (evento B), cual es la probabilidad de que el hombre sea daltonico


(evento
A)? Si sabemos que el evento B ha ocurrido, debemos restringir nuestro enfoque
el 51 % de la poblacion
masculina. La probabilidad de ser daltonica,

a solo
dado
que la persona es masculina, es 4 % del 51 %, o
P (A|B) =

P (A B) .04
=
= .078
P (B)
.51

Cual es la probabilidad de que sea daltonica,


dado que la persona es femenina?
el 49 % de la poblacion
que es femenina, y
Ahora estamos restringidos a solo
P (A|Bc ) =

P (A Bc ) .002
=
= .004
P (Bc )
.49

Notar que la probabilidad del evento A cambia, dependiendo de si el evento B


ocurre. Esto indica que los dos eventos son dependientes.

Relacionamos los conceptos de independencia y probabilidad condicional
de la siguiente manera:
si P (A|B) = P (A).
a) Si P (B) > 0, los eventos A y B son independientes si y solo
b) Si P (A1 A2 An1 ) > 0, entonces
P (A1 An ) = P (An |A1 A2 An1 )
es decir, se puede considerar B = A1 A2 An1 en a).
Sean A y B eventos. Utilizaremos las probabilidades P (A|B) y P (B|A) para calcular la probabilidad de que ambos eventos A y B ocurran, cuando un experimento
es realizado.

La ley multiplicativa de probabilidad


La probabilidad de que ambos eventos A y B ocurran cuando un experimento es realizado es
P (A B) = P (A)P (B|A)


CAPITULO
3. PROBABILIDAD

32

o
P (A B) = P (B)P (A|B).
Si A y B son independientes, entonces
P (A B) = P (A)P (B).

La ley aditiva de probabilidad


de dos eventos A y B es
La probabilidad de la union
P (A B) = P (A) + P (B) P (A B).
Si A y B son eventos mutuamente excluyentes, P (A B) = 0 y P (A B) = P (A) +
P (B)

Ejemplo 3-8
de petroleo

Una empresa de prospeccion


planea perforar dos pozos exploratorios. La evidencia pasada se utiliza para evaluar los posibles resultados listados
en la Tabla 3.2. Encontrar P (A B) y P (B C).
Por su definicion,
los eventos A,B y C son mutuamente excluyentes
Solucion.
conjuntamente porque la ocurrencia de un evento imposibilita la ocurrencia de
cualquiera de los otros dos. Por lo tanto,
P (A B) = P (A) + P (B) = .80 + .18 = .98
y
P (B C) = P (B) + P (C) = .18 + .02 = .20
El evento A B puede ser descrito como el evento que al menos uno de los pozos

produce petroleo
o gas, y B C describe el evento que a lo mas uno de los pozos

produce gas o petroleo.



Evento
A
B
C

Descripcion

Ni un pozo produce petroleo


o gas

Exactamente uno produce petroleo


o gas

Ambos pozos producen petroleo


o gas

Probabilidad
.80
.18
.02

Tabla 3.2: Resultados del experimento para la extraccion de petroleo.

3.6. PROBABILIDAD CONDICIONAL

33

Ejercicios
Tecnicas basicas
3.1 Lanzamiento de un dado Un
experimento involucra lanzar un dado.
Estos son los eventos:

3.3 Cuatro monedas Un frasco contiene cuatro monedas: una de 1 peso, una
de 2 pesos, una de 5 y una de 10 pesos.
Tres monedas son seleccionadas aleatoriamente del frasco:

A: Observar un 2.

B: Observar un numero
par.

C: Observar un numero
mayor
que 2.
D: Observar A y B.
E: Observar A o B o ambos.
F: Observar A y C.
a. Listar los eventos simples en el
espacio muestral.
b. Listar los eventos simples en cada uno de los eventos del A al F
c. Que probabilidades se deben
asignar a los eventos simple?
d. Calcular las probabilidades de
los seis eventos del A al F mediante la suma apropiada de probabilidades de los eventos simples.

a. Listar los eventos simples en S.


b. Cual es la probabilidad de que
contenga la moneda
la seleccion
de 10 pesos?
c. Cual es la probabilidad de que
la cantidad total sea igual a 16
pesos o mas?

3.4 El problema de la urna Un tazon


contienes tres bolas rojas y dos bolas
amarillas. Se seleccionan dos bolas de
manera aleatoria y sus colores son registrados. Usar un diagrama de a rbol
para listar los 20 eventos simples en el
experimento, teniendo en cuenta el orden en que se extraen las bolas.

3.5 El problema de la urna, continuidad En referencia al Ejercicio 3.4. Una


bola es seleccionada de forma aleatoria
que contiene tres rojas y dos
del tazon
3.2 Un espacio muestral consta de amarillas. Su color es anotado, y la bo antes de selec10 eventos simples: E1 , E2 , ..., E10 . Si la es regresada al tazon
P (E1 ) = 3P (E2 ) = 0.45 y el resto de cionar una segunda bola. Listar los cinlos eventos simples son equiprobables, co eventos simples que deben ser agreencontrar las probabilidades de estos gados al espacio muestral en el Ejercieventos simples restantes.
cio 3.4.

de eventos para llenar los espacios en blanco en la tabla de


3.6 Usar la relacion
abajo.

P (A)
.3
.3
.1
.2

P (B)
.4
.4
.5
.5

Condiciones para los eventos A y B

P (A B)
.12

P (A B)
.7

Mutuamente exclusivos
Independientes

P (A|B)


CAPITULO
3. PROBABILIDAD

34

de eventos para llenar los espacios en blanco en la tabla de


3.7 Usar la relacion
abajo.

P (A)
.3
.3
.1
.2

P (B)
.4
.4
.5
.5

Condiciones para los eventos A y B


Mutuamente exclusivos
Independientes

P (A B)

P (A B)

P (A|B)

.1
0

a. P (Ac )
b. P ((A B)c )
3.8 Un experimento puede resultar en
uno de los cinco eventos simples igualmente probables, E1 , E2 , E3 , E4 , E5 . Los
eventos A , B y C son definidos como:
3.10 Considerar un problema de selecA: E1 , E3
P (A = .4)
cionar dos aplicaciones para un trabajo
B: E1 , E2 , E4 , E5 P (B) = .8
de un grupo de cinco e imaginar que
C: E3 , E4
P (C) = .4
las aplicaciones son muy competentes,
Encontrar las probabilidades asocia- siendo 1 la mejor, 2 la segunda mejor,
das con estos eventos compuestos me- y as sucesivamente para 3,4 y 5. Estas
diante el listado de los eventos simples clasificaciones son desconocidas para
el empleador. Definir dos eventos A y
en cada uno.
B como:
A: El empleador selecciona la mejor
a. Ac
b. A B
c. B C
y una de las dos peores (las aplid. A B
e. B|C
f. A|B
caciones 1 y 4 o 1 y 5).
g. A B C h. (A B)c
B: El empleador selecciona al menos una de las dos mejores.
3.9 En referencia al Ejercicio 3.8. Cal- Encontrar la probabilidad de estos
eventos.
cular las siguientes probabilidades:

4. Variables aleatorias y esperanza

Contenido
4.1. Variables aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.2. Distribuciones de probabilidad . . . . . . . . . . . . . . . . . 39
4.3. Valor esperado de una variable aleatoria . . . . . . . . . . . . 40

de distribuObjetivo: Identificar una variable aleatoria y obtener su funcion

cion.
de variable aleatoria y su funcion
de disPanorama general: Se da la definicion

tribucion.
Los eventos de mayor interes en la ciencia, ingeniera o persona de negocios

son aquellos identificados por numeros,


llamados eventos numericos. Por ejem
plo, una persona de negocios esta interesada en el evento de que el siguiente ano
las ventas llegaran a 3 millones de cierto producto. Tambien, un ingeniero civil
no se ocupa directamente de los levantamientos y descensos diarios del nivel de
agua de un reservorio (el cual puede ser considerado como el resultado de un
puede preocuparse por el nivel al final de una tempoexperimento) pero solo
rada de lluvia. Estas cantidades de interes que son determinas por el resultado
del experimento son conocidas como variables aleatorias.

4.1.

Variables aleatorias

experimento estamos interesados en el resultado,


Cuando realizamos algun
esto nos lleva a estudiar el espacio muestral S. Puesto que las variables cuantitativas generan datos numericos y las variables cualitativas generan datos ca
tegoricos,
describir el espacio muestral S sera muy tedioso si los elementos de S

no son numeros.
La manera de estudiar dicho espacio sera asignando un valor
numerico a cada evento A del espacio muestral S.
Consideremos un experimento aleatorio con un espacio muestral S. Defini X que asigna a cada elemento A S
mos una variable aleatoria como una funcion
un numero

X son los
uno y solo
X(A) = x. Aqu, el espacio o rango de la funcion

numeros
reales D = {x | X(A) = x, A S} (por lo general es un conjunto contable

o un intervalo de numeros
reales).
Algunos ejemplos de variables aleatorias son:

X:= El numero
de defectos en un mueble seleccionado aleatoriamente.
X:= La suma de las cantidades observadas de las caras superiores en el
lanzamiento de dos dados.
35


CAPITULO
4. VARIABLES ALEATORIAS Y ESPERANZA

36

Ejemplo 4-1
Supongamos que se lanzan dos monedas y se observan los resultados. Sea X

igual al numero
de caras obtenidas. Identificar los eventos simples en S, asignar
un valor de X a cada evento simple e identificar los eventos simples asociados
con cada valor de la variable aleatoria X.
Suponer que c y s representan cara y sello, respectivamente. ConsideSolucion.
rar un par ordenado de smbolos para identificar los resultados de la primera
y segunda moneda. As, cs implica una cara en la primera moneda y un sello
en la segunda moneda. Entonces, los cuatro eventos simples en S son: E1 := cc,
E2 := cs, E3 := sc y E4 := ss. Los valores de X asignados a los eventos simples

dependen del numero


de caras asociadas con cada evento, por ejemplo, para
E4 =ss la Variable X le asigna el valor x = 0. La Tabla 4.1 muestra los valores
de X asignados a cada evento simple y la Tabla 4.2 muestra los eventos simples
asociados con cada valor de la variable X.


Ejemplo 4-2
estamos interesados en la suma
Supongamos que se lanzan dos dados y que solo
de los dos dados. Realizamos lo siguiente:
1. Describimos el espacio muestral S del experimento aleatorio. En este caso
es:
S ={(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6, ),
(2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6),
(3, 1), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6),
(4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6),
(5, 1), (5, 2), (5, 3), (5, 4), (5, 5), (5, 6),
(6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6)},
el cual consta de los 36 eventos simples A1 = (1, 1), A2 = (1, 2), ..., A36 =
(6, 6).
que asigne la suma de los resultados de los dos
2. Definimos una funcion
dados, a saber,
X((d1 , d2 )) = d1 + d2 ,
donde d1 indica el resultado del primer dado y d2 el resultado del segundo
dado.
X solo
toma los valores 2, 3, 4, 5, 6, 7, 8, 9, 10, 11
3. Observamos que la funcion
y 12.
X asigna a cada resultado (d1 , d2 ) S uno y solo
un valor X((d1 , d2 )) =
la funcion
d1 + d2 , , la cual representa la suma de los dos dados, donde d1 es resultado
X es
del primer dado y d2 es el resultado del segundo dado. Entonces la funcion
una variable aleatoria con rango {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12} (que es un conjunto
finito).


4.1. VARIABLES ALEATORIAS

37

Observemos que se pueden definir otras variables aleatorias en el espacio muestral del Ejemplo 5-2 tales como: la diferencia de los resultados (X((d1 , d2 )) =
|d1 d2 |) o la suma de los cuadrados de cada resultado (X((d1 , d2 )) = d12 + d22 ).

Ejemplo 4-3
con valores numericos es
En un espacio muestral discreto (S, F ) cada funcion
una variable aleatoria.


Evento
simple

Moneda 1

Moneda 2

P (Ei )

E1
E2
E3
E4

c
c
s
s

c
s
c
s

1/4
1/4
1/4
1/4

2
1
1
0

Tabla 4.1: Eventos simples y sus probabilidades al lanzar dos monedas .

Eventos simples
en x

p(x)

0
1
2

E4
E2 , E3
E1

1/4
2/4
1/4

Tabla 4.2: Distribucion de probabilidad para X (X = Numero de caras).

Como en el captulo 2, las variables aleatorias cuantitativas se clasifican


como discretas o continuas, de acuerdo a los valores que X pueda asumir. Es
importante distinguir entre variables aleatorias discretas y continuas porque
son usadas diferentes tecnicas para describir sus distribuciones.
Los eventos de interes frecuentemente son eventos numericos que corres
ponden a valores de una variable aleatoria discreta, tales como: el numero
de
o el numero

artculos defectuosos de una produccion


de accidentes en un cruce de avenidas. Por lo tanto, es necesario conocer las probabilidades de estos
eventos.
Consideremos una variable aleatoria discreta X con un espacio finito D =
{x1 , x2 , ..., xm }. Estos m subconjuntos, x1 , x2 , ..., xm , son de interes y estan dados
por
{A S|X(A) = xi },

para i = 1, 2, ..., m.


CAPITULO
4. VARIABLES ALEATORIAS Y ESPERANZA

38

Ejemplo 4-4
Consideremos el espacio muestral S de la variable aleatoria discreta X del Ejemplo 4-2, definida como la suma de los resultados de los dos dados. Entonces,
El espacio finito de la variable X es D = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}
Los subconjuntos de interes son:
{A S|X(A) = 2} = {(1, 1)}
{A S|X(A) = 3} = {(1, 2), (2, 1)}
{A S|X(A) = 4} = {(1, 3), (2, 2), (3, 1)}
{A S|X(A) = 5} = {(1, 4), (2, 3), (3, 2), (4, 1)}
{A S|X(A) = 6} = {(1, 5), (2, 4), (3, 5), (4, 2), (5, 1)}
{A S|X(A) = 7} = {(1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)}
{A S|X(A) = 8} = {(2, 6), (3, 5), (4, 4), (5, 3), (6, 2)}
{A S|X(A) = 9} = {(3, 6), (4, 5), (5, 4), (6, 3)}
{A S|X(A) = 10} = {(4, 6), (5, 5), (6, 4)}
{A S|X(A) = 11} = {(5, 6), (6, 5)}
{A S|X(A) = 12} = {(6, 6)}


Ejemplo 4-5
Del Ejemplo 4-4 se tiene que los subconjuntos B1 = {x1 = 2} {x2 = 3} y B2 =
{x8 = 9} {x9 = 10} {x10 = 11} {x12 = 11} pertenecen al conjunto generado por
los eventos simples x1 = 2, x2 = 3, x3 = 4, x4 = 5, x5 = 6, x6 = 7, x7 = 8, x8 = 9, x9 =
10, x10 = 11 y x11 = 12, los cuales son:
B1 = {2, 3}
= {A S|X(A) 3}
= {(1, 1), (1, 2), (2, 1)},
B2 = {9, 10, 11, 12}
= {A S|X(A) 9}
= {(3, 6), (4, 5), (5, 4), (6, 3), (4, 6), (5, 5), (6, 4), (5, 6), (6, 5), (6, 6)}


El conjunto de todos los subconjuntos de D, es decir, el generado por la co de los eventos simples {{x1 }, {x2 }, ..., {xm }} se denotara por D (ver Seccion

leccion
3.3 y 3.4).
de eventos,
Puesto que tenemos un nuevo espacio muestral y una coleccion
para cualquier conjunto B D definimos
PX (B) = P [{A S|X(A) B}],

4.2. DISTRIBUCIONES DE PROBABILIDAD

39

Decimos que PX es la probabilidad inducida sobre D mediante la variable aleatoria X. As, la probabilidad de que X tome el valor x es definida como la suma
de las probabilidades de todos los puntos muestrales en S que se les ha asignado el
valor x. Denotamos P (X = x) por p(x).

Ejemplo 4-6
Del ejemplo 4-5 tenemos que B = {2, 3} es un subconjunto de F . As,
PX (B) = P [{A S|X(A) 3}]
= P [{(1, 1), (1, 2), (2, 1)}]
= 3/36.


4.2.

Distribuciones de probabilidad

En este captulo vamos a definir la distribucion de probabilidad de una varia


ble aleatoria X como funcion de distribucion relativa construida para poblacion
entera de mediciones.
Usaremos una letra mayuscula, tal como X, para denotar una variable aleatoria y una letra minuscula, tal como x, para denotar un valor particular que una
variable pueda asumir. Por ejemplo, considerar que x denota uno de los seis
posibles valores que deben ser observados en la cara superior cuando un da
do es lanzado. Despues de ser lanzado el dado, el numero
realmente observado
sera denotado por el smbolo x. Notar que X es una variable, pero el valor especifico observado x no es aleatorio.
(X = x) puede leerse, el conjunto de todos los puntos en S que se
La expresion
les ha asignado el valor x por la variable X.
Ahora es significativo hablar de la probabilidad que toma X en el valor x,
3.4, esta probabilidad es definida
denotado por P (X = x). Como en la Seccion
como la suma de las probabilidades de los puntos muestrales apropiados en S.
La probabilidad de que X tome el valor x, P (X = x), es definida como la
suma de las probabilidades de todos los puntos muestrales en S que les es asignado
el valor x. Algunas veces denotar P (X = x) por p(x).
La distribucion de probabilidad para una variable aleatoria discreta X puede

ser representada por una formula,


tabla o grafica que proporciona los valores
posibles de X y la probabilidad p(x) = P (X = x) asociada a cada valor de X.
Los valores de X representan eventos numericos mutuamente excluyentes.
Resumiendo p(x) sobre todos los valores de x es equivalente a sumar todas las
probabilidades de todos los eventos simples y por lo tanto es igual a 1.


CAPITULO
4. VARIABLES ALEATORIAS Y ESPERANZA

40

de probabilidad discreta
Requisitos para una distribucion
0 p(x) 1
P
p(x) = 1

Ejemplo 4-7
de probabilidad para la variable X, definida como la suma de
La distribucion
los resultados de los dos dados, es la Tabla 4.3.


Numero
de eventos simples en x

p(x)

1/36

2/36

3/36

4/36

5/36

6/36

5/36

4/36

10

3/36

11

2/36

12

1/36
P

P (X) = 1

Tabla 4.3: Distribucion de la variable X:resultado del lanzamiento de dos dados

4.3.

Valor esperado de una variable aleatoria

intentamos encontrar la media y la varianza de una variable


En esta seccion
aleatoria y de este modo adquirir medidas descriptivas numericas, parametros,
de probabilidad p(x) que son consistentes con los discutidos
para la distribucion
en el captulo 2.
de probabilidad p(x).
Sea X una variable aleatoria discreta con la funcion

4.3. VALOR ESPERADO DE UNA VARIABLE ALEATORIA

41

Entonces el valor esperado de X, E(X), es definido a ser


X
E(X) =
xp(x).
x

precisa de la distribucion
de frecuencia de
Si p(x) es una caracterizacion
entonces E(x) = , la media poblacional. Por ejemplo, considerar
la poblacion,
de probabilidad
la variable aleatoria discreta del Ejemplo 4-7 con distribucion
visual revelara la media
p(x) como se muestra en la Tabla 4.3. Una inspeccion
a ser localizada en x = 7
de la distribucion
P
de probaPara mostrar que E(X) = x xp(x) es la media de la distribucion
bilidad p(x), realizar lo siguiente
Pn
=

i=1 xi

(1)(2) + (2)(3) + (3)(4) + + (1)(12)


36
(2)(1/36) + (3)(2/36) + (4)(3/36) + + (12)(1/36)

12
X

xp(x) = 7

x=2

de media
As, E(X) es un promedio y se tiene la consistencia de la definicion
dada en el captulo 2.
Si X es una variable aleatoria con media E(X) = , entonces la varianza de
una variable aleatoria X esta definida a ser el valor esperado de (X )2 . Esto es,
V (X) = E[(X )2 ].
La desviacion estandar de X es la raz cuadrada positiva de V (Y ).
precisa de la distribucion
de frecuencia de
Si p(x) es una caracterizacion
entonces E(X) = , V (X) = 2 y es la desviacion
estandar de la
la poblacion,

poblacion.


CAPITULO
4. VARIABLES ALEATORIAS Y ESPERANZA

42

Ejercicios
Tecnicas basicas
4.1 Discretas o continuas? Identificar las siguientes variables aleatorias
como discretas o continuas:

de la distribu0,1,2,3,4. una porcion


de probabilidad es mostrada aqu:
cion
x
0 1 2 3 4
p(x) .1 .3 .3 ? .1

a) El numero
total de puntos registrados en un juego de futbol

a. Encontrar p(3)

de un farmab) Tiempo de vida util


co

b. Construir un histograma de probabilidad para describir p(x)

c) Altura de la mareas de un oceano


en una lugar dado

c. Calcular la media, la varianza y


estandar poblaciola desviacion
nal

d) Longitud de un ballena de 2 anos


de edad

e) El numero
de colisiones cercanas

en un ano

d) Cual es la probabilidad de que


X sea menos o igual a 3?
e) Cual es la probabilidad de que
X sea mayor a 2?

4.2
Distribucion
de
probabilidad Una variable X tiene es
ta distribucion
de probabilidad:
4.4 Jugador profesional Un golfista
0 1 2 3 4
5
x
profesional juega mejor en hoyos a disp(x) .1 .3 .4 .1 ? .05
tancia corta. Su experiencia muestra

que el numero
X de disparos requeridos
para
los
hoyos
par 3, 4 y 5 tiea. Encontrar p(4)
nen las distribuciones de probabilidad
b. Construir un histograma de pro- mostradas en la tabla:
babilidad para describir p(x)
c. Encontrar , y .

4.3 Distribucion
de probabilidad
Una variable X asume 5 valores:

Hoyo par 3
x
p(x)
2
.12
3
.80
4
.06
5
.02

Hoyo par 4
x
p(x)
3
.14
4
.80
5
.04
6
.02

Hoyo par 5
x
p(x)
4
.04
5
.80
6
.12
7
.04

5. Distribuciones especiales

Contenido
5.1. Distribuciones de probabilidad discretas . . . . . . . . . . . . 43
de probabilidad binomial . . . . . . . . 43
5.1.1. La distribucion
de probabilidad de Poisson . . . . . . . 46
5.1.2. La distribucion
de probabilidad Hipergeometrica . . . . 47
5.1.3. La distribucion
5.2. Distribuciones de probabilidad continuas . . . . . . . . . . . 48
de probabilidad uniforme continua . . . 48
5.2.1. La distribucion
de probabilidad exponencial . . . . . . 48
5.2.2. La distribucion
de probabilidad normal . . . . . . . . . 48
5.2.3. La distribucion

Objetivo: Identificar algunas distribuciones de cierto tipo de variables que ocurren una y otra vez en las aplicaciones.

Panorama general: Se describen algunas distribuciones, as como su media y


varianza.

5.1.

Distribuciones de probabilidad discretas

5.1.1.

de probabilidad binomial
La distribucion

Supongamos que un ensayo, o un experimento, es realizado cuyos resultados pueden ser clasificados ya sea como un exito o como un fracaso. Consideramos que X = 1 cuando el resultado es un e xito y X = 0 cuando es un
fracaso. Una variable aleatoria X se dice ser una variable aleatoria de Bernoulli
de masa de probabilidad de X esta dada por
si la funcion
P {X = 0} = 1 p
P {X = 1} = p
donde p, 0 p 1, es la probabilidad de que el ensayo sea un exito.
43


CAPITULO
5. DISTRIBUCIONES ESPECIALES

44

Ejemplo 5-1
Lanzar un dado y salir un 6.
Cuando lanzamos un dado tenemos 6 posibles resultados:
S = {1, 2, 3, 4, 5, 6}

Estamos realizando un unico


experimento (lanzar el dado una sola vez).
Se considera e xito al sacar un 6, por tanto, la probabilidad (casos favorables
dividido entre casos posibles) sera p = 1/6. Se considera fracaso no sacar un 6,
por tanto, se considera fracaso sacar cualquier otro resultado; q = 1p = 11/6 =
5/6

existen
La variable aleatoria X medira numero
de veces que sale un 6, y solo
dos valores posibles, 0 (que no salga 6) y 1 (que salga un 6). Por tanto, la variable
aleatoria X es una variable Bernoulli de parametro p = 1/6.


Ahora, supongamos que se realizan n ensayos de manera independiente, en


los cuales cada uno resulta en un exito con probabilidad p y en un fracaso

con probabilidad q = 1 p. Si X representa el numero


de e xitos que ocurren en
n ensayos, entonces X se dice ser una variable aleatoria binomial con parametros (n, p), es decir, una variable aleatoria binomial es un experimento con las
siguiente caractersticas:

El experimento consiste de n ensayos identicos.


El resultado de cada ensayo es uno de dos posibles resultados. Uno de los
resultados es llamado exito y el otro fracaso.

La probabilidad de e xito en un unico


ensayo es igual a p y sigue siendo el
mismo de ensayo a ensayo. La probabilidad de fracaso es igual a 1 p = q.
Los ensayos son independientes.

La variable X de interes es el numero


de e xitos observados durante n ensayos, para X = 0, 1, 2, ..., n.

Ejemplo 5-2
Lanzar un dado en dos ocasiones y salir un 6.

Consideremos la variable aleatoria X: numero


de veces que sale un 6, como en
el Ejemplo 5-1. En este caso se lanzaran dos dados, y puesto que el resultado
en un dado es independiente del otro, se tiene que X es una variable aleatoria
binomial con parametro p = 1/6.


5.1. DISTRIBUCIONES DE PROBABILIDAD DISCRETAS

45

de probabilidad binomial
La distribucion
de masa de probabilidad de una variable aleatoria binomial
La funcion
con parametros (n, p) esta dada por:
!
n k nk
n!
P {X = k} =
p q
=
pk qnk ,
k
k!(n k)!

para valores de k = 0, 1, 2, ..., n. El valor k es el numero


de e xitos en los n

ensayos. El smbolo nk es
n!
,
k!(n k)!
donde n! = n(n 1)(n 2) (2)(1) y 0! 1.

Ejemplo 5-3
Nuevamente, considerando el Ejemplo 5-1, se tiene que la probabilidad de que
obtengamos un 6 viene definida como la probabilidad de que X sea igual a 1.
As,
!
1
P (X = 1) =
(1/6)1 (5/6)0 = (1/6)1 (5/6)0 = 1/6 = 0.1667
1
La probabilidad de que NO obtengamos un 6 viene definida como la probabilidad de que X sea igual a 0.
!
1
P (X = 0) =
(1/6)0 (5/6)1 = (1/6)0 (5/6)1 = 5/6 = 0.8333
1


Ejemplo 5-4
Considerar el Ejemplo 5-2, se tiene que la probabilidad de que obtengamos un
6 viene definida como la probabilidad de que X sea igual a 1. As,
!


2
P (X = 1) =
(1/6)1 (5/6)1 = 2 (1/6) (5/6) = 10/36 = 0.277
1
La probabilidad de que NO obtengamos un 6 viene definida como la probabilidad de que X sea igual a 0.
!
2
P (X = 0) =
(1/6)0 (5/6)2 = (1) (25/36) = 25/36 = 0.694
0



CAPITULO
5. DISTRIBUCIONES ESPECIALES

46

estandar para la distriLa media, varianza y desviacion


de probabilidad binomial
bucion

La variable aleatoria X, el numero


de e xitos en n ensayos, tiene una dis de probabilidad con
tribucion
= np
2 = npq

= npq

Ejemplo 5-5

La variable X: numero
de veces que sale un 6 al lanzar dos dados, del Ejemplo
5-2, tiene media y varianza iguales a 0.333 y 0.277, respectivamente.


Si X1 y X2 son variables aleatorias independientes con parametros respectivos (ni , p), con i = 1, 2, entonces su suma es binomial con parametros (n1 + n2 , p)
Esto puede verse facilmente notando que porque Xi , i = 1, 2, representan el

numero
de e xitos en ni ensayos independientes cada uno de los cuales es un e xi
to con probabilidad p, entonces X1 +X2 representa el numero
de e xitos en n1 +n2
ensayos independientes cada uno de los cuales es un e xito con probabilidad p.
Por lo tanto, X1 + X2 es binomial con parametros (n1 + n2 , p).

5.1.2.

de probabilidad de Poisson
La distribucion

de probabilidad de Poisson
La distribucion

Estamos interesados en saber la probabilidad de ocurrencia de k eventos,


en donde se puede esperar un promedio de tales eventos a ocurrir. La dis de probabilidad de una variable aleatoria de Poisson proporciona un
tribucion

buen modelo para datos que representan el numero


de ocurrencia de un evento

especfico en una unidad de tiempo o espacio dado. Lo unico


que se necesita es
que los eventos ocurran de manera aleatoria e independiente.

5.1. DISTRIBUCIONES DE PROBABILIDAD DISCRETAS

de probabilidad Poisson
La distribucion
Una variable aleatoria X que toma uno de los valores 0, 1, 2, ..., se dice
ser una una variable aleatoria de Poisson con parametro , > 0, si su
de probabilidad esta dada por
distribucion
P {X = k} =

k e
,
k!

k = 0, 1, 2, ...

El smbolo e representa una constante aproximadamente igual a


2.71828.
estandar de una variable aleatoria PoisLa media, varianza y desviacion
son son:
=
2 =

5.1.3.

de probabilidad Hipergeometrica
La distribucion

de probabilidad Hipergeometrica
La distribucion

con M e xitos y N M fracasos. La probaSupongamos una poblacion


n
bilidad de exactamente k e xitos en una muestra aleatoria de tamano
es


M N M
P {X = k} = k Nnk

n

para valores de k que depende de N , M y n con


!
N
N!
=
.
n
n!(N n)!
La media y la varianza de una variable aleatoria hipergeometrica son:
 
M
=n
N
 


M
N M N n
2 = n
N
N
N 1

47


CAPITULO
5. DISTRIBUCIONES ESPECIALES

48

5.2.

Distribuciones de probabilidad continuas

5.2.1.

de probabilidad uniforme continua


La distribucion

Si a < b, una variable aleatoria X se dice tener una distribucion de proba de densidad
bilidad uniforme continua en el intervalo (a, b) si su funcion
es
(
1/(b a)
axb
f (x) =
0
de otra forma
de distribucion
esta dada por
La funcion
(
0 x a(x a)/(b a) a x b
F(x) = P (X x) =
1
x b.
uniforme son
La media y la varianza de la distribucion
=

1
(a + b)
2

1
(b a)2
12

respectivamente.

5.2.2.

de probabilidad exponencial
La distribucion

esta distribuida de forma exponencial si su funcion


de denUna funcion
sidad es
( x
e
x>0
f (x) =
0
x0
exponencial son
La media y la varianza de la distribucion
=

2 =

1
2

respectivamente.

5.2.3.

de probabilidad normal
La distribucion

de probabilidad de una variable aleatoria normal es como


La distribucion
sigue:

5.2. DISTRIBUCIONES DE PROBABILIDAD CONTINUAS

de probabilidad Normal
La distribucion
Una variable aleatoria X se dice que tiene una distribucion de probabili si, para > 0 y < < , la funcion
de densidad
dad normal si y solo
de X es
2
2
1
< x < .
f (x) = e(x) /(2 ) ,
2
estandar de una variable aleatoria NorLa media, varianza y desviacion
mal son:
=
2 = 2
=

49