Está en la página 1de 207

MDULO 1.

ESTADSTICA DESCRIPTIVA DE
UNA VARIABLE
Salvador Naya Fernndez. Universidad de A Corua

Objetivos del curso

Objetivos Generales: Aprender a utilizar, disear y


valorar experiencias de enseanza-aprendizaje con
contenidos de estadstica y probabilidad.

Competencias: Capacitar al profesor-alumno para


disear y valorar experiencias de enseanzaaprendizaje sobre nueva metodologa para la
enseanza de la estadstica.

Programa de Probabilidades y
estadstica en Secundaria (Espaa)

Tema 1: Estadstica descriptiva unidimensional.


Tipos de variables. Tablas y grficos. Parmetros
estadsticos de centralizacin, de dispersin y de
posicin.
Tema 2: Distribuciones bidimensionales. Interpretacin
de partir de la representacin grfica de una nube de puntos. Grado de
relacin entre das variables estadsticas. Regresin lineal. Extrapolacin de
resultados.

Tema 3: Azar y probabilidad. Distribuciones de


probabilidad binomial y normal.

Programa de Probabilidades y
estadstica en Secundaria (Espaa)

OBJETIVOS/COMPETENCIAS
Utilizar las tablas y grficas como instrumento para
el estudio de situaciones empricas relacionadas con
fenmenos sociales.
Interpretar la posible relacin entre las variables de
una distribucin bidimensional utilizando la recta de
regresin y el coeficiente de correlacin.
Utilizar tcnicas estadsticas elementales para
asignar probabilidades en situaciones que se ajusten
a una distribucin de probabilidad binomial o
normal.

Programa de Probabilidades y
estadstica en Secundaria (Espaa)

CRITERIOS DE EVALUACIN
Elaborar e interpretar tablas y grficos esdatsticos,
as como calcular parmetros estadsticos ms
usuales, correspondientes a variables estadsticas
discretas y continuas, interpretarlos y valorar
cualitativamente la representatividad de las muestras
utilizadas.

Evaluar la capacidad para interpretar, analizar y valorar


informaciones estadsticas presentes en los medios de
comunicacin.

There are three kinds of lies: lies,


dammed lies and statistics.
Autobiografa de Mark Twain

Samuel Langhorne Clemens

La Estadstica en los medios

Estadstica (del latn status: situacin)


Fotos

de la misma manifestacin

La Estadstica en los medios

La verdad:

La Estadstica en los medios

La de unos

La Estadstica nos medios

La de los otros

Estadstica en los medios

Estudios de Insercin
Laboral

Breve historia de la Estadstica

Censos:

Siglos XV y XVI

Nacimiento de la Demografa
Graunt: predicciones sobre evolucin de la poblacin

Siglos XVII y XVIII

Desde los Egipcios

Clculo de probabilidades
Jacques Qutelet y Christiaan Huygens : aplicacin de la Estadstica en
las Ciencias Sociales

Siglos XIX y XX

Francis Galton: colabora con Mendel y Darwin en el nacimiento de la


gentica. Concepto de Regresin.
Laplace, Gauss, Bernouilli,
Pearson, Fisher, Tukey, Kolmogorov,.

Qu es la Estadstica Descriptiva?
Estadstica descriptiva
Tcnicas para describir y analizar un grupo
dado de datos, sin extraer conclusiones
(inferencias) sobre la poblacin a la que
pertenecen.
Inferencia Estadstica

Es la parte de la Estadstica que trata las


condiciones bajo las cuales las inferencias
extradas a partir de una muestra son vlidas

Qu es la Estadstica descriptiva?

La estadstica descriptiva es una parte de la


estadstica que se dedica a analizar y representar
los datos. Este anlisis es muy bsico, pero
fundamental en todo estudio
Wikipedia

Poblacin, muestra, variable


Poblacin
Colectivo de individuos sobre los que se desea
extraer alguna conclusin.

muestra
Subconjunto de la Poblacin

Variable
Cada una de las caractersticas medidas sobre
los individuos de una muestra

Poblacin, muestra, variable

Nominales

Sexo
Color de ojos

Ordinales

Posicin

Discretas

Edad
N hermanos

Continuas

Peso
Altura

Cualitativas
Variables

Cuantitativas

Tablas de frecuencias

Tablas de frecuencias:
Para

representar y resumir la informacin contenida en


una muestra de tamao n
modalidads: cada un de los valores que puede tomar
una variable (cualitativa o cuantitativa discreta)
Intervalos

de clase: en el caso de variables cuantitativas


continuas, se agrupan los distintos valores obtenidos en
la muestra en intervalos.

Tablas de frecuencias

Para cada modalidad, definimos:


Frecuencia

absoluta: nmero de individuos en la modalidad:

Frecuencia

relativa: proporcin de individuos en la


modalidad:

Frecuencia

absoluta acumulada:

Frecuencia

relativa acumulada:

Tablas de frecuencias
modalidad

TOTAL

Frecuencia
absoluta

Frecuencia
relativa

F. Absoluta
acumulada

F. Relativa
acumulada

Tablas de frecuencias

Construccin de intervalos de clase:


Cada

intervalo se considerar como una modalidad


Se elige un representante (marca de clase) de cada
intervalo: o punto medio.
Cuntos? Entero ms prximo a
n
Todos iguales? Normalmente, si.
Como escogemos el primero e el ltimo punto? (menor
que el mnimo y mayor que el mximo de la muestra)

Todo depende de la inferencia


Frecuencias

relativas: probabilidad!
Frecuencias relativas acumuladas: distribucin!

Frecuencias acumuladas
1. Cuntos obtuvieron 40
puntos o menos en el
examen?
2. Entre que das notas se
ubica el 50% central
de los resultados?

Frecuencias acumuladas
1. Cuntos obtuvieron 40
puntos o menos en el
examen?
2. Entre que dos notas se
ubica el 50% central
de los resultados?

Frecuencias acumuladas
1. Cuntos obtuvieron 40
puntos o menos en el
examen?
2. Entre que dos notas se
ubica el 50% central
de los resultados?

Frecuencias acumuladas
1. El 40% no supera el examen
cul es la calificacin mnima para
aprobar?

Frecuencias acumuladas
1. El 40% no supera el examen
cul es la calificacin mnima para
aprobar?

Representaciones grficas
Mtodos grficos para variables
cualitativas

Diagrama de barras
Diagrama de sectores

Representaciones grficas

Diagrama de barras

Representaciones grficas

Diagrama de sectores

Representaciones grficas
Mtodos grficos para variables
cuantitativas
Histograma
Diagrama de tallo y hojas

Diagrama de caja (Box-Plot) *

Representaciones grficas

HISTOGRAMA: Cmo se construye?


El histograma es una generalizacin del
diagrama de barras para el caso de
variables cuantitativas continuas.
Sobre cada intervalo de clase, Se
levanta un rectngulo de altura la
frecuencia (absoluta o relativa) del
intervalo (en caso de que los intervalos
tengan distinto tamao se hacen las
reas del rectngulo proporcionales a
dicha frecuencia, calculando las
alturas).

Representaciones grficas
HISTOGRAMA: Qu informacin contiene?

Histograma
Radiacin S.-airquality

frecuencia

10 15 20 25 30 35

20
10

frecuencia

30

ozono-airquality

50

ozono

100

150

50

100

150
200
Radiacin
Solar

Histograma viento-airquality

Temperatura-airquality

250

300

350

frecuencia

10

15 20

25 30

35

30

5
0

20

frecuencia

La forma general de la distribucin.


Simetra o asimetra.
Unimodalidad o multimodalidad.
Sobre las frecuencias relativas: intuicin sobre la funcin de densidad
(polgono de frecuencias)

10

10
Viento

15

20

60

70

80
Temperatura

90

100

Representaciones grficas

HISTOGRAMA: Cuntos intervalos?


Nmero

de intervalos: el entero ms prximo a


n (normalmente entre 5 y 20).
O histograma sensible seleccin do nmero de
intervalos:
Si

tenemos una distribucin bimodal, y escogemos intervalos


muy amplios no se detecta!
Si escogemos intervalos muy pequeos, pueden aparecer
caractersticas en el histograma que sean slo debidas a
rudo.

Representaciones grficas

DIAGRAMA DE TALLO Y HOJAS


(John Tukey)
Consideremos los siguientes
datos, en orden ascendente:
8, 13, 16, 25, 26, 29, 30, 32,
37, 38, 40, 41, 44, 47, 49, 51,
54, 55, 58, 61, 63, 67, 75, 78,
82, 86, 95
El diagrama se construye
colocando en una primera
columna los primeros dgitos, y
los dems en las siguientes
columnas

Representaciones grficas

DIAGRAMA DE TALLO Y HOJAS:


ventajas
Proporciona

la misma informacin
que el histograma, pero adems:
Cada

dato puede recuperarse del


grfico

Medidas caractersticas
Es una cantidad
numrica
calculada
sobre una
Poblacin

Es una cantidad
numrica
calculada
sobre una
muestra

Parmetro

Estadstico

Medidas caractersticas

Medidas caractersticas
Tendencia

Tendencia
central

Tendencia no
central

Media
Mediana
Moda

Cuartiles
Deciles
Percentiles

Dispersin

Forma

Varianza
Desviacin
tpica

Asimetra
Curtosis

Medidas caractersticas

De tendencia central
Indican

el punto alrededor del cual se sitan los datos.


Media aritmtica:
Propiedades:
Entre

el mnimo y el mximo:

Linealidad
Media

de las desviaciones con respecto a la media: 0


Media de los cuadrados con respecto a una constante: mnima
para la media aritmtica

Medidas caractersticas

De tendencia central
Media

aritmtica:

Propiedades:
No

es robusta!
Media truncada: eliminar un porcentaje de los datos ms extremos.
Media recortada: substituir un porcentaje de los datos ms extremos
por el valor del punto de corte.

Medidas caractersticas

De tendencia central
Media

Sobre

aritmtica:

una Tabla de frecuencias:

1 k
x ni ci
n i 1

Medidas caractersticas

De tendencia central
Mediana:

es el punto en el que encontramos el 50% de


los datos de una muestra ordenada.
Intervalo

mediano (la frecuencia absoluta en su extremo


inferior es menor que 1/2)

Medidas caractersticas

De tendencia central
Moda:

(variables discretas o cualitativas) es el valor que


ms se repite.
Intervalo

modal: variables cuantitativas continuas (intervalo con


mayor frecuencia)

Medidas caractersticas

De tendencia no central
Cuartiles:

los cuartiles Q1, Q2 y Q3 dividen la muestra


en cuatro partes iguales. Es decir, por debajo de Q1
tenemos el 25%, por debajo de Q2 tenemos el 50% y
por debajo de Q3 el 75% de los datos.
Q2

es la mediana

Medidas caractersticas

De tendencia non central


Deciles:

D1,,D9 dividen la muestra en 10 partes


iguales (intervalos del 10%).
Percentiles: P1,,P99 dividen a muestra en 100 partes
iguales (intervalos del 1%)
Cuantiles: valores en tanto por uno(0.25, 0.89,)

Medidas caractersticas

Medidas de Dispersin
Indican

la mayor o menor concentracin de los datos con


respecto a las medidas de centralizacin.
Varianza:
Desviacin

tpica:

Medidas caractersticas

Medidas de Dispersin
Sobre

una Tabla de frecuencias:


Varianza:
k

1
2
s ni ci x
n i 1
2

Desviacin

tpica:

1 k
2
s
ni ci x

n i 1

Medidas caractersticas

Medidas de Dispersin
Varianza

y desviacin tpica
Propiedades:
Valores

no negativos
No linealidad! Pero no afectada por cambios de localizacin.
La varianza puede calcularse como:

Medidas caractersticas

Medidas de Dispersin
Rango

muestral: mx(x)-mn(x)

Rango

intercuartlico: Q3-Q1

Grficas y medidas caractersticas

Un ejercicio con histogramas:

Grficas y medidas caractersticas

Media
9.93

Desviacin tpica
2.93

Mediana
9.88

RIC
5.11

Grficas y medidas caractersticas

Media

7.98

Desviacin tpica
4.48

Mediana
7.29

RIC
6.22

Grficas y medidas caractersticas

Media

7.88

Desviacin tpica
4.81

Mediana
7.46

RIC
8.31

Grficas e medidas caractersticas

Media

9.90

Desviacin tpica
1.92

Mediana
9.84

RIC
2.65

Representaciones grficas

En 1977, John Tukey publica un


mtodo
para
representar
grficamente cinco estadsticos
descriptivos.
El diagrama de caja: boxplot o
tambin
box and whisker
plot,
que
contiene
las
siguientes medidas:
Mediana
Primer

y tercer cuartil
Extremos(*): LI maxmin( xi ), Q1 1.5(Q3 Q1 )
LS min max( xi ), Q3 1.5(Q3 Q1 )

John W. Tukey (1915-2000)

Representaciones grficas
BOXPLOT: Interpretacin
En la caja central, el Boxplot
contie el 50% de los datos. La
lnea interior marca la
mediana, y los lmites de la
caja son el primer y tercer
cuartil.
Si la mediana no equidista de
los vrtices, entonces la
distribucin es asimtrica.
Los puntos que quedan fuera
del diagrama son datos
atpicos (outliers).

Guinea Pigs' Tooth Growth

35

30

25
tooth length

20

15

10
Ascorbic acid
Orange juice

0
0.5

0.5

Vitamin C dose mg

Representaciones grficas

BOXPLOT: ventajas e
inconvenientes
Visualizacin

de varios
estadsticos al mismo tiempo!
Muestra los datos atpicos.
tiles para comparar
distribuciones condicionadas a
variables categricas.
pero no detectan
multimodalidad!
Solucin: hacer un histograma
y un boxplot

Representaciones grficas

Representaciones grficas

Representaciones grficas

Medidas caractersticas

Si tenemos dos conjuntos de datos con las siguientes


desviaciones tpicas:
Desv.

Tpica X: 2.005975
Desv. Tpica Y: 309.0946

Cul de los conjuntos es ms variable?

Medidas caractersticas

Y si las medias son:


Media

X: 0.99661
Media Y: 150.4486

Seguimos pensando lo mismo?

Medidas caractersticas

Todas estas medidas dependen de las unidades de


los datos
Coeficiente

Coef.

de variacin:

X: 2.012799
Coef. Y: 2.054486

Medidas caractersticas

Para comparar muestras, debemos TIPIFICAR los


datos:

xi x
zi
sx

yi y
wi
sy

Medidas caractersticas

Para comparar muestras, debemos TIPIFICAR los


datos:

xi x
zi
sx

yi y
wi
sy

Medidas caractersticas

Para la asignacin de becas para estudios de


posgrado, se consideran las notas medias del
expediente:
Alumno

titulacin A: nota media de 6


Alumno titulacin B: nota media de 7.5
A

quin se le da la beca?

Medidas caractersticas

Alumno titulacin A:

Alumno titulacin B:

Medidas caractersticas

Titulacin A: media=5.5, varianza=1.48


En

relacin a su titulacin, el alumno A (nota media de


6) es mejor que la media pero hay que tener en
cuenta la varianza para saber cunto mejor.

Titulacin B: media=7.92,varianza=0.56
En

relacin a su titulacin, el alumno B (nota media de


7.5) es peor que la media pero tambin hay que
tener en cuenta la dispersin.

Medidas caractersticas

Tipificamos: a cada uno de los valores de las dos


titulaciones les restamos su media y los dividimos
por su desviacin tpica:
El

valor 6 del alumno A queda tipificado como:

6 5.5
0.32
1.48
O

valor 7.5 del alumno B queda tipificado como :

7.5 7.92
0.56
0.75

Medidas caractersticas

Alumno titulacin A:

Alumno titulacin B:

Medidas caractersticas

Coeficiente de asimetra de Fisher:

Un ejemplo: curva de ingresos


Comprese con la Normal (simtrica, coeficiente 0)

Medidas caractersticas

Asimetra:

Medidas caractersticas

Coeficiente de curtosis de Fisher (slo distribuciones


simtricas):

Comprese con la distribucin Normal o campana


de Gauss (que tiene coeficiente de curtosis 0)

Medidas caractersticas

Curtosis:
Leptocrtica
Mesocrtica
Planicrtica

Medidas caractersticas

Momentos con respecto al origen

Momentos centrales

Medidas caractersticas

En particular
Media:

Varianza:

Coef.

Asimetra:

Coef.

Curtosis:

Mdulo 1. Estadstica descriptiva

Salvador Naya Fernndez


salvador.naya@udc.es

MDULO 2.
ESTADSTICA DESCRIPTIVA DE
DOS VARIABLES
Salvador Naya Fernndez. Universidad de A Corua

Programa de Probabilidades y
estadstica en Secundaria (Espaa)

Tema 1: Estadstica descriptiva unidimensional.


Tipos de variables. Tablas y grficos. Parmetros estadsticos de
centralizacin, de dispersin y de posicin.

Tema
2:
Distribuciones
bidimensionales.
Interpretacin de partir de la representacin
grfica de una nube de puntos. Grado de relacin
entre das variables estadsticas. Regresin lineal.
Extrapolacin de resultados.
Tema 3: Azar y probabilidad. Distribuciones de
probabilidad binomial y normal.

Programa de Probabilidades y
estadstica en Secundaria (Espaa)

CRITERIOS DE EVALUACIN
Utilizar las tablas y grficas como instrumento para
el estudio de situaciones empricas relacionadas con
fenmenos sociales.
Interpretar la posible relacin entre las variables de
una distribucin bidimensional utilizando la recta de
regresin y el coeficiente de correlacin.
Utilizar tcnicas estadsticas elementales para
asignar probabilidades en situaciones que se ajusten
a una distribucin de probabilidad binomial o
normal.

Descriptiva de dos variables

Vector estadstico
Tablas de frecuencias conjuntas
Tablas de contingencia
Representacin de cualitativa-cuantitativa
Diagrama de dispersin (cuant-cuant)
Regresin y correlacin

descriptiva de dos variables

Tablas de frecuencias conjuntas:


dos

variables X e Y, como modalidades:

Para

X:

ci , i 1,..., k
Para

Y:

dj,

j 1,..., l

descriptiva de dos variables

Tabla de doble entrada para las frecuencias


absolutas
X\Y
c1
c2

d1
n11
n21

d2
n12
n22

ck

nk 1
n1

dl
n1l
n2 l

n1
n2

nk 2
n2

nkl
nl

nk

descriptiva de dos variables

Para las frecuencias absolutas


X\Y
c1
c2

d1
n11
n21

d2
n12
n22

ck

nk 1
n1

dl
n1l
n2 l

n1
n2

nk 2
n2

nkl
nl

nk

Tablas de contingencia
Rubio

Peliojo

Castao

Oscuro

Negro

Claros

688

116

584

188

1580

Azules

326

38

241

110

718

Castaos

343

84

909

412

26

1774

Oscuros

98

48

403

681

81

1311

1455

286

2137

1391

114

5383

Datos de 5383 escolares escoceses color del pelo


frente a color de ojos (Fisher, 1940)

Tablas de contingencia
Rubio

Rojo

Castao

Oscuro

Negro

Claros

688

116

584

188

1580

Azules

326

38

241

110

718

Castaos

343

84

909

412

26

1774

Oscuros

98

48

403

681

81

1311

1455

286

2137

1391

114

5383

Distribuciones marginales

Tablas de contingencia
Rubio

Rojo

Castao

Oscuro

Negro

Claros

688

116

584

188

1580

Azules

326

38

241

110

718

Castaos

343

84

909

412

26

1774

Oscuros

98

48

403

681

81

1311

1455

286

2137

1391

114

5383

Distribuciones marginales

Tablas de contingencia

Resultados de un examen de Estadstica:


Suspenso Aprobado
Mujer
14
36
Hombre

50

20

11

31

34

47

81

Aprueban ms las mujeres que los hombres?

Tablas de contingencia

Si el sexo non influye, los porcentajes de aprobados


en los dos grupos deberan ser los mismos
Mujer Observados
Esperados
Hombre Observados
Esperados

Suspenso
14
21
20
13
34

Aprobado
36
29
11
18
47

Esperaramos, 47*50/81 y 47*31/81, para hombres y


mujeres, respectivamente.

50
31
81

Tablas de contingencia

una forma de medir la distancia entre lo observado


y lo esperado (si las variables son independientes):
2

observado esperado2
esperado

Si el valor de este estadstico es grande, entonces


hay dependencia entre las variables. En este caso:
10.51
pero cuando es grande? (Inferencia: Contrastes)

Representaciones grficas

Para representar cualitativa-cualitativa


Barras

agrupadas (frecuencias absolutas)


Barras apiladas (frecuencias relativas)
Grficos de reas

Representaciones grficas

Barras agrupadas:
40
36

35
30
25
20

20
15

Muller
Home

14
11

10
5
0

Suspende

Aproba

Representaciones grficas

Barras agrupadas:
40
36
35
30
25
20

20
15

Suspende
Aproba

14
11

10
5
0

Muller

Home

Representaciones grficas

Barras apiladas
100%
90%

80%
70%

60%

Home
Muller

50%

40%
30%
20%
10%
0%

Suspende

Aproba

Representaciones grficas

Barras apiladas
100%
90%

80%
70%

60%

Aproba
Suspende

50%

40%
30%
20%
10%
0%

Muller

Home

Representaciones grficas

Grficos de reas
40
35
30
25
20

Home
Muller

15
10
5
0

Suspenso

Aprobado

Notable

Sobresaliente

Representaciones grficas

Grficos de reas
100%
90%
80%

70%
60%
50%

Home
Muller

40%
30%
20%
10%
0%
Suspenso

Aprobado

Notable

Sobresaliente

Representaciones grficas

Grficos de reas
100%
90%
80%
70%

Moi satisfeito
Bastante satisfeito
Satisfeito
Pouco satisfeito
Insatisfeito

60%
50%
40%
30%
20%
10%
0%

Suspenso

Aprobado

Notable

Sobresaliente

Representaciones grficas

Para representar cualitativa-cuantitativa:


Diagramas

de caja
Grficos radiales

Representaciones grficas

Grfico radial

Regresin y correlacin

Para confrontar los valores de


dos variables continuas, se
utiliza el diagrama de
dispersin o nube de puntos.

Regresin y correlacin

Consideremos (X,Y) un vector estadstico:


Vector

de medias:

Matriz

de varianzas-covarianzas:

Regresin y correlacin

Vector de medias

Regresin y correlacin

Tipos de relacin

Regresin y correlacin

Regresin y correlacin

La covarianza entre dos variables indica si existe


relacin entre ellas, y si esta es directa o inversa.

Que tambin se puede calcular como:


1 n
S xy xi yi x y
n i 1

Regresin y correlacin

La covarianza entre dos variables indica se existe


relacin entre ellas, e se esta directa o inversa.

El coeficiente de correlacin lineal de Pearson


de dos variables, r, indica si los puntos tienden
a disponerse alineadamente:
r

S xy
SxS y

Regresin y correlacin

Propiedades:
Mismo

signo que la covarianza


til para determinar relaciones lineales
Es adimensional
Toma valores en [-1,1]
r=0

: variables incorreladas
r ~1: relacin lineal directa
r ~(-1): relacin lineal inversa

Y se r=0, son independientes?

Regresin y correlacin

Regresin y correlacin

Si son incorrelados
son independentes?
No necesariamente:

Regresin y correlacin

El trmino regresin fue introducido por Galton


(padre de la BioEstadstica) en su publicacin
Natural inheritance (1889), en referencia a la ley de
regresin natural.
Cada peculiaridad en un hombre es
compartida por sus descendientes, pero
en media, en un grado menor.
Regresin a la media

Regresin y correlacin

una fbrica produce este


tipo de tornillos de los que
tomamos una muestra
para saber cul es la
relacin entre la longitud
y el dimetro.

Regresin y correlacin

Diagrama de dispersin
para a longitud (X) frente
al dimetro (Y).
Identificaremos:
X: variable independiente
Y: variable dependiente

Buscamos:
Y m(X )

Regresin y correlacin

Modelo inferencial:
Y m( X )
m( X ) a bX

Modelo descriptivo: no tenemos en cuenta las


Distribuciones de las variables que intervienen en el
modelo; slo las observaciones muestrales.
y m( x ) e
m( x) a bx

Regresin y correlacin

Cmo ajustamos la recta a la nube de puntos?


y a bx

Regresin y correlacin

Cmo ajustamos la recta a la nube de puntos?


y a bx

residuos

Objetivo: hacer
que las
diferencias entre
los valores
observados y los
que proporciona
el modelo sean
pequeas.

Regresin y correlacin

Mtodo de mnimos cuadrados (Gauss):


Ajustamos

una recta (tambin vlido para cualquier


funcin paramtrica).
La recta ajustada dar una aproximacin de cada valor
de la variable Y.
Objetivo: minimizar los errores (al cuadrado) de la
aproximacin.

a , b arg min yi a bxi

a ,b

i 1

Regresin y correlacin

Mtodo de mnimos cuadrados:


El

resultado:

br
La

Sy
Sx

S xy
S

2
x

a y bx

recta ajustada es:


y y

S xy
2
x

x x

S
b es el llamado coeficiente de regresin
Tiene

el mismo signo que la covarianza

Regresin y correlacin

Un ejemplo: (N=7 datos)

2,5

3,6

6,2

6,5

2
1
0
0

Regresin y correlacin

Un ejemplo:

X2

Y2

XY

16

49

14

2,5

6,25

36

15

3,6

12,96

25

18

25

64

40

6,2

38,44

36

37,2

6,5

42,25

64

52

26,8

44

129,9

290

180,2

Regresin y correlacin

Un ejemplo:

X2

Y2

XY

16

49

14

2,5

6,25

36

15

3,6

12,96

25

18

25

64

40

6,2

38,44

36

37,2

6,5

42,25

64

52

26,8

44

129,9

290

180,2

26.8
x
3.83
7
44
y
6.29
7

Regresin y correlacin

Un ejemplo:

X2

Y2

XY

16

49

14

2,5

6,25

36

15

3,6

12,96

25

18

25

64

40

6,2

38,44

36

37,2

6,5

42,25

64

52

26,8

44

129,9

290

180,2

129.9
S
3.832 3.90
7
290
2
Sy
6.29 2 1.92
7
2
x

Regresin y correlacin

Un ejemplo:

X2

Y2

XY

16

49

14

2,5

6,25

36

15

3,6

12,96

25

18

25

64

40

6,2

38,44

36

37,2

6,5

42,25

64

52

26,8

44

129,9

290

180,2

180.2
3.83 6.29
7
1.68

S xy2

Regresin y correlacin

Un ejemplo:

X2

Y2

XY

16

49

14

2,5

6,25

36

15

3,6

12,96

25

18

25

64

40

6,2

38,44

36

37,2

6,5

42,25

64

52

26,8

44

129,9

290

180,2

y 4.64 0.43x

S xy

1.68
b 2
0.43
S x 3.90

a y bx
6.29 0.43 3.83
4.64

Regresin y correlacin

Un ejemplo:

2,5

3,6

6,2

6,5

y 4.64 0.43x

1
0
0

Regresin y correlacin

Sobre los residuos

Y^

5,07

-1,07

5,50

1,50

2,5

5,71

0,29

3,6

6,19

-1,19

6,79

1,21

6,2

7,31

-1,31

6,5

7,44

0,56

y 4.64 0.43x
9
8
7
6
5
4
3

2
1
0
0

Regresin y correlacin

Sobre los residuos: Lo que queda sin explicar

ei yi y i

El error residual medio es nulo:


1 n
1 n
e ei yi y i 0
n i 1
n i 1

Regresin y correlacin

La varianza de los residuos (varianza residual) es


mnima:

1 n 2 1 n
1 n
2
S ei yi y i yi a bxi
n i 1
n i 1
n i 1
2
e

Por

definicin del ajuste por mnimos cuadrados

Regresin y correlacin

Como medimos la
bondad del ajuste?
Vamos

tener una relacin


entre la variabilidad de Y
e la variabilidad del
residuo e.

Regresin y correlacin

Variabilidad de Y:
proyectamos los valores
observados sobre el eje OY.

Regresin y correlacin

Variabilidad de Y:
proyectamos los valores
observados sobre el eje OY.

Regresin y correlacin

Residuos:
proyectamos sobre el
eje OY.

Regresin y correlacin

Residuos:
proyectamos sobre el
eje OY.

Regresin y correlacin

Residuos:
proyectamos sobre el
eje OY.
La varianza de los residuos nos
da la variabilidad (de Y) no
explicada por el modelo.

Regresin y correlacin

Bondad do ajuste:
La

dispersin del error residual


ser una fraccin de la dispersin de Y
Cuanto menor sea esta dispersin
mejor ser o ajuste

Regresin y correlacin

El coeficiente de determinacin:
S xy
S
2

R 1
r
S S
S
x y
2

2
e
2
y

proporciona una medida da bondad del ajuste de


una recta de regresin (o de otro ajuste
paramtrico).

Regresin y correlacin

una vez que tenemos la relacin:

podemos hacer prediciones (!): dado un valor


calcular:

Regresin y correlacin

Algunas aclaraciones:
La

recta de Y sobre X no es la misma que


la de X sobre Y

El

mtodo es sensible a datos atpicos

No

todo es lineal

Pero

Non

tambin hay mnimos cuadrados!

todo es paramtrico

Pero

precisaramos de otro curso

Regresin y correlacin

ejemplos de relaciones NO LINEALES


Polinomio

de grado 3

Regresin y correlacin

ejemplos de relaciones NO LINEALES


Curvas

de ingresos-gastos
Curva de consumo de vino, de riesgo de infarto, de
desgaste, de supervivencia,

Regresin y correlacin

Cuatro conjuntos de datos (Anscombe):

x1

y1

x2

y2

x3

y3

x4

y4

10
8
13
9
11
14
6
4
12
7
5

8,04
6,95
7,58
8,81
8,33
9,96
7,24
4,26
10,84
4,82
5,68

10
8
13
9
11
14
6
4
12
7
5

9,14
8,14
8,74
8,77
9,26
8,1
6,13
3,1
9,13
7,26
4,74

10
8
13
9
11
14
6
4
12
7
5

7,46
6,77
12,74
7,11
7,81
8,84
6,08
5,39
8,15
6,42
5,73

8
8
8
8
8
8
8
19
8
8
8

6,58
5,76
7,71
8,84
8,47
7,04
5,25
12,5
5,56
7,91
6,89

Regresin y correlacin

Cuatro conjuntos de datos: CUARTETO DE


ANSCOMBE

x1

y1

x2

y2

x3

y3

x4

y4

10
8
13
9
11
14
6
4
12
7
5

8,04
6,95
7,58
8,81
8,33
9,96
7,24
4,26
10,84
4,82
5,68

10
8
13
9
11
14
6
4
12
7
5

9,14
8,14
8,74
8,77
9,26
8,1
6,13
3,1
9,13
7,26
4,74

10
8
13
9
11
14
6
4
12
7
5

7,46
6,77
12,74
7,11
7,81
8,84
6,08
5,39
8,15
6,42
5,73

8
8
8
8
8
8
8
19
8
8
8

6,58
5,76
7,71
8,84
8,47
7,04
5,25
12,5
5,56
7,91
6,89

Media X

Media Y

7,5

Var X

11

Var Y

4,13

Recta

y=3+0.5x

Regresin y correlacin
14

14

12

12

10

10

10

15

20

14

14

12

12

10

10

10

12

14

16

10

15

20

10

15

20

Portal educativo del IGE

http://www.ige.eu/estatico/educacion/index.htm
Varios mdulos de contenidos:
Estadstica

descriptiva
Probabilidad
Regresin
Series de tiempo

Applet interactivo

APPLETS:
http://www.shodor.org/interactivate/
Para:
Estudiantes
Profesores

Mdulo 2. Estadstica descriptiva


de dos variables

Salvador Naya Fernndez


salvador.naya@udc.es

Modulo 3: Azar y Probabilidad

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes

Cursillo de Estadstica. Medelln 2010


Azar y probabilidad
Profesor: Salvador Naya
Departamento de Matematicas. Universidade da Coru
na

Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta
1 / 63

Introduccion

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta

El concepto de probabilidad esta asociado a experimentos


(procesos de observacion) donde existe incertidumbre
sobre el resultado final, que desde un punto de vista
practico son la mayora de los experimentos reales.
La Teora de la Probabilidad es importante como soporte
te
orico de la Estadstica (Inferencia Estadstica) y como
herramienta en el estudio de la mayora de las areas de
conocimiento: Ingeniera, Economa, Sociologa, Medicina,
Biologa, etc.
El origen de la Teora de la Probabilidad esta ligado al
estudio de los juegos de azar, siendo pioneros los trabajos
realizados por G. Cardano y G. Galilei en el siglo XVI.
Actualmente constituye un area cientfica de intensa
investigacion.
2 / 63

Experimentos y sucesos

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta

Experimentos
Un experimento es un proceso por medio del cual se
obtiene una observacion.
Un experimento determinista es el que al realizarse
repetidas veces, en identicas condiciones, proporciona
siempre el mismo resultado y, por tanto, puede predecirse
de antemano.
Un experimento aleatorio es el que puede dar lugar a
diferentes resultados, conocidos previamente, sin que sea
posible predecir cual va a ser el resultado que va a ocurrir
en una determinada realizaci
on del experimento.
La Teora de la Probabilidad y la Estadstica estudian los
experimentos aleatorios que, en mayor o menor medida,
son todos los experimentos reales.
3 / 63

Experimentos y sucesos

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta

Algebra
de sucesos
Suceso elemental o simple: es cada uno de los posibles
resultados del experimento aleatorio.
Espacio muestral: es el conjunto formado por todos los
sucesos elementales. Lo denotaremos por = {/ es un
suceso elemental}. Se clasifica en: discreto (si es finito o
infinito numerable) y continuo.
Suceso: es un subconjunto del espacio muestral. Son
sucesos de interes: , el suceso seguro, formado por todos
los sucesos elementales y , el suceso imposible, que no
contiene elementos.

Algebra
de sucesos: es el conjunto formado por todos los
sucesos asociados a un experimento aleatorio. Lo
denotaremos por A = {A/A es un suceso}.

4 / 63

Experimentos y sucesos

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta

Ejemplo 1
Considerese el experimento aleatorio lanzar un dado y
observar el n
umero de puntos obtenido. Los sucesos
elementales son i = se obtienen i puntos, donde
i = 1, 2, . . . , 6. Son sucesos A = se obtiene un n
umero par =
el resultado es 2, 4 o 6 y B = se obtiene un n
umero mayor
que 2 = el resultado es 3, 4, 5 o 6.
Ejemplo 2
Considerese el experimento aleatorio tiempo de ejecucion de
un programa. Los sucesos elementales son t = la ejecucion
ha durado t segundos, con t R, t 0. Son sucesos C = el
tiempo de ejecucion es superior a 10 segundos y D = el
tiempo de ejecucion esta entre 5 y 15 segundos.
5 / 63

Experimentos y sucesos

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria

Algebra
de sucesos. Operaciones
Union de sucesos: si A, B A, se define el suceso union,
A B, como el que ocurre si sucede A o sucede B.
Intersecci
on de sucesos: si A, B A, se define el suceso
intersecci
on, A B, como el que ocurre si sucede A y
sucede B. Por sencillez, A B tambien se escribe AB.

Suceso complementario o contrario: si A A, se define el


como el que ocurre si no sucede A.
suceso contrario, A,
Inclusion de sucesos: si A, B A, se dice que A
esta contenido en B o que A implica B, A B, si siempre
que sucede A ocurre B.

Variable
aleatoria
discreta
6 / 63

Experimentos y sucesos

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria

Algebra
de sucesos. Operaciones
Diferencia de sucesos: si A, B A, se define el suceso
diferencia,
A\B, como el que ocurre si sucede A y no sucede B, esto es,

A\B = A B
Diferencia simetrica de sucesos: si A, B A, se define el
suceso diferencia simetrica, AB, como el que ocurre si
sucede solo A o solo B, esto es,
(B A)

AB = (A B)\(A B) = (A B)
Sucesos incompatibles: dos sucesos A, B A son
incompatibles si A B = .

Variable
aleatoria
discreta
7 / 63

Experimentos y sucesos

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta

Algebra
de sucesos. Operaciones
Conjunto exhaustivo de sucesos: {A1 , A2 ,S
. . . , An / Ai A}
n
es un conjunto exhaustivo de sucesos si
i=1 Ai =
Conjunto completo de sucesos: {A1 , A2 , . . . , An / Ai A}
es un conjunto completo de sucesos si es exhaustivo y los
sucesos
son incompatibles dos a dos:
Sn
A
i=1 i = y Ai Aj = si i 6= j
A un conjunto completo de sucesos tambien se le
denomina particion del espacio muestral. El conjunto de
los sucesos elementales es una clase completa de sucesos y
la particion mas fina del espacio muestral.
El algebra de sucesos, A, asociada a un experimento
aleatorio tiene estructura de algebra de Boole respecto a
las operaciones union e intersecci
on
8 / 63

Experimentos y sucesos

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria

Algebra
de sucesos. Propiedades
Conmutativa. A B = B A,

AB =B A

Asociativa.] A (B C ) = (A B) C ,
A (B C ) = (A B) C

Elemento neutro. El suceso imposible () para la union


A() = A y el suceso seguro () para la intersecci
on
(A = A).
que llamaremos
Complementario. Dado A A existe A,
suceso complementario o contrario de A, tal que
= y AA
= .
AA

Variable
aleatoria
discreta
9 / 63

Experimentos y sucesos

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes

Algebra
de sucesos. Propiedades
Idempotente. A A = A,
AA=A
Simplificativa. A (A B) = A,

A (A B) = A

Relativas al elemento neutro. A = ,


A=

Leyes de De Morgan. A B = A B,
AB =A

Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta
10 / 63

Experimentos y sucesos

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria

Ejemplo 3
Respecto al experimento del ejemplo 1 se obtienen los
siguientes sucesos:
A B= obtener 2, 3, 4, 5 o 6.
A B= obtener 4 o 6.
obtener un n
A=
umero impar.
obtener 1 o 2.
B=
A\B=obtener el 2.
B\A= obtener 3 o 5.
AB= obtener 2, 3 o 5.

Variable
aleatoria
discreta
11 / 63

Experimentos y sucesos

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta

Ejemplo 4
Respecto al experimento del ejemplo 2 se obtienen los
siguientes sucesos:
C D= el tiempo de ejecucion es superior a 5 segundos.
C D= el tiempo de ejecucion esta entre 10 y 15 segundos.
= el tiempo de ejecucion es inferior o igual a 10 segundos.
C
el tiempo de ejecucion es menor o igual que 5 segundos o
D=
mayor o igual que 15 segundos.
C \D= el tiempo de ejecucion es mayor o igual que 15
segundos.
D\C = el tiempo de ejecucion es superior a 5 segundos y
menor o igual que 10 segundos.
C D= el tiempo de ejecucion esta en (5, 10] [15, ).
12 / 63

Definicion de probabilidad

Salvador Naya
Introducci
on
Experimentos
y sucesos

Definici
on axiomatica de Kolmogorov
La probabilidad (P) asociada a un experimento aleatorio es una
aplicacion del algebra de sucesos (A) en R
P : A R

Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos

verificando los siguientes axiomas:


1
2

Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta

Para todo suceso A, P(A) 0


P() = 1

(aditividad) Si {An }
on de sucesos
n=1 es una sucesi
incompatibles dos a dos, entonces:
!

X
[
P
P(An )
An =
n=1

n=1

13 / 63

Definicion de probabilidad

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos

Definici
on
Llamaremos espacio de probabilidad a la terna, (, A, P)
formada por el espacio muestral (), el algebra de sucesos (A)
y la aplicacion (P) verificando los anteriores axiomas.

Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta
14 / 63

Definicion de probabilidad

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria

Ejemplo 5
En relaci
on con el experimento del ejemplo 1, puede definirse la
funci
on de probabilidad a partir de la probabilidad de los
sucesos elementales, Ai = obtener el n
umero i, de la
1
siguiente forma: P (Ai ) = , i = 1, 2, . . . , 6
6
Ejemplo 6
En relaci
on con el experimento del ejemplo 2, puede definirse la
funci
on de probabilidad a partir de la probabilidad de sucesos
de la forma At = la duraci
on de la ejecucion del programa es
inferior a t segundos, como P(At ) = 1 e t (t > 0).

Variable
aleatoria
discreta
15 / 63

Definicion de probabilidad

Salvador Naya

Propiedades

Introducci
on

Experimentos
y sucesos

Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes

Variable
aleatoria
discreta

Si {Ai }ni=1 es un conjunto


! de sucesos incompatibles dos a
n
n
S
P
dos entonces, P
Aj =
P(Aj )
j=1

3
4
5

Variables
aleatorias
Noci
on de
variable
aleatoria

P() = 0.

j=1

= 1 P(A).
P(A)

Para cualquier suceso A, 0 P(A) 1.


Si A B entonces P(A) P(B) y
P(B\A) = P(B) P(A).

Para dos sucesos cualesquiera A y B se verifica que,


P(A B) = P(A) + P(B) P(A B).
16 / 63

Definicion de probabilidad

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta

Ejemplo 7
La probabilidad de que el estudiante A apruebe un examen es
00 5, la probabilidad de que apruebe B es 00 3 y la probabilidad
de que aprueben los dos es 00 2.
La probabilidad de que al menos uno de los dos apruebe es
P(A B) = 00 5 + 00 3 00 2 = 00 6.
La probabilidad de que exactamente uno de los dos
apruebe es P(AB) = P(A) + P(B) 2P(A B) = 00 4.
La probabilidad de que no apruebe ni A ni B es
B)
= 1 P(A B) = 1 00 6 = 00 4.
P(A

La probabilidad de que apruebe A pero no B es


= P(A\B) = P(A) P(A B) = 00 5 00 2 = 00 3.
P(A B)
17 / 63

Definicion de probabilidad

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta

Ejemplo 8
Supongase que la probabilidad de obtener el n
umero i al lanzar
un dado es inversamente proporcional a dicho n
umero. Calcular
la probabilidad de obtener un n
umero par en una tirada.
Llamamos pi = P(obtener el n
umero i ) = k/i,
i = 1, 2, . . . , 6, con k una constante por determinar, que
obtenemos de la siguiente igualdad
6
X
i=1

pi = k

6
X
1
i=1

= P() = 1 = k =

Por tanto, P(obtener un n


umero par) =

60
147

55
.
147
18 / 63

Definicion de probabilidad

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta

Asignaci
on de probabilidades
Metodo de las frecuencias: Definir la probabilidad del
suceso como el lmite de las frecuencias realtivas.
Metodo clasico: En los espacios muestrales finitos
equiprobables, podemos calcular la probabilidad del suceso
A como el cociente entre el n
umero de casos favorables
en que sucede A y el n
umero de casos posibles que se
pueden dar. Esta regla se conoce como definici
on clasica o
Ley de Laplace.
Metodo subjetivo: en el que una determinada persona
asigna de forma subjetiva probabilidades a cada uno de los
posibles resultados de un proceso seg
un su propio juicio
sobre la verosimilitud de cada resultado.
19 / 63

Probabilidad condicionada e independencia de


sucesos
Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria

Ejemplo 9
En un curso de Estadstica de 80 estudiantes aprobaron 50, de
los que 35 eran chicas. La probabilidad de que haya aprobado
0
un alumno elegido al azar es: P(aprobar) = 50
80 = 0 625
Pero si el n
umero de chicas que participaron en el curso fue de
45, entonces la probabilidad de que haya aprobado un alumno
elegido al azar sabiendo que es una chica, es:
P(aprobar/ser chica) =
=

P(aprobar y ser chica)


P(ser chica)
35/80
= 00 777
45/80

Variable
aleatoria
discreta
20 / 63

Probabilidad condicionada e independencia de


sucesos
Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes

Definici
on
Sean A y B dos sucesos cualesquiera con P(B) > 0. Se define
la probabilidad del suceso A condicionada al suceso B y se
representa por P(A/B) como:
P(A/B) =

P(A B)
P(B)

Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta
21 / 63

Probabilidad condicionada e independencia de


sucesos
Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta

Probabilidad condicionada. Comentarios


1 La probabilidad condicionada es muy importante en la
practica, ya que, en muchas situaciones, peque
nas
modificaciones en la informacion basica producen cambios
sustanciales en las probabilidades condicionadas.
2

Con la definici
on anterior, es facil probar que la
probabilidad condicionada a un suceso B verifica la
axiomatica de la probabilidad dada en la definici
on.

Es importante diferenciar entre P(AB) y P(A/B): la


primera indica la probabilidad de ocurrencia de A y B
conjuntamente, por tanto siempre es menor o igual que
P(A); y la segunda indica la probabilidad de ocurrencia de
A cuando es conocido que ha ocurrido el suceso B y puede
ser menor, igual o mayor que P(A).
22 / 63

Probabilidad condicionada e independencia de


sucesos
Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos

Ejemplo 10
En un almacen se dispone de diez motores de los cuales tres
son defectuosos. Si se eligen dos motores al azar y
Denominando por Di al suceso el motor elegido en lugar
i-esimo es defectuoso y Ni al suceso el motor elegido en
lugar i-esimo es no defectuoso, se pueden calcular las
siguientes probabilidades condicionadas

Teorema de
Bayes

P(D2 /N1 ) =

Variables
aleatorias

P(D2 /D1 ) =

Noci
on de
variable
aleatoria

P(D2 ) =

P(N1 D2 )
P(N1 )
P(D1 D2 )
P(D1 )

=
=

7/10 3/9
7/10
3/10 2/9
3/10

3
9

2
9

3
10

Variable
aleatoria
discreta
23 / 63

Probabilidad condicionada e independencia de


sucesos
Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos

Ejemplo 11
En una encuesta realizada en Medelln se ha determinado que
el 40 % de los encuestados lee el periodico El Colombiano, el
15 % lee La Rep
ublica y el 3 % lee ambos periodicos.
1

Seleccionado al azar un lector de La Rep


ublica, calcular la
probabilidad de que lea El Colombiano.
Sea C el suceso lee El Colombiano., y R el suceso lee
R)
3
0
La Rep
ublica, entonces P(C /R) = P(C
P(R) = 15 = 0 2

Si se ha elegido un lector de El Colombiano, calcular la


probabilidad de que no lea La Rep
ublica.
) = 1 P(RC ) = 1 3 = 00 925
P(R/C
40
P(C )

Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta

24 / 63

Probabilidad condicionada e independencia de


sucesos
Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta

Ejemplo 12
En un centro de secundaria el 50 % de los alumnos aprueba el
Bachillerato. Se estima que si se presentasen todos los alumnos
a las pruebas de Selectivo solo suspenderan el 40 % y que un
30 % de los alumnos que aprobaran el Selectivo suspenden el
Bachillerato. Con estos datos calcular la probabilidad de que un
alumno que apruebe el Bachillerato apruebe el Selectivo.
Sea C el suceso aprueba el Bachillerato y S el suceso
= 00 40
aprueba el Selectivo, por tanto, P(C ) = 00 50, P(S)
/S) = 00 30.
P(C
La probabilidad pedida es
P(S/C ) =

P(C /S)P(S)
00 70 00 60
P(S C )
=
=
= 00 84
P(C )
P(C )
00 50
25 / 63

Probabilidad condicionada e independencia de


sucesos
Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria

Regla del producto


Sean A1 , A2 , . . . , An sucesos tales que P

n1
\
i=1

Entonces:
P

n
\

i=1

Ai

Ai

> 0.

= P(A1 )P(A2 /A1 )P(A3 /A1 A2 ) P

An

n1
\
i=1

Ai

!!

Variable
aleatoria
discreta
26 / 63

Probabilidad condicionada e independencia de


sucesos
Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias

Ejemplo 13
En relaci
on con el ejemplo 10, si se eligen cuatro motores al
azar, sin reemplazamiento, calcular la probabilidad de que el
primer y el tercer motores elegidos sean defectuosos y los otros
dos no.
P(D1 N2 D3 N4 ) =
= P(D1 )P(N2 /D1 )P(D3 /D1 N2 )P(N4 /D1 N2 D3 ) =
=

1
3 7 2 6
=
= 00 05
10 9 8 7
20

Noci
on de
variable
aleatoria
Variable
aleatoria
discreta
27 / 63

Probabilidad condicionada e independencia de


sucesos
Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes

Definici
on
Dos sucesos A y B se dicen independientes si
P(A B) = P(A)P(B)
o, equivalentemente, P(A/B) = P(A), si P(B) > 0, o bien
P(B/A) = P(B), si P(A) > 0.

Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta
28 / 63

Probabilidad condicionada e independencia de


sucesos
Salvador Naya
Introducci
on

Independencia de sucesos. Comentarios


1

La independencia de sucesos puede suponerse en algunas


situaciones y deducirse del contexto del problema pero, en
general, debe comprobarse experimentalmente.

No debe confundirse sucesos independientes con sucesos


incompatibles.

Si A y B son sucesos independientes tambien lo son A y


A
yB yA
y B.

B,

Los sucesos A1 , A2 , . 
. . , An son mutuamente
 Q

Tk
k
independientes si P
A
h=1 j(h) =
h=1 P Aj(h) para
cualesquiera ndices 1 j(1) < j(2) < < j(k) n.

Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta

29 / 63

Probabilidad condicionada e independencia de


sucesos
Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria

Ejemplo 14
Consideremos un sistema electr
onico que consta de diez
componentes que funcionan independientemente teniendo cada
uno una probabilidad de fallo de 00 05. Calcular la fiabilidad del
sistema (probabilidad de que el sistema funcione
correctamente).
Si denominamos Ci al suceso la componente i-esima funciona
correctamente, donde i = 1, . . . , 10, con P(Ci ) = 00 95, la
fiabilidad del sistema es
P(C1 C2 . . . C10 ) = 00 9510 = 00 598

Variable
aleatoria
discreta
30 / 63

Probabilidad condicionada e independencia de


sucesos
Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta

Ejemplo 14
Para aumentar la fiabilidad del sistema, se conectan en paralelo
dos sistemas iguales al descrito. Calcular la fiabilidad del nuevo
sistema.
Sea Sj el suceso el sistema j funciona correctamente, con
j = 1, 2. Dado que P(Sj ) = 00 598, la fiabilidad del nuevo
sistema es
P(S1 S2 ) = 00 598 + 00 598 00 5982 = 00 838
Si conectasemos en paralelo tres sistemas como el primero,
cual sera la fiabilidad del sistema resultante?
La fiabilidad de este u
ltimo sistema es P(S1 S2 S3 ) = 00 935
31 / 63

Teorema de Bayes

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes

Teorema de las probabilidades totales


Sea A1 , A2 , . . . , An un sistema completo de sucesos, con
P(Ai ) > 0 (i = 1, . . . , n), y sea B un suceso cualquiera.
Entonces
n
X
P(B) =
P(B/Ai )P(Ai )
i=1

Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta
32 / 63

Teorema de Bayes

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias

Ejemplo 15
En una escuela tecnica el 50 % de los alumnos es de primer
curso, el 30 % es de segundo y el 20 % de tercero. De la
encuesta de evaluaci
on de profesorado se sabe que el 60 % de
los alumnos de primero tiene buena opinion del profesorado, al
igual que el 70 % de los de segundo y el 75 % de los de tercero.
Elegido un alumno al azar cual es la probabilidad de que tenga
una buena opinion del profesorado?

Noci
on de
variable
aleatoria
Variable
aleatoria
discreta
33 / 63

Teorema de Bayes

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria

Ejemplo 15
Si consideramos el suceso B = tener buena opinion del
profesorado y el sistema completo de sucesos formado por I =
ser de primero, S = ser de segundo y T = ser de
tercero, la probabilidad pedida es:
P(B) = P (B ) = P (B (I S T ))

= P (B I ) + P (B S) + P (B T )

= P(B/I )P(I ) + P(B/S)P(S) + P(B/T )P(T )


= 00 6 00 5 + 00 7 00 3 + 00 75 00 2 = 00 66

Variable
aleatoria
discreta
34 / 63

Teorema de Bayes

Salvador Naya
Introducci
on
Experimentos
y sucesos

Ejemplo 16

Definici
on de
probabilidad

En una estaci
on de ITV (Inspecci
on Tecnica de Vehculos) hay
dos equipos de inspecci
on, el equipo A rechaza el 30 % de los
coches inspeccionados y el equipo B no rechaza ning
un coche.
Si llegan tres coches a la estaci
on y cada uno elige al azar uno
de los dos equipos de inspecci
on, cual es la probabilidad de
que los tres coches superen la inspecci
on?

Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta

35 / 63

Teorema de Bayes

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria

Ejemplo 16
Sean los sucesos A = elegir equipo A, B =elegir equipo B
y S = superar la inspecci
on, por el teorema de las
probabilidades totales se obtiene
P(S) = P(S/A)P(A) + P(S/B)P(B) = 00 7 00 5 + 1 00 5 = 00 85
Denominemos Si al suceso el coche i supera la inspecci
on,
con i = 1, 2, 3. Por la independencia de estos sucesos, la
probabilidad pedida es
P (S1 S2 S3 ) = 00 853 = 00 6141

Variable
aleatoria
discreta
36 / 63

Teorema de Bayes

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias

Teorema de Bayes
Sea A1 , A2 , . . . , An un sistema completo de sucesos, con
P(Ai ) > 0 para i = 1, . . . , n, (probabilidades a priori) y sea B
un suceso cualquiera, con P(B) > 0. Entonces, para
j = 1, 2, . . . , n,
P(Aj /B) =

P(Aj B)
P(B/Aj )P(Aj )
,
= Pn
P(B)
i=1 P(B/Ai )P(Ai )

llamadas probabilidades a posteriori.

Noci
on de
variable
aleatoria
Variable
aleatoria
discreta
37 / 63

Teorema de Bayes

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias

Ejemplo 17
Se dispone de dos metodos para transmitir un mensaje, el
metodo A transmite correctamente el 70 % de los mensajes y el
metodo B el 90 %. Un da se elige un metodo al azar y se
transmiten ocho mensajes comprobandose posteriormente que
los dos primeros se han transmitido de forma incorrecta. Cual
es la probabilidad de que se haya utilizado el metodo A? Cual
es la probabilidad de que se haya utilizado el metodo B?

Noci
on de
variable
aleatoria
Variable
aleatoria
discreta
38 / 63

Teorema de Bayes

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta

Ejemplo 17
Sean los sucesos A = se utiliza el metodo A y B = se
utiliza el metodo B, con probabilidades P(A) = P(B) = 00 5.
Denominemos M al suceso se envan ocho mensajes, los dos
primeros de forma incorrecta, entonces
P(M/A) = 00 32 00 76 = 00 01059
P(M/B) = 00 12 00 96 = 00 00531
P(A/M) =

00 5 00 01059
= 00 666
00 5 00 01059 + 00 5 00 00531

La probabilidad P(B/M) tambien puede calcularse utilizando


Bayes, o directamante: P(B/M) = 1 P(A/M) = 00 334
39 / 63

Teorema de Bayes

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes

Ejemplo 18
En un examen tipo test con cinco posibles respuestas, la
probabilidad de que Juan sepa la respuesta es 00 6, la
probabilidad de que responda al azar es 00 2 y la probabilidad de
que no responda es 00 2. Si el estudiante
respondio correctamente cual es la probabilidad de que
realmente sepa la respuesta?

Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta
40 / 63

Teorema de Bayes

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria

Ejemplo 18
Sean los sucesos S = Juan sabe la respuesta, A = Juan
responde al azar y N = Juan no responde, con
probabilidades: P(S) = 00 6, P(A) = 00 2 y P(N) = 00 2. Sea C
el suceso Juan respondio correctamente, se verifica que
P(C /S) = 1, P(C /A) = 1/5 = 00 2 y P(C /N) = 0. Por el
teorema de Bayes se obtiene:
P(S/C ) =

00 6 1
00 6
=
= 00 9375
00 6 1 + 00 2 00 2 + 00 2 0
00 64

analogamente, P(A/C ) =
P(N/C ) = 00064 = 0

00 04
00 64

= 00 0625 y,

Variable
aleatoria
discreta
41 / 63

Variables aleatorias

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria

Noci
on de variable aleatoria
Sean un experimento aleatorio y su espacio muestral E .
Una variable aleatoria X es una aplicacion que asocia a
cada elemento del espacio muestral un n
umero real:
X : E R
Una v.a. no es mas que una forma de asociar un n
umero
real a cada uno de los posibles resultados de un
experimento aleatorio.

Variable
aleatoria
discreta
42 / 63

Variables aleatorias

Salvador Naya
Introducci
on
Experimentos
y sucesos

Ejemplos
Urna: Se elige al azar una bola de una urna que contiene 2
bolas blancas y 1 bola negra. Una v.a. asociada a este
experimento podra ser:

Definici
on de
probabilidad

X : E = {B, N}
B
N

Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta

R
0
1

Dos dados: Se lanzan dos dados. La funci


on que asocia a cada
resultado el maximo de los puntos obtenidos es una v.a.:
E=

{(1, 1),

(1, 2),

...,

(1, 6),

(2, 1),

...,

(6, 6)}

6
43 / 63

Variables aleatorias

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos

Noci
on de variable aleatoria
La funci
on de distribuci
on F de una v.a. X es la funci
on
que asigna a cada no real x la probabilidad de que la v.a.
tome un valor menor o igual que x; esto es, la probabilidad
acumulada hasta dicho no real:
F :R
x

R
F (x) = P (X x)

Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta

La funci
on de distribuci
on nos proporciona toda la
estructura probabilstica asociada a la v.a. Por tanto,
cualquier pregunta relacionada con dicha estructura puede
ser contestada a partir de la funci
on de distribuci
on.
44 / 63

Variables aleatorias

Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta

Variable aleatoria discreta


Una v.a. discreta es aquella que toma un n
umero finito de
posibles valores, o bien un n
umero infinito pero numerable
(esto es, tantos valores como elementos tiene el conjunto de los
n
umeros naturales).
Ejemplos

Las v.a. presentadas en los dos ejemplos anteriores (Urna


Dos dados) son discretas.

Salvador Naya

La v.a. que asocia a cada da el no de monitores


producidos en una fabrica es discreta.
Lanzamos una moneda sucesivamente hasta que
obtengamos cara. La v.a. que asocia a cada resultado del
experimento el no de lanzamientos realizados es discreta.
45 / 63

Variables aleatorias

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta

Variable aleatoria discreta


Sea X una v.a. discreta que toma los valores x1 < x2 < .
La funci
on de masa de probabilidad pX de dicha v.a. es la
funci
on que asigna a cada valor xi la probabilidad de que
la v.a. lo tome; esto es:
pX : {xj }
xi

R
pi = P (X = xi )

Se verifica que:
p
i 0, i = 1, 2, . . .
P
i pi = 1
46 / 63

Variables aleatorias

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta

Ejemplo: Urna
pX : {0, 1} R
0 2/3 = P ({B})
1 1/3 = P ({N})

si x < 0
P() = 0,
P ({B}) = 2/3, si 0 x < 1
F (x) =

P (E ) = 1,
si x 1

Observaci
on: La funci
on de distribuci
on de una v.a. discreta
puede escribirse como:
X
F (x) =
pi
i / xi x

47 / 63

Variables aleatorias

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias

Variable aleatoria continua


Una v.a. continua es aquella que toma valores en un conjunto
continuo (toda la recta real, un intervalo, o la union de varios
intervalos).
Ejemplos
La v.a. que asocia a cada persona su peso es continua.
La v.a. que asocia a cada ejecucion de un programa
informatico el tiempo utilizado es continua.

Noci
on de
variable
aleatoria
Variable
aleatoria
discreta
48 / 63

Variables aleatorias

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta

Variable aleatoria continua


La funci
on de densidad f asociada a una v.a. continua X es el
lmite de los histogramas (de area 1) construidos con
observaciones de dicha v.a. El lmite se toma sobre el n
umero
de observaciones (que debe tender a ) y sobre la amplitud de
cada clase (que debe tender a 0). La grafica de f describe el
reparto de densidad de probabilidad de la v.a. continua X .
Se verifica que:
f (x) 0, x R.
R
f (x) dx = 1.

Rx
F (x) = P (X x) = f (t) dt.
Rb
P (a X b) = a f (x) dx = F (b) F (a).

f (x) = F 0 (x) en los puntos x en los que F es derivable.


En los que no lo es, se toma f (x) = 0, por convenio.

49 / 63

Variables aleatorias

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta

Ejemplo
Si la funci
on de distribuci
on de una v.a. X es

si x < 0
0,
1
F (x) =
x,
si 0 x 2
2
1,
si x > 2
entonces su funci
on de densidad es
 1
2 , si 0 < x < 2
f (x) =
0, si x
/ (0, 2)


Ademas, P 41 X 1 = F (1) F ( 14 ) = 21 1 21 14 = 38 .
Equivalentemente,
 R1
R1
P 14 X 1 = 1 f (x) dx = 1 12 dx = 83 .
4

50 / 63

Variables aleatorias

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta

Ejemplo
Si la funci
on de densidad de una

x,
2 x,
f (x) =

0,

v.a. X es
si 0 < x 1
si 1 < x < 2
si x
/ (0, 2)

entonces su funci
on de distribuci
on es

0,

Z x
x2
2 ,
f (t) dt =
F (x) =
x2

2x 2 1,
1,

si
si
si
si

x 0
0<x 1
1<x <2
x 2
51 / 63

Variables aleatorias

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta

Esperanza y varianza de una variable aleatoria


La esperanza matematica o media de una v.a. X se define
como:
P
E (X ) = = i xi pi , si X es discreta.
R
E (X ) = = xf (x)dx, si X es continua.

La varianza de una v.a. X se define como:


P
Var (X ) = 2 = i (xi )2 pi , si X es discreta.
R
Var (X ) = 2 = (x )2 f (x)dx, si X es continua.



Se tiene que Var (X ) = E (X )2 = E X 2 2 , esto es:
P
Var (X ) = i xi2 pi 2 , si X es discreta.
R
Var (X ) = x 2 f (x)dx 2 , si X es continua.

La desviacion tpica es la raz cuadrada positiva de la varianza.


52 / 63

Variables aleatorias

Salvador Naya
Introducci
on

Esperanza y varianza de una variable aleatoria


La esperanza y la varianza verifican:
E (X1 + X2 + + Xn ) = E (X1 ) + E (X2 ) + + E (Xn ).

Experimentos
y sucesos

E (aX + b) = aE (X ) + b, donde a, b R.

Definici
on de
probabilidad

Var (X1 + X2 + + Xn ) =
Var (X1 ) + Var (X2 ) + + Var (Xn ), si las v.a. Xi son
independientes .

Probabilidad
condicionada
e
independencia
de sucesos

Var (aX + b) = a2 Var (X ), donde a, b R.

Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta

Las

v.a. X e Y se dice que son independientes si lo son


cualquier par de sucesos definidos por ambas. Ejemplo de tales
sucesos podra ser {X 5} e {Y 6= 3}. Esta definici
on se
puede generalizar a mas de dos variables.
53 / 63

Variables aleatorias

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta

Distribuci
on binomial
Supongamos que un experimento es realizado n veces, de modo
que las n pruebas o realizaciones son independientes.
a un suceso de inter

Denominemos EXITO.
es asociado al
experimento, y sea p su probabilidad de ocurrencia.

La v.a. X =N
umero de EXITOS
en las n pruebas realizadasse
dice que tiene una distribuci
on binomial de parametros n y p
(X B(n, p)).
Su funci
on de masa de probabilidad viene dada por
 
n k
pX (k) = P(X = k) =
p (1 p)nk , k = 0, 1, . . . , n.
k
Su media es = np y su varianza es 2 = np(1 p).

54 / 63

Variables aleatorias

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria

Ejemplos
Lanzamos 15 veces un dado, y consideramos la v.a.
X =N
umero de cuatros obtenidos. Esta v.a. tiene

distribuci
on B(15, 1/6) (el suceso EXITO
es .obtener
cuatro). El n
umero medio de cuatros que se obtendran es
= 15 61 = 2,5
De una urna con 30 bolas blancas y 20 bolas negras
extraemos 10 bolas con reemplazamiento, y consideramos
la v.a. X =N
umero de bolas negras extradas. Esta v.a.

tiene distribuci
on B(10, 2/5) (el suceso EXITO
es .extraer
bola negra). El n
umero medio de bolas negras que se
extraeran es = 10 25 = 4

Variable
aleatoria
discreta
55 / 63

Variables aleatorias

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria

Don Anselmo y los pimientos de Padron


Cierto restaurante dispone de un gran lote de pimientos de
Padron, de los cuales el 10 % son picantes. Don Anselmo toma
en ese establecimiento 20 pimientos.
Denotando por X a la v.a. n
umero de pimientos que le pican
a Don Anselmo, se tiene que su distribuci
on es
aproximadamente una B(20, 0,1). Por tanto:
La probabilidad de que no le pique ninguno es:
 
20
0,10 (1 0,1)200 = 0,920 = 0,1216
P(X = 0)
0

Variable
aleatoria
discreta
56 / 63

Variables aleatorias

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta

Don Anselmo y los pimientos de Padron (continuaci


on)
La probabilidad de que le piquen dos o mas es:
P (X 2) = 1 P (X < 2)

= 1 P(X = 0) P(X = 1)
 
20
0,11 (1 0,1)201
1 0,1216
1
= 1 0,1216 20 0,1 0,919

= 1 0,1216 0,2702 = 0,6082

El n
umero medio de pimientos que le picaran es
20 0,1 = 2
57 / 63

Variables aleatorias

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta

Distribuci
on normal
Se dice que una v.a. X tiene una distribuci
on normal de
parametros y (X N(, )) si su funci
on de densidad es
(x)2
1
f (x) = e 22 , x R.
2

La media de una v.a. X N(, ) es y su varianza 2 .

La distribuci
on N(0, 1) se denomina normal estandar, y la
v.a. correspondiente se denota, en general, por Z .
Se verifica que
X N(, ) Z =

X
N(0, 1)

58 / 63

Variables aleatorias

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta

Don Anselmo y los percebes de Cedeira


Cada verano, a finales de Julio y/o comienzos de Agosto,
Cedeira celebra su afamada Festa do Percebe, en la que se
reparten (previo pago) miles de raciones del mencionado
crustaceo. En general, los organizadores indican que el
contenido de cada raci
on pesa 250 gr, aunque en realidad, si
denotamos por X a la v.a. peso (en gr) de una racion, se
tiene que X N(250, 25). Don Anselmo va a comprar una
racion.
La probabilidad de que pese menos de 225 gr es:


X 250
225 250
P (X < 225) = P
<
25
25
= P (Z < 1) = P (Z > 1) = 0,1587
59 / 63

Variables aleatorias

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta

Don Anselmo y los percebes de Cedeira (continuaci


on)
La probabilidad de que pese al menos 300 gr es:


X 250
300 250
P (X 300) = P

25
25
= P (Z 2) = 0,0228

La probabilidad de que su peso este entre 225 y 300 gr es:




X 250
300 250
225 250

P (225 X 300) = P
25
25
25
= P (1 Z 2)
= 1 P (Z > 1) P (Z > 2)

= 1 0,1587 0,0228 = 0,8185

60 / 63

Variables aleatorias

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta

Distribuci
on normal
Si X1 , X2 , . . . , Xn son v.a. independientes y con
distribuci
on N (1 , 1 ) , N (2 , 2 ) , . . . , N (n , n ),
respectivamente, y a1 , a2 , . . . , an son n
umeros reales,
entonces:
qP

P
n
n
2 2
a1 X1 + a2 X2 + + an Xn N
i=1 ai i
i=1 i ,
Teorema Central del Lmite: Si X1 , X2 , . . . , Xn son v.a.
independientes e identicamente distribuidas (i.i.d.) con
media y desviacion tpica , entonces, para n
grande(n > 30), se tiene que

X1 + X2 + + Xn N n, n

61 / 63

Variables aleatorias

Salvador Naya
Introducci
on
Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria

Distribuci
on normal
A medida que n aumenta, se tiene que la distribuci
on
binomial B(n, p) se acerca mas y mas a una distribuci
on
normal. En la practica, dicha aproximacion se da por
valida cuando n > 30 y 0,1 < p < 0,9 (o np(1 p) > 5).
As, en estas condiciones, se tienep
que X B(n, p) puede
aproximarse mediante Y N(np, np(1 p)).

Puesto que la binomial es una distribuci


on discreta y la
normal es continua, es conveniente aplicar la siguiente
correcci
on por continuidad. De este modo, la aproximacion
de las probabilidades es mas fina.
P (X = k) P (k 0,5 Y k + 0,5) , k = 0, 1, . . . , n

Variable
aleatoria
discreta
62 / 63

Variables aleatorias

Salvador Naya
Introducci
on

Ejemplos
Nos disponemos a lanzar 180 veces un dado, y deseamos
calcular la probabilidad de obtener entre 25 y 40 cuatros.

Experimentos
y sucesos
Definici
on de
probabilidad
Probabilidad
condicionada
e
independencia
de sucesos
Teorema de
Bayes
Variables
aleatorias
Noci
on de
variable
aleatoria
Variable
aleatoria
discreta

La v.a. X =N
umero de cuatros obtenidostiene distribuci
on
B(180, 1/6), que puede
qaproximarse (n > 30 y 0,1 < p < 0,9)
por la Y N(180 61 ,

80

1
6

65 ) = N(30, 5). Por tanto:

P (25 < X < 40) = P (X = 26) + P (X = 27) + + P (X = 39


= P (26 X 39)
P
(26 0,5 Y 39 + 0,5) = P (25,5
 Y 39,5)
Y 30
39,5 30
25,5 30

=P
5
5
5
= P (0,9 Z 1,9) = 1 0,0287 0,1841 = 0,7872
63 / 63