Está en la página 1de 82

GRADO EN BIOLOG

IA
ESTAD

ISTICA APLICADA A LA BIOLOGA


CURSO 2012-13
Nota: Este documento es un gui on-resumen de la materia que se desarrollara en clase.
No puede ser considerado como apuntesde la asignatura
CARACTER: FORMACI

ON B

ASICA. PRIMER CURSO. PRIMER SEMESTRE


DEPARTAMENTO QUE LA IMPARTE: Departamento de Estadstica e Investigaci on Operativa
Facultad de Matem aticas.
www-en.us.es/destadio
N umero de creditos: 6
N umero de horas de trabajo del alumno (presencial + no presencial+ trabajos pr acticos+ex amenes):
150 horas. (El tiempo de trabajo personal se considera una estimacion media, pero dependera de las
necesidades de cada alumno en particular).
OBJETIVOS DOCENTES ESPEC

IFICOS: El objetivo principal es una introducci on b asica al


an alisis de datos y a la inferencia estadstica, que se concretar a en las siguientes competencias:
Aprender a planicar e interpretar los resultados de los an alisis experimentales desde el punto
de vista de la signicacion estadstica.
Resumir y representar gr acamente de manera adecuada un conjunto de datos.
Conocer las nociones basicas de probabilidad y algunos modelos clasicos de distribuciones.
Adquirir y comprender el modo de razonar en las situaciones donde se usa la inferencia es-
tadstica.
METODOLOG

IAS DOCENTES:
Sesiones academicas te orico-pr acticas: 4 horas semanales.
Tutoras personalizadas: voluntarias.
B asicamente, se expondr a el contenido te orico de los temas a traves de clases presenciales, siguiendo
libros de texto de referencia y/o documentacion adicional. Que servir an para jar los conocimientos
y contenidos ligados a las competencias previstas.
A su vez, las clases pr acticas de resolucion de problemas y/o estudio de casos practicos permitir an
la aplicaci on de las deniciones, propiedades y teoremas expuestos en las clases te oricas, utilizando
cuando sea conveniente medios inform aticos, de modo que los estudiantes alcancen las competencias
previstas. Se jaran horas de practicas con software especco.
1
BLOQUES TEM

ATICOS
BLOQUE TEM

ATICO I: AN

ALISIS DESCRIPTIVO DE UN CONJUNTO DE DA-


TOS.
1. Introduccion a la Estadstica. Conceptos b asicos.
2. Metodos gracos.
3. Caractersticas asociadas a una distribucion de frecuencias.
4. Series estadsticas de dos caracteres. Regresion.
BLOQUE TEM

ATICO II: NOCIONES DE PROBABILIDAD. MODELOS TE

ORI-
COS POBLACIONALES.
5. Experimentos aleatorios. Probabilidad.
6. Variables aleatorias. Modelos cl asicos de distribuciones de probabilidad.
BLOQUE TEM

ATICO III: INFERENCIA ESTAD

ISTICA.
7. Introduccion a la Inferencia Estadstica.
8. El problema de la estimaci on: Estimacion puntual y estimacion por regiones de conanza.
9. Contrastes de hip otesis estadsticas.
2
SISTEMAS Y CRITERIOS DE EVALUACI

ON:
Sistema de evaluaci on continua (evaluaci on alternativa). Se desarrolla durante el periodo de
docencia de la asignatura a traves de
2 pruebas escritas que se celebrarn el 23/11/2012 (todos los grupos) y el 16/01/2012
(grupos C y D) 17/01/2012 (grupos A y B).
trabajos personales (individuales y/o en grupo), exposiciones, y participaci on en las acti-
vidades presenciales u otros medios que ser an jados por el profesor.
Sistema de evaluacion tradicional (convocatorias ociales). Un examen teorico-pr actico que
consistir a en una prueba escrita con cuestiones relacionadas con la materia impartida en las
clases te oricas y habra de efectuar el planteamiento y resoluci on de problemas de naturaleza
similar a los realizados en clase.
Evaluacion de las pr acticas con software especco.
En la ultima pr actica se realizar a una prueba. La nota obtenida en esta prueba supondr
el 15 % de la nota de la Primera Convocatoria (tanto en la evaluacion continua como en
la tradicional).
Restantes convocatorias: en el examen se incluir an cuestiones especcas (15 % de la nota)
sobre la materia desarrollada en las pr acticas.
BIBLIOGRAF

IA RECOMENDADA
Rius Daz, F., Baron L opez, F.J. Bioestadstica. Ed. Thomson.
Samuels, Witmer, Schaner. Fundamentos de Estadstica para las Ciencias de la Vida. Ed.
Pearson.
Milton, J.S. Estadstica para Biologa y Ciencias de la Salud. Ed. McGraw-Hill.
Martn Andres, A., Luna del Castillo, J.D. Bioestadstica para las Ciencias de la Salud. Norma-
Capitel.
Carlberg, C.G., An alisis Estadstico con Excel. Ed. Anaya Multimedia
3
BLOQUE TEM

ATICO I:
AN

ALISIS DESCRIPTIVO DE UN CONJUNTO DE DATOS


1. Introducci on a la Estadstica. Conceptos basicos. Distribuciones de
frecuencias
1.1. Introducci on
Los investigadores en el campo de las Ciencias de la Vida realizan sus actividades en varios
entornos: en la clnica, laboratorio, invernadero o en el campo. Generalmente los datos resultantes
presentan una cierta variabilidad. A menudo el grado de variabilidad es sustancial, incluso aunque
las condiciones experimentales se mantengan tan constantes como sea posible. Las Ciencias de la
Vida son esencialmente ciencias experimentales que necesitan del razonamiento inductivo a partir de
datos: se hacen armaciones acerca de un colectivo de individuos u objetos, habiendo observado en
realidad solo una parte de ellos.
La Estadstica es la ciencia de la interpretacion de los datos y de la toma de decisiones en entornos
de variablidad e incertidumbre. Los conceptos y metodos de la estadstica permiten al investigador
describir la variabilidad y planicar sus investigaciones teniendo en cuenta dicha varibilidad. Es decir,
la estadstica tiene como objetivo descubrir los patrones que pueden estar m as o menos ocultos por
la varibilidad de las respuestas de los sistemas vivos.
Los metodos estadsticos se utilizan para analizar los datos y extraer la maxima informacion,
identicando adem as la abilidad de dicha informacion.
1.2. Tipos de estudios.
Hay dos modos b asicos de recoger datos: estudios observacionales y dise no de experimentos.
En un estudio observacional, los investigadores recogen datos de un modo que no intereran
directamente en c omo se obtienen los datos. En estos casos, los investigadores no intentan interferir
con el orden natural en el que surgen los datos.
Cuando los investigadores quieren establecer una conexi on causal, tienen que dise nar un expe-
rimento. Generalmente habra variables explicativas y variables respuesta.
Para chequear si realmente hay una conexi on causal entre la variable explicativa y la respuesta,
los investigadores recoger an una muestra de individuos y partir an los casos en grupos. A los casos
en cada grupo se les asigna un tratamiento. Cuando los grupos son creados usando una tecnica de
aleatorizaci on, el experimento se llama experimento aleatorizado.
4
Principios del Dise no de Experimentos
Los experimentos aleatorizados son generalmente construidos sobre cuatro principios.
Control. Los investigadores asignan los grupos de tratamientos a los casos, y hacen todo lo
posible por controlar cualquier otra diferencia en los grupos.
Aleatorizaci on. Los investigadores aleatorizan los pacientes entre los grupos de tratamientos
para que no inuyan las variables que no se pueden controlar.
Bloqueo. Los investigadores a veces saben o sospechan que otras variables diferentes a las del
tratamiento pueden inuir en la respuesta. Bajo estas circunstancias, ellos pueden en primer
lugar agrupar individuos bas andose sobre estas variables en bloques, y luego aleatorizar casos
dentro de cada bloque a los grupos de tratamiento.
Efecto placebo Muchas veces, en experimentos con personas se utiliza un placebo (me satis-
fara), que es una sustancia inerte, para eliminar el componente psicol ogico. Las investigaciones
han demostrado que los placebos pueden ser efectivos para aproximadamente la tercera parte
de los enfermos.
Para evitar sesgos, se intenta evitar que los pacientes sepan que nivel de tratamiento se les
ha asignado (o que no se le ha asignado ninguno, grupo de control). A estos experimentos
se les denomina ciegos. Para evitar sospechas, se recurre a darles un tratamiento falso (por
ejemplo, pastilla de az ucar), llamado placebo, a los casos control (sin tratamiento). A veces,
estos casos, presentan una ligera mejora real, lo que se denomina efecto placebo. Tambien se
puede evitar que los investigadores conozcan el nivel de tratamiento asignado a cada paciente,
para evitar nuevos sesgos. La razon de cegar a la persona que realiza las evaluaciones es que se
reduce la posibilidad de que introduzca un sesgo subjetivo. Alguien que espera o desea ciertos
resultados puede inuir insconcientemente en estos resultados. A estos experimentos se les
denomina doble ciego.
1.3. Conceptos basicos
Se llama poblacion o universo al conjunto de elementos que es objeto de estudio y que
poseen una determinada caracterstica. Cada uno de los elementos de la poblaci on se denomina
individuo o unidad estadstica.
Se llama Caracter o Variable a un rasgo de la poblacion, es decir es una caracterstica de
una persona o cosa a la que se le puede asignar un n umero o una categora.
Distinguimos dos tipos de variables o caracteres: cualitativos y cuantitativos.
5
Una Variable Cualitativa o Categorica es aquella que no se puede cuanticar. Dado
que las variables categ oricas no pueden medirse no tienen un orden natural asociado, sin
embargo, en algunas ocasiones las categoras se pueden disponer en alg un tipo de orden
que tenga sentido. A las variables cualitativas tambien se les denomina atributos.
Una Variable Cuantitativa o Numerica es aquella que puede ser medida numerica-
mente.
A su vez dentro de las variables cuantitativas podemos distinguir dos tipos: variables
discretas (toman valores aislados) y variables continuas (toman todos los valores de
un intervalo).
Durante este curso trabajaremos b asicamente con variables cuantitativas, discretas o conti-
nuas. Usualmente se denotar a por X la variable de interes en el estudio, n el n umero total de
observaciones y x
1
, . . . x
k
los valores distintos observados de la variable ordenados en sentido
creciente, es decir, x
1
< . . . < x
k
.
Si X es un atributo, a x
1
, . . . x
k
se les denomina modalidades. N otese que en este caso x
1
, . . . x
k
no se pueden ordenar.
No siempre es posible estudiar todos los elementos de una poblacion. En estos casos se recurre
a observar un subconjunto de la misma. Se llama muestra a un subconjunto de la poblacion
elegido en terminos de representatividad. Por regla general el tama no de la muestra se
representa por n (o N).
De la poblaci on, por razones de inaccesibilidad, extraeremos una muestra, de forma que del
comportamiento estudiado en la muestra pueda generalizarse o inferir el de la poblacion.
Razones de inaccesibilidad a la Poblaci on:
Imposibilidad fsica de acceder a toda la poblacion:
Imposibilidad economica de acceder a toda la poblacion:
Imposibilidad por destrucci on del individuo objeto de estudio:
Para poder extraer conclusiones de la muestra que sean aplicables a toda la poblaci on con una
base cientca las diferencias entre la muestra y la poblaci on deben ser mnimas, es decir la muestra
debe ser representativa de la poblaci on. Pero la poblaci on es desconocida, debemos escoger la muestra
a ciegas. Por ello debemos cuidar:
Tama no de la muestra. Viene determinado por el tama no de la poblacion, por la varaibilidad
de la misma, por el procedimiento de seleccion de la muestra y por la precisi on deseada.
Procedimiento de eleccion que garantice la objetividad y la representatividad
6
La forma de seleccionar los individuos que han de constituir la muestra tiene, como es l ogico, una
importancia capital para garantizar que esta permita obtener conclusiones que puedan extrapolarse
v alidamente a la poblacion de la que la muestra procede. No hay que olvidar nunca que el objeto
nal del estudio es siempre la poblaci on y que la muestra es solo un medio para obtener informaci on
sobre esta.
Con el n de permitir inferir conclusiones v alidas sobre una poblaci on la muestra debe ser re-
presentativa de esta. En teora la unica forma de garantizar la representatividad de una muestra es
seleccionando al azar los individuos (MUESTRA ALEATORIA SIMPLE).
Denici on 1 Una muestra aleatoria simple de n elementos es una muestra en la que:
a) todos los miembros de la poblacion, y solo ellos, tienen las mismas oportunidades de ser inclui-
dos en la muestra,
b) los miembros de la muestra se escogen independientemente entre s. Es decir que las oportu-
nidades de que un determinado miembro de la poblacion sea elegido no dependen de que otros
miembros de la poblacion son elegidos y los valores que presentan esos individuos no estan
condicionados por los valores que presenten otros individuos.
Aunque esta forma de proceder rara vez sea aplicable de forma estricta en la practica, siempre
hay que extremar las precauciones para que la forma real de obtener la muestra sea lo mas parecida
posible a la ideal.
Al procedimiento mediante el cual se obtiene la muestra se llama muestreo.
El objetivo de los metodos de muestreo es conseguir que la muestra sea una replica de la poblaci on.
Pero esto puede fallar debido a:
Errores de muestreo. Se producen por la variabilidad inherente a la poblacion.
Errores ajenos al muestreo:
de observaci on: sobrecobertura, de medida y de proceso.
no en la observacion: subcobertura, falta de respuesta.
Seg un la naturaleza de la investigaci on que se lleve a cabo ser a conveniente un tipo de muestreo
u otro. Se deber a escoger aquel que minimice los errores de muestreo.
1.4. Distribuci on de frecuencias
Un primer paso para entender el signicado de un conjunto de datos de una variable dada consiste
en explorar dichos datos y describirlos en forma resumida. En este apartado se ver an tres maneras
7
complementarias de resumir esta informacion: las distribuciones de frecuencias, las medidas de ten-
dencia central y las medidas de dispersion.
Una Distribucion de frecuencias es simplemente una presentaci on del n umero de apariciones
de cada valor en el conjunto de datos. Est a informaci on se puede presentar en forma de tabla o
mediante un graco.
Para ello, denimos los siguientes conceptos:
Frecuencia (absoluta) de x
i
, que denotaremos n
i
, es el n umero de veces que se observa dicho
valor. Se tiene que
k

i=1
n
i
= n.
Frecuencia relativa de x
i
, que denotaremos f
i
, es la proporci on de observaciones que toman
dicho valor, es decir
f
i
=
n
i
n
, 1 i k.
Se tiene que
k

i=1
f
i
= 1.
Frecuencia (absoluta) acumulada de x
i
, que denotaremos N
i
, es el n umero de observaciones
con valor menor o igual que x
i
.
N
i
=
i

j=1
n
j
, 1 i k.
Se tiene que
N
1
= n
1
, N
k
= n, n
i
= N
i
N
i1
, 2 i k.
Frecuencia relativa acumulada de x
i
, que denotaremos F
i
, es la proporci on de observaciones
con valor menor o igual que x
i
,
F
i
=
N
i
n
=
i

j=1
f
j
, 1 i k.
Se tiene que
F
1
= f
1
, F
k
= 1, f
i
= F
i
F
i1
, 2 i k.
Las frecuencias se representan en una tabla, denominada tabla de frecuencias, como sigue:
8
x
i
n
i
N
i
f
i
F
i
x
1
n
1
N
1
f
1
F
1
x
2
n
2
N
2
f
2
F
2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
x
k
n
k
N
k
f
k
F
k
n 1
Si la variable toma muchos valores distintos, entonces es usual agruparlos en intervalos. En esta
situaci on, se denen de manera an aloga las frecuencias de los intervalos, que se disponen en una tabla
de la siguiente forma:
(L
i1
, L
i
] n
i
N
i
f
i
F
i
x
i
A
i
h
i
(L
0
, L
1
] n
1
N
1
f
1
F
1
x
1
A
1
h
1
(L
1
, L
2
] n
2
N
2
f
2
F
2
x
2
A
2
h
2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
(L
k1
, L
k
] n
k
N
k
f
k
F
k
x
k
A
k
h
k
n 1
donde x
i
= (L
i
+ L
i1
)/2 es el punto medio de cada intervalo, denominado marca de clase y que
representa al intervalo, A
i
= L
i
L
i1
es la amplitud del intervalo y h
i
= n
i
/A
i
.
Ejemplo 1 Un profesor desea conocer el nivel de Matematicas de sus alumnos. Para ello somete a
una prueba a 15 alumnos obteniendo los siguientes resultados:
4, 3, 7, 5, 6, 4, 5, 4, 5, 6, 7, 7, 3, 4, 5
La tabla de frecuencias para estos datos es
x
i
n
i
N
i
f
i
F
i
3 2 2 0.133 0.133
4 4 6 0.266 0.4
5 4 10 0.266 0.666
6 2 12 0.133 0.8
7 3 15 0.2 1
15 1
Ejemplo 2 Se miden las longitudes en milmetros de las patas de una determinada variedad de
escarabajos, obteniendose los siguientes resultados
0,2, 0,6, 1,1, 1,7, 1,9, 3,7, 3,8, 4,2, 4,5, 4,8, 5,3,
5,7, 6,2, 6,7, 7,5, 8,1, 8,5, 8,7, 9,2, 9,5
9
Observese que en los datos se repiten muy pocos valores, por lo que casi todas las frecuencias son
1, y en consecuencia, la tabla de frecuencias que se obtendra sera demasiado larga. En este caso,
es aconsejable agrupar los datos por intervalos. El criterio de division no es objetivo, pero no ha
de haber muy pocos intervalos, pues se perdera demasiada informacion, ni demasiados, pues no se
lograra el efecto deseado, aunque s deben abarcar todos los posibles valores y no solaparse. Tomare-
mos como criterio general los intervalos de la forma (a, b]. En este caso, hemos tomado la division
(0, 1], (1, 3], (3, 5], (5, 6], (6, 8], (8, 10]. Entonces la tabla quedara como sigue:
(L
i1
, L
i
] n
i
N
i
f
i
F
i
x
i
A
i
h
i
(0,1] 2 2 0.1 0.1 0.5 1 2
(1,3] 3 5 0.15 0.25 2 2 1.5
(3,5] 5 10 0.25 0.5 4 2 2.5
(5,6] 2 12 0.1 0.6 5.5 1 2
(6,8] 3 15 0.15 0.75 7 2 1.5
(8,10] 5 20 0.25 1 9 2 2.5
20 1
Notese que no todos los intervalos han de tener la misma amplitud.
10
2. Metodos gracos
Una buena representacion gr aca de los datos puede mostrar de forma clara y concisa las ca-
ractersticas de los mismos. No obstante, es necesario recalcar que la representaci on gr aca no es
m as que un elemento auxiliar de analisis y representacion, y que por s sola no sirve para un estudio
riguroso de la informaci on contenida en los datos.
Una misma informaci on puede ser representada gr acamente de muchas maneras. Existen distin-
tos tipos de representaci on seg un el tipo de la variable, ya sea cuantitativa o cualitativa:
V. cuantitativas
_

_
Discretas
(no agrupadas)
Continuas
(agrupadas)
_

_
Diagrama de barras
Polgono de frecuencias
Curva acumulativa
_

_
Histograma
Polgono de frecuencias
Curva acumulativa
V. cualitativas
_

_
Diagrama de rectangulos
Diagrama de sectores
Pictogramas
2.1. Variables no agrupadas
2.1.1. Diagrama de barras
En el eje de abscisas se representan los distintos valores observados de la variable. Para cada valor
observado se levanta un segmento con altura igual a la frecuencia absoluta de dicho valor.
El diagrama de barras de los datos en el ejemplo 1 se muestra en la gura 1.
1 2 3 4 5 6 7 8
1
2
3
4
5
n
i
Figura 1: Diagrama de barras para los datos del ejemplo 1.
11
Tambien puede usarse el diagrama de barras para representar las frecuencias relativas. En ese
caso, la altura de cada segmento sera f
i
, en vez de n
i
.
2.1.2. Polgono de frecuencias
El polgono de frecuencias es una forma alternativa de representar los mismos datos que el dia-
grama de barras. Se construye uniendo los extremos superiores de los segmentos del correspondiente
diagrama de barras, como se muestra en la gura 2.
1 2 3 4 5 6 7 8
1
2
3
4
5
n
i
Figura 2: Polgono de frecuencias para los datos del ejemplo 1
Tambien puede usarse para representar las frecuencias relativas en vez de las absolutas.
2.1.3. Curva acumulativa
Hasta ahora ninguno de los metodos gr acos ha representado las frecuencias acumuladas, ya sean
absolutas o relativas. La curva acumulativa es una forma de representar estas frecuencias, esto es, el
n umero de observaciones que hay con valor menor o igual que uno dado. Es una funci on escalonada
que vale 0 desde hasta el valor observado m as peque no. Entre el primer y el segundo valor mas
peque no, la funci on vale N
1
, la primera frecuencia acumulada. Entre el segundo valor m as peque no
y el tercero, la funci on vale N
2
, etc. A partir del valor m as grande, la funcion es constante e igual al
n umero de observaciones n. En la gura 3 puede apreciarse la curva acumulativa para los datos del
ejemplo 1.
La funcion dibujada es discontinua en cada valor observado, siendo continua a la derecha.
Tambien pueden representarse las frecuencias acumuladas relativas, en vez de las absolutas, en
cuyo caso a partir del valor mas grande, la funcion es constante e igual a 1.
12
1 2 3 4 5 6 7 8
2
4
6
8
10
12
14
16
N
i
n
i
Figura 3: Curva acumulativa correspondiente a los datos del ejemplo 1.
2.2. Variables agrupadas
2.2.1. Histograma
En el eje de abscisas se sit uan los intervalos en los que se han agrupado los datos, y para cada
uno de ellos se levanta un rect angulo con base dicho intervalo y area igual a la frecuencia absoluta
observada. Observese que si A
i
es la amplitud del intervalo, para que el area del rect angulo sea igual
a n
i
, entonces su altura ha de ser
h
i
=
n
i
A
i
El histograma correspondiente a los datos del ejemplo 2 puede verse en la gura 4.
1 3 5 6 8 10
0,5
1
1,5
2
2,5
h
i
Figura 4: Histograma correspondiente a los datos del ejemplo 2.
Al igual que en el caso anterior, tambien puede usarse el histograma para representar las frecuen-
13
cias relativas en vez de las absolutas. En ese caso, la f ormula para la altura de los rectangulos pasara
a ser
h
i
=
f
i
A
i
y el area de los rect angulos sera f
i
.
2.2.2. Polgono de frecuencias
El polgono de frecuencias es una forma alternativa de representar los mismos datos que el his-
tograma. Su construcci on diere ligeramente del caso discreto. En el caso de variables agrupadas
por intervalos, se unen los puntos medios de la parte superior de cada rectangulo. Observese que la
coordenada x de cada punto es la marca de clase del intervalo. Un ejemplo del polgono de frecuencias
en este caso puede verse en la gura 5.
1 3 5 6 8 10
0,5
1
1,5
2
2,5
h
i
Figura 5: Polgono de frecuencias para los datos del ejemplo 2.
Al igual que en los casos anteriores, tambien puede usarse para representar las frecuencias relativas
en vez de las absolutas.
2.2.3. Curva acumulativa
Como en el caso discreto, representa el n umero de observaciones que hay con valor menor o igual
que uno dado. En el caso continuo, la curva acumulativa es una lnea quebrada que vale 0 desde
hasta L
0
. Dentro del primer intervalo, (L
0
, L
1
], es un segmento que une los puntos (L
0
, 0) y
(L
1
, N
1
). En el segundo intervalo, (L
2
, L
3
], es un segmento que une los puntos (L
1
, N
1
) y (L
2
, N
2
),
y as sucesivamente. A partir del extremo derecho del ultimo intervalo, L
k
, hasta + su valor
ser a siempre igual al n umero de observaciones n. Un ejemplo de este tipo de curva acumulativa
puede verse en la gura 6.
14
1 3 5 6 8 10
2
4
6
8
10
12
14
16
18
20
N
i
Figura 6: Curva acumulativa correspondiente a los datos del ejemplo 2.
Tambien pueden representarse las frecuencias acumuladas relativas, en vez de las absolutas, en
cuyo caso a partir del extremo derecho del ultimo intervalo hasta + su valor sera siempre 1.
2.3. Variables cualitativas o atributos
2.3.1. Diagrama de rectangulos
Su construcci on es similar al diagrama de barras. Las frecuencias se pueden representar en el eje
horizontal o en el eje vertical.
Ejemplo 3 Se ha observado el color de pelo a 12 individuos obteniendose los siguientes resultados:
Color de pelo n
i
Moreno (M) 5
Rubio (R) 3
Otros (O) 4
12
Estos datos se pueden representar en un diagrama de rectangulos (horizontales o verticales) como
sigue
15
T
E
1 2 3 4 5 n
i
O
R
M
T
E
1
2
3
4
5
n
i
M R O
2.3.2. Diagrama de sectores
En un crculo, se asigna a cada modalidad un sector de tama no proporcional a su frecuencia. Para
el ejemplo 3, los sectores correspondientes a cada categora seran:
Color de pelo n
i
f
i
f
i
360
o
Moreno (M) 5 0.4166 150
o
Rubio (R) 3 0.2500 90
o
Otros (O) 4 0.3333 120
o
12 1 360
o
Con los datos del ejemplo 3 se obtendra el siguiente diagrama de sectores:
M
R
O
2.3.3. Pictograma
En este tipo de gr acos se emplean guras relacionadas con el fenomeno que se est a estudiando,
de forma que su tama no o n umero nos indique la frecuencia asociada a cada modalidad.
16
Ejemplo 4 La siguiente tabla muestra el tipo de viviendas construidas en una poblacion durante el
pasado a no:
Tipo de vivienda n
i
Casa 200
Apartamento 400
Piso 600
1200
Pictograma con guras de tama no proporcional a las frecuencias:

d
d
d
d
PISOS

d
d
d
d
APARTAMENTOS

d
d
d
CASAS
Pictograma con n umero guras proporcional a las frecuencias:

d
d
d
=200
PISOS
APARTAMENTOS
CASAS

d
d
d

d
d
d

d
d
d

d
d
d

d
d
d

d
d
d
17
3. Caractersticas asociadas a una distribucion de frecuencias
Una vez recogidos los datos, hay que buscar un n umero reducido de magnitudes o valores que nos
resuman la informaci on contenida en los mismos y que a su vez, nos permita comparar dos o m as
series. El tipo de informaci on sobre la variable puede ser muy diverso. Centraremos nuestro estudio
en las medidas de localizacion y las medidas de dispersi on.
3.1. Medidas de localizacion
El objetivo de las medidas de localizaci on consiste en resumir cuantitativamente una distribucion,
es decir, dar un unico valor que represente a todos los datos.
3.1.1. La media aritmetica
Se dene la media aritmetica como
x =
n

i=1
x
i
n
=
k

i=1
x
i
n
i
n
o de forma alternativa
x =
k

i=1
x
i
f
i
donde x
1
, . . . , x
k
son los valores distintos observados para variables no agrupadas y las marcas de
clase para variables agrupadas en intervalos.
N otese que la media aritmetica se mide en las mismas unidades que los datos.
Ejemplo 5 Se toman 100 cajas de semillas y se observa que en cada una de ellas hay entre 0 y 5
semillas germinadas. Si X =n umero semillas germinadas en una caja, calcula el n umero medio de
semillas germinadas a partir de los datos en la siguiente tabla:
x
i
n
i
N
i
0 4 4
1 20 24
2 45 69
3 25 94
4 5 99
5 1 100
100
18
x =
k

i=1
x
i
n
i
N
=
0 4 + 1 20 + 2 45 + 3 25 + 4 5 + 5 1
100
= 2,10 semillas
Propiedades (linealidad)
(a) Si sobre una variable se realiza una transformaci on de tipo lineal Y = a + bX, entonces
y = a + bx
es decir, realizar un cambio de escala y/o un cambio de ejes en los datos supone realizar el
mismo cambio a la media aritmetica.
(b) Si la variable Z se puede expresar de la forma Z = aX + bY , entonces
z = ax + by.
Ejemplo 6 Calcula la media aritmetica de la variable Z, si sus valores son z
i
= 3y
i
+ 9x
i
, i =
1, 2, ..., n, y se sabe que y = 3 y x = 4.
z = 3y + 9x = 3 (3) + 9 4 = 27.
3.1.2. Moda
La moda es el valor de la variable que mas veces se presenta.
Md = x
i
/n
i
= max{n
j
: 1 j k} o f
i
= max{f
j
: 1 j k}
La moda puede no ser unica. Si una distribuci on tiene 2 modas se llama bimodal, o si tiene 3
modas se llama trimodal. En general, si tiene varias modas se llama multimodal y si solo tiene una
se llama unimodal.
En el ejemplo 5: Md = 2 semillas y en el ejemplo 1 Md
1
= 4 y Md
2
= 5.
La moda se mide en las mismas unidades que los datos.
3.1.3. Mediana
La mediana se dene como el punto que deja a su izquierda el 50 % de las observaciones y a su
derecha el otro 50 %. Es decir, es el punto que corta a los datos ordenados de menor a mayor en
dos, con igual n umero de observaciones en cada lado. Matem aticamente, es aquel valor x
i
tal que
F
i
= 1/2 (o equivalente, N
i
= n/2).
La mediana se mide en las mismas unidades de los datos.
19
Si los datos no los tenemos resumidos en una tabla de frecuencias, la mediana sera el valor que
se encuentre en la posici on central de la serie, una vez ordenada de menor a mayor. Por lo tanto
si tenemos un n umero impar de datos (n = 2r + 1), la mediana sera la observacion (r+1)-esima.
Si embargo si n es par (n = 2r), la mediana sera el punto medio entre las observaciones r-esima y
(r+1)-esima.
Ejemplo 7 Si tenemos los datos 4, 6, 6, 8, 9, 11, 12, la mediana es 8, que ocupa la posicion
central. (n = 7 = 2 3 + 1, r = 4 )
Si tenemos los datos 4, 6, 6, 8, 9, 11, 12, 12, la mediana sera 8.5. (n = 8 = 2 4, r = 4 )
En el caso de tener los datos resumidos en una tabla de frecuencias, para calcular la mediana
primero obtenemos las frecuencias absolutas acumuladas y si existe un i de forma que N
i
= n/2, la
mediana es
Me =
x
i
+x
i+1
2
Si ning un N
i
= n/2, sea j de forma que N
j1
< n/2 < N
j
, es decir, j indica el primer N
j
que es
mayor que n/2. Entonces Me= x
j
.
Ejemplo 8 Calcule la mediana de los siguientes datos:
x
i
n
i
N
i
2 3 3
7 44 47
15 7 54
19 54 108
En este caso, observese que N
3
= 54 = n/2, luego la mediana vale Me=(x
3
+x
4
)/2 = (15+19)/2 = 17.
Ejemplo 9 Calcule la mediana de los datos del ejemplo 5. En este caso, observamos que ning un N
i
coincide con n/2 = 50. La primera frecuencia acumulada que supera a N/2 es N
3
= 69, entonces, la
mediana valdra
Me = x
3
= 2
3.1.4. Percentiles
Dijimos antes que la mediana es el punto que deja a su izquierda el 50 % (n/2) observaciones. La
idea de percentil generaliza en este sentido al de la mediana deniendo el percentil de orden como
aquel punto que deja a su izquierda n/100 observaciones y a su derecha (1)n/100 observaciones,
y se denota P

, es decir, P

es aquel x
i
tal que F
i
= /100. As, P
20
es el punto que deja a su
izquierda el 20 % de las observaciones, P
55
el que deja un 55 %, etc. Observese que P
50
=Me.
20
El calculo de los percentiles es analogo al de la mediana, pero sustituyendo n/2 por n/100.
Los percentiles P
25
, P
50
y P
75
tambien se llaman cuartiles y dividen a los datos en 4 partes con
igual n umero de observaciones. Se representan por Q
1
, Q
2
y Q
3
Ejemplo 10 Para calcular el tercer cuartil, P
75
= Q
3
, con los datos del ejemplo 1, tenemos que ver
si hay alg un i con N
i
= 75n/100 = 11,25. Como ning un i verica esta igualdad, se procede igual que
en la mediana, es decir, se busca el primer valor cuya frecuencia absoluta acumulada sea mayor que
11,25, que en este caso es x
i
= 6 con N
i
= 12, y entonces
P
75
= x
i
= 6,
lo que se interpreta como sigue: un 75 % de los alumnos ha sacado una nota menor o igual que 6.
3.2. Medidas de dispersion
Dado que las medidas de localizacion resumen los datos en un valor, es interesante conocer si este
valor representa bien la serie, es decir, si los datos se encuentran concentrados en torno a este valor,
o bien est an muy dispersos. Las medidas de dispersi on miden la representatividad de las medidas de
localizaci on.
3.2.1. Rango
Se dene el rango como el mayor valor observado menos el menor. Matematicamente
Rango = x
max
x
min
En el ejemplo 1, su rango vale 7 3 = 4.
Observamos que viene dado en las mismas unidades de los datos.
3.2.2. Varianza y desviacion tpica
Se dene la varianza, que denotaremos por S
2
, como
S
2
=
n

i=1
(x
i
x)
2
n
=
k

i=1
(x
i
x)
2
n
i
n
=
k

i=1
x
2
i
n
i
n
x
2
donde, como es usual, los x
i
denotan los valores de la variable.
Se dene la desviaci on tpica como S = +

S
2
.
Otra forma de denotar la varianza de una variable X es V ar(X).
Propiedades
21
(a) S
2
0, S 0.
(b) S = 0 S
2
= 0 los valores observados son todos iguales, es decir, no existe varibilidad
en las observaciones.
(c) Si y
i
= a + bx
i
, entonces S
2
y
= b
2
S
2
x
y S
y
= |b|S
x
, donde S
2
y
es la varianza de Y y S
2
x
es la
varianza de X.
(d) Las unidades en que se mide la varianza son las de X al cuadrado y las de la desviacion tpica
coinciden con las de X.
El problema que plantea el uso de la varianza y de la desviaci on tpica, como medidas de disper-
si on, es la dependencia de las unidades. Por ello, es conveniente denir una medida adimensional de
dispersion (es decir, que no tenga unidades), que sea objetiva y adem as, que permita la comparaci on
de la dispersion entre distintas variables. Si x = 0, esta medida nos la da el coeciente de variacion:
CV = 100
S
|x|
( %)
Cuanto m as se separen las observaciones de la media, mayor es la dispersi on y el valor de la
varianza, y por tanto mayor es el coeciente de variaci on. Cuanto menor sea S, m as representativa
es la media.
Ejemplo 11 Para los datos del ejemplo 1, la varianza de las notas es
S
2
=
k

i=1
x
2
i
n
i
n
(x)
2
=
3
2
2 + 4
2
4 + 5
2
4 + 6
2
2 + 7
2
3
15
5
2
= 26,733 (5)
2
= 1,733
Por lo tanto, S =

1,733 = 1,3164 y el coeciente de variacion


CV = 100
1,3164
5
= 26,33( %)
22
4. Series estadsticas de dos caracteres. Regresion
Hasta ahora hemos estudiado herramientas que nos permiten describir las caractersticas de una
sola variable. Sin embargo, en muchos casos practicos, es necesario estudiar conjuntamente dos o mas
variables, as como la relacion que hay entre ellas.
De ahora en adelante supondremos que sobre cada individuo se miden u observan dos variables
X e Y , o equivalentemente, que sobre cada individuo se observa la variable bidimensional (X, Y ).
Cada observaci on vendra dada por un par (x
i
, y
i
), 1 i n, y por tanto ahora los datos observados
ser an los n pares (x
1
, y
1
), (x
2
, y
2
), ..., (x
n
, y
n
). Denotaremos por x
1
, ..., x
k
a los k valores distintos
observados de la variable X; y por y
1
, ..., y
p
a los p valores distintos observados de la variable Y . En
general k y p no tienen porque coincidir.
Ejemplo 12 En una ciudad se desea estudiar la relacion que puede existir entre los a nos de an-
tig uedad de carnet y el n umero de accidentes de traco sufridos en el ultimo a no. Para ello se
entrevisto a 10 jovenes menores de 25 a nos obteniendose los siguientes datos,
Individuo 1 2 3 4 5 6 7 8 9 10
A nos 2 5 3 2 5 4 2 4 5 3
Accidentes de traco 2 1 2 3 1 1 3 2 1 2
A la representaci on de los n pares observados en un sistema de ejes se le denomina nube de
puntos.
1 0 1 2 3 4 5
1
0
1
2
3
4
5
4.1. Tabla de frecuencias
La frecuencia (absoluta) conjunta del par (x
i
, y
j
), que denotaremos n
ij
, es el n umero de veces
que se observa dicho par. Se tiene que
k

i=1
p

j=1
n
ij
= n.
La frecuencia relativa conjunta del par (x
i
, y
j
), que denotaremos f
ij
, es la proporci on de veces
que se observa dicho par, es decir
f
ij
=
n
ij
n
, 1 i k, 1 j p.
23
Se tiene que
k

i=1
p

j=1
f
ij
= 1.
La frecuencia (absoluta) marginal de x
i
, que denotaremos n
i.
, es el n umero de veces que X
presenta dicho valor. La frecuencia relativa marginal de x
i
, que denotaremos f
i.
, es la proporcion
de veces que X presenta dicho valor. La frecuencia (absoluta) marginal de y
j
, que denotaremos
n
.j
, es el n umero de veces que Y presenta dicho valor. La frecuencia relativa marginal de y
j
,
que denotaremos f
.j
, es la proporci on de veces que Y presenta dicho valor. Estas frecuencias se
representan en una tabla llamada tabla de frecuencias conjuntas o tabla de doble entrada
como sigue
X\Y y
1
y
2
... y
p
x
1
n
11
n
12
... n
1p
n
1.
x
2
n
21
n
22
... n
2p
n
2.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
x
k
n
k1
n
k2
... n
kp
n
k.
n
,1
n
,2
... n
.p
n
N otese que las frecuencias marginales son las frecuencias de cada variable, sin tener en cuenta la
otra. Son distribuciones de una variable, y por tanto tiene sentido, para cada una de ellas, calcular
las medidas estudiadas anteriormente, como la media y la varianza. As, hablaremos de la media
marginal de la variable X, x, la varianza marginal de la variable X, S
2
x
, la media marginal de la
variable Y , y, y la varianza marginal de la variable Y , S
2
y
.
Ejemplo 13 La tabla de frecuencias conjuntas con los datos del ejemplo 12 es
X= A nos, Y = Accidentes
r
r
r
r
r
r
r
X
Y
1 2 3
2 0 1 2
3 0 2 0
4 1 1 0
5 3 0 0
4.2. Distribuciones condicionadas
De los n individuos en el estudio hay n
.j
con Y = y
j
. Podemos estar interesados en estudiar la
variable X en este subconjunto de los datos originales. A la distribucion de frecuencias de la variable
24
X en este subconjunto, denido por aquellos individuos con Y = y
j
, se le denomina distribucion
de X condicionada a Y = y
j
.
Ejemplo 14 Con los datos del ejemplo 12, la distribucion de frecuencias de X condicionada a Y = 2,
es decir la antiguedad con el carnet, los jovenes que sufrieron dos accidentes de traco, es
X|Y = 2 Frec. Abs. Cond.
2 1
3 2
4 1
5 0
4
An alogamente podemos considerar la distribucion de Y condicionada a X = x
i
,
Ejemplo 15 Con los datos del ejemplo 12, la distribucion de frecuencias de Y condicionada a X = 4,
Y |X = 4 Frec. Abs. Cond.
1 1
2 1
3 0
2
Las distribuciones condicionadas son distribuciones de una variable (en un subconjunto de los datos
originales), y por tanto tiene sentido, para cada una de ellas, calcular las medidas estudiadas en el
tema anterior, como la media y la varianza. As, hablaremos de la media condicional de la variable
X dado que Y = y
j
, x|
Y =y
j
, la varianza condicional de la variable X dado que Y = y
j
, S
2
X|
Y =y
j
, la
media condicional de la variable Y dado que X = x
i
, y|
X=x
i
y la varianza condicional de la variable
Y dado que X = x
i
, S
2
Y |
X=x
i
.
4.3. Dependencia funcional e Independencia
Diremos que dos variables X e Y son funcionalmente dependientes cuando existe una funcion
f tal que Y = f(X). Es decir, a cada valor x le corresponde un unico valor y.
Diremos que dos variables X e Y son independientes si la distribuci on de una variable, p.e. X
no depende de los valores de la otra, en este caso Y . Es decir, la distribuci on de los valores de X es
la misma para los individuos en los que Y = y
1
, que en los que Y = y
2
, etc. Esto se traduce en que
las frecuencias relativas de X condicionada a los valores de Y no dependen de la elecci on del valor
de Y , o equivalentemente
f
ij
= f
i
f
j
para todo i, j
25
o bien, usando frecuencias absolutas
n
ij
=
n
i
n
j
n
para todo i, j.
Si existe un i y un j que no cumplan la ecuaci on anterior, entonces las variables no son independientes.
Para que se de la independencia ha de cumplirse la igualdad para todos los i, j.
4.4. Covarianza
Dada una variable bidimensional (X, Y ), denimos la covarianza entre X e Y como
S
xy
=
1
N
N

i=1
(x
i
x)(y
i
y) =
1
N
k

i=1
p

j=1
(x
i
x)(y
j
y)n
ij
.
Una forma alternativa para el c alculo de la covarianza es
S
xy
=
1
N
N

i=1
x
i
y
i
x y =
1
N
k

i=1
p

j=1
x
i
y
j
n
ij
x y.
Otra forma de denotar la covarianza entre dos variables es Cov(X, Y ).
La covarianza es una medida de dependencia de las dos variables: si la covarianza es positiva, la
relaci on entre X e Y es directa, es decir, cuando X crece, Y tambien tiende a crecer, y viceversa.
Si la covarianza es negativa, la relacion es inversa, o sea, cuando X crece, Y tiende a decrecer, y
viceversa (ver gura 7). Si S
XY
= 0, se dice que las variables X e Y son incorreladas.
Propiedades
(a) X, Y independientes =X, Y incorreladas.
(b) Cov(aX +b, cY + d) = acS
xy
.
(c) Cov(aX +bY, Z) = aS
xz
+bS
yz
.
(d) V ar(X +Y ) = S
2
x
+ S
2
y
+ 2S
xy
.
(e) V ar(X Y ) = S
2
x
+S
2
y
2S
xy
.
Aunque la independencia implique incorrelacion (propiedad (a)), la implicacion contraria no es
cierta en general, como se muestra en el siguiente ejemplo.
26
S
XY
> 0 S
XY
< 0 X X
Y Y
Figura 7: Interpretaci on del signo de la covarianza.
Ejemplo 16 Consideremos la siguiente tabla de doble entrada:
X\Y 1 0 1
2 3 4 3 10
0 1 0 1 2
2 2 2 2 6
6 6 6 18
Para estos datos se tiene que S
xy
= 0, pero X e Y no son independientes pues
n
22
= 0 =
2 6
18
=
n
2.
n
,2
n
.
4.5. Analisis de regresion. Recta de regresi on
Dada la variable bidimensional (X, Y ), muchas veces es interesante estudiar la relaci on o nivel de
asociaci on que presentan, as como predecir o estimar el valor de una variable en funcion de la otra,
digamos la Y en funcion de X. En este sentido, es necesario buscar cu al es la mejor funci on h(X)
que aproxima a Y . Es lo que llamamos Analisis de regresi on.
El criterio mas usado para encontrar la mejor funcion suele ser el de mnimos cuadrados, es
decir, hallar la funci on h que haga lo m as peque na posible la cantidad
N

i=1
(y
i
h(x
i
))
2
=
k

i=1
p

j=1
(y
j
h(x
i
))
2
n
ij
Puede demostrarse que la mejor funci on en este sentido es h(x) = y
|X=x
, es decir, la media
condicionada. Como en general, en la practica no puede calcularse, se suele buscar la mejor funci on
h dentro de un conjunto de funciones. Y as podremos calcular la mejorfunci on lineal (recta), la
mejorfunci on cuadratica (par abola), la mejorfunci on logartmica, etc.
desde el punto de vista te orico solo desarrollaremos la aproximaci on de la nube de puntos a
partir de una funcion lineal (analisis de regresi on lineal). Es decir, buscamos la recta que mejor
represente a la nube de puntos, es decir
h(x) = y

= a +bx.
27
Para determinar los coecientes a y b aplicamos de nuevo el criterio de mnimos cuadrados, es decir,
consideramos la funcion
F(a, b) =
n

i=1
(y
i
h(x
i
))
2
=
n

i=1
(y
i
a bx
i
)
2
y buscamos a y b que minimicen esta funci on F. Para ello, se deriva F(a, b) con respecto a a y b y
se iguala a 0, obteniendose
_

_
a = y b x
b =
S
xy
S
2
x
A dicha recta se le llama recta de regresi on de Y sobre X o recta de mnimos cuadrados de
Y sobre X y se denota r
Y |X
.
An alogamente tambien podemos aproximar los valores de X a partir de los Y a traves de una
recta y calcular la recta de regresi on de X sobre Y , r
X|Y
, cambiando los papeles de las variables:
h

(y) = x

= a

+b

y
con
_

_
a

= x b

y
b

=
S
xy
S
2
y
Propiedades
(a) Las dos rectas no coinciden, a menos que exista dependencia lineal funcional entre las variables
(los puntos de la nube de puntos estaran alineados). Por tanto, si de la ecuaci on de la recta
r
Y |X
despejaramos x no obtendremos, en general, la recta de regresi on r
X|Y
.
(b) Las dos rectas se cortan siempre en el punto (x, y).
(c) Las pendientes de las dos rectas r
Y |X
y r
X|Y
tienen el mismo signo y coincide con el signo de
la covarianza. Es decir, si una de ellas es creciente, la otra tambien. No puede darse el caso de
que una tenga pendiente positiva y la otra negativa.
Ejemplo 17 Consideremos los datos del ejemplo 12. Calcular las rectas de regresion y el coeciente
de correlacion lineal del ejemplo ??
r
r
r
r
r
r
r
X
Y
1 2 3
2 0 1 2 3
3 0 2 0 2
4 1 1 0 2
5 3 0 0 3
4 4 2 10
28
Calculamos primero las medias, las desviaciones tpicas y la covarianza que necesitamos para el
c alculo de las rectas de regresion,
X =
35
10
= 3,5 S
x
=
_
137
10
3,5
2
= 1,2042 S
2
x
= 1,45
S
xy
=
55
10
3,5 1,8 = 0,8
Y =
18
10
= 1,8 S
y
=
_
38
10
1,8
2
= 0,7483 S
2
y
= 0,56
La recta de regresion de Y
|X
sera y = a +bx
b =
Sxy
S
2
x
= 0,5517
a = Y (0,5517)X = 3,73
y = 3,73 0,5517x
La recta de regresion de X
|Y
x = a

+b

y
b

=
Sxy
S
2
y
= 1,4286
a

= X (1,4286)Y = 6,07
x = 6,07 1,4286y
Calcular los accidentes de traco que podra sufrir un joven que lleva 6 a nos con el carnet.
x = 6 y = 3,73 0,5517 6 = 0,42
Calcular los a nos de carnet que podra tener un joven que ha sufrido 4 accidentes de traco en el
ultimo a no.
y = 4 x = 6,07 1,4286 4 = 0,36
4.6. Medida de la bondad del ajuste
Adem as de calcular la recta de regresi on de Y sobre X para predecir la Y en funcion de la X
es necesario dar una medida de la abilidad de las estimaciones que hagamos. Para ello necesitamos
medir la fuerza de la asociacion lineal.
ex
istente entre las variables. Es necesario saber c omo es de
29
ajuste bueno ajuste bueno ajuste malo
-1 1 0
bueno el ajuste hecho por la recta de regresi on. Para ello, tenemos que introducir alguna cantidad
que nos mida la distancia entre la nube de puntos y la recta.
Si el ajuste es bueno, entonces las diferencias entre los valores observados y los valores ajustados,
e
i
= y
i
y

i
, con y

i
= a +bx
i
, i = 1, 2, ..., n
seran todas muy peque nas, y por tanto la cantidad
S
2
e
=
1
n
n

i=1
(y
i
y

i
)
2
=
1
n
n

i=1
(y
i
a b x
i
)
2
tambien sera peque na. A e
i
se le denomina residuo y a S
2
e
varianza residual. Sustituyendo a y b
en la expresi on para la varianza residual y operando obtenemos
S
2
e
= S
2
y
(1 r
2
) donde r =
S
xy
S
x
S
y
A la cantidad r se le llama coeciente de correlaci on lineal. Observese que la varianza residual
ser a mas peque na cuanto mas cercano este r a 1 o a 1. Observese tambien que la varianza residual
alcanza su valor m as grande cuando r = 0, por lo tanto, podemos medir el grado del ajuste realizado
por la recta de regresion mediante el coeciente de correlaci on lineal.
Propiedades
(a) r
2
= b b

(b) El signo de r es el mismo signo que b, b

y S
xy
. Si r < 0 entonces la dependencia lineal entre
X e Y es inversa (cuando una crece la otra decrece), y si r > 0 entonces la dependencia lineal
entre X e Y es directa (cuando una crece la otra tambien).
(c) r es un n umero entre 1 y 1.
(d) Si r = 1 o r = 1, entonces el ajuste es perfecto. Esto es debido a que si r
2
= 1, entonces
S
2
e
= 0, y en consecuencia, los valores ajustados coinciden con los observados. En este caso las
dos rectas de regresi on coinciden. A la hora de la pr actica, en raras ocasiones se tiene r = 1
o r = 1. El ajuste lineal sera mejor cuanto mas cercano esta r a 1 o a -1, en otras palabras,
cuanto m as cercano est a r
2
a 1.
Conviene notar que una correlaci on de 0 no signica necesariamente que no haya relacion entre
X e Y , si no que no hay relaci on lineal.
(e) El coeciente de correlacion lineal es una medida numerica invariante bajo cambios de escala.
30
(f) A r
2
se le denomina coeciente de determinaci on y representa la proporci on de varianza
de Y explicada por la recta de regresion r
Y |X
, o reciprocamente la proporci on de varianza de
X explicada por la recta de regresi on r
X|Y
.
Ejemplo 18 Con los datos del ejemplo 12, para obtener el coeciente de correlacion lineal.
Coeciente de Correlacion Lineal r
r =
S
xy
S
x
S
y
= 0,8878
En este caso tendremos una fuerte correlacion lineal inversa, ya que r < 0,8.
31
ESTAD

ISTICA APLICADA A LA BIOLOG

IA
Hoja de Problemas n
0
1
1. Un gabinete de trabajo ha realizado un estudio sobre la distribuci on de la renta per capita
por municipio, construyendose una tabla que posteriormente se extravio, quedando solo la siguiente
fotocopia con muchos datos borrados. Reconstruir a partir de ella la tabla original, y construir el
histograma correspondiente:
(L
i1
, L
i
] x
i
n
i
N
i
f
i
F
i
a
i
h
i
(20, 50] 35 2 2
( , 60] 10 0,125
(60, ] 0,425 10
( , ] 75 0,225
( , 100)] 28 80 1,4
2. Un medico estudi o el n umero de ataques de un grupo de personas con epilepsia severa en un
periodo de ocho semanas.
N
0
ataques 5 6 8 9 10 12
Pacientes 12 18 20 15 15 20
(a) Identique y clasique la variable del estudio.
(b) Represente el diagrama de barras y la curva acumulativa.
(c) Calcular media, moda, varianza, desviaci on tpica, coeciente de variacion, los cuartiles y los
percentiles 15 y 90.
(d) Complete: el 60 % de los pacientes sufrieron mas de....ataques
3. El siguiente graco representa la curva acumulativa de una variable X.
32
3
3
3
3
3

3
3
3
3
3

5 7 12 15
0.2
0.7
1
F
i
x
i
Siendo 40 el n umero de observaciones,
(a) Construir la tabla estadstica : intervalos, marcas de clase, frecuencias.
(b) Representar el histograma
4. Considerese el siguiente diagrama:
1/4
1
3/4
3
1
7
(a) Obtener los datos originales sabiendo que el tama no muestral es 20.
(b) Calcular las medidas de tendencia central y dispersion aplicables a esta distribuci on.
5. Un investigador encontr o en un libro de bioestadstica la siguiente tabla de frecuencias, siendo
X = altura e Y = edad de 100 adolescentes.
Y 15 16 17 18
X
(130,150] 15 4 5 1
(150,160] 10 20 3 2
(160,170] 5 10 15 5
(170,190] 0 1 2 2
(a) Cual es la edad mayoritaria? De las ni nas de altura entre (150,170], cu al es el porcentaje de
ni nas de 17 a nos? Y cual es la edad media?
33
(b) Representa gracamente el histograma de la variable X. Representa la curva acumulativa de la
variable Y.
(c) D onde existe mayor variabilidad en cuanto a la altura, entre las adolescentes de 15 o de 18
a nos?
6. Sea (X, Y ) una variable bidimensional de la que se conocen los siguientes datos:
Y 0 1
X
1 0.03 0.07
3 0.06 0.14
5 0.09 0.21
7 0.06 0.14
9 0.06 0.14
Calcula la media, mediana y moda de X y de X|
Y =1
. Son independientes X e Y ?
7. Dadas las siguientes rectas de regresion
r : 3x + 2y 1 = 0
s : x +y + 2 = 0
(a) Determine de manera razonada cu al es la recta de regresi on de Y sobre X y cu al es la de X
sobre Y .
(b) Calcule el coeciente de correlacion lineal.
(c) Calcule x y y.
(d) Si X = 3, que valor se puede predecir para Y ? es able la prediccion?
8. Los datos sobre la concentraci on de estrona en la saliva (X) y la concentraci on en plasma libre
(Y ), en pg/ml, de 15 individuos son los siguientes
X 7.5 8 8.3 7.5 8.9 12 11.2 10 14.4 16.5 15.1 18 17.9 22 22.3
Y 26 35 34 27 43.5 25.8 45 46 50.7 43.2 54 68 68.5 53.1 60
(a) Identique las variables del estudio.
(b) Calcule las medias marginales e indique que signica cada una de esas medidas estadsticas.
34
(c) Calcula la recta de mnimos cuadrados para ajustar la concentracion de estrona en funci on de
la concentraci on de plasma libre.
(d) Cual se estima que sera la concentraci on de estrona en un individuo con 50pg/ml de plasma
libre? Es able esta prediccion?
(e) En que variable presentan los datos una mayor dispersion?
9. En un estudio para relacionar la longitud de lnea de la vida en la mano izquierda y la duracion
de la vida se han tomado datos de 50 personas con los resultados recogidos en la siguiente tabla,
donde X representa la longitud de la lnea en centmetros e Y la edad al morir en a nos:
X / Y (10,30] (30,50] (50,80]
(6, 7] 7 2 1
(7, 8] 1 11 3
(8, 9] 0 1 9
(9, 10] 2 1 12
(a) Determinar la relacion lineal que mejor exprese la longitud de lnea en funci on de la edad al
morir.
(b) Que edad cabe esperar que tenga al morir una persona cuya lnea de la vida mide 10 centme-
tros? En que medida son ables este tipo de predicciones? Justicar la respuesta.
10. En un estudio sobre la reduccin del n umero de ganglios linfaticos cancerosos detectados en una
muestra de pacientes sometidos a tratamiento, los resultados obtenidos se muestran en la siguiente
tabla:
X Frecuencia
0 7
1 26
3 35
4 20
5 8
6 3
8 1
Se sabe que otra variable Y inuye en la reducci on del n umero de ganglios. Los datos obtenidos
fueron

j
y
j
= 540,

j
y
2
j
= 3520,

i,j
x
i
y
j
= 5500.
Que n umero de ganglios se espera se reduzca en un paciente en el que y = 7? Es able la predicci on?.
35
11. Al observar dos variables estadsticas X e Y sobre un conjunto de 20 individuos, se han obtenido
los siguientes valores:
(5, 1) (5, 0) (5, 0) (8, 1) (5, 0) (5, 1) (8, 0) (5, 1) (5, 2) (8, 1)
(5, 0) (8, 0) (5, 1) (5, 0) (8, 2) (5, 1) (5, 0) (5, 2) (8, 0) (5, 0)
(a) Construya la tabla de frecuencias conjunta.
(b) Determine la distribuci on relativa de Y condicionada a X = 5 y calcule su media.
(c) Son independientes las variables?. Razone la respuesta.
(d) Determine que valor de X cabe esperar para un valor de Y igual a 3.
(e) Valore si es able la predicci on realizada.
12. Para estudiar el efecto de las aguas residuales de las alcantarilla que auyen a un lago, se toman
medidas de la concentraci on de nitrato en el agua. Para monitorizar la variable se ha utilizado un
antiguo metodo manual. Se idea un nuevo metodo automatico. Si se pone de maniesto una alta
correlaci on positiva entre las medidas tomadas empleando los dos metodos, entonces se har a uso
habitual del metodo autometico. Los datos obtenidos son los siguientes:
Manual=X 25 40 120 75 150 300 270 400 450 575
Autom atico = Y 30 80 150 80 200 350 240 320 470 583
(a) Hallar el coeciente de determinacion para ambas variables.
(b) Comprobar la idoneidad del modelo lineal de regresion. Si el modelo es apropiado, hallar la
recta de regresi on de Y sobre X y utilizarla para predecir la lectura que se obtendra empleando
la tecnica autom atica con una muestra de agua cuya lectura manual es de 100.
(c) Para cada una de las observaciones, halle las predicciones que ofrece el modelo linal de regresion
para X en funcion de Y , e Y en funcion de X, es decir X

e Y

.
(d) Calcule los errores para cada una de dichas predicciones, es decir, e
i
= x
i
x

i
e e

i
= y
i
y

i
.
(e) Que relacion hay entre las medias de X y X

? Y entre las de Y e Y

?
(f) Calcule las medias de e y e

.
(g) Calcular el cociente entre la varianza de e y la de X. Analogamente para la de e

y la de Y .
36
BLOQUE TEM

ATICO II:
NOCIONES DE PROBABILIDAD.
MODELOS TE

ORICOS POBLACIONALES
5. Experimentos aleatorios. Probabilidad
5.1. Experimentos aleatorios. Sucesos
El azar juega un papel importante en el pensamiento cientco sobre los sistemas vivos. Algunos
procesos biologicos estan afectados directamente por el azar (aparicion de mutaciones), otras veces los
experimentos se ven afectados por uctuaciones aleatorias en las condiciones, variaciones aleatorias
en la genetica, etc.
Las conclusiones de un analisis de datos estadstico se establecen en terminos de probabilidad,
no solo porque el azar inuya en los resultados del experimento, sino tambien porque los modelos de
probabilidad nos permiten cuanticar como es de probable o improbable un resultado experimental,
dadas ciertas hip otesis iniciales.
En este tema se introducir a el lenguaje probabilstico y algunas herramientas basicas para manejar
probabilidades.
Denici on Diremos que un experimento o fenomeno es aleatorio si se verican las siguientes
condiciones:
(a) Se puede repetir indenidamente, siempre en las mismas condiciones.
(b) Antes de realizarlo, no se puede predecir el resultado que se va a obtener.
(c) El resultado que se obtenga pertenece a un conjunto conocido, previamente, de resultados posi-
bles. A este conjunto, de resultados posibles, lo denominaremos espacio muestral y lo deno-
taremos por . Los elementos del espacio muestral se denominan sucesos elementales.
Cualquier subconjunto de sera denominado suceso y lo denotaremos por letras may usculas:
A, B,...
5.1.1. Operaciones con sucesos
Uni on: Dados dos sucesos A, B , se denomina suceso union de A y B al suceso formado
por todos los sucesos elementales que pertenecen a A o bien pertenecen a B. Se denotara por
A B.
37
Intersecci on: Dados dos sucesos A, B , se denomina suceso intersecci on de A y B al
suceso formado por todos los sucesos elementales que pertenecen a A y a la vez pertenecen a
B. Se denotar a por A B.
Deniremos:
Suceso imposible: Lo representaremos por y es cualquier resultado que no puede suceder al
realizar el experimento.
Suceso complementario: Dado un suceso A llamaremos suceso complementario,

A, al
suceso formado por todos los elementos del espacio muestral que no pertenecen a A.
Sucesos incompatibles o mutuamente excluyentes: Dados dos sucesos A, B diremos que
son incompatibles o mutuamente excluyentes si cuando ocurre uno de ellos nunca ocurre
el otro, es decir, A B =
Suceso seguro: Es aquel que ocurre sea cual sea el resultado del experimento. Lo representare-
mos por .
5.2. Probabilidad
Denici on Una probabilidad es una cantidad numerica que expresa verosimilitud o posibilidad de
ocurrencia de un suceso. Se expresa como P(A).
Nocion frecuentista de probabilidad
En los experimentos aleatorios se observa que cuando el n umero de pruebas aumenta, las frecuen-
cias relativas con las que ocurre cierto suceso, A, tienden a estabilizarse en torno a un valor jo al
que denominaremos probabilidad de A, P(A).
Es decir, cada vez que se repite el experimento aleatorio, un suceso A ocurre o no ocurre. La
probabilidad P(A) se interpreta como la frecuencia relativa de A en una serie innitamente larga de
repeticiones del experimento.
Regla de Laplace
Si un experimento aleatorio tiene un espacio muestral nito y no existe ninguna razon que
privilegie unos resultados elementales en contra de otros, decimos entonces que los resultados ele-
mentales son equiprobables. En este caso se calcula la probabilidad de un suceso A, seg un la
regla de Laplace como el cociente entre el n umero de casos favorables (o sucesos elementales) a A,
y el de todos los posibles resultados del experimento.
P(A) =
n umero de casos favorables a A
n umero de casos posibles
38
Propiedades basicas de la probabilidad
(P1) P() = 1.
(P2) 0 P(A) 1.
(P3) Si A y B son dos sucesos disjuntos o mutuamente excluyentes entonces P(AB) = P(A)+P(B)
Otras Propiedades de la probabilidad
Si A B entonces P(A) P(B).
Probabilidad de la union. Sean A, B dos sucesos cualesquiera (no necesariamente
disjuntos). Se tiene que
P(A B) = P(A) + P(B) P(A B)
Probabilidad del complementario: P(

A) = 1 P(A)
En particular P() = 0.
Probabilidad condicionada
Sea B un suceso aleatorio de probabilidad no nula, es decir P(B) > 0. Para cualquier otro
suceso A , llamamos probabilidad condicionada de A a B a
P(A|B) =
P(A B)
P(B)
Mas resultados basicos para calcular probabilidades
Probabilidad de la intersecci on: P(A B) = P(B)P(A|B) si P(B) > 0.
Como los papeles de A y B se pueden intercambiar tambien podemos escribir P(A B) =
P(A)P(B|A) si P(A) > 0.
P(

A|B) = 1 P(A|B)
Independencia de sucesos. Diremos que dos sucesos son independientes si el conocimiento
de que ha ocurrido uno de ellos no cambia la probabilidad de que ocurra el otro. Es decir,
P(A|B) = P(A) equivalentemente P(A B) = P(A)P(B)
39
Teorema de la Probabilidad Total y Teorema de Bayes
Llamaremos sistema exhaustivo y excluyente de sucesos (o tambien sistema completo de
sucesos) a una colecci on de sucesos A
1
, A
2
, ..., A
n
tales que
n
_
i=1
A
i
= y A
i
A
j
= para todo i = j .
Teorema de la Probabilidad Total Sean A
1
, A
2
, ..., A
n
un sistema exhaustivo y exclu-
yente de sucesos con P(A
i
) > 0 para todo i. Entonces para cualquier B se tiene
P(B) =
n

i=1
P(B|A
i
)P(A
i
).
Teorema de la Bayes Sean A
1
, A
2
, ..., A
n
un sistema exhaustivo y excluyente de sucesos
con P(A
i
) > 0 para todo i y sea B cualquier otro suceso con P(B) > 0. Entonces para cualquier
j
P(A
j
|B) =
P(B|A
j
)P(A
j
)
n

i=1
P(B|A
i
)P(A
i
)
5.3. Pruebas diagn osticas:
Ayuda a mejorar una estimaci on de la probabilidad de que un individuo presente una enfermedad.
Sera deseable que los test que se aplican para detectar la presencia de una enfermedad, un factor
genetico o alguna otra condici on fueran seguros en el sentido de que siempre detectaran la condici on
cuando est a presente y nunca la indicaran cuando el individuo no la tiene. Desgraciadamente, esto
no es as. Solo cabe exigir que los tests no den resultados err oneos muy a menudo.
En principio tenemos una idea de las posibilidades de un individuo de estar enfermo.
Prevalencia o incidencia de la enfermedad: porcentaje de la poblaci on que presenta una
enfermedad.
Para conrmar la sospecha, usamos una prueba diagn ostica. Ha sido evaluada con anterioridad
sobre dos grupos de individuos: sanos y enfermos. Asi de modo frecuentista se ha estimado:
P(+|Enfermo)= sensibilidad (verdaderos +)= Tasa de acierto sobre enfermos
P(|Sano)= especicidad (verdaderos -)= Tasa de acierto sobre sanos.
40
A partir de lo anterior y usando el teorema de Bayes, podemos calcular las probabilidades a
posteriori (en funcion de los resultados del test): ndices predictivos
P(Enfermo|+) = Indice predictivo positivo.
P(Sano|) = Indice predictivo negativo.
5.4. Riesgo relativo
Algunos estudios se dise nan para investigar un factor que el investigador cree que puede estar
asociado con el desarrollo de una enfermedad o condici on especca. Este factor se denomina factor
de riesgo. Para realizar el estudio se seleccionan dos muestras, una formada por sujetos que han
estado expuestos al facto de riesgo (E); los demas no han estado expuestos al factor de riesgo (

E).
Si notamos por D al suceso padecer la enfermedad, se denomina factor de riesgo relativo (RR)
al cociente:
RR =
P[D|E]
P[D|

E]
Si RR = 1, signica que no existe asociaci on entre el factor de riesgo y el desarrollo de la
enfermendad.
Si RR > 1, se supone que un individuo expuesto al riesgo tiene m as probabilidades de desarro-
llar la enfermedad que uno que no estuvo expuesto.
Si RR < 1, indica que es menos probable que un individuo expuesto desarrolle la enfermedad
que uno que no lo estuvo.
41
6. Variables aleatorias. Modelos clasicos de distribuciones
de probabilidad.
6.1. Deniciones
Llamaremos variable aleatoria (v.a.) a cualquier funci on X : R tal que asigna un
n umero real a cada suceso elemental del espacio muestral.
Las variables aleatorias se representar an por letras may usculas, y sus valores numericos, por letras
min usculas
Para describir el comportamiento de la variable en terminos de probabilidades se utiliza la Fun-
ci on de Distribucion
F : R [0, 1]
x F(x) = P[X x]
Uso de la Funcion de la Distribuci on para el c alculo de probabilidades
(a) P[a < X b] = F(b) F(a)
(b) P[X > a] = 1 F(a)
Diremos que una variable aleatoria es discreta si s olo puede tomar un n umero nito o innito
numerable de valores. Y diremos que es continua si puede tomar un n umero innito no numerable
de valores, normalmente, un intervalo o union de intervalos.
6.2. Variables aleatorias discretas
Dada una v.a. discreta, X, se dene su funcion de probabilidad como
P[X = k] = P[{sucesos elementales que se transforman en k mediante la v.a. X}]
Se verica que

k
P[X = k] = 1.
Para una v.a. discreta la funcion de distribuci on viene dada por:
F : R [0, 1]
x F(x) = P[X x] =

kx
P[X = k]
Ejemplo 1: Consideremos una familia con tres hijos. Los sexos de los hijos son un fenomeno aleatorio
con el siguiente espacio muestral,
= {OOO, OOA, OAO, AOO, OAA, AOA, AAO, AAA}
42
donde O={ni no} y A={ni na}.
Este fenomeno puede ser modelizado por la v.a. X= n umero de hijos varones. Entonces:
X(OOO) = 3
X(OOA) = X(OAO) = X(AOO) = 2
X(OAA) = X(AAO) = X(AOA) = 1
X(AAA) = 0
Por tanto, Im() = {0, 1, 2, 3} que es un conjunto nito, luego X es una v.a. discreta con funcion
de probabilidad:
P[X = 0] = P[{AAA}] =
1
8
P[X = 1] = P[{OAA, AOA, AAO}] =
3
8
P[X = 2] = P[{OOA, OAO, AOO}] =
3
8
P[X = 3] = P[{OOO}] =
1
8
El fen omeno aleatorio planteado puede ser, entonces, sustuido por un m odelo matem atico represen-
tado por la v.a.
k 0 1 2 3
P[X = k]
1
8
3
8
3
8
1
8
Su funcion de distribucion viene dada por:
F(x) =
_

_
0 si x < 0
1
8
si 0 x < 2
4
8
si 2 x < 3
7
8
si x 3
6.3. Variables aleatorias continuas
En Estadstica Descriptiva utilizamos el histograma para representar la distribucion de frecuen-
cias de las variables continuas (o que presentaban tantos valores diferentes que resultaba m as eciente
agruparlas en intervalos). Si consideramos un histograma construido con frecuencias relativas (recor-
demos la noci on frecuentista de probabilidad) podemos verlo como una representaci on aproximada
de la verdadera distribuci on de probabilidades que sigue la variable de la que provienen los datos.
Suponiendo que consideramos un histograma de frecuencias relativas con intervalos muy estrechos,
el polgono de frecuencias se convierte en una curva, llamada curva de densidad que es la
representaci on graca de la funcion de densidad.
Denici on: Dada una v.a. continua, X, se dene su funcion de densidad como una funcion
f : R R que verica las siguientes propiedades:
(a) f(x) 0.
43
(b) Interpretacion de la densidad. Dados dos n umeros a y b, a b, a, b R.
area bajo la curva de densidad limitada entre a y b =
= proporcion de valores de X comprendidos entre a y b=
P[a < X b] =
_
b
a
f(x)dx
(c)
_
+

f(x)dx = 1 ya que P[< X +] = 1.


(d) Paradoja del continuo. La interpretacion de la probabilidad, en una v.a. continua, como el area
limitada por la f.d.d. nos lleva a que la probabilidad de que X tome un valor concreto es cero.
Enntonces, para las variables continuas se cumple que P[X = x] = 0, para cualquier x R. Lo
que implica que
P[a < X b] = P[a < X < b] = P[a X b] = P[a X < b] = F(b) F(a)
P[X a] = P[X < a] = F(a)
P[X > a] = P[X a] = 1 F(a)
La funcion de distribuci on de una variable aleatoria continua, F, viene dada por:
F : R [0, 1]
x F(x) = P[X x] =
_
x

f(t)dt
6.4. Medidas de tendencia central y dispersi on de una variable aleatoria
Por su interes nos vamos a centrar en dos medidas que son la esperanza matem atica y la varianza
que desempe nan un papel equivalente al de la media aritmetica y la varianza en la Estadstica
Descriptiva.
Sea X una variable aleatoria, se denomina
Esperanza matematica o valor esperado de X, E[X]: es el promedio teorico de X a largo
plazo
44
Variable discreta Variable continua
E[X] =

iI
x
i
P[X = x
i
] E[X] =
_
+

xf(x)dx
donde {x
i
, i I} es el conjunto de
valores que toma la variable X
Ejemplo 1: Su valor esperado se calcula como
E[X] = 0
1
8
+ 1
3
8
+ 2
3
8
+ 3
1
8
= 1,5
Propiedades de la esperanza matematica
(a) E[aX + b] = aE[X] + b, siendo a y b n umeros reales y X una variable aleatoria.
(b) E[X + Y ] = E[X] + E[Y ]
Varianza de X, y se denota V ar[X] a la E[(XE[X])
2
], se demuestra que V ar[X] = E[X
2
]
(E[X])
2
Variable discreta Variable continua
V ar[X] =

iI
(x
i
E[X])
2
P[X = x
i
] = V ar[X] =
_
+

(x E[X])
2
f(x)dx =
=

iI
x
2
i
P[X = x
i
] (E[X])
2
=
_
+

x
2
f(x)dx (E[X])
2
Ejemplo 1: Su varianza se calcula como
V ar[X] = (0
1
8
+ 1
3
8
+ 4
3
8
+ 9
1
8
) 1,5
2
= 0,75
Propiedades de la varianza
(a) V ar[X] 0
(b) V ar[aX + b] = a
2
V ar[X], siendo a un n umero real y X una variable aleatoria.
45
6.5. Independencia de variables aleatorias
Dadas dos variables aleatorias X e Y , diremos que son independientes si lo son los experimentos
aleatorios que cada una de ellas describe, es decir, si el resultado de uno no inuye en absoluto en el
resultado del otro.
Este concepto puede extenderse a m as de dos variables, en general a n variables independientes,
X
1
, X
2
, ..., X
n
.
Propiedad: Si X e Y son varibles aleatorias independientes entonces
V ar(X +Y ) = V ar(X Y ) = V ar(X) + V ar(Y )
6.6. Modelos clasicos de distribuciones de probabilidad
Modelos Discretos
6.6.1. Distribuci on Bernoulli
Considerese un experimento con dos posibles resultados, E (exito) y F (fracaso). A un experi-
mento as se le denomina experimento de Bernoulli. En este caso el espacio muestral es = {E, F}.
Sean P(E) = p (0, 1) y P(F) = q = 1 p. A la v.a. X que se dene como:
X(E) = 1, X(F) = 0,
se le denomina variable aleatoria Bernoulli (o que sigue un modelo de distribuci on de Bernoulli) con
probabilidad de exito p y se denota X Be(p).
La funcion de probabilidad de esta v.a. es
P(X = 1) = p, P(X = 0) = 1 p = q.
La media y la varianza de esta distribuci on son E(X) = p y V ar(X) = pq.
6.6.2. Distribuci on Binomial
Supongamos que realizamos n experimentos Bernoulli independientes, todos ellos con igual proba-
bilidad de exito p. La distribuci on de la v.a. denida como
X= n umero de exitos ocurridos en los n experimentos Bernoulli independientes,
se denomina distribucion Binomial de par ametros n y p y se denota X B(n, p). La funci on de
probabilidad de esta v.a. viene dada por
P(X = k) =
_
n
k
_
p
k
(1 p)
nk
, k = 0, . . . , n.
46
La media y la varianza de esta distribuci on son E(X) = np y V ar(X) = npq.
Los siguientes fenomenos aleatorios pueden modelarse como distribuciones Binomiales.
Un portador de tuberculosis tiene un 10 % de posibilidades de transmitir la enfermedad a
alguien que no haya estado previamente expuesto a ella y con el que entre en contacto directo.
Durante el transcurso de un da, un portador entra en contacto con diez de tales individuos.
Sea X=n umero de individuos que contraen la enfermedad.
Se esta desarrollando una nueva variedad de maz. Se espera que tenga una tasa de germinaci on
del 90 %. Para vericar esto, se plantan 20 semillas en suelos de identica composici on y se les
dedican los mismos cuidados. Sea X=n umero de semillas que geminan en la muestra.
Se est a llevando a cabo un estudio de opinion p ublica relativo a la conveniencia de construir una
presa para controlar inundaciones. Hay que elegir aleatoriamente y preguntar a 15 residentes del
area. Resulta que un 80 % de la gente que vive en el area se opone a la presa. Sea X=n umero
de personas que se oponen en la muestra seleccionada.
Notas
(a) Se dene el factorial de k como k! = k (k 1) 2 1 k = 0, 1, 2, . . .
(b) Se dene el n umero combinatorio
_
n
k
_
, n sobre k como
_
n
k
_
=
n!
k!(nk)!
k = 0, . . . , n
(c) Se cumple:
a) 0! = 1! = 1 n! = n(n 1)!
b)
_
n
0
_
=
_
n
n
_
= 1
_
n
1
_
=
_
n
n1
_
= n
6.6.3. Distribuci on Poisson
Supongamos que se realiza un experimento que consiste en observar la ocurrencia de cierto suceso
a lo largo de un intervalo continuo de tiempo, longitud o espacio. Supongamos que tales sucesos
ocurren de modo independiente y que se conoce el n umero medio de ocurrencias que tienen lugar en
una unidad de tiempo (longitud o espacio), llamemosle . Entonces la v.a. X que da el n umero de
ocurrencias del suceso en esa unidad de tiempo (longitud o espacio) se distribuye seg un una ley de
Poisson con parametro , lo que se denota X P().
Si X P(), entonces su funci on de probabilidad es de la forma
P(X = k) = e

k
k!
, k = 0, 1, 2, ...
La media y la varianza de esta distribuci on son E(X) = V ar(X) = .
Se ajustan a modelos de Poisson:
47
El n umero de leucocitos en una gota de sangre.
El n umero de veces que una planta de energa nuclear emite gases radioactivos en un perodo
de tres meses.
El n umero de llamadas de emergencia recibidas cada noche por una brigada de rescate.
A la ley Poisson tambien se le conoce como ley de los sucesos rarospor lo siguiente: si X B(n, p),
n grande y p es peque no, entonces podemos aproximar la ley Binomial por una ley Poisson de
par ametro = np. En la pr actica, la usaremos si n > 30, p < 0,1 y np 5.
Modelos continuos
6.6.4. Distribuci on Exponencial
Diremos que una v.a. X sigue una distribucion Exponencial de par ametro > 0, y se denota
X Exp(), si su funci on de densidad es de la forma
f(x) =
_
e
x
si x > 0,
0 en caso contrario.
La funcion de distribucion es
F(x) = P[X x] =
_
0 si x < 0,
1 e
x
si x 0.
La media y la varianza son E(X) =
1

y V ar(X) =
1

2
.
Usualmente esta variable representa el tiempo de vida, esto es, el tiempo hasta que ocurre un
determinado suceso.
6.6.5. Distribuci on Normal
Un gran n umero de fenomenos aleatorios continuos como el peso, la altura, etc, se pueden modelar
con la distribuci on Normal. Diremos que una v.a. X sigue una ley Normal de parametros y
2
( R, > 0), X N(,
2
), si su funci on de densidad es
f(x) =
1

2
exp
_

1
2
2
(x )
2
_
, x R.
La media y la varianza de esta distribuci on son
E(X) = , V ar(X) =
2
.
Siguen un modelo de distribucion Normal:
48
La concentraci on de plomo en partes por millon en la corriente sangunea del individuo.
La cantidad de radiaci on que puede ser absorbida por un individuo antes de que sobrevenga la
muerte.
El volumen de la cavidad craneal de los primates.
El error que se comete cuando se utiliza un instrumento electronico para contar partculas como
globulos blancos.
La densidad de la tierra arcillosa, etc.
Propiedades
(a) Por ser una variable aleatoria continua, el area determinada por la gr aca de la funcion de
densidad de cualquier variable aleatoria Normal es igual a 1. Y el valor de la funci on de distri-
buci on en un punto, x
0
, F(x
0
) = P[X x
0
] viene dada por el area delimitada por la gr aca
de la funci on de densidad, a la izquierda del punto x
0
(b) Sea X N(,
2
), entonces si realizamos una transformacion lineal del tipo
X

, la v.a.
resultante
Z =
X

N(0, 1)
A Z se le denomina variable tipicada. A la distribuci on N(0, 1) se le denomina distribucion
normal estandar.
De lo que se deduce que cualquier v.a. Normal sean cuales sean sus par ametros puede trans-
formarse en la N(0, 1) sin mas que tipicarla. As para calcular probabilidades en cualquier
distribuci on normal, lo primero que debemos hacer es tipicar la variable, esto es,
P(X x) = P
_
Z
x

_
= P[Z z] = (z) ,
donde representa la funcion de distribuci on de una distribuci on normal estandar y z =
x

.
(c) La gr aca de la funci on de densidad de cualquier variable aleatoria Normal, X N(,
2
) es
una curva simetrica respecto a x = . Por lo que
P[X a] = P[X + a] para cualquiera R
En particular para N(0, 1)
P[Z a] = P[Z a] = 1 P[Z a]
49
(d) Los valores de (z) estan tabulados pero s olo para z 0, ya que por la propiedad (c) se verica
que (z) = 1 (z).
(e) Si X e Y son variables aleatorias independientes de modo que X N(
X
,
2
X
) e Y
N(
Y
,
2
Y
), entonces para cualesquiera a, b R se tiene que
aX + b N(a
X
+b, a
2

2
X
),
X +Y N(
X
+
Y
,
2
X
+
2
Y
),
X Y N(
X

Y
,
2
X
+
2
Y
).
(f) Percentiles o puntos crticos: sea (0, 1), representaremos por Z

el valor x R tal que


P[Z Z

] =
Ejemplo: Para hallar el percentil 70 de una distribuci on N(0, 1) buscaremos en la tabla,
observamos que
P[Z 0,52] = 0,6985
por lo que aproximando deducimos que Z
0,7
= 0,52
(g) La importancia de la distribuci on normal radica en que no s olo es util para modelar algunos
fen omenos aleatorios frecuentes (peso, altura, etc), sino que tambien sirve para aproximar la
funci on de distribuci on de otras distribuciones, como muestran las siguientes propiedades:
Si X B(n, p) con n elevado, entonces podemos aproximar la distribuci on de X por una
ley Normal de par ametros = np y
2
= npq, en el siguiente sentido
P(X x) = P
_
X np

npq

x np

npq
_

_
x np

npq
_
.
Emplearemos la aproximaci on normal a la distribucion Binomial cuando n sea grande y
no sea adecuado aplicar la aproximaci on por la distribuci on de Poisson.
Si X P() y es elevado, entonces podemos aproximar la distribucion de X por una
ley Normal de par ametros = y
2
= , en el siguiente sentido
P(X x) = P
_
X

_

_
x

_
.
6.7. Modelos de distribuciones de probabilidad asociados al muestreo
A continuaci on deniremos tres modelos de distribuciones de probabilidad fundamentales para
las tecnicas de inferencia estadstica que introduciremos en el siguiente bloque
50
6.7.1. Distribuci on chi-cuadrado
Denici on 2 Sean X
1
, X
2
, ..., X
n
n v.a. i.i.d. seg un una ley N(0, 1) y consideremos la v.a.
Y = X
2
1
+X
2
2
+... +X
2
n
A la distribucion de la v.a. Y se le denomina distribucion chi-cuadrado con n grados de
libertad, lo que se representa como Y
2
n
La esperanza y la varianza de esta distribuci on son:
E[X] = n V ar[X] = 2n
Percentiles o puntos crticos: sea (0, 1), mediante
2
n,
representaremos a aquel x R tal
que

2
n,
= x / P(
2
n
x) = .
Ejemplo: Para X
2
20
, hallar el percentil o punto crtico de nivel = 0,95.
Soluci on: X
2
20,0,95
= 31,410, lo que signica que P[
2
20
31,410] = 0,95
6.7.2. Distribuci on t de Student
Denici on 3 Sean X e Y dos v.a. independientes de modo que X N(0, 1) e Y
2
n
. Sea
T =
X
_
Y/n
A la distribucion de la v.a. T se le denomina distribucion t de Student con n grados de
libertad, y se representa T t
n
La distribucion t de Student tiene propiedades parecidas a N(0, 1).
Su esperanza es cero y es simetrica respecto a la misma, entonces
P(T x) = 1 P(T x)
Para un n umero alto de grados de libertad se puede aproximar por la Normal, es decir
t
n

n N(0, 1)
Percentiles o puntos crticos: sea (0, 1), mediante t
n,
representaremos a aquel x R tal
que
t
n,
= x / P(t
n
x) = .
Por la simetra respecto del origen se verica que t
n,
= t
n,1
.
Ejemplo: Para X t
20
, hallar el percentil o punto crtico de nivel = 0,9 y de nivel = 0,1.
Soluci on: t
20,0,9
= 1,325341, lo que signica que P[t
20
1,325341] = 0,9, y
t
20,0,1
= t
20,0,9
= 1,325341
51
6.7.3. Distribuci on F de Snedecor
Denici on 4 Sean X e Y dos v.a. independientes de modo que X
2
n
e Y
2
m
. Sea
F =
X/n
Y/m
A la distribucion de la v.a. F se le denomina distribucion F de Snedecor con n y m grados
de libertad, y se representa F F
n,m
.
Percentiles o puntos crticos: sea (0, 1), mediante F
m,n,
representaremos a aquel x R tal
que
F
m,n,
= x / P(F
m,n
x) = .
Si F F
m,n
entonces
1
F
F
n,m
. Por tanto, se verica que F
m,n,
=
1
F
n,m,1
.
Ejemplo: Para X F
n=8,m=15
, hallar el percentil o punto crtico de nivel = 0,9 y de nivel = 0,1.
Soluci on: F
8,15,0,9
= 2,11853, lo que signica que P[F
8,15
2,11853] = 0,9, y
F
8,15,0,1
=
1
F
15,8,0,9
=
1
2,464216
= 0,4058
52
ESTAD

ISTICA APLICADA A LA BIOLOG

IA
Hoja de Problemas n
0
2
13. Cu al es la probabilidad de que una mujer con tres hijos que es portadora de hemoflia cl asica
no transmita su enfermedad a ninguno de sus hijos?.
14. Se dise na un estudio para investigar el peso y el h abito de fumar de los pacientes con hiperten-
si on. El 70 % de los pacientes tiene sobrepeso y un 60 % fuma; adem as, un 35 % del total presenta
ammbas condiciones. Elegido un paciente al azar, calcular las probabilidades de las siguientes situa-
ciones:
(a) que fume si tiene sobrepeso,
(b) que fume, si no tiene sobrepeso,
(c) no fume, sabiendo que tiene sobrepeso,
(d) que fume o tenga sobrepeso,
(e) que fume o no tenga sobrepeso.
15. En una planta de un hospital se tienen los siguientes datos:
Varon Mujer
Ni nos 15 35
Adolescentes 20 20
Adultos 25 10
Ancianos 45 15
Obtener las probabilidades de que al seleccionar un paciente al azar este sea:
(a) Anciano varon.
(b) Adulto o var on.
(c) Ni no, sabiendo que es var on.
16. Un estudio de las corrientes acuaticas que ciculan en las proximidades de un complejo industrial
revela que el 35 %tiene una alta DBO(demanda biol ogica de oxigeno), el 10 % muestra una acidez
elevada y un 4 % presenta ambas caractersticas Son independientes los sucesos la corriente tiene
una alta DBO y la corriente posee una acidez elevada? Son excluyentes? Calcular la probabilidad
de que la corriente tenga una acidez elevada, dado que presenta una alta DBO.
53
17. En una determinada muestra de suelo se pueden aislar 3 tipos de bacterias: A, B, C, que se
presentan en las proporciones 0.6; 0.3; 0.1 respectivamente. La probabilidad de que una bacteria de
la clase A reaccione a la prueba del nitrato (transformandolo en nitrito) es 0.15. Para B y C son 0.8
y 0.6 respectivamente. Se asla una bacteria; hallar la probabilidad de que reaccione a la prueba del
nitrato.
18. Se cree que la distribuci on de los grupos sanguineos en los soldados de la Segunda Guerra
Mundial era: tipo A, 41 %; tipo B, 9 %; tipo AB, 4 % ; y tipo O, 46 %. Se estima que en esa epoca,
el 4 % de las personas pertenecientes al grupo O fue clasicado tipo A; el 88 % de los de tipo A
fue correctamente clasicado; el 4 % de los de tipo B se clasico como tipo A y el 10 % de los de
tipo AB fue igualmente clasicado tipo A. Un soldado fue herido y conducido a la enfermera. Se le
clasic o como de tipo A, Cu al es la probabilidad de que tal grupo fuese ciertamente el suyo?
19. Estamos interesados en saber cual de dos an alisis A y B es mejor para el diagn ostico de una
determinada enfermedad de la cual sabemos que la presentan un 10 % de individuos de la poblaci on.
El porcentaje de resultados falsos positivos del analisis A es del 15 % y el de B es del 22 %. El
porcentaje de falsos negativos del analisis A es del 7 % y el de B es del 3 %. Cu al es la probabilidad
de acertar en el diagnostico con cada metodo?
20. Un medico aplica un test para detectar una enfermedad cuya incidencia (probabilidad a priori
de padecer la enfermedad) es del 10 %. La sensibilidad (probabilidad de que el test de positivo al
aplicarlo sobre un enfermo) es del 80 % y la especicidad (probabilidad de que el test de negativo
sobre una persona sana) es del 75 %.
(a) Calcular la probabilidad de que el test de positivo al aplicarlo sobre un ni no elegido al azar.
(b) Calcular la probabilidad de que el test suministre un resultado incorrecto.
21. En una cierta regi on se sabe por experiencia que la probabilidad de seleccionar a un manzano
afectado de mildiu es de 0.02. Adem as la probabilidad de que un experto detecte correctamente a
un manzano afectado por la enfermedad en una etapa temprana es 0.78 y la de que se equivoque, es
decir, que diagnostique que tiene la enfermedad un manzano sin mildiu, es de 0.06.
a) Cual es la probabilidad de que el experto diagnostique en una etapa temprana que un manzano
se encuentra afectado por mildiu?
b) Cual es la probabilidad de que si diagnostica que un manzano posee mildiu, verdaderamente
tenga la enfermedad?
54
22. Se ha realizado un estudio sobre la edad de la madre en el momento del nacimiento de su
hijo como factor de riesgo en el desarrollo del sndrome de la muerte s ubita (SMS). Se seleccionaron
para el estudio un total de 7330 mujeres que estaban por debajo de los 25 a nos en el momento del
nacimiento. De ellas, 29 tuvieron ni nos afectados de SMS. De las 11256 mujeres que tenan 25 a nos
o mas, 15 tuvieron ni nos con SMS. Que puede concluirse?
23. Dada una urna con tres bolas numeradas de 1 a 3, considerese el experimento extraer dos
bolas con reemplazamiento y apuntar los n umeros que aparecen. Sea la variable aleatoria S = suma
de los n umeros obtenidos. Hallar la funci on de probabilidad de dicha variable. Hallar la funci on de
distribuci on. Hallar esperanza y varianza.
24. Una variable aleatoria discreta viene dada por la funci on de probabilidad
X 2 4 6 8 10
P[X=x] 0.5 0.1 0.1 0.1 0.2
(a) Halla la funcion de distribuci on.
(b) Calcula la esperanza, la varianza y la desviacion tpica.
(c) Calcula P[2 < X 7], P[2 X 8], P[X 3], P[X < 6],
P[X > 6], P[X 4|X 7]
25. Despues de inyectar determinado farmaco a una rata, la variable aleatoria que mide el tiempo
de vida restante tiene la siguiente funcion de distribucion :
F(x) =
_

_
0 si x < 0
x/4 si 0 x < 4
1 si 4 x
Determinar las siguientes probabilidades: P[X > 2], P[X 4,5], P[(0,5 < X 2,5)|X > 2]. Calcular
el valor de c que verica P[X c] = 0,95.
26. Despues de una determinada operacion quir urgica, un equipo medico tiene dos opciones: man-
tener ingresado al paciente en el hospital durante 5 das o durante 8 das. Cuando los pacientes son
dados de alta a los 8 das el coste por paciente es de 600 euros y no regresan al hospital por causa de
la operaci on. Cuando son dados de alta a los 5 das,
2
3
de los pacientes no regresan pero el
1
3
restante
s lo hacen. Cada individuo del primer caso cuesta 300 euros y del segundo 900 euros. En terminos
puramente econ omicos es preferible dar de alta a los enfermos a los 5 o a los 8 das?
55
27. Un varon y una mujer, cada uno con un gen recesivo y uno dominante para el color de los ojos,
son padres de tres hijos. Cual es la distribuci on de probabilidades para el n umero de hijos con ojos
azules?
28. Al realizar un estudio sobre cierta especie animal se ha observado que el 60 % de los machos
vive m as de 9 a nos, porcentaje que es del 80 % en el caso de las hembras. Se sabe tambien que en la
poblaci on los machos representan el 40 % y las hembras el 60 % del total.
(a) Si se eligen 10 individuos de la especie al azar, cual es la probabilidad de que se obtengan
como maximo 2 machos?
(b) Calcular la probabilidad de que al elegir 5 individuos al azar, al menos 1 viva m as de 9 a nos.
29. En una cierta poblaci on, se ha obsevado un n umero medio anual de muertes por c ancer de
pulm on de 12. Si el n umero anual de muertes por cancer de pulmon sigue una distribucion de
Poisson, cu al es la probabilidad de que durante el a no en curso:
(a) Haya exactamente diez muertes por cancer de p ulmon?
(b) Alguna persona muera de c ancer de p ulmon?
(c) Haya 4 muertes o mas por c ancer de p ulmon?
30. Cierta enfermedad se presenta en 1 de cada 100.000 personas.
(a) Calcular la probabilidad de que en una ciudad de 500.000 habitantes haya m as de tres personas
con dicha enfermedad.
(b) Calcular el n umero esperado de habitantes que la padecen.
31. Entre los diabeticos, a la glucemia en ayunas puede suponersele una distribuci on aproximada-
mente Normal con media 106mg/100ml y desviacion tpica 8 mg/100ml.
(a) Calcular P[X 120mg/100ml].
(b) Que porcentaje de diabeticos tendr a niveles entre 90 y 120 mg/100ml?
(c) Calcular P[X > 95mg/100ml].
32. Sea X la cantidad de radicacion que puede ser absorbida por un individuo antes de que le
sobrevenga la muerte. Supongamos que X es Normal con una media de 500 roentgen y una desviaci on
tpica de 150 roentgen. Por encima de que nivel de dosicaci on sobrevivira solamente el 5 % de los
expuestos?
56
33. Se ha comprobado que el tiempo de vida de cierto tipo de marcapasos sigue una distribucion
exponencial con media de 16 a nos.
(a) Cual es la probabilidad de que a una persona a la que se le ha implantado este marcapasos se
le deba reimplantar otro antes de 20 a nos?
(b) Si el marcapasos lleva funcionando correctamente 5 a nos en un paciente, cu al es la probabilidad
de que haya que cambiarlo antes de 25 a nos?
34. Se sabe que la distribucion de la variable aleatoria X = tiempo en segundos que tarda una
cierta droga en dejar sentir sus efectos posee una distribuci on Exponencial de media 130.
(a) Determinar la probabilidad de que aplicada la droga a un individuo seleccionado al azar tarde
m as de 140 segundos en actuar.
(b) Determinar la probabilidad de que la droga tarde entre 80 y 120 segundos en actuar.
(c) Determinar la probabilidad de que la droga tarde menos de 150 segundos en actuar.
35. En un bosque que conviven dos tipos de escarabajos, A y B, el 60 % de la poblacion es de tipo
A y el resto de tipo B. La longitud, en cm, de la poblacion de escarabajos sigue una distribuci on
Normal de media 1.5 cm y desviacion tpica 0.25 cm para el tipo A y media 1.6 cm y desviacion
tpica 0.2 cm para el tipo B. Si tomamos un escarabajo al azar,
(a) Cual es la probabilidad de que mida menos de 1.8 cm?
(b) Si mide menos de 1.8 cm, cual es la probabilidad de que pertenezca al tipo B?
(c) Si se ha tomado una muestra de 20 individuos del tipo B, cual sera el n umero esperado de
escarabajos cuya longitud este entre 1.5 cm y 1.8 cm?
36. Sean X e Y v.a. independientes, que representan, respectivamente, la altura en cms. de hombres
y mujeres de cierta poblaci on, de la que se sabe que se distribuyen seg un leyes normales de igual
varianza, y que la media de los hombres es mayor que la de las mujeres en 10 cm.
La probabilidad de que un hombre elegido al azar mida menos de 190 cm. es de 0.67 y la proba-
bilidad de que un hombre sea m as alto que una mujer es 0.833.
(a) Determinar los par ametros de las distribuciones.
(b) Se eligen diez parejas al azar. Determinar el n umero esperado de parejas en las que el hombre
es mas bajo que la mujer.
57
37. En la fabricacion de un cierto tipo de l amparas, la resistencia electrica se distribuye seg un una
ley normal de media 2000 y desviacion tpica 200. Dichas l amparas se empaquetan en lotes de 10,
consider andose un lote defectuoso si la resistencia media de las lamparas que contiene el lote no se
encuentra en el intervalo (1900, 2150).
a) Cual es la probabilidad de que un determinado lote sea defectuoso?
38. Una maquina realiza autom aticamente el envasado de cierto producto. En cada frasco introduce
una cantidad X, que es una v.a. con media 20 y desviaci on tpica 0.5. Sea

X la media de los contenidos
de una muestra de tama no 100. Calcula la probabilidad de que el error absoluto que se comete al
envasar sea inferior a 0.1, es decir, P(|

X 20| 0,1).
58
BLOQUE TEM

ATICO III:
INFERENCIA ESTAD

ISTICA
7. Introducci on a la Inferencia Estadstica
La Inferencia Estadstica es la parte de la Estadstica que se encarga de obtener conclusiones sobre
una poblacion, a partir de los datos de una muestra. Para ello emplea tecnicas basadas en el c alculo
de probabilidades y tambien, generalmente, en hip otesis sobre modelos de probabilidad para las
variables aleatorias bajo estudio. Es el conjunto de tecnicas estadsticas que permiten la formulacion
y conmaci on de hipotesis. Se cuantica el grado de certidumbre con el que se pueden establecer
armaciones sobre los datos. Se obtiene conclusiones a partir de una informaci on incompleta.
Recordemos los conceptos b asicos que manejamos
Poblaci on: conjunto de objetos o individuos que se desean estudiar.
Muestra: parte de esa poblaci on seleccionada para el estudio.
Observaci on: es cada uno de los objetos o individuos que nos sirven como fuente de datos para
la realizacion de nuestra investigaci on. Pueden recibir diferentes nombres: unidades muestrales,
individuos, casos, unidades experimentales, etc...
Variable: Es una caracterstica de los individuos que puede tomar distintos valores.
Valor: Son los distintos estados en los que se puede encontrar la caracterstica objeto de estudio.
De la poblacion, por razones de inaccesibilidad, extraemos una muestra, de forma que del compor-
tamiento estudiado en la muestra pueda generalizarse o inferirse el de la poblacion.
Los aspectos a tener en cuenta al aplicar las tecnicas de inferencia estadstica pueden resumirse
en:
(a) Seleccion de la muestra (metodos de muestreo).
(b) Estimacion de los par ametros del m odelo probabilstico que describe a la poblaci on.
(c) Contraste de hip otesis sobre el comportamiento de la poblaci on.
As, consideremos una caracterstica bajo estudio en una poblacion descrita por una variable
aleatoria X con funci on de distribuci on F que ser a desconocida, bien en parte (por ejemplo, X
P(), con desconocida), o bien totalmente (no sabemos nada sobre F). Supongamos que disponemos
de un conjunto de observaciones o datos experimentales, que denotaremos por x
1
, x
2
, ..., x
n
.
59
Objetivo fundamental de la Inferencia Estadstica: A partir de estos datos experimentales preten-
demos deducir informaci on acerca de la distribucion de la variable en la poblaci on. Es decir nuestro
objetivo es la obtenci on de informaci on acerca de la f.d.D. F(x; ).
Lo haremos de diferentes formas:
Estimacion puntual: daremos un valor numerico aproximado del valor del par ametro o
par ametros poblacionales desconocidos.
Estimacion por intervalos: daremos un intervalo dentro del cual est a el verdadero y desco-
nocido valor del par ametro poblacional buscado, con alta probabilidad, jada de antemano.
Contrastes de hipotesis: haremos hip otesis (conjeturas) acerca del valor o valores de los
par ametros de una poblaci on, en distintas situaciones, o sobre la forma o expresi on de su
funci on de distribuci on.
Pero todas ellas estaran basadas en la previa selecci on de una muestra. Las diferencias entre la muestra
y la poblaci on deben ser mnimas, es decir la muestra debe ser representativa de la poblaci on. Pero
la poblacion es desconocida, debemos escoger la muestra a ciegas. Por ello debemos cuidar:
Tama no de la muestra.
Procedimiento de eleccion que garantice la objetividad y la representatividad
7.1. Muestra aleatoria simple y Estadstico
Para tratar la investigacion con datos, hay que considerar primero c omo se obtienen esos datos.
La forma de obtener los datos implica luego a los metodos de an alisis e incluso a la validez de nuestro
estudio.
Sea X una variable aleatoria (v.a.) que cuantica los valores de una caracterstica medida sobre
una poblacion. Supongamos que hacemos n pruebas independientes del experimento, obteniendo los
datos x
1
, x
2
, ..., x
n
. Cada x
i
se puede considerar como una realizacion de una v.a. X
i
que se distribuye
como X. As pues, (x
1
, x
2
, ..., x
n
) puede ser considerado como una realizaci on de un vector aleatorio
(X
1
, X
2
, ..., X
n
), cuyas componentes son variables aleatorias independientes y est an igualmente dis-
tribuidas (i.i.d.) como X. A X
1
, X
2
, ..., X
n
se le denomina muestra aleatoria simple, (m.a.s.) de
X. A n se le denomina tama no de muestra.
Denici on 1 Sea X
1
, X
2
, ..., X
n
una m.a.s. de una v.a. X y sea T : R
n
R una funcion. Entonces
a la v.a. dada por T(X
1
, X
2
, ..., X
n
) se denomina estadstico.
60
Ejemplos: T(X
1
, X
2
, ..., X
n
) =
1
n
n

i=1
X
i
=

X, media muestral.
T(X
1
, X
2
, ..., X
n
) =
1
n
n

i=1
(X
i


X)
2
= S
2
, varianza muestral.
T(X
1
, X
2
, ..., X
n
) =
1
n 1
n

i=1
(X
i


X)
2
= S
2
c
, cuasivarianza muestral.
N otese que cualquier estadstico, T(X
1
, X
2
, ..., X
n
), es una v.a. que tomar a diferentes valores
dependiendo de la muestra extraida, y cada valor tendr a una probabilidad asociada. Luego conviene
recordar que un estadstico es una v.a. con una distribuci on de probabilidad (o modelo probabilstico
asociado).
61
8. El problema de la estimaci on: estimacion puntual y estimacion por
intervalos
8.1. Estimaci on Puntual
El concepto de estimador, como herramienta fundamental, lo caracterizamos mediante una serie de
propiedades que nos servir an para elegir el mejorpara un determinado parametro de una poblaci on.
Supongamos que queremos estudiar una poblacion descrita por una v.a. X, con F.d.D. F y
f.d.d. f (si X es continua) o funcion de probabilidad P (si X es discreta). A lo largo del tema
supondremos que la forma funcional de f o de P es conocida, y que desconocemos el valor de un
n umero nito de par ametros, que denotaremos mediante = (
1
,
2
, ...,
k
) (por ejemplo, sabemos
que X Exponencial(), pero desconocemos el valor de = ). N otese que si fuera conocido,
entonces conoceramos completamente el comportamiento de la variable en la poblacion. Por tanto,
nuestro objetivo sera estimar o aproximar lo mejor posible.
8.1.1. El concepto de estimador
Se denomina estimador de un parametro
i
a cualquier estadstico que tenga por objetivo
aproximar el valor de
i
.
Sea X
1
, X
2
, ..., X
n
una m.a.s. de la poblacion. Bas andonos en la muestra, deseamos estimar o
aproximar el valor desconocido de . Para ello, tendremos que buscar una funcion de la muestra o
estadstico, T = T(X
1
, X
2
, ..., X
n
) que estime el parametro .
Para cada posible realizacion de la muestra, esto es, para cada posible muestra extraida, (x
1
, x
2
, ..., x
n
),
obtendriamos un valor de T, T(x
1
, x
2
, ..., x
n
), al que llamaremos estimacion del parametro.
Observese que el estimador no es un valor concreto sino una variable aleatoria (por ser un es-
tadstico), ya que depende de la muestra y la elecci on de esta es un proceso aleatorio. Una vez que
la muestra ha sido elegida, se denomina estimacion al valor numerico que toma el estadstico sobre
esa muestra.
Debido a que un estimador es una variable aleatoria podremos conocer, en algunos casos, su
funci on de distribuci on y ello nos permitir a determinar sus propiedades.
8.1.2. Propiedades
Como hemos visto, el problema de la estimacion puntual consiste en la b usqueda de un estimador
que aproxime o estime al par ametro . Obviamente, es deseable obtener una buena.
a
proximaci on
o estimacion, en otras palabras, sera deseable que la funci on de la muestra que utilicemos para
estimar el par ametro desconocido vericara una serie de propiedades. A continuaci on daremos algunas
propiedades que nos van a permitir evaluar la bondad u optimalidad de un estimador.
62
Intuitivamente, las caractersticas que seran deseables para esta nueva variable aleatoria, que
llamamos estimador y que usamos para estimar un parametro desconocido deben ser:
Consistencia: cuando el tama no de la muestra crece arbitrariamente, el valor estimado se
aproxima al verdadero y desconocido valor del parametro.
Insesgadez: el valor medio que se obtiene de la estimaci on para un n umero sucientemente
grande de muestras diferentes debe ser el valor del par ametro.
Eciencia: Al estimador, por ser una variable aleatoria, no puede exigrsele que para una
muestra cualquiera se obtenga como estimaci on el valor exacto del par ametro. Sin embargo
podemos pedirle que su dispersi on con respecto al valor central (varianza) sea tan peque na
como sea posible.
Suciencia: El estimador debera aprovechar toda la informaci on existente en la muestra.
8.1.3. Algunos estimadores de interes
Bas andonos en las propiedades anteriormente mencionadas podemos construir el siguiente cuadro
donde se denen los estimadores de los parametros de las distribuciones de probabilidad presentadas
en el tema 6.
N(,
2
)
=

X

2
= S
2
c
Be(p) p =

X
B(n, p), N conocido p =

X/n
P()

=

X
E()

= 1/

X
8.2. Estimaci on Por Intervalos de Conanza.
8.2.1. Concepto e interpretaci on de un intervalo de conanza
Un estimador nos proporciona un unico valor posible para un paraametro poblacional. Sin embar-
go, una estimaci on difcilmente es exacta, generalmente hay alg un error en la estimaci on. En lugar
de dar una estimaci on de un par ametro, el siguiente paso l ogico debera ser facilitar un rango de
valores posibles del parametro poblacional, al que se le llama intervalo de conanza. Usar un valor o
estimaci on puntual es como pescar en un lago turbio con un arpon, y con un intervalo de conanza
es como pescar con una red. Podemos tirar un arpon cuando vemos un pez pero probablemente
no lo pescaremos. Por otro lado, si lanzamos una red en la zona en la que vimos el pez, tenemos
m as posibilidades de capturar el pez. Nuestra estimaci on puntual es el valor m as adecuado para el
63
par ametro poblacional, por lo que tiene sentido que construyamos el intervalo de conanza entorno
al valor de la estimaci on puntual. El error est andar, una medida de la incertidumbre asociada con el
estimador puntual, nos da una indicaci on de como de grande debera ser el intervalo de conanza.
Existen una multitud de circunstancias en las que el interes de un estudio no estriba tanto en
obtener una estimaci on puntual para un par ametro, como determinar un posible rangode valores
o intervalo.
en
los que pueda precisarse, con una determinada probabilidad, que el verdadero valor
del parametro se encuentra dentro de esos lmites.
Las tecnicas que abordan este tipo de situaciones, se encuadran dentro de la estadstica inferencial
bajo el ttulo de estimacion condencial, estimacion por intervalos o regiones de conanza.
Denici on 2 Sea X una variable aleatoria con funcion de distribucion F

que depende de un parame-


tro que desconocemos. Sea X
1
, ...X
n
una m.a.s procedente de la poblacion descrita por la variable X.
Diremos que I(, 1) es un intervalo aleatorio al nivel de signicaci on , o equivalentemente,
intervalo aleatorio al nivel de conanza 1 si
P[ I(, 1 )] 1
o lo que es lo mismo
P[ / I(, 1 )] <
Conviene observar que I(, 1 ) es un conjunto aleatorio que depende de la muestra elegida.
Por tanto para cada muestra obtendremos un intervalo numerico diferente. Una vez seleccionada
una muestra y calculado, con esa muestra, el intervalo aleatorio correspondiente , obtendremos dos
valores numericos: extremo inferior y extremo superior. Al intervalo determinado por estos extremos
le llamaremos intervalo de conanza
Interpretaci on de un Intervalo de Conanza: Si elegimos un nivel de conanza, por ejemplo
de = 95 %, y encontramos los intervalos de conanza al 95 % que se correspondan con todas y
cada una de las muestras que podriamos extraer de esa poblaci on, lo que sabemos es que
el 95 % de todos esos intervalos encontrados contienen al verdadero valor del par ametro y como
mucho un 5 % no lo contienen. Pero nosotros solo tenemos uno de esos intervalos.
En la pr actica se suele tomar 1 = 0,90 , 0,95 , 0,99
8.2.2. Intervalos aleatorios para los parametros de las principales distribuciones de
probabilidad.
Utilizando el metodo de la cantidad pivotal (que no desarrollaremos explcitamente) se construyen
los siguientes intervalos aleatorios para los par ametros de las distribuciones estudiadas en el tema 6.
(a) INTERVALOS DE CONFIANZA PARA UNA POBLACI

ON NORMAL.
Sea X
1
, ...X
2
una m.a.s. procedente de una poblacion X N(;
2
)
64
Intervalos de conanza para
I.C(; 1 ) =
_

X t
n1,1

2
S
c

n
_
Intervalo de conanza para
2
,
I.C
_

2
; 1
_
=
_
(n 1)S
2
c

2
n1,1

2
;
(n 1)S
2
c

2
n1,

2
_
, con S
2
c
=

n
i=1
(X
i


X)
2
n 1
.
ESTIMACI

ON DEL TAMA

NO MUESTRAL Debido a la posibilidad de conocer


las distribuciones de probabilidad de los intervalos aleatorios, antes de realizar el estu-
dio podemos estimar el tama no necesario de la muestra a seleccionar, para un nivel de
signicaci on y un error jados de antemano.
As para una precisi on buscada, d y un nivel de conanza prejado 1 consiste en elegir
n tal que
n
Z
2
1

2
d
2

S
2
Donde

S
2
es una estimacion puntual de la varianza de la muestra (para obtenerla nos
podemos basar en una cota superior conocida por nuestra experiencia previa, o simple-
mente, tomando una muestra piloto que sirve para dar una idea previa de los par ametros
que describen una poblacion).
(b) INTERVALOS DE CONFIANZA PARA DOS POBLACIONES NORMALES.
X
1
, . . . , X
n
m.a.s. de N(
1
;
2
1
) ; Y
1
, . . . , Y
m
m.a.s. de N(
2
;
2
2
) independientes.
Intervalo de conanza para la diferencia de medias,
si
2
1
=
2
2
desconocidas:
I.C(
1

2
; 1) =
_
(

X

Y ) t
n+m2,1

(n 1)S
2
c
1
+ (m1)S
2
c
2
n + m2
_
1
n
+
1
m
_
_
si
2
1
=
2
2
desconocidas:
I.C(
1

2
; 1 ) =
_
(

X

Y ) t
,1

2
_
S
2
c
1
n
+
S
2
c
2
m
_
,
con =
_
S
2
c
1
n
+
S
2
c
2
m
_
2
_
S
2
c
1
n
_
2
1
n1
+
_
S
2
c
2
m
_
2
1
m1
2 .
65
Intervalo de conanza para el cociente de varianzas:
I.C
_

2
1

2
2
; 1
_
=
_
S
2
c
1
S
2
c
2
1
F
n1,m1,1

2
;
S
2
c
1
S
2
c
2
1
F
n1,m1,

2
_
(c) INTERVALOS DE CONFIANZA PARA VARIABLES BERNOUILLI.
a) Intervalo de conanza para una proporci on: Sean X
1
, ...X
2
una m.a.s. de una poblaci on
B
e
(p) donde n es grande y p no es cercana a 0.
I.C(p, 1 ) =
_
p Z
1

2
_
p q
n
_
donde p =

X y q = 1 p.
b) ELECCION DEL TAMA

NO MUESTRAL Si queremos elegir una muestra que satis-


faga nuestros requerimientos con respecto al error (d) y al nivel de signicacion, tendremos
que considerar un tama no muestral de
n
1
4
Z
1

2
d
2
c) Intervalo para la diferencia de dos proporciones: Sean X
1
, ...X
n
una m.a.s de una B
e
(p
1
) e
Y
1
, ...Y
m
una m.a.s de una B
e
(p
2
) independientes y n y m sucientemente grandes
I(p
1
p
2
, 1 ) =
_
p
1
p
2
) Z
1

2
_
p
1
q
1
n
+
p
2
q
2
m
_
(d) INTERVALOS DE CONFIANZA PARA LA MEDIA (CASO GENERAL CON
TAMA

NO DE MUESTRA ELEVADO). Sea X


1
, ...X
n
una m.a.s. procedente de una
distribuci on cualquiera donde n es sucientemente grande
I.C( ; 1 ) =
_

X Z
1

2
S
c

n
_
9. Contrastes de hip otesis estadsticas.
En ocasiones, el investigador esta interesado, m as que en obtener una estimacion de los parametros
de interes, en determinar si hip otesis realizadas sobre la poblaci on son ciertas o no, a partir de una
serie de resultados experimentales. Un problema de este tipo se denomina un problema de contraste
de hip otesis.
Por ejemplo:
66
Un biologo puede estar interesado en contrastar, con base en la evidencia experimental, si la
longitud media de cierta especie es menor o igual que cierta cantidad
0
.
Si denotamos mediante a la media de la variable aleatoria X=longitud de la especie en
estudio, entonces la hip otesis a contrastar es
H :
0
Un bi ologo podra tener la necesidad de decidir si, con base en una serie de pruebas, existe
diferencia entre las precisiones de dos clases de medidores.
Si las variables X e Y , medida realizada con el medidor 1 y medida realizada con el medidor 2,
respectivamente, se distribuyen seg un leyes N(,
2
1
) y N(,
2
2
), respectivamente, la hip otesis
a contrastar es
H :
2
1
=
2
2
Una vez denida la hipotesis a contrastar, el siguiente paso es hallar una medida de la discrepancia
entre los datos resultantes de la experimentaci on y la hipotesis H, de modo que si la discrepancia es
muy grande se rechazara tal hipotesis, y en caso contrario se tomara como valida.
Un problema de contraste de hipotesis implica la existencia de dos teoras o hipotesis implcitas,
que denominaremos hip otesis nula e hip otesis alternativa, que reejar an la idea a priori que tenemos
y que pretendemos contrastar con la realidad. De la misma manera aparecen, implcitamente,
diferentes tipos de errores que podemos cometer durante el procedimiento. De la probabilidad con
la que estemos dispuestos a asumir estos errores, depender a, por ejemplo, el tama no de la muestra
requerida.
Denici on 3 Una hip otesis estadstica es una armacion sobre la distribucion de una o mas
variables aleatorias.
En un contraste de hip otesis, tambien denominado test de hipotesis o contraste de signicacion
se decide si cierta hipotesis H
0
que denominamos hip otesis nula puede ser rechazada o no a la vista
de los datos suministrados por una muestra de la poblacion. Para realizar el contraste es necesario
establecer previamente una hipotesis alternativa, H
1
, que ser a admitida cuando H
0
sea rechazada.
Ejemplos:
Supongamos que queremos contrastar si una moneda es perfecta o no. Las hipotesis a contrastar
seran:
H
0
: p = 1/2
H
1
: p = 1/2
siendo p = P(cara).
67
Si X es una variable aleatoria continua, nos planteamos si la distribucion es Normal o no.
H
0
: X
i
Normal
H
1
: X
i
Normal
Incluso, las hipotesis, no tienen porque ser exhaustivas. Se estudia si un medicamento es efectivo.
Suponiendo que la variable aleatoria es X: reducci on de la temperatura, de la que se sabe que
sigue una distribucion N(,
2
), las hip otesis planteadas seran:
H
0
: = 0
H
1
: > 0
Sea X una variable aleatoria simetrica respecto a 0 y dudamos entre si la distribucion es normal
o sigue una t de Student. En tal caso, planteamos las hip otesis:
H
0
: X Normal
H
1
: X t Student
Los contrastes de hip otesis o de signicaci on se realizan:
(a) suponiendo a priori que la ley de distribuci on de la poblacion es conocida.
(b) se extrae una muestra aleatoria de dicha poblacion.
(c) si el comportamientode la muestra es diferente.
a
l que cabra esperar bajo la hipotesis hecha
a priori, concluimos que existen evidencias muestrales para suponer que la hip otesis de partida
era erronea.
Si se pretende decidir cual de las dos hip otesis propuestas es la que m as se adapta a las evidencias
que nos dan los datos, necesitamos una regla de decision o procedimiento para rechazar o aceptar
una hipotesis estadstica. A esta regla se le llama test o contraste de hip otesis.
Denici on 4 Un test es una regla para decidir cuando rechazar H
0
.
Un contraste de hipotesis se elabora a partir de la muestra. Si la muestra contradice la hip otesis
nula, H
0
, rechazaremos tal hip otesis. En caso contrario, diremos que no existen evidencias signica-
tivas para rechazar la hip otesis nula ( aceptamos H
0
). As, cuando nosotros tomemos una muestra,
nos llevara a aceptar H
0
o rechazar H
0
. Por lo tanto, las muestras las podemos dividir en dos
grupos: con las que se rechaza H
0
y con las que se aceptatal hip otesis.
Siguiendo con el ejemplo de la moneda, supongamos que se desea contrastar si una moneda es
perfecta o no. Para ello la lanzamos 20 veces, de las que 18 de ellas resultan ser cara. El resultado
68
obtenido hace dudar de la hipotesis H
0
que la moneda es perfecta. Obviamente, bajo H
0
, el resultado
obtenido es posible. No obstante, y bajo esta hip otesis, el n umero esperado de caras es 10, que dista
bastante del resultado obtenido 18. De hecho si H
0
es cierta X=n umero de caras obtenidas en 20
lanzamientos B(20, 0.5). Si razonamos: lo poco probable no ocurre entonces
P
p=1/2
(|X 10| > 8) = 0.004
nos conduce a pensar que la hip otesis de p artida era falsa y por tanto, p = 1/2.
Por otra parte, si el resultado obtenido hubiera sido de 10 caras, esto podra inducirnos a aceptar
nuestra hip otesis inicial de que la moneda es perfecta; pero no hemos de olvidar que este resultado
tambien puede ocurrir si p = 1/2.
Como consecuencia, podemos armar que, aunque el resultado obtenido muestre fuertes evidencias
a favor o en contra de la hip otesis nula, cabe la posibilidad de que la decisi on a tomar (rechazar o
aceptar H
0
) sea err onea.
Formalmente, al realizar un test de hip otesis, pueden darse las siguientes circunstancias:
H
0
cierta H
0
falsa
Rechazar H
0
Error tipo I
Decisi on
correcta
Aceptar H
0
Decisi on
correcta
Error tipo II
Denici on 5 Se denomina error tipo I al error que se comete al rechazar H
0
siendo cierta. Se
denomina error tipo II al error que se comete al aceptar H
0
siendo falsa.
As, continuando con el ejemplo de la moneda si en los 20 lanzamientos se obtienen 18 caras,
sospecharemos que la moneda no es perfecta y por lo tanto p = 0.5. Pero, a un siendo p = 0.5, el
hecho anterior puede ocurrir aunque sea poco probable. De este modo se cometera un error de tipo
I si rechazamos la hip otesis nula. De igual forma, si obtuvieramos 10 caras, lo mas l ogico es pensar
que la moneda es perfecta, pero siendo p = 0.5, tambien puede darse esta situaci on. En este caso
cometeramos un error de tipo II al no rechazar H
0
: p = 0.5.
Estos errores se deben a que las decisiones se toman a partir de m.a.s., que estan constituidas
por variables aleatorias. Tales errores s olo pueden ser cuanticados con probabilidades (medidas de
la posibilidad de que ocurran).
Llamaremos
= P(error tipo I) = P(rechazar H
0
/H
0
)
= P(error tipo II) = P(aceptar H
0
/H
1
)
Nuestro objetivo, l ogicamente, es intentar equivocarnos lo menos posible, es decir, que la proba-
bilidad de equivocarnos sea lo menor posible
69
Lo ideal sera hallar un test que minimizara la probabilidad de ocurrencia simultanea de ambos
errores. Pero esto no es posible en general, ya que al disminuir uno aumenta el otro. Por ello lo que se
hace es acotar la probabilidad de ocurrencia de uno de ellos, el de tipo I. A esta cota se le denomina
nivel de signicaci on.
P(Rechazar H
0
/ H
0
cierta)
Usualmente =0.10, 0.05, 0.01. Una vez jado el nivel de signicacion, se trata de encontrar una
regla de decisi on, es decir, un test que minimice la probabilidad de error tipo II.
10. Interpretaci on de un test de hipotesis
Es una constante en Estadstica acompa nar toda armacion con una medida del error que pueda
cometerse al realizarla (nunca estamos libres de este error al realizar inferencias, pues la armaciones
se basan en el an alisis de una muestra, no de toda la poblaci on). Por tanto, y puesto que tal y como
se han dise nado los contrastes de hipotesis, tan s olo estamos controlando el error tipo I, en caso de
no rechazar H
0
, no debe interpretarse como que H
0
es cierta (ya que en general se desconoce P(error
tipo II)), sino que los datos no aportan suciente evidencia para dudar de su validez.

Este es el motivo por el que no se debe decir que se acepta la hip otesis nula: cuando H
0
es cierta,
la probabilidad de equivocarnos (al rechazar) es muy peque na ()y est a acotada, pero cuando H
0
es falsa la probabilidad de equivocarnos (al aceptar) es elevada y no la podemos controlar por no
poderla calcular. As, sera m as correcto decir que no existen evidencias signicativas para rechazar
H
0
, mejor que aceptamos tal hip otesis. Cuando aceptamos, sera porque no hay evidencias de que se
de lo contrario, no porque tengamos una gran seguridad de ello y de cualquier forma no podramos
dar una medida de la probabilidad de equivocarnos.
Existen dos tipos de problemas de contrates de hip otesis, seg un el tipo de hipotesis que se planteen:
Contrastes parametricos: aquellos en los que las hipotesis versan sobre el valor de los par ametros
desconocidos de la distribuci on de la v.a. bajo estudio.
Contrastes no parametricos: aquellos en los que las hip otesis versan sobre otros aspectos de la
distribuci on de la v.a. bajo estudio.
10.1. Contrastes parametricos
En los contrastes parametricos se supone que la variable aleatoria X objeto del contraste sigue
una distribuci on de probabilidad conocida, si bien se desconoce alguno de los par ametros que la
determinan. En estos casos, el contraste de hipotesis este referido a alg un parametro de la distri-
buci on cuyo valor se desconoce. Por ejemplo, si sabemos que X Be(p), podemos estar interesados
en contrastar, a partir de una muestra X
1
, ..., X
n
, si el valor de p es superior a un cierto valor de
70
referencia p
0
(una situacion como esta se tendr a al someter a un conjunto de n personas a una prueba
para diagnosticar una enfermedad, a partir de los resultados podramos contrastar si la prevalencia
de la enfermedad es superior al 15 %).
En los contrastes parametricos podemos distinguir entre unilaterales y bilaterales. Si es el
par ametro estudiado, los pares de hip otesis
(1)
H
0
: =
0
H
1
: =
0
(2)
H
0
: =
0
H
1
: >
0
(3)
H
0
: =
0
H
1
: <
0
proporcionan contrastes unilaterales (2), (3) y bilaterales (1)
10.1.1. Relaci on entre intervalos de conanza y contrastes de hipotesis parametricos
Existe una estrecha relaci on entre los contrastes de hipotesis y los intervalos de conanza. De
hecho, puede demostrarse la siguiente equivalencia:
La hipotesis H
0
: =
0
es rechazada a un nivel de signicaci on si y s olo si
0
no es un valor del intervalo de conanza construido para al nivel 1
As por ejemplo, si calculamos un intervalo de conanza para la proporci on p de manzanas sanas
que tiene un manzano, y obtenemos (0.69,0.99), la hip otesis H
0
: p =0.85 no sera rechazada, y por
ejemplo, la hip otesis H
0
: p =0.65 s sera rechazada. Por tanto, la equivalencia anterior puede ser
utilizada como regla de decisi on para resolver los problemas de contrastes de hip otesis parametricos.
Una forma de obtener el contraste de hip otesis para el caso bilateral se basa en los intervalos de
conanza. Suponemos que vamos a utilizar un nivel de signicaci on . La forma es la siguiente:
Se construye un intervalo de conanza con nivel 1 para .
Se comprueba si
0
pertenece al intervalo de conanza:
Si
0
/ IC(; 1) rechazaremos H
0
ya que tenemos evidencias signicativas para pensar
que es falso.
Si
0
IC(; 1 ) s olo diremos que no rechazamos H
0
. La muestra no proporciona
evidencias signicativas para contradecir la hip otesis nula.
Ejemplo: Sea X N(, 1) y planteamos las hip otesis
H
0
: = 0
71
H
1
: = 0
Construyamos un contraste de hipotesis con un nivel de signicaci on = 0.05. Sabemos que para
esta distribucion, IC(; 0.95) =

X Z
1

x
=

X Z
0.975
1

n
=

X
1.96

n
Si n = 10 y x = 5, entonces IC(; 0.95) =5
1.96

10
=(4.3802, 5.6198), intervalo que no contiene
el valor 0, por lo que se rechaza la hip otesis nula, es decir, es signicativamente diferente de 0.
En cambio, si n = 10 y x = 0.5, entonces IC(; 0.95) =0. 5
1.96

10
= (.0.1198, 1.1198), intervalo que
contiene el valor 0, por lo que no se rechaza la hipotesis nula por no haber evidencias signicativas
para ello, es decir, no es signicativamente diferente de 0.
10.2. Contrastes no parametricos
Los contrastes no parametricos se caracterizan porque en ellos no se tiene informaci on a priori
sobre la distribuci on que sigue la variable aleatoria objeto de estudio.
Para realizar estos contraste utilizaremos como regla de decision el calculo de la Region Crtica.
10.2.1. Regi on crtica y Region de aceptacion
El procedimiento general consiste en denir un estadstico T relacionado con la hip otesis que
deseamos contrastar. A este lo denominamos estadstico del contraste. Como todo estadstico es
una v.a. tomara diferentes valores dependiendo de la muestra extraida. A continuaci on suponiendo
que H
0
es verdadera, se calcula la distribuci on de estadstico y se determina una region R
c
llamada,
regi on crtica, de valores que son poco probables para el estadstico y por tanto, si al calcular el
valor del estadstico para nuestra muestra obtenemos uno de esos valores, nos llevar a pensar que H
0
es falsa.
Denici on 6 Se denomina region crtica al conjunto de valores del estadstico que nos llevaran a
rechazar H
0
.
Es decir que despues de calcular el valor del estadstico T sobre la muestra, T
exp
seguimos el
siguiente criterio:
Si T
exp
/ R
c
no rechazamos H
0
( rechazamos H
1
).
Si T
exp
R
c
rechazamos H
0
y aceptamos H
1
Al complementario de la regi on crtica se le llama intervalo de aceptacion
(T
i
, T
s
) = R \ R
c
De entre los diferentes tipos de contrastes no parametricos, podemos destacar los denominados
contrastes de bondad de ajuste, que permiten determinar si los datos experimentales proceden de
72
una determinada distribuci on. De entre estos citaremos como ejemplo, por su relevancia, los tests de
Shapiro- Wilk y DAgostino, que permiten contrastar si los datos experimentales proceden de una
distribuci on Normal. Tambien dentro de este grupo se encuentra el test de Kolmogorov-Smirnov, que
permite comprobar si los datos experimentales proceden de una variable continua dada, o el test
2
de bondad de ajuste, con identica nalidad que el anterior para el caso de una variable discreta o
cualitativa. Otro grupo de interes lo constituyen los contrastes sobre tablas de contingencia (es decir,
sobre tablas de frecuencias conjuntas para variables cualitativas). De estos estudiaremos en detalle
el contraste
2
de homogeneidad e independencia.
10.2.2.
2
para contrastar homogeneidad
Consideramos r poblaciones en las que se observa una variable cualitativa con s modalidades, lo
que da lugar a s grupos o clases en cada una de las poblaciones. Nuestro objetivo es contrastar la
hip otesis nula
H
0
: Las r poblaciones son homogeneas
Dos poblaciones se dicen homogeneas si la proporci on de individuos pertenecientes a cada clase es la
misma en todas las poblaciones.
Para ello nos basaremos en r muestras de tama nos respectivos n
1
, n
2
, ..., n
r
, lo que nos permi-
tir a construir la siguiente tabla de contingencia:
Muestra
Clase
C
1
C
2
... C
s
P
1
n
11
n
12
... n
1s
n
1
P
2
n
21
n
22
... n
2s
n
2
.
.
. ... ... ... ...
P
r
n
r1
n
r2
... n
rs
n
r
m
1
m
2
... m
r
n
La proporci on del total de individuos que pertenece a la clase C
j
viene dada por
m
j
n
. Por tanto, si
la hip otesis nula es cierta, esa misma proporci on deber a presentarse en la clase C
j
de cualquiera de
las poblaciones. As, de ser cierta H
0
, el n umero esperado de individuos en la clase C
j
de la muestra
P
i
ser a
e
ij
= n
i
m
j
n
El estadstico del contraste estara basado en la comparaci on de las frecuencias observadas en cada
clase dentro de cada muestra, n
ij
, con las que cabra esperar de ser cierta la hip otesis nula, e
ij
:

2
=
r

i=1
s

j=1
(n
ij
e
ij
)
2
e
ij
73
Cuando la hipotesis nula es cierta, las diferencias n
ij
e
ji
deben ser peque nas, por lo que el valor
del estadstico tambien lo sera. Teniendo en cuenta que este estadstico sigue aproximadamente una
distribuci on
2
(r1)(s1)
cuando H
0
es cierta, la regla de decisi on que se obtiene es la siguiente:
Rechazar H
0
si
2

2
(r1)(s1),1
Ejemplo: Con objeto de comparar el rendimiento de dos marcas de fertilizantes F
1
y F
2
, se
abonaron 50 naranjos con el fertilizante F
1
y 60 con F
2
. Como resultado, unos naranjos aumentaron
su produccion, otros la disminuyeron y, por ultimo, en otros no se vio alterada.
F
1
F
2
Producci on + 20 35 55
Producci on = 20 15 35
Producci on - 10 10 20
50 60 110
Teniendo en cuenta esta infomaci on muestral (frecuencias muestrales), podemos concluir que los
dos fertilizantes producen los mismos efectos, con un nivel de signicaci on =0.1?
La hip otesis nula consiste en suponer que los dos fertilizantes producen efectos homogeneos o, lo
que es lo mismo, que ambas muestras proceden del mismo modelo de distribucion de probabilidad.
Si la hipotesis nula fuera cierta esa muestra tendra que comportarse de la siguiente forma (fre-
cuencias esperadas)
F
1
F
2
Producci on + 25 30 55
Producci on = 15.9 19.1 35
Producci on - 9.1 10.9 20
50 60 110
Realizando los c alculos oportunos, se obtiene que
2
=4.3 < 4.60517=
2
(21)(31),10.1
, por lo que
se concluye que no existen sucientes diferencias entre los valores muestrales y los valores teoricos (es
decir, que las diferencias que existen pueden ser debidas s olo y exclusivamente al azar) para rechazar
la hipotesis nula.
Con objeto de garantizar que la aproximaci on a la distribuci on
2
es adecuada, es preciso exigir
que todas las frecuencias esperadas, e
ij
, sean mayores o iguales a 5. Si esto no se cumple, se deben
agrupar clases contiguas hasta que se satisfaga esa condici on, o bien aplicar la denominada correccion
de Yates al estadstico del contraste:

2
c
=
r

i=1
s

j=1
(|n
ij
e
ij
| 0.5)
2
e
ij
La correcci on de Yates conduce a tests mas conservdores, es decir, que tienden a no rechazar la
hip otesis nula en un mayor n umero de casos.
74
10.2.3.
2
para contrastar independencia
Consideremos dos variables X e Y , con k y p modalidades, respectivamente. Queremos contrastar
la hiotesis de que ambas variables son independientes.
H
0
: Las variables Xe Y son independientes
H
1
: Las variables Xe Y no son independientes
Partimos de una muestra de tama no N y construimos la tabla de doble entrada (tabla de contingen-
cia):
X/Y y
1
y
2
... y
p
x
1
n
11
n
12
... n
1p
n
1.
x
2
n
21
n
22
... n
2p
n
2.
.
.
. ... ... ... ...
.
.
.
x
k
n
k1
n
k2
... n
kp
n
k.
n
,1
n
,2
... n
.p
n
Si la hip otesis de independencia es cierta, vimos que debe vericarse
n
ij
=
n
i.
n
.j
n
para todo par de ndices i, j. Por tanto, de ser cierta H
0
, la frecuencia esperada del par (x
i
, y
j
) debe
ser igual a
e
ij
=
n
i.
n
.j
n
El estadstico del contraste se basara, por tanto, en evaluar las difencias entre las frecuencias
observadas (en la muestra), n
ij
, y las frecuencias esperadas, e
ij

2
=
k

i=1
p

j=1
(n
ij
e
ij
)
2
e
ij
Este estadstico sigue aproximadamente una distribucion
2
(k1)(p1)
cuando H
0
es cierta. Teniendo
en cuenta que el valor del estadstico debe ser peque no cuando la hip otesis nula es cierta (pues lo
son las diferencias n
ij
e
ij
), la regla de decision resultante es la siguiente:
Rechazar H
0
si
2

2
(k1)(p1),1
Al igual que en el contraste de homogeneidad, se debe vericar e
ij
5 en todos los pares de ndices
i, j. En caso contrario, se deben agrupar modalidades contiguas o bien aplicar la correccion de Yates.
Ejemplo: Se desea contrastar, con nivel de signicaci on del 5 %, si existe alg un tipo de relacion
entre la hipertenci on arterial (HTA) y el estado civil en una determinada poblacion. Para ello se
selccion o una muestra formada por 619 individuos, obteniendose los siguientes resultados:
75
Estado civil
Tension Casado Soltero Viudo/Separado
HTA 76 7 23 106
No HTA 393 83 37 513
469 90 60 619
Las frecuencias esperadas e
ij
obtenidas a partir de la tabla anterior son las siguientes:
Estado civil
Tension Casado Soltero Viudo/Separado
HTA 80.31 15.41 10.27 106
No HTA 388.69 74.59 49.73 513
469 90 60 619
Realizando los calculos oportunos, se obtiene un valor para el estadstico
2
igual a 24.84. Para
un nivel de signicaci on del 5 %, se tiene:

2
(k1)(p1),1
=
2
2,0.95
= 5.991465
Dado que
2
=24.84 > 5.991465=
2
2,0.95
, podemos entender que las diferencias existentes entre fre-
cuencias observadas y esperadas son superiores a lo que cabra esperar si se debieran s olo al azar,
por lo que debemos rechazar la hip otesis de independencia entre ambas variables, concluyendo, por
tanto, que existe relaci on entre la tensi on arterial y el estado civil.
10.3. Contrastes No Parametrico para la Normalidad
Si X es una variable aleatoria continua, de la cual hemos recogido una muestra aleatoria queremos
contratar
H
0
: X Normal
H
1
: X Normal
10.4. El concepto de p-valor
Veamos otra forma de obtener conclusiones en un problema de contrastes de hip otesis que en
la pr actica es m as r apida de interpretar y lo incorporan la mayora de los paquetes estadsticos.
El p-valor proporciona el nivel de signicacion mas peque no que nos hubiera llevado a rechazar la
hip otesis nula con los datos experimentales del problema concreto que se este estudiando. Si el p-valor
es inferior al nivel de signicacion prejado, se rechazar a la hipotesis nula planteada. Si es igual o
superior no se rechazar a la hip otesis nula. En la pr actica, tras introducir las observaciones que se
76
obtienen de la muestra y tras indicar el estudio deseado, los paquetes estadsticos proporcionan el
p-valor asociado. A partir de este se realizaran las interpretaciones correspondientes.
Ejemplo: Suponemos que para resolver el problema del tiempo (segundos) en recorrer 30 metros
por j ovenes entre 14 y 18 a nos, introducimos en un paquete estadstico los tiempos obtenidos por 50
j ovenes. En tal caso, pediremos que el paquete estudie la hip otesis: el tiempo medio en recorrerlos
es 5. Debemos de jar el nivel de signicaci on a utilizar en el problema, por ejemplo = 0.05. Si
el p-valor obtenido por el paquete estadstico es p = 0.386, al ser p > = 0,05, no se rechaza la
hip otesis nula, es decir, el tiempo medio no es signicativamente diferente de 5. En cambio, si el
p-valor fuera 0,013 < = 0,05, se rechazara la hip otesis nula, es decir, podramos armar que el
tiempo medio es signicativamente diferente de 5.
77
ESTAD

ISTICA APLICADA A LA BIOLOG

IA
Hoja de Problemas n
0
3
1. El n umero de plantas por metro cuadrado que pueden encontrarse en un parque natural es una
v.a. que se distribuye seg un una Poisson de par ametro desconocido. Se muestrearon al azar 10
zonas de 1 m
2
. El n umero de plantas obtenidas en cada zona fue:
ZONA 1 2 3 4 5 6 7 8 9 10
N

DE PLANTAS 7 6 4 10 12 15 3 8 4 4
Estima el par ametro .
2. El tiempo de vida de una artemia en un cultivo de laboratorio se distribuye seg un una exponencial
de parametro . Para estimar se observaron 8 artemias obteniendose los siguientes tiempos de vida
en das:
13, 9, 7, 18, 15, 14, 10, 12
Estima .
3. A continuaci on se dan los resultados de un estudio realizado con 30 universitarios sobre el tiempo
de reaccion ante un estmulo auditivo:
0.11 0.11 0.12 0.17 0.13 0.15 0.10 0.12 0.19 0.19
0.18 0.11 0.10 0.16 0.14 0.15 0.16 0.18 0.20 0.17
0.12 0.16 0.13 0.17 0.18 0.19 0.20 0.12 0.14 0.18
(a) Cual es el tiempo esperado de reacci on en un individuo cualquiera?
(b) Cual es la probabilidad de que, elegido un individuo al azar, tarde mas de 0.135 en reaccionar?
(c) Si est a establecido que valores por encima de 0.175 indican alg un tipo de anomala, Que pro-
porci on de universitarios presentan alguna incidencia?
4. En una muestra aleatoria de 26 botellas de suero se ha observado que el contenido medio es de
71.2 centilitros y la varianza es 13.4. Se supone normalidad de la caracterstica en estudio.
(a) Calcular un intervalo de conanza al 95 % para el contenido medio de las botellas.
(b) Manteniendo el nivel de conanza del 95 %, cuantas observaciones habra que tomar para
estimar dicho contenido medio con un error maximo de 1 centilitro?
78
5. El peso por comprimido de cierto preparado farmaceutico sigue una distribuci on normal. De
la produccion diaria extraemos una muestra aleatoria de seis artculos para estudiar la varianza de
esta caracterstica. Estimar la varianza mediante un intervalo de conanza al 90 % sabiendo que la
varianza muestral obtenida es de 40.
6. En cierta regi on se observo que en una muestra aleatoria de 125 individuos, 12 padecan afecciones
pulmonares.
(a) Estimar por intervalos de conanza la proporcion de individuos en dicha region con afecciones
pulmonares (nivel de conanza del 90 %)
(b) Para un nivel de conanza del 95 %, que tama no de muestra debemos tomar para estimar
dicha proporci on con un error m aximo de 0.10?
7. La experiencia ha sugerido que una dosis ja de cierta droga produce un aumento medio de
pulsaciones de 10 latidos por minuto. En un grupo de nueve pacientes que recibieron la misma dosis
se encontraron los siguientes aumentos:
13, 15, 14, 10, 8, 12, 16, 9, 20
Puede considerarse que la ingesta de esta droga aumenta las pulsaciones en 10 latidos? Tomar un
nivel de conanza del 95 % y suponer normalidad.
8. Un laboratorio de farmacia sostiene que uno de sus productos tiene una efectividad del 90 %
para reducir una alergia en 8 horas. En una muestra de 200 personas con esa alergia, el medicamento
redujo la alergia en 8 horas a 160 personas. Determinar si la armaci on del laboratorio es legtima.
(Considerar = 0,5)
9. A continuacion se muestra la presion sangunea sistolica medida en un conjunto de 11 individuos
antes (variable X) y despues (variable Y ) de la administraci on de un hipotensor beta-bloqueante.
X: 164 144 175 196 194 205 126 165 192 148 156
Y : 144 136 152 157 147 145 142 141 109 146 148
Puede considerarse a un nivel de conanza del 95 % que el farmaco es efectivo para el tratamiento
de la hipertensi on?
79
10. Una central de productos lacteos recibe diariamente la leche de dos granjas A y B. Deseando
estudiar la calidad de los productos recibidos se extraen dos muestras al azar y se analiza el contenido
en materia grasa, obteniendose los siguientes resultados en tantos por cientos:
granja A x
A
=8.7 % s
2
c
A
=1.05 % n
A
= 31
granja B x
B
=10.9 % s
2
c
B
=1.80 % n
B
= 25
Puede considerarse a un nivel de conanza del 90 % que el contenido en materia grasa de la leche
es igual en las dos granjas? (Nota: recuerda estudiar antes la igualdad de varianzas de los
contenidos en grasa de la leche de las dos granjas)
11. Se quiere probar la efectividad de un antitermico (reductor de la ebre). Con tal n se tom o la
temperatura a 10 ni nos afectados de gripe, antes y despues de la administraci on del antitermico
resultando una diferencia de medias de x y=1.58 y una cuasidesviaci on tpica de la diferencia
s
c
d
=0.71. Suponiendo que la caracterstica en estudio es normal, estudia si el antitermico es efectivo,
a un nivel de conanza del 90 % .
12. La resistencia en Kg/cm
2
de cierto material se distribuye normalmente. Se desea comparar la
resistencia de los materiales suministrados por dos proveedores para lo que se toman las siguientes
muestras:
Proveedor 1: 30 46 35 40 43 51 49 29
Proveedor 2: 41 27 2 29 5 10 11 31 33
Puede considerarse que la diferencia entre las resistencias medias es nula? (Fijar =0.1).
13. En una f abrica de componentes electronicos, se desea mejorar los resultados, haciendo un cambio
en su proceso de fabricacion. Se toman muestras del procedimiento de fabricaci on existente y del nuevo
para determinar si este tiene como resultado alguna mejora. Si se obtiene que 75 de 1500 artculos
del procedimiento actual son defectuosos y 80 de 2000 artculos del procedimiento nuevo tambien lo
son, estudiar si el nuevo proceso de fabricaci on es mejor que el antiguo. Considerar = 0,1
14. Una cadena de televisi on realiz o una encuesta para averiguar las preferencias de programacion
entre sus telespectadores, a la que respondieron 180 mujeres y 134 hombres. 64 mujeres y 30 hombres
mostraron su preferencia por uno de los programas Se puede concluir, con un nivel de conanza del
0.95, que hay una preferencia en cuanto al sexo por ese programa?
15. En un estudio realizado sobre la efectividad de un cierto servicio p ublico se ha querido estudiar
el n umero de llamadas telef onicas no atendidas antes de conseguir hablar con dicho servicio. Para
80
ello se ha llamado a dicho telefono durante 50 dias anotando el n umero de llamadas fallidas antes
de ser atendidos. Los datos muestrales nos dan una media de 8.8 llamadas fallidas con una varianza
de 16. A partir de estos datos se desea: 1. Construir un intervalo de conanza para el n umero medio
de llamadas fallidas antes de ser atendidos a un nivel de conanza del 98 % (justica la eleccion del
intervalo, = 0;05 e interpreta el resultado).
16. En un estudio realizado sobre la efectividad de un cierto servicio p ublico se ha querido estudiar
el n umero de llamadas telef onicas no atendidas antes de conseguir hablar con dicho servicio. Para
ello se ha llamado a dicho telefono durante 50 dias anotando el n umero de llamadas fallidas antes
de ser atendidos. Los datos muestrales nos dan una media de 8.8 llamadas fallidas con una varianza
de 16. A partir de estos datos se desea: 1. Construir un intervalo de conanza para el n umero medio
de llamadas fallidas antes de ser atendidos a un nivel de conanza del 98 % (justica la eleccion del
intervalo, = 0;05 e interpreta el resultado).
17. Se pretende determinar si la edad de los chimpances puede explicar su preferencia por distin-
tos tipos de alimentos (A, B o C) con diferente contenido en hi- dratos de carbono. Para ello se
seleccionaron 200 chimpances, obteniendose:
Edad A B C
00-15 11 39 13
15-30 37 31 25
30-50 7 18 19
Puede armarse que la edad inuye en la selecci on del tipo de alimento? tomar = 0,05.
18. En un ensayo clnico se han probado cinco medicamentos diferentes so- bre un grupo de pa-
cientes afectados de una cierta enfermedad, observandose si estos presentaban mejor a al analizar el
tratamiento:
Medicamento A B C D E
N umero de pacientes 51 54 48 49 48
Pacientes con mejora 12 8 10 15 5
Puede considerarse, a un nivel de signicaci on = 0;05, que los cinco tratamientos son igualmente
efectivos?
19. Ocho grupos de 30 ranas cada uno de distintas procedencias fueron inyectadas con estrofantina
G, anotandose las siguientes cantidades de ranas fallecidas en cada grupo: 15, 12, 12, 18, 14, 22, 17,
13. Puede suponerse al 5 % de signicaci on que las ranas de los diferentes grupos fallecen con la
misma probabilidad?
81
20. En una explotacion agrcola experimental se desea comparar el rendi- miento de dos fertilizantes
A y B, para los cual se divide el terreno en 60 parcelas, aplic andose cada fertilizante en la mitad
de ellas. De las 22 par- celas que tienen un rendimiento de mas de 15 Tm/Ha, 9 corresponden al
fertilizante A; de las 31 con rendimiento entre 5 a 15 Tm/Ha, 14 correspon- den al fertilizante A y,
por ultimo, las 7 parcelas con rendimiento inferior a 5 Tm/Ha han sido tratadas con el fertilizante
A. Son igualmente efectivos ambos fertilizantes? Considerar = 0.05.
82