Curso de Estadística Universitaria 2007

CURSO DE ESTADISTICA UNIVERSITARIA
2007

DR. MAURICIO CANALS LAMBARRI
FACULTAD DE CIENCIAS UNIVERSIDAD DE CHILE

RPI N:153541
2
Prologo

Este libro ha sido diseado como un curso de estadstica general de acuerdo a los
programas vigentes en diferentes universidades. Est escrito en una forma general con
ejemplos aplicables a diferentes mbitos. Tiene un nfasis en las bases conceptuales y
metodolgicas de los distintos temas, sin perder el rigor matemtico de sus
fundamentos. En general se evitan las demostraciones matemticas dificultosas que
distraen del objetivo general.

El libro est dividido en seis unidades, de las cuales las primeras cuatro
corresponden a los programas habituales de los cursos de pre-grado en todas las carreras
donde el anlisis de datos es relevante.

La primera unidad corresponde a Estadstica descriptiva, donde se sientan las
bases de la descripcin de la informacin. La segunda unidad corresponde a Estadstica
matemtica, donde se aportan los aspectos ms relevantes de la teora de probabilidades.

Las unidades tres y cuatro son las ms importantes en un curso bsico, donde se
encuentran los principales mtodos usados en inferencia estadstica. Se separan en una
unidad especial el anlisis de varianza y la regresin. Para los lectores poco avezados en
matemticas, se puede pasar directamente desde la unidad 1 a la 3.

La unidad 5 corresponde a una serie de tpicos, habitualmente no tratados en los
cursos bsicos, pero que frecuentemente son usados en diversas reas como las
estadsticas vitales en los estudios poblacionales, el muestreo en poblaciones finitas en
el rea industrial, las series temporales y la regresin logstica. En esta unidad los temas
son tratados con menor profundidad, haciendo hincapi en las bases conceptuales, pero
sin perder rigurosidad de tratamiento del tema.

La ltima unidad introduce el anlisis multivariado, ya que cada da se toma
mayor conciencia del origen multicausal de muchos fenmenos, por lo que es necesario
una mayor comprensin y utilizacin de esta metodologa.

Este libro es el resultado de varios aos dictando cursos bsicos de estadstica. El
tratamiento en todos los captulos intenta ser claro pero conciso, sin redundar en largas
explicaciones ni repeticiones de ejemplos. Cuando se ha considerado necesario, se
apoyan las explicaciones con ejemplos didcticos aplicables en cualquier disciplina.

3
ndice general

INTRODUCCIN: CIENCIA Y ESTADISTICA 6
I UNIDAD: ESTADISTICA DESCRIPTIVA 8
I.- ESTADSTICA 9

I.1.- Bases e historia 9
I.2.- Definicin 9

II.- ESTADSTICA DESCRIPTIVA 12

II.1.- Observaciones, variables y escalas 12
II.2.- Representacin de la informacin 12
II.3.- Medidas de resumen 14

Ejercicios de estadstica descriptiva 20

II UNIDAD: ESTADISTICA MATEMATICA 22

III.- PROBABILIDADES 23

III.1.- Experimento Aleatorio, Espacio Muestral 23
III.2.- Probabilidades y Conjuntos 25
III.3.- Propiedades de las Probabilidades 26
III.4.- Independencia Estocstica y Probabilidad Condicional 27
III.5.- Probabilidades en Medicina 31

Ejercicios de Probabilidades 39

IV.- VARIABLES ALEATORIAS 44

IV.1.- Distribucin de una variable aleatoria 44
IV.2.- Distribucin de Bernoulli 48
IV.3.- Distribucin binomial 48
IV.4.- Distribucin de Poisson 50
IV.5.- Variables aleatorias continuas 52
4
IV.6.- Distribucin uniforme 53
IV.7.- Distribucin exponencial 53
IV.8.- DISTRIBUCIN NORMAL 53
IV.9.- Otras distribuciones importantes 57

Ejercicios de variables aleatorias 61

III UNIDAD: INFERENCIA ESTADISTICA 64

V.- ESTIMACIN 65

V.1.- Estimadores 65
V.2.- Estimaciones 67
V.2.1 Intervalo de confianza para una proporcin P y para la diferencia P1-P2 67
V.2.2 Intervalo de confianza para el promedio x y para la diferencia x
1
-x
2
68
V.3.- El tamao muestral 69
V.2.3.- Estimaciones en Medicina 70

Ejercicios de estimacin 72

VI.- DOCIMASIA O PRUEBA DE HIPTESIS 74

VI.1.- Bases 74
VI.2.- Dcimas para una muestra 78
VI.3.- Dcimas para dos muestras 80
VI.4.- Supuestos de las dcimas 84

Ejercicios de Pruebas de Hiptesis para una y dos muestras 87

VII.- ANLISIS DE DATOS ENUMERATIVOS O FRECUENCIAS 91

VII.1.- La distribucin
2
91
VII.2.- Bondad de ajuste de
2
96
VII.3. El
2
para proporciones 98
VII.4.- La prueba G 99
5

Ejercicios de anlisis de datos enumerativos 101

VIII.- ESTADSTICA DE DISTRIBUCIN LIBRE O NO-PARAMTRICA 103

VIII.1.- Alternativas no paramtricas a las dcimas para dos muestras 104

Ejercicios de estadstica no-paramtrica 110

IV UNIDAD: ANALISIS DE LA VARIANZA, CORRELACION Y
REGRESION 112

IX.- ANLISIS DE LA VARIANZA (ANOVA o ANDEVA) 113

IX.1.-El Problema de Bonferroni 112
IX.2.- Diseo experimental 114
IX.3.- Anlisis de la varianza de 1 va o factor (ANOVA de 1 va). 115
IX4.- Comparaciones mltiples 119
IX.5.- ANOVA de dos vas: la interaccin 122
IX.6.- Otros diseos 125
IX.7.- Alternativas no paramtricas al ANOVA 127

Ejercicios de anlisis de la varianza 129

X.- CORRELACIN Y REGRESIN 132

X.1.- Correlacin 132
X.2.- Regresin 133
X.3.- Regresin y ANOVA 135
X.4.- Predicciones 138
X.4.- Supuestos y alternativas no paramtricas 139
X.5.- Anlisis de Covarianza (ANCOVA) 140

Ejercicios de correlacin y regresin 142
6

INTRODUCCIN: CIENCIA Y ESTADISTICA

El objetivo de la ciencia es captar el orden de los fenmenos para hacerlos
comprensibles dando una explicacin racional de ellos, determinando sus causas y
hacindolos previsibles.

Esta captacin del orden pasa primero por la eleccin e identificacin del
fenmeno y decidiendo el enfoque de inters. Este puede ser de tipo sistmico u holista
en el que el inters esta concentrado en la totalidad y no en las partes (el todo es mas
que la suma de las partes), o bien de tipo reduccionista en el que se estudian las
partes para entender el todo. En general ambos enfoques conducen a la construccin de
modelos, sean stos formales o de simple palabra, que representen el fenmeno. Estos
reducen la complejidad del fenmeno, hacindolo comprensible.

La ciencia, segn Kuhn (1962), puede ser entendida como una coleccin de datos
en el contexto de una forma de entender como funciona la naturaleza (paradigma). En
su conjunto, evoluciona saltando de paradigma en paradigma (revoluciones cientficas)
en la medida que se acumulan evidencias contradictorias a la luz del paradigma
existente. Esta acumulacin de evidencias obedece a un proceso constante de
proposicin de explicaciones y causalidades de fenmenos naturales que puede ir de lo
general a lo particular (deduccin) o desde lo particular a lo general (induccin).

La deduccin es una forma de generacin de proposiciones lgicas. Estas
proposiciones lgicas que tienen un valor de verdad desconocido las conocemos como
hiptesis y pueden ser entendidas como enunciados que contienen proposiciones
verificables y que anteceden a otras en el proceso continuo de la ciencia.

La induccin por el contrario, genera proposiciones generales a partir de la
repetitividad de hechos particulares.

El proceso del conocer requiere de un mtodo. Este es conocido como mtodo
cientfico, que bsicamente contiene varias etapas:

i) eleccin del sistema,
ii) enunciado del problema,
iii) planteamiento de la hiptesis y deduccin de consecuencias verificables de ella
(si p, entonces q),
iv) diseo experimental,
v) prueba de la hiptesis, y
vi) interpretacin de los resultados, generando nuevas hiptesis.
7

Para Popper (1979) el mtodo consiste en una confrontacin de los datos con una
hiptesis, pudiendo sta ser solamente rechazada y no probada. As, en el mtodo de
Popper, hipottico-deductivo-refutacionista, existe una hiptesis de nulidad que
cuando es rechazada, nos permite proponer nuevas hiptesis (falsificacin de la
hiptesis).

En el mtodo de Popper convergen la deduccin y la induccin, estando
relacionada la primera con la generacin de hiptesis y la segunda con la refutacin.
Para este segundo proceso, la refutacin, son necesarios mtodos rigurosos y eficientes
que permitan una adecuada toma de decisiones. Aqu es donde es relevante la
metodologa de la inferencia estadstica. Esta, en su base fundamental consiste en
plantear una dicotoma entre la hiptesis de nulidad (Ho) y un alternativa (H
1
), de tal
manera que a travs de la repetitividad de resultados experimentales (induccin) en una
muestra, sea posible el rechazo de Ho y por tanto la inferencia de H
1
a la poblacin
completa.

8
I UNIDAD: ESTADISTICA DESCRIPTIVA
9

I.- ESTADSTICA

I.1.- Bases e historia

El trmino estadstica proviene de la palabra estado, y se refiere al origen
histrico de esta disciplina relacionado con la descripcin cuantitativa de asuntos del
estado. Tambin se llam aritmtica poltica. Su objetivo inicial era describir
cuantitativamente diversos hechos de inters. En tiempos de Cesar Augusto el
estadstico era el recaudador de impuestos y en tiempos de Guillermo el conquistador se
edit el primer censo de Inglaterra (Domesday Book). En el siglo XVII J. Graunt (1620-
1674) y W. Petty (1623-1687) desarrollaron la estadstica vital.

En esta misma poca, en forma independiente naci la rama matemtica de las
probabilidades a raz del inters en el juego de Antoine Gombaud (el caballero de Mer:
1610-1685) y de los matemticos B. Pascal (1623-1662) y P. Fermat (1601-1665).
Posteriormente, J Bernouilli (1654-1705), A. De Moivre (16671754), P.S. Laplace
(1749-1827) y K.F. Gauss (1777-1855) contribuyeron a fortalecer las probabilidades,
combinndola con los datos estadsticos. A. Quetelet (1796-1874) y finalmente F.
Galton (1822-1911) aplicaron la estadstica al anlisis de la variabilidad biolgica.

El desarrollo definitivo de la estadstica, uniendo sus races descriptivas y
matemticas viene con K. Pearson (1857-1936), W.S. Gosset Student (1876-1937), J.
Neyman (1894), E.S. Pearson (1895), A. Wald (1902-1950) y R.A. Fisher (1890-1962).
Tal vez las figuras mas destacadas que relacionaron la estadstica y la biologa, dando
origen a la biometra, son K. Pearson (fundador de la revista Biometrika) y R.A.
Fisher (Statistical methods for research workers, 1925).

En paralelo, la estadstica matemtica ha sido enriquecida con las contribuciones
de Maxwell, Boltzman y Gills (mecnica estadstica) y por Kolmogorov (probabilidades
axiomticas) y Lebesgue (teora de la medida).

I.2.- Definicin

La estadstica actual se puede definir de muchas formas, por ejemplo conjunto
de mtodos que permiten recolectar presentar y analizar informacin o anlisis
cientfico de datos basados en fenmenos naturales (Sokal & Rholf, 1969). Sin
embargo una definicin til en el contexto de su aplicacin en las ciencias es:

10
La estadstica es la ciencia, pura y aplicada, que crea, desarrolla y aplica
tcnicas para la descripcin de datos y la evaluacin de la incertidumbre de
inferencias inductivas (modificada de Steel & Torrie, 1985).

Esta definicin hace nfasis en dos aspectos:

i) la estadstica no es slo un conjunto de mtodos o recetas para aplicar ante
determinados problemas, sino que tambin incluye la creacin y el
desarrollo de la teora y mtodos.
ii) la estadstica en ciencias se basa en la evaluacin de la incertidumbre
(probabilidad) de ciertas proposiciones (hiptesis) inferidas mediante un
proceso de induccin (de lo particular a lo general)

La estadstica tiene tres captulos claramente diferentes que se correlacionan con
el desarrollo histrico:

I) Estadstica Descriptiva: cuyo fin es describir datos.
II) Estadstica Matemtica: que constituye la base terica de toda la
estadstica.
III) Inferencia Estadstica: que tiene dos sub-captulos con objetivos
diferentes:
a) Estimacin: cuyo fin es aproximar el valor de ciertos parmetros
b) Docimasia o prueba de Hiptesis: cuyo objetivo es probar
hiptesis.

La estadstica en investigacin ha enriquecido el mtodo cientfico, dndole
sentido y un marco terico a sus diversas etapas. Este ltimo se puede describir
detalladamente como:

i) eleccin del sistema a estudiar y su enfoque,
ii) enunciado del problema,
iii) definicin de objetivos,
iv) planteamiento de la hiptesis,
v) deduccin de consecuencias verificables de ella,
vi) dicotoma de la hiptesis (Ho vs. H
1
),
vii) diseo experimental:
a) decidir tipo de investigacin:
1) Recopilacin de datos ya registrados (estudio retrospectivo) u
obtener nuevos datos (estudio prospectivo).
2) Un estudio instantneo (estudio transversal) o un seguimiento
(estudio longitudinal).
3) Ser slo un estudio descriptivo o explicativo?
11
4) Ser experimental o no-experimental?
b) definir el Universo,
c) diseo de la muestra,
d) definicin de grupo control,
e) definicin de unidades de observacin,
f) definicin de las fuentes de informacin,
g) unidades de medidas y escalas
viii) eleccin de estadgrafos para la prueba de la hiptesis,
ix) eleccin del nivel de significacin
x) docimasia de hiptesis
xi) toma de decisin (rechazo Ho?)
xii) representacin de la informacin
xiii) interpretacin de los resultados,
xiv) gnesis de nuevas hiptesis
12

II.- ESTADSTICA DESCRIPTIVA

II.1.- Observaciones, variables y escalas

La estadstica trabaja con datos u observaciones, que en general son valores
numricos de una variable en una unidad de observacin particular. Por ejemplo, si
estamos interesados en la edad de los individuos, la unidad de observacin es el
individuo, la variable de inters es la edad, la unidad de medida puede ser aos y un
dato puede ser 5 aos en un individuo.

Las variables pueden ser cuantitativas cuando miden cantidad o contenido de
algn atributo, o bien cualitativas cuando se refieren a calidad. Por ejemplo masa, peso,
longitud, cantidad son cuantitativas y color, olor y textura son cualitativas. Las variables
pueden ser tambin continuas cuando se puede establecer correspondencia biunvoca
con los nmeros reales, o discretas cuando establecen relacin con los nmeros
naturales.

Las escalas de medidas pueden ser nominales, ordinales, discretas, continuas o
por intervalos. Por ejemplo, nominal: negro o blanco; ordinal: corto, mediano, largo;
continua: gramos; por intervalos: menor que 10 aos, mayor o igual que diez aos.

II.2.- Representacin de la informacin

Los datos u observaciones se representan de diversos modos, que en general se
pueden resumir en dos: i) grficos, e ii) tablas. Entre stos, son de inters las tablas de
distribucin de frecuencias y los histogramas y polgonos de frecuencia

Tablas de distribucin de frecuencias.

Las tablas de distribucin de frecuencias de n datos u observaciones corresponden
bsicamente a la representacin en columnas del conjunto de valores de una variable
(niveles de una variable: y
i
) y sus frecuencias absolutas (n
i
).

En el caso de variables cualitativas adquiere una representacin muy simple:

Variable Frecuencia absoluta (n
i
) %
Y
1
n
1
(n
1
/n)100
Y
2
n
2
(n
2
/n)100
....... ....... .........
Y
k
n
k
(n
k
/n)100

n =n
i
100
13

En el caso de las variables discretas, si consideramos una variable X, donde X
i

son las observaciones e y
i
los k niveles de la variable. Entonces podemos definir:

i) frecuencia relativa n n h
i i
/ =

ii) frecuencia acumulada
=
=
=
j i
i
i j
n N
1

iii) frecuencia acumulada relativa
=
=
=
j i
i
i j
h H
1

En este caso la tabla incluye las columnas: y
i
, n
i
, h
i
, N
i
, y H
i
.

En el caso de las variables continuas muchas veces es necesario agrupar datos
(series agrupadas) por intervalos llamados intervalos de clase. Estos se anotan como
[y
i-1
, y
i
], donde y
i-1
representa el lmite inferior del intervalo e y
i
, el lmite superior.
La amplitud de cada intervalo es c
i
= y
i
- y
i-1
.

Si definimos recorrido o rango de la variable X como la diferencia entre los
valores mximo y mnimo, R = xmax xmin, y se agrupa en k intervalos iguales,
entonces c
i
= R/k.

En estas tablas de distribucin de frecuencias se define marca de clase como el
valor promedio entre los lmites del intervalo: y
i
= (y
i
- y
i-1
)/2.

La tabla incluye las columnas: y
i-1
, y
i
, c
i
, y
i
, n
i
, h
i
, N
i
, y H
i

Histograma y polgono de frecuencias

La tabla de distribucin de frecuencias tiene una expresin grfica natural en el
histograma y el polgono de frecuencias. El histograma de frecuencias corresponde a un
grfico de barra de X vs h
i
, donde cada barra es un intervalo. El polgono de frecuencias
corresponde a la grfica de y
i
vs h
i
.

Ejemplo 1.-

La variable X con la siguiente tabla de distribucin de frecuencias:

14

y
i-1
Y
i
y
i
c
i
n
i
h
i
N
i
h
i

2 4 3 2 20 0.2 20 0.2
4 6 5 2 25 0.25 45 0.45
6 8 7 2 30 0.3 75 0.75
8 10 9 2 10 0.1 85 0.85
10 12 11 2 12 0.12 97 0.97
12 14 13 2 3 0.03 100 1.00

En esta figura, el histograma corresponde al grfico de barras y el polgono a la
lnea poligonal que une los puntos medios de cada barra.

II.3.- Medidas de resumen

La informacin se puede representar en grficos o tablas, sin embargo stas no
son tiles a la hora de tomar decisiones estadsticas. Es mejor caracterizar las variables
por ciertas medidas que describen su distribucin o histograma. Estas se denominan
medidas de resumen y se pueden dividir en cuatro:

15
a) medidas de posicin: cuyo fin es representar la posicin
central de la distribucin u otras posiciones de inters.

b) medidas de dispersin: cuyo fin es representar la
dispersin de los datos en torno a alguna medida de
posicin.

c) medidas de simetra o sesgo: cuyo fin es representar el
tipo de asimetra de la distribucin.

d) medidas de apuntamiento o curtosis: cuyo fin es medir la
elevacin de las frecuencias relativas.

Medidas de posicin

La medida de posicin ms usada es el promedio, que podemos definir
preliminarmente como una medida central que se relaciona el valor de una variable con
su frecuencia relativa de presentacin. Corresponde a la media aritmtica y se puede
expresar como:

n
x
x
i
=

Si la serie ha sido agrupada, entonces
= =
i i
i i
y h
n
y n
y

Algunas propiedades den promedio son:

i) La suma de las desviaciones de los valores en torno al promedio es nula.
Si definimos z
i
= x
i
-x, entonces z
i
= 0.
ii) Dado z
i
= x
i
u, con u un valor cualquiera, entonces z
i
es mnima si
u = x.

El promedio entonces es una medida central en donde se equilibra la
distribucin completa, es decir es su centro de masas.

Una segunda medida de posicin es la mediana que corresponde a un valor bajo
el cual se encuentra el 50% de las observaciones. Es decir si ordenamos en orden
ascendente la serie de n observaciones, la mediana corresponde al valor Me = x
(n+1)/2
si n
es impar y al valor Me = (x
n/2
+x
n/2 +1
)/2 si n es par.
16

Si la serie se encuentra agrupada la mediana se calcula como:

L
L L
L
n
N n c
y Me
) 2 / (
'
1
1

+ =

Donde L es el subndice del intervalo que contiene a la mediana, y ste intervalo
es aquel cuya frecuencia acumulada sobrepasa la mitad de la cantidad de observaciones
(cuya N
j
sobrepasa a n/2).

Una medida de posicin asociada a la mediana es el percentil Pp que
corresponde al valor bajo el cual se encuentra el p% de las observaciones. En una
serie agrupada, se puede calcular como:

L
L L
L p
n
N np c
y P
) 100 / (
'
1
1

+ =

Es fcil ver que P
50
es la mediana. A los percentiles P
25
, P
50
y P
75
se les denomina
primer, segundo y tercer cuartl (Q
1
, Q
2
y Q
3
). Del mismo modo se pueden definir los
deciles, por ejemplo P
10
es el primer decl.

La tercera medida de inters es la moda. Esta se define como el valor que tiene
una mayor frecuencia relativa. En el caso de series agrupadas la moda corresponde a un
intervalo, aunque se ha propuesto una frmula que en cierta manera hace perder sentido
a la definicin.

1 1
1
1
'
+
+
+
+ =
L L
L
L L
n n
n
c y Md

Observaciones

i) Si la distribucin de frecuencias es simtrica, entonces Md Me X = = .
ii) Si la distribucin de frecuencias es asimtrica, se puede reconocer una
asimetra negativa en que Md Me X < < , y una asimetra positiva en que
Md Me X > > .

17
Medidas de dispersin

Las medidas de dispersin son aquellas que evalan la variabilidad de las
observaciones. La ms importante es la varianza (V(x) o S
2
) que podemos definir como
la desviacin cuadrtica media de los valores en torno al promedio, es decir:

S
2
= (x
i
-x)
2
/n

Observamos que (x
i
-x)
2
= (x
i
2
+x
2
2x
i
x) = x
i
2
+x
2
2x
i
x) =

= x
i
2
+nx
2
2nx
2
= x
i
2
-nx
2
, y entonces:

=
2
2
2
x
n
x
s
i

En una serie agrupada

= =
2 2 2
2
2
y y h y
n
y n
s
i i
i i

Algunas propiedades de la varianza son: Si a y b son constantes, entonces:

V(a) = 0; V(ax) = a
2
V(x); V(a+x) = V(x) y V(ax+b) = a
2
V(x).

Un problema de la varianza como medida de dispersin es que se expresa en
unidades cuadrticas. Por ejemplo, si la variable se mide en metros, su varianza se mide
en metros cuadrados.

Una medida de dispersin an ms usada que la varianza y que corrige el
problema de las unidades, es la desviacin estndar (s) que corresponde a la raz
cuadrada de la varianza:

2
s s =

Por su estructura, la desviacin estndar corresponde aproximadamente a una
distancia: la distancia media desde las observaciones individuales al promedio.

Las desviaciones estndar dependen del valor del promedio, siendo ms grandes
cuanto mas grande es este ltimo, lo que hace difcil su comparacin. El coeficiente de
variacin (CV) corrige este problema y corresponde a una desviacin estndar
normalizada dividida por el promedio:
18

x s CV / =

Otra medida de dispersin es el error estndar (Es): n s Es / =

Sin embargo, esta tiene un sentido diferente. Corresponde a la desviacin
estndar del promedio, es decir si de un conjunto de observaciones tomamos varias
sub-muestras y en cada una de ellas calculamos un promedio y a continuacin
calculamos la desviacin estndar de stos promedios, obtenemos Es. Esta medida
adquiere sentido en inferencia estadstica.

Otras medidas de dispersin son el rango (R) R = xmx- xmn y el recorrido
intercuartlico (Q): Q = P
75
-P
25
= Q
3
-Q
1
.

Medidas de simetra o sesgo

Las medidas de simetra se basan en las relaciones entre la moda, mediana y
promedio en las distribuciones simtricas y asimtricas. Existe una relacin emprica
que relaciona stas medidas: ) ( 3 Me x Md x = . A partir de sta se usan los
coeficientes de asimetra de Pearson:

s
Md x
=
3
y
s
Me x ) ( 3
5

=

Si cualquiera de los > 0 se habla de sesgo positivo, o distribucin sesgada a la
derecha. Si el cambio < 0 el sesgo es negativo o la distribucin es sesgada a la
izquierda.

Medidas de apuntamiento o curtosis

El apuntamiento o curtosis se mide en referencia a una distribucin muy habitual
denominada distribucin normal (ver ms adelante). Esta distribucin se puede
caracterizar a travs de un coeficiente =
4
/S
4
= [ (x
i
-x)
4
/n]/S
4
. En esta distribucin
= 3. Esto permite clasificar las distribuciones como:

i) Leptocrticas o ms apuntadas que la normal, si > 3,
ii) Mesocrticas o igualmente apuntadas, si = 3, y
iii) Platicrticas o menos apuntadas que la normal, si < 3.

19
Ejemplo 2.-

Si tomamos la tabla del ejemplo uno podemos calcular las siguientes medidas de
posicin:

a) Promedio: 56 . 6 13 03 . 0 11 12 . 0 9 1 . 0 7 3 . 0 5 25 . 0 3 2 . 0 = + + + + + = y
b) Intervalo de moda: (6; 8)
c) Mediana: el intervalo que contiene la mediana es aqul que por primera vez
sobrepasa la mitad de la cantidad total de observaciones, es decir 50. En este
caso es el intervalo (6; 8). Entonces y
L-1
= 6. y la mediana es:
Me = 6 + 2((50-45)/30) = 6.33.
d) Primer cuartl: el intervalo que contiene Q
1
es aqul que por primera vez
sobrepasa el 25% de la cantidad total de observaciones, es decir 25. En este
caso es el intervalo (4; 6). Entonces y
L-1
= 4. y Q
1
es:
Q
1
= 4 + 2((25-20)/25) = 4.4.
e) Tercer cuartl: en forma anloga al clculo anterior:
Q
3
= 8 + 2((75-75)/10) = 8.

Tambin podemos calcular las siguientes medidas de dispersin:

a) Varianza: en este caso lo ms simple es calcular primero h
i
y
i
2
:

44 . 50 169 03 . 0 121 12 . 0 81 1 . 0 49 3 . 0 25 25 . 0 9 2 . 0
2
= + + + + + =
i i
y h

Y, ahora se puede calcular fcilmente la varianza:

= = = 41 . 7 ) 56 . 6 ( 44 . 50
2 2 2 2
y y h s
i i

b) Rango: 14-2= 12.
c) Desviacin estndar: s = (s
2
) = 2.74
d) Coeficiente de variacin: CV = 2.74/6.56 = 0.41
e) Error estndar: Es = 2.74/(100) = 0.27.
f) Recorrido intercuartlico: Q
3
-Q
1
= 8-4.4 = 3.6.

Adems en ocasiones es til cuantificar la simetra, en ste caso a travs de:

5
= 3(6.56-6.33)/2.74 = 0.25. Esto indica un pequeo sesgo o asimetra a la derecha.
20

Ejercicios de Estadstica descriptiva

1.a. Pesos de nacimiento de nios (en kg)

Rango Marca de
clase (y
i
)
Frecuenci
a (n
i
)
Frec.
acumulada
(N
i
)
Frec.
relativa
(h
i
)
Frec.
relativa
acumulada
(H
i
)
0 2 2
2 4 6
4 6 18
6 8 12
8 10 7
10 12 3

1.b. Datos de mg de glicina por mg de creatinina en la orina de 20 chimpancs
(tomadas de Gartler, Firchein y Dobzhansky, 1956)

0.008 0.018 0.056 0.055 0.135 0.052 0.077 0.026 0.440 0.300
0.025 0.036 0.043 0.100 0.120 0.110 0.100 0.350 0.100 0.300

Para los dos conjuntos de datos presentados arriba:
i) Calcular: promedio, mediana, moda, percentil 30, desviacin estndar y
coeficiente de variacin.
ii) Son simtricas las distribuciones? Comprubelo haciendo histogramas de
frecuencia.
iii) Realice histogramas de frecuencia acumulada para cada grupo de datos.

R: i) a) promedio: 6.04; mediana: 5.78; Moda [4;6]; P
30
: 4.71; desviacin estndar: 2.39;
CV: 0.395; b) promedio: 0.123; mediana: 0.089; Moda 0.1; P
30
: 0.0475; desviacin
estndar: 0.120; CV: 0.979.
21

2. Se ha realizado el estudio de dos medicamentos utilizando ratas. Se midi el
porcentaje cambio de una variable X en la sangre arterial tras la administracin de
dosis idnticas de distintos medicamentos.

% de cambio en X

Compuesto I Compuesto
II

26.0 31.7 55.1 65.8 63.6
30.0 32.0 56.3 58.3 64.0
30.5 28.6 60.0 57.1 65.3
26.2 29.2 63.5 55.4 62.8
30.7 33.0 64.9 56.5 59.5
31.3 32.0 62.7 55.1
30.5 32.6 60.5 57.0
30.1 28.2 59.2 59.3
29.6 29.1 63.7 60.7
30.2 30.7 64.1 62.1

i) Calcular la media y la mediana muestral.
ii) Calcular la varianza y la desviacin estndar de la muestra.
iii) Calcular rango y el rango intercuartlico.
iv) Cul compuesto produjo una respuesta ms variable?

R: i) Compuesto I: media 30.11, mediana: 30.55; Compuesto II: media 60.5, mediana
60.5; ii) CI: V 3.52, ds 1.87; CII: V 12.04, ds 3.47; iii) CI: Rango 7, RIQ 2.35; CII:
Rango 10.7, RIQ 6.5; iv) el primero (ver coeficiente de variacin)
22
II UNIDAD: ESTADISTICA MATEMATICA
23

III.- PROBABILIDADES

III.1.- Experimento Aleatorio, Espacio Muestral

Definiciones Llamaremos experimento determinstico, a aquel que repetido en
las mismas condiciones, da siempre el mismo resultado, en caso contrario lo llamaremos
aleatorio.

Llamaremos espacio muestral () al conjunto de todos los posibles resultados de
un experimento aleatorio. Un punto muestral ser un resultado posible, es decir, un
elemento de omega.

Llamaremos sigma-lgebra en omega a un conjunto - formado por
subconjuntos de que cumple con:

i) Si P (subconjunto de ) , entonces P -.
ii) Si P y Q - entonces P Q -.
iii) Si P y Q - entonces P Q - .

Es decir, - es cerrada bajo complementacin, unin e interseccin. Una -
es el conjunto de todos los subconjuntos de ( ()).

Llamaremos suceso o evento a los elementos de -, o de otra forma, a cualquier
subconjunto de . En este sentido - es el conjunto de los sucesos.

Ejemplo1.-

Sea el experimento aleatorio tiro un dado Su espacio muestral es = {1, 2, 3,
4, 5, 6} Son posibles sucesos (1)= que salga 1; (1,2) = que salga 1 o 2; (1, 2, 3, 4, 5, 6)
= que salga 1 o 2 o 3 o 4 o 5 o 6.

Del ejemplo anterior es evidente que hay sucesos ms posibles o probables
que otros. Es necesario definir entonces probabilidad de un suceso.

Existen varias definiciones de probabilidad, cada una de las cuales tiene cierta
utilidad.

Definicin clsica: Llamaremos probabilidad des suceso A al cuociente entre el
nmero de resultados o casos favorables a A y el nmero de resultados o casos
posibles.
24

les casosposib
ables casosfavor
A P = ) (

As, en nuestro ejemplo, la probabilidad de sacar un dos en una tirada de un dado
(A = 2) es P(A) = 1/6, la probabilidad de sacar un uno o un tres (B = (1,3)) es P(B) = 2/6
y la probabilidad de sacar cualquier nmero (C = (1, 2, 3, 4, 5, 6)) es P(C) = 6/6 = 1.

Definicin de Frechet: Si un experimento aleatorio se realiza n veces, es posible
estimar la probabilidad del suceso A como la frecuente relativa de ocurrencia de A, es
decir, el cuociente entre el nmero de veces en que dio como resultado A (nA) y el
nmero de veces en que se repiti el experimento.

n
nA
A P = ) (

Se debe hacer notar que al contrario de la definicin clsica, esta es una
definicin a posteriori, es decir, exige que el experimento se haya realizado repetidas
veces, antes de estimar la probabilidad de un suceso. En nuestro ejemplo, habra que
haber tirado el dado en varias oportunidades para luego calcular las probabilidades.

La crtica ms importante a la definicin de Frechet, es que no responde a la
pregunta cuantas veces hay que repetir el experimento? La respuesta es: un nmero
suficientemente grande de veces; y es esto lo que quiso corregir Von Mises.

Definicin de Von Mises: La probabilidad del suceso A corresponde a la
frecuencia relativa de ocurrencia de A, es decir, el cuociente entre el nmero de veces
en que dio como resultado A (nA) y un nmero suficientemente grande de veces en que
se repiti el experimento: El lmite al que tiende la frecuencia relativa, cuando n tiende
a infinito.

) / ( lim ) ( n nA A P
n
=

Un problema bsico con esta definicin, es que no es posible repetir un
experimento infinitas veces.

Definicin axiomtica (Kolmogorov): Una probabilidad es una funcin:

P: - -----------------------> {0,1}
A ----------------------------> P(A), tal que:
25

i) P () = 1
ii) P (A) > 0 A -
iii) si A B = , entonces P (A B) = P(A) +P(B) (teorema de la o)

Definicin Al triplete (,-, P) se le denomina Espacio de probabilidades.

III.2.- Probabilidades y Conjuntos

Es posible establecer analogas entre los conjuntos y las probabilidades:

Conjunto universo: .
Conjunto vaco (): suceso imposible.
Elemento de -: suceso.
A B: sucede A o sucede B o ambos.
A B: sucede A y sucede B.
A
C
: no sucede A.

Definicin Dos sucesos A y B sern mutuamente excluyentes si la ocurrencia
de A que no ocurre B. As, si A B = entonces A y B son mutuamente
excluyentes.

Definicin Dos sucesos A y B son complementarios si la no ocurrencia de A
la ocurrencia de B y a la inversa. Es decir A
C
= B. Notemos que A B = , es decir,
constituyen una particin de omega. Observemos tambin que los sucesos
complementarios son mutuamente excluyentes, pero no todos los sucesos excluyentes
son complementarios.

Una definicin de probabilidad de un suceso, asociada a la nocin conjuntista, es
P(A) = m(A) / m(), en que m(A) y m() representan alguna medida del suceso y del
espacio muestral respectivamente. Un ejemplo de esta medida es el cardinal de A y
de omega (P(A) / #(A) / #())

26

III.3.- Propiedades de las Probabilidades

I) P () = 0

Demostracin Sea A = y B = , como A B = , entonces usando las propiedades
1 y 3 de la definicin axiomtica, P (A B) = P( ) = 1 = P(A) + P(B) = 1 + P(B),
entonces P(B) = P( ) = 0.

Ejemplo 2.-

La probabilidad que salga 0 al tirar un dado es P(0) = P() = 0.

II) Aditividad finita: Si A
i
B
i
= , para cualquier i, j, entonces P ( A
i
) = P (A
i
)

Demostracin por extensin directa de la propiedad 3.

Ejemplo 3.-

Si tiro una vez un dado, la probabilidad que salga 5 o 6 es P(5 o 6) = P(5) + P(6)
= 1/6 +1/6 = 2/6, pues los sucesos sale 5 y sale 6 son excluyentes.

IV) Probabilidad del Complemento: P (A
C
) = 1 P(A)

Demostracin P() = 1 = P(A
C
A) = P(A
C
) + P(A).

Ejemplo 4.-

Si la probabilidad de que un individuo lea el diario es p = 0.2, entonces la
probabilidad que no lo lea es q = 1-p = 1-0.2 = 0.8.

IV) Monotona: Si A B, entonces P(A) < P(B)

Demostracin Si A B, #A #B, entonces P(A) < P(B)

Ejemplo 5.-

La probabilidad de encontrar un gato negro es menor que la de encontrar un gato,
pues los gatos negros son un sub-conjuto del conjunto de los gatos.

27
V) Probabilidad Compuesta: P(A B) = P(A) + P(B) P(A B)

Demostracin P(A B) = #(A B)/#() =[#(A) + #(B) - #(A B)]/ #() = #(A)/
#() + #(B)/ #() - #(A B)/ #() = P(A) + P(B) P(A B).

Es posible extender este teorema a ms de 2 conjuntos, por ejemplo: P(A B C)=
P(A) + P(B) + P(C) P(A B) P(A C) P(B C)+ P(A B C)

Ejemplo 6.-

Si se tienen 60 alumnos, entre los cuales 15 slo toman un curso de matemticas
(M); 20 slo de fsica (F); 10 slo de qumica (Q); 4 M y F; 5 F y Q; 6 M y Q y ninguno
M F y Q. Entonces la probabilidad que un alumno tome matemticas o fsica es : P(M
F) = P(M) + P(F) P(M F) = (15+6+4)/60 +(20+4+5)/60 4/60 = 50/60 =5/6
(Haga un diagrama de Venn, para una mejor comprensin del problema).

VI) Probabilidad que ocurra al menos un evento:

P( A
i
)= 1 P( A
i
C
), lo que se interpreta como P(alguno) = 1 P (ninguno)

Demostracin Por teorema de De Morgan ( A
i
)
C
= ( A
i
C
) entonces aplicando la
propiedad del complemento P( A
i
)= 1 P[( A
i
)
C
] = 1 -P( A
i
C
).

Ejemplo 7.-

Si de dos personas, la probabilidad que muera la primera (p)es 0.1 y la
probabilidad que muera la segunda (s) es 0.01, entonces la probabilidad que muera
alguna P(alguna) = 1- P(ninguna) = 1- 0.9x0.99 = 0.109.

III.4.- Independencia Estocstica y Probabilidad Condicional

Definicin Dos sucesos A y B se dirn independientes si la ocurrencia de uno
no influye en la ocurrencia del oro.

Ejemplo 8.-

Sean los sucesos A= llueve en Santiago, B = Juan duerme y C = hacemos un
asado. Los sucesos A y B son probablemente independientes; no as los sucesos A y
C.

28
Probabilidad condicional Definiremos probabilidad del suceso A, dado que ocurri el
suceso B (condicin) al cuociente:

) (
) (
) / (
B P
B A P
B A P

=

Podemos ahora hacer una definicin ms formal de sucesos independientes: A y
B son independientes si P(A/B) = P(A). Entonces, despejando P(A B) en la
definicin anterior, se sigue inmediatamente el siguiente teorema:

Teorema de la probabilidad conjunta Si A y B son independientes, entonces P(A
B) = P(A) P(B) (teorema de la y)

Definicin El conjunto {B
i
} constituir una particin de si i) B
i
B
j
= i,
j y ii) B
i
= .

Teorema de la probabilidad total Dado un suceso A y una particin de {B
i
},
entonces:

=
i
i i
B P B A P A P ) ( ) / ( ) (

Demostracin: A = (A B
1
) (A B
2
) ... (A B
n
) Como (A B
i
) (AB
j
) =
, i, j, por el teorema de la o

P(A) = P(A B
1
) + P(A B
2
) + ... P(A B
n
) = P(A B
i
) y por la definicin de
probabilidad condicional,

P (A) = [P(A/B
i
) P(B
i
)]

Teorema de Bayes Dado un suceso A y una particin {B
i
} entonces,

=
j j j
i i
i
B P B A P
B P B A P
A B P
) ( ) / (
) ( ) / (
) / (

Demostracin Por definicin P(B
i
/A) = P(B
i
A)/P(A) y por lo tanto,

P(B
i
/A) = P(A/B
i
) P(B
i
)/P(A) y aplicando el teorema de la probabilidad total,
29

P(B
i
/A) = P(A/B
i
) P(B
i
) / [P(A/B
j
)P(B
j
)]

Ejemplos 9-13.-

9.- Se lanza una moneda tres veces. a) Cul es su espacio muestral? b) Cul es la
probabilidad de obtener exactamente 2 caras? c) cual es la probabilidad de obtener al
menos 2 caras d) cual es la probabilidad de que los tres lanzamientos sean iguales?

R: a) = {ccc, ccs, csc, css, scc, scs, ssc, sss}
b) Los nicos resultados en que salen exactamente dos caras son: {2c} = (ccs,
csc, scc) es decir hay 3 casos favorables, o, de otra manera, la medida o
cardinal de este suceso es 3.- Los casos posibles (o el cardinal del espacio
muestral) son 8, entonces, P(2c)/m(omega) = casos favorables/casos posibles
= 3/8.
c) P(2c o 3c) = P(2c U 3c) = P(2c) + P(3c) = 3/8 +1/8 = .
d) P(3c o3s) = P(3c U 3s) = P(3c) + P(3c) = 1/8 + 1/8 =

10.- De un grupo de 200 estudiantes, 137 se inscribieron en Biologa, 50 en
Matemticas, y 124 en Zoologa. El nmero de inscritos en Biologa y Matemticas es
33, en Matemticas y Zoologa es 29 y en Biologa y Zoologa es 92. Los inscritos en
las tres clases es 18. Al escoger un alumno al azar de los 200: a) Cul es la
probabilidad de que est en Biologa o Matemticas? b) Cul es la probabilidad que no
est en ninguna clase?

R: P(B) = 137/200; P(M) = 50/200; P(Z) = 137/200; P(B M) = 33/200; P(M Z) =
29/200; P(B Z) = 92/200; P(B M Z) = 18/200.
a) P(B M) = P (B) +P(M) P(B M) = (137+50-33)/200 = 154/200.
b) la probabilidad de que est en al menos una clase es P (B M Z) entonces la
probabilidad de que est en ninguna es P(0) = 1-P(B M Z)

P(B M Z) = P(B) + P(M) + P(Z) P(B M) P(B Z) P(M Z) + P(B M
Z) = (137 + 50 + 124-33-29-92+18)/200 = 7/8, por lo que P(0) = 1-7/8 =1/8.

11.- Se estudian 98 perros con sospecha de hepatitis. Se les palpa el hgado
clasificndolo en: 0: no se palpa, 1: aumentado de tamao, 2: muy aumentado de
tamao. A los mismos perros se les hace biopsia heptica y se obtiene:
30

Lesin
heptica
Tamao del hgado
0 1
2 Total
Cirrosis 1 4 12 17
Hematoma 8 13 14 25
Esteatosis 12 8 9 29
Sin lesin 9 15 3 27
Total 30 40 28 98

Sea C: el perro es cirrtico, y T2: el hgado tiene tamao.
Determine a) P(C), b) P(T2), c) P(C T2) d) son independientes C y T2?

R: a) P(C) = 17/98
b) P(T2) = 28/98
c) P(C T2) = P(C/T2) P (T2) = 12/28 28/98= 12/98
d) P(C/T2) = 12/28 = P(C) = 17/98, entonces no son independientes.

12.- En una caja hay 4 huevos de gallina, 10 de pato y 8 de ganso. Si son frtiles 4 de
cada 5 de gallina, 6 de cada 7 de pato y 11 de cada 12 de ganso. Al sacar un huevo:

a) Cul es la probabilidad que sea frtil?
b) si fue frtil, cual es la probabilidad de que sea de gallina?

R.- P(G) = 4/22, P(P) = 10/22, P(Gz) = 8/22, P(F/G) = 4/5, P(F/P) = 6/7 y P(F/Gz) =
11/12.
a) Los sucesos G, P y Gz constituyen una particin de , pues G P Gz =
y G P Gz = . Entonces por teorema de la probabilidad total:

P(F) = P(F/G P (G) + P(F/P) P (P) + P(F/Gz) P (Gz) = 0.868.
b) P(G/F) por teorema de Bayes, es P(G/F) = P(F/G) P(G)/P(F) = 0.168.

13.- Se quiere saber la bondad de la radiografa en el diagnstico de la piometritis en
perros. Se estudian entonces 20 perras con piometritis y 40 perras sin piometritis, y se
anotan las radiografas que sugirieron tal diagnstico. Se registraron los siguientes
resultados:
31

Radiografa (+) para pm (-) para pm Total

Animales con pm 13 7 20
Animales sin pm 8 32 40
Total 21 39 60

a) Cul es la probabilidad de que se encuentre una radiografa positiva dado que la
paciente tiene piometritis? (concepto de sensibilidad de un examen)

b) Cul es la probabilidad de que la radiografa sea negativa dado que la paciente no
tiene piometritis? (concepto de Especificidad de un examen)

c) con estos datos que concluira acerca de este examen

R: a) Sensibilidad: P(e+/dg+) = 13/20 = 0.65

b) Especificidad: P(e-/dg-) = 32/40 = 0.80

c) No es un buen examen, pues es capaz de detectar slo el 65% de los casos, en
pacientes con la patologa. De los casos en que la radiografa sale positiva,
slo un 80% efectivamente son piometritis.

III.5.- Probabilidades en Medicina

Probabilidades en el diagnstico

Un concepto til muy usado en medicina que se relaciona con probabilidad es la
chance (odds). Esta se puede definir como la razn entre la probabilidad de ocurrencia
de un suceso (p) y la probabilidad complementaria de que ste no ocurra (1-p):

p
p
O
=
1

Este concepto tiene un uso habitual y se relaciona bi-unvocamente con la
probabilidad p. Por ejemplo el decir que tengo una chance de O = 4/1 de ganar un
partido es equivalente a decir que la mi probabilidad de ganar es p = 4/(4+1) = 0.8.

32
En medicina es habitual el uso de exmenes para el diagnstico de enfermedades.
Sin embargo los exmenes no son 100% certeros para hacer el diagnstico. A veces un
individuo posee una enfermedad y el examen sale negativo (falso negativo) y otras
veces sale positivo para la enfermedad y el paciente no la tiene (falso positivo). Es
posible representar esto en la siguiente tabla:

EXAMEN
+ - Total
ENFERMO A B a +b
NO ENFERMO C D c+d
Total a+c b+d n = a+b+c+d

En este caso, los falsos positivos seran c y los falsos negativos seran b.

A partir de esta tabla se pueden definir ciertos conceptos:

La Sensibilidad de un examen corresponde a la probabilidad que el examen salga
positivo dado que el paciente est enfermo:

b a
a
E P S
+
= + = ) / (

Representa la capacidad del examen de detectar la enfermedad. La Especificidad
del examen corresponde a la probabilidad de que el examen salga negativo dado que el
paciente no tiene dicha enfermedad (aunque tenga otra):

d c
d
noE P Sp
+
= = ) / (

Es decir, mide la capacidad del examen de responder a esa y slo a esa
enfermedad.

El Valor predictivo positivo corresponde a la probabilidad de que el paciente
est enfermo dado que el examen sali positivo, es decir mide la capacidad de
prediccin de la enfermedad:

c a
a
E P VPP
+
= + = ) / (

33
El Valor predictivo negativo corresponde a la probabilidad de que el paciente no
est enfermo dado que el examen sali negativo, es decir mide la capacidad de descarte
de la enfermedad.

d b
d
noE P VPN
+
= = ) / (

La certeza diagnstica corresponde a la probabilidad general de acertar P(C) =
(a+d)/n.

n
d a
C P
+
= ) (

Otra medida interesante es la razn o coeficiente de verosimilitud que se define
como la razn entre la probabilidad de un cierto resultado en el examen dado que el
paciente est enfermo, dividido por la probabilidad de ese mismo resultado, dado que no
lo est. Por ejemplo, para un resultado positivo:

Sp
S
noE P E P noE P E P LR
= + = + + =
1
)) / ( 1 /( ) / ( ) / ( / ) / (

Para un resultado negativo es fcil ver que:

Sp S LR / ) 1 ( =

En cierta medida LR mide la potencia de un examen: cuanto ms positivo es en
presencia que en ausencia de enfermedad.

Por ejemplo es interesante saber que sucede con un paciente que a priori tiene una
probabilidad P de tener una enfermedad, cuando se hace el examen y este sale
positivo. Su chance a priori es Oo = P/(1-P). En este caso interesa P(E/+), y por el
teorema de Bayes:

P(E/+) = P(+/E)P(E)/(P(+/E)P(E) + P(+/noE)P(noE) = SP/(SP + (1-Sp)(1-P)).

La probabilidad de que no tenga la enfermedad es P(noE/+) = 1 [SP/(SP+(1-
Sp)(1-P)] = (1-Sp)(1-P)/ /(SP+(1-Sp)(1-P)). Entonces su chance a posteriori es Op =
P(E/+)/P(noE/+) = SP/(1-Sp)(1-P), es decir la chance a posteriori es:

Oo LR Op =
34

entonces el coeficiente de verosimilitud acta como un factor potenciador de la
chance. Este mismo resultado es vlido para un resultado negativo.

Ejemplo 14.- Supongamos que para una enfermedad X, se est ensayando un
examen A y que en un estudio poblacional representativo se obtuvo:

EXAMEN A
+ - Total
ENFERMO de X 85 20 105
NO ENFERMO
de X
10 200 210
Total 95 220 315

Entonces, la prevalencia de la enfermedad se estima en: p = 105/315 = 0.33 y la
chance de un enfermo de tener dicha enfermedad antes de hacerse el examen es: O
0
=
0.33/(1-0.33) = 0.5, es decir 1es a 2. La sensibilidad del examen es S = 85/105 = 0.81; la
especificidad es Sp = 200/210 = 0.952; el valor predictivo positivo es VPP = 85/95 =
0.894; el valor predictivo negativo es VPN = 200/220 = 0.909; la probabilidad de
certeza es C = 285/315 = 0.904 y el LR(+) = 0.81/(1-0.952) = 16.875. As, si a un
paciente le sale el resultado positivo, entonces ahora su chance de tener la enfermedad
es: Op = 0.5x16.875 = 8.44, es decir alrededor de 8 a 1.
Probabilidades en el tratamiento

Cuando se ensaya un tratamiento en general se dispone de dos grupos, uno que no
recibe el tratamiento (grupo control) y otro que lo recibe (grupo experimental) y se
mide un cierto efecto o evento, en general negativo (i.e. muerte).

Esto se representa en una tabla del tipo:

Control Experimental Total
Evento A B A+b
No evento C D C+d
Total A+c B+d N=a+b+c+d

Se define como tasa de evento en el control:

c a
a
control evento P CER
+
= = ) / ( y tasa de evento en el grupo experimental:

35
d b
b
ex evento P EER
+
= = ) / (

Estas tasas miden los riesgos absolutos de presentar cierto evento en situacin
control y en situacin experimental. De aqu surgen varias medidas tiles. Primero es
interesante medir el riesgo relativo RR = EER/CER, que indicar si es mayor que 1 un
aumento en el riesgo, y si es menor que 1 una disminucin en ste:

CER EER RR / =

Otra medida importante es la reduccin en el riesgo absoluto producida por el
tratamiento experimental: reduccin de absoluta del riesgo:

EER CER ARR =

Por ejemplo si la ARR = 0.01 significa que uno de cada cien saldrn beneficiados
con el tratamiento, o de otra manera habra que tratar 100 para beneficiar a uno. En otras
palabras el nmero necesario para beneficiar a uno es:

ARR NNT / 1 =

Otra medida de menor inters es la reduccin relativa del riesgo:

CER EER CER RRR / ) ( =

Esta representa la baja porcentual en el riesgo producida por el tratamiento.

Ejemplo 15.- Se est ensayando un nuevo tratamiento Y para una enfermedad
de alta mortalidad y se obtiene:

Tratamiento
antiguo (control)
Tratamiento Y Total
Fallecidos 20 5 25
Vivos 90 100 190
Total 110 105 215

Se puede observar que la tasa de mortalidad control es CER = 20/110 = 0.182,
mientras que la tasa experimental es EER = 5/105 = 0.048. As la reduccin absoluta del
riesgo con el nuevo tratamiento es ARR = 0.18-0.048 = 0.134 y entonces al tratar NNT
= 1/0.134 = 7.44, aproximadamente 8 pacientes se obtendr al menos un beneficiado. La
reduccin relativa del riesgo es RRR = 0.134/0.182 = 0.736, es decir un 73.6%.
36

Probabilidades en la etiologa

Muchas veces es necesario indagar en las causas de las enfermedades. A veces se
sospecha de un agente causal y se procede con estudios que pueden ser de dos tipos: i)
Seguimiento de cohortes que consiste en el seguimiento de dos grupos a lo largo del
tiempo (seguimiento longitudinal) uno expuesto al factor sospechoso y el otro no
expuesto, para estudiar despus cuantos desarrollan la enfermedad en cada grupo (por
ejemplo tabaco y cncer bronquial); e ii) Estudio de casos y controles que consiste en
la eleccin de dos grupos, el primero de enfermos y el segundo de no enfermos,
estudiando en ellos cuantos de stos estuvieron expuestos al factor. En este caso es un
estudio transversal. Cualquiera sea el tipo de estudio en general se expresa en la
siguiente tabla:

Caso (enfermo) control (no
enfermo)
Total
Expuesto A B a+b
no expuesto C D c+d
a+c b+d n=a+b+c+d

Aunque la tabla sea la misma las medidas tiles son distintas. En el caso de un
estudio de cohortes tiene sentido estudiar el riesgo de tener la enfermedad cuando se est
expuesto EER = a/(a+b) y cuando no se est expuesto CER = c/(c+d) y en este caso el
aumento absoluto del riesgo al estar expuesto:

CER EER ARA =

El riesgo relativo:

CER EER RR / =

Y el aumento relativo del riesgo:

CER CER EER RRA / ) ( =

En este caso el nmero necesario de expuestos para que haya 1 enfermo es:

ARA NNH / 1 =
37

Ejemplo 16.- Supongamos que se realiza un experimento con ratones donde se
deja reproducir parejas en dos ambientes, uno con fertilizantes y otro sin fertilizantes.
Despus de un tiempo largo se estudia la presencia de malformaciones congnitas en las
cras, obteniendo:

Cras con
malformaciones
Cras sin
malformaciones
Total
Expuestos a
fertilizantes
25 100 125
No expuestos 16 200 216
41 300 341

En este caso la tasa de eventos de los no expuestos es CER = 16/216 = 0.074 y, en
el caso de los sujetos experimentales es: EER = 25/125 = 0.2. As el aumento absoluto
del riesgo es ARA = 0.2-0.074 = 0.126 y el nmero de individuos expuestos para que
ocurra al menos una malformacin es NNH = 1/0.126 = 7.93 individuos. El aumento
relativo del riesgo es RRA = 0.126/0.074 = 1.70, es decir de un 170%, al estar expuestos
a fertilizantes. El riesgo relativo es RR = 0.2/0.074 = 2.70, es decir, al estar expuestos el
riesgo es 2.7 veces el riesgo que se tiene al no estar expuesto.

En el estudio de casos y controles no tiene sentido el clculo de riesgos
directamente de la tabla porque los totales marginales de la derecha no son los expuestos
o no expuestos sino las sumas de los individuos que tienen antecedentes de exposicin.
Entonces una buena medida del riesgo y que se interpreta de la misma manera es la
razn de disparidades de la chance (Odds ratio (OR)). Esta corresponde a la razn entre
la chance de tener el factor de exposicin cuando se es un caso Oc = [a/(a+c)]/[c/(a+c)]
= a/c y la chance de tener el factor de exposicin cuando se es un control Oo = b/d. De
esta manera la razn de disparidades es:

bc
ad
d b
c a
OR = =
/
/

En este caso tambin es posible estimar un nmero necesario de expuestos para
tener un caso a travs de: NNH = [PEER(OR-1) +1]/[PEER(OR-1)(1-PEER)], donde
PEER es alguna estimacin de EER.

Ejemplo 17.- Se piensa que el cigarrillo tiene relacin con el cncer de Vejiga,
entonces se realiza un estudio en pacientes con cncer de vejiga (casos) y en sujetos
38
normales, pareados por edad y sexo (controles). Se estudia en estos pacientes el
antecedente de consumo de cigarrillos, obteniendo:

Pacientes con
Cncer de Vejiga
Controles
normales
Total
Fumadores 56 26 82
No fumadores 120 200 320
176 226 402

En este caso la chance de fumar en pacientes con cncer de vejiga es: 56:120,
mientras que cuando no se tiene este cncer es de 26:200. As la razn de disparidades
es OR = 56x200/(26x120) = 3.59. As si por ejemplo la prevalencia de cncer de vejiga
en fumadores fuera PEER = 0.03, entonces NNH =[0.03(3.59-1)+1]/[0.03(3.59-1)(1-
0.03)] = 14.3.

39

Ejercicios de Probabilidades

1. Se tira una moneda 3 veces y se observa la secuencia de caras y sellos que aparecen.
El espacio muestral es:
= {CCC, CCS, CSC, SCC, CSS, SCS, SSC, SSS}
Sea A el evento que aparezcan dos o ms caras consecutivas, y B, que sean todas cara
o todas sello. Calcular P(A), P(B) y P(AB).
R: 3/8; 1/4; 1/8.

2. Calclese la probabilidad de obtener un 1 o un 5 al tirar un dado. Comprubelo
lanzando un dado y calculando la probabilidad obtenida (como frecuencia relativa)
con distintos N muestrales (5, 10, 20, 30). Haga lo mismo para obtener la
probabilidad de que salga un nmero par.
R: 2/6.

3. Una urna contiene 4 bolas blancas, 2 rojas y 2 verdes. Cul es la probabilidad de
sacar:
i) una bola roja de una bola sacada de la urna.
ii) una bola verde de una bola sacada de la urna.
iii) una bola blanca y una bola roja.
R: 1/4; 1/4; 2/7.

4. En un juego, un combate simulado es resuelto tirando dados. Para determinar si el
ataque de un jugador es exitoso si le salen un * o un al lanzar un dado de 20 caras.
Si el ataque resulta exitoso, se lanza un dado de 8 caras para determinar el dao
causado por el ataque. Supongamos que se necesita un valor mayor o igual a 17 para
atacar exitosamente al oponente.
i) Sea A el evento ataque exitoso, cul es P(A).
ii) Sea B el evento causar 5 o ms puntos de dao, cul es P(B).
iii) Si necesitas 6 o ms puntos de dao para matar a tu oponente, cul es la
probabilidad de matar a tu oponente en un ataque.
R: 1/10; 1/20; 3/160.

5. Una ruleta de casino tiene 37 nmeros, del 0 al 36. Excepto por el 0, el cual es verde,
la mitad de los nmeros son rojos (pares) y la otra mitad, negros (impares). Encuentre
la probabilidad de:
i) obtener un 18 en un solo tiro de ruleta.
ii) obtener un nmero rojo en un solo tiro.
iii) obtener un 5 o un nmero negro en un solo tiro.
iv) obtener un nmero rojo en el primer tiro y el cero en el segundo tiro.
40
R: 1/37; 18/37; 18/37; 18/1369.

6. En una encuesta realizada a 100 estudiantes de Ciencias, se obtuvo que 30 estaban
tomando el curso de bioestadstica, 20 estaban tomando qumica orgnica y 10
estaban los dos cursos. Si un estudiante es seleccionado al azar, cul es la
probabilidad de que est tomando bioestadstica o qumica orgnica?
R: 0.4.

7. En una competencia de tiro de dardos se tiene un blanco circular de 30 cm de radio.
La circunferencia menor tiene un radio de 5 cm. Si se tiran 3 dardos, y suponiendo
que todos los tiros caen dentro de la circunferencia mayor, cul es la probabilidad de
dar en el blanco (circunferencia menor) los tres tiros?.
R: 0.0000214.

8. Se tira una moneda y un dado a la vez.
i) Definir el espacio muestral .
ii) Expresar explcitamente los siguientes eventos; A = {sale cara y nmero par}, B =
{salga un nmero primo}, C = {salga sello y nmero impar}.
iii) Expresar explcitamente el evento que: a) A o B ocurra, b) B y C ocurra y c)
slo C ocurra. Determinar sus probabilidades.

9. En una cierta ciudad, 40% de la gente tiene pelo castao, 25% tiene ojos pardos y un
15% tienen ambas caractersticas. Si una persona es seleccionada al azar:
i) y tiene el pelo castao, cul es la probabilidad de que tambin tenga ojos
pardos.
ii) y tiene ojos pardos, cul es la probabilidad de que no tenga pelo castao.
iii) cul es la probabilidad de que no tenga ni los ojos pardos ni el pelo castao.
R: 0.375, 0.6, 0.5.

10. Se estima que el 15% del total de la poblacin adulta padece de hipertensin.
Adems se estima que el 75% de los adultos creen no tener este problema. Se estima
tambin que el 6% de la poblacin tiene hipertensin y no es consciente de tenerla. Si
un adulto opina que no tiene hipertensin, cul es la probabilidad de que la
enfermedad de hecho exista en este individuo?
R: 0.012.

11. Un estudio indica que el 10% de la poblacin de Chile tiene 75 aos o ms, y que el
1% de la poblacin total padece de deficiencia cardiaca moderada. Adems el 10.4%
de la poblacin tiene 75 aos o ms o padece de enfermedad cardiaca.
i) hallar la probabilidad de que un individuo tenga 75 aos o ms y padezca de
deficiencia cardiaca.
41
ii) si un individuo tiene 75 aos o ms, cul es la probabilidad de que padezca
de deficiencia cardiaca?
iii) si un individuo tiene menos de 75 aos, cul es la probabilidad de que
padezca la enfermedad?
R: i) 0.006; ii) 0.0006; iii) 0.0094.

12. Se realiza un experimento de tirar tres veces al aire una moneda. Considere tres
eventos: A = {la primera moneda sale cara}, B = {segunda moneda sale cara}, C =
{salen exactamente 2 caras en forma consecutiva (CCS o SCC)}. Son estos eventos
independientes entre si (analice parejas de eventos).
R: Independientes A con B; A con C; dependientes B con C.

13. En una escuela se estudia la desnutricin infantil, tratando de ver si el hecho de estar
o no desnutrido tiene que ver con el sexo del nio. De 1000 nios examinados, 100
presentan desnutricin; y de 500 nias, 49 presentan desnutricin. Afecta el sexo de
los nios al fenmeno de desnutricin?
R: Son eventos estocsticamente dependientes.

14. En una caja hay 4 huevos de gallina, 10 de pato y 8 de ganso. Si la probabilidad de
que los huevos sean frtiles es de 70% para la gallina, 80% para el pato y 90% para el
ganso:
i) cul es la probabilidad de que sea frtil?
ii) dado que fue frtil, cul es la probabilidad de que sea de pato?
R: 0.818; 0.445.

15. En un laboratorio se ha boicoteado el experimento de un investigador. Se sabe que
los otros 4 investigadores del laboratorio (A, B, C, D) han boicoteado anteriormente
otros experimentos. Haciendo una investigacin de las veces que han boicoteado
anteriormente, se estim las probabilidades de cada investigador de haber intervenido
en los experimentos. A tiene una probabilidad de 0.02; B, de 0.09; C, de 0.01; y D, de
0.05. Dado que el laboratorio tiene acceso restringido slo a estos 5 investigadores, y
que A, B y D trabajan slo 1 da a la semana, y que C trabaja 2 das a la semana
(todos en das distintos), quin es el boicoteador ms probable?.
R: B, con probabilidad 0.474.

16. En la universidad, 4% de los hombres y el 1% de las mujeres son ms altos que 1.85
m. Adems, se sabe que el 60% de los estudiantes son mujeres. Ahora, si un
estudiante es seleccionado al azar y mide ms de 1.85 m, cul es la probabilidad de
que el estudiante sea mujer?
R: 0.272.

42
17. A un grupo de individuos, algunos enfermos de cierta enfermedad (E) y otros no
(noE) se les practic cierto examen. En algunos de ellos el examen sali positivo (+)
y en otros no (-). Calcule la prevalencia (pv) de la enfermedad (proporcin de
individuos con la enfermedad), la chance a priori de estar enfermo (pv/(1-pv)), la
sensibilidad del examen, la especificidad, el VPP, el VPN, la certeza diagnstica, el
coeficiente de verosimilitud (LR), y la chance a posteriori de estar enfermo y de no
estarlo.

E NoE Total
731 270 1001
+ 78 1500 1578
- 809 1770 2579

R: O
0
+ = 0.45; O
0
-=2.22; S = 0.9; Sp = 0.85; VPP = 0.73; VPN = 0.95; P(C) = 0.87;
LR+ = 6; LR-=0.12; Op+=2.7; Op-=0.27.

18. Se estudia la respuesta de un grupo de pacientes a un nuevo tratamiento (NT), como
alternativa al tratamiento habitual (HT). Se mide la presencia de complicaciones propias
de la enfermedad (evento) en uno y otro grupo, obteniendo:

HT NT
Complicaciones (%) 9.6 2.8

Calcule el CER, EER, RR, ARR, RRR, y NNT. Comente sus resultados.
R: CER = 0.096, EER = 0.028, RR = 0.29, ARR = 0.068, RRR = 0.708, NNT = 15.

19. Se estudia la presencia (E) o ausencia (noE) de enfermedad en ciertos individuos,
algunos de los cuales estaban expuestos a cierto eventual factor de riesgo (F(+)). Los
resultados se resumen en la siguiente tabla:

E NoE Total
F(+) 58 22 80
F(-) 36 44 80
94 66 160

Calcule el RR de la exposicin al factor, el ARA, el RRA y el NNH. Interprete sus
resultados.
R: RR = 1.61, ARA = 0.275, RRA = 0.61, NNH = 4.
43

20. Se estudia la relacin entre cierto factor de riesgo (F(+)) y una cierta enfermedad.
Para ello se toma un grupo de enfermos (E) y otro de sanos (controles: noE), midiendo
en ellos la presencia o ausencia de dicho factor. Los resultados se resumen en la
siguiente tabla:

E NoE
F(+) 58 22
F(-) 36 44
94 66

Calcule la OR y el NNH en un paciente en que esperamos que el riesgo a priori (PEER)
sea similar al de la tabla.
RR: OR = 3.22, NNH = 6.
44

IV.- VARIABLES ALEATORIAS

Definicin: Llamaremos variable aleatoria (v.a) a una funcin definida
X: ------> R, tal que para cada punto del codominio, su preimagen es un suceso.

Ejemplo 1.- Sea el experimento se tira 2 veces una moneda = {cc, cs, sc,ss}
Podemos definir la variable aleatoria X = nmero de caras. As para X = 0 su preimagen
es el suceso (ss), para X = 1 su preimagen es (cs) (sc) y para X = 2 su preimagen es
(cc).

Las variables aleatorias pueden ser discretas si slo pueden tomar un nmero k N
valores distintos, en todo otro caso, son continuas.

IV.1.- Distribucin de una variable aleatoria

Variables discretas

Definicin Si X es una variable aleatoria discreta (vad) , llamaremos funcin de
cuanta a:

P(X = x), si x al rango de X (Rx)
p(x) =
0 si x Rx

Adems, llamaremos funcin de distribucin a F(x) = P(X x) = p(x
i
)
x
i
x

Se puede observar que F(x) es la funcin acumulada de p(x).

Ejemplo 2.-

Si se tiran 2 monedas y se define la variable aleatoria X = nmero de caras,
entonces P(X = 0) = , P(X = 1) = y P(X= 2) = . Entonces:

X p(x) F(x)
0 0.25 0.25
1 0.50 0.75
2 0.25 1.00

45
Las caractersticas fundamentales de una variable aleatoria son la esperanza y la
varianza

Definicin: Llamaremos Esperanza de una v. a a la cantidad:

E[X] = xi pi

Llamaremos varianza de una v. a. a la cantidad:

V[X] = E (X E[X])
2
= E[X
2
] (E[X])
2

As en nuestro ejemplo, la esperanza es E[X] = 00.25+10.50+20.25 = 1, y la
varianza es V[X] = 00.25+ 1
2
0.5+2
2
0.25 1
2
= 1.5 1 = 0.5.

Se puede observar que la esperanza corresponde al promedio ponderado de una
variable aleatoria y tiene la misma estructura que el promedio definido para series
agrupadas en estadstica descriptiva y = hiyi. Del mismo modo el histograma de
frecuencias representa la funcin de cuanta y el histograma acumulado, la funcin de
distribucin. La varianza representa la variabilidad de la variable en torno a la
esperanza.

Ejemplos 3-4.-

3.- El concepto de esperanza matemtica surgi de las matemticas financieras.
Supongamos que a alguien se le ofrece el siguiente negocio: invierte $100, y con este
dinero se tiene una probabilidad de 0.2 de perderlo todo, 0.2 de quedar igual, 0.4 de
duplicar la inversin y 0.2 de triplicar la inversin. Convendra aceptar el negocio?

Sea la variable aleatoria X = retorno; entonces P(X=0) = 0.2 P(X = 100) = 0.2; P(X =
200) = 0.4 y P(X = 300) = 0.2. Entonces, E[X] = 0.0.2 + 100.0.2 + 200.0.4 + 300.0.2 =
160.

Como la esperanza del retorno (160) es mayor que la inversin (100), el negocio parece
conveniente.

46
4.- Un alumno ha dado 100 pruebas de matemticas con los siguientes resultados:

Nota n de veces que la ha
obtenido
1 1
2 4
3 10
4 40
5 30
6 12
7 3

Se enfrenta a una nueva prueba de matemticas qu nota esperamos que saque
(esperanza)? Cul es la varianza?

Sea la v. a. X = nota. Entonces P (X = 1) = 0.01, P(X = 2) = 0.04, P(X=3) = 0.1, P(X=4)
= 0.4, P(X=5) = 0.3, P(X=6) = 0.12 y P(X = 7) = 0.03. E[X] = 0.011 + 0.042 + 0.13 +
0.44 + 0.35 + 0.126 + 0.037 = 4.42 (Observacin: La esperanza corresponde al
promedio)

E[X
2
] = 0.041
2
+ 0.042
2
+0.1.
2
+0.44
2
+ 0.35
2
+ 0.126
2
+0.037
2
= 20.76; (E[X])
2
=
(4.42)
2
= 19.54, y entonces, V[X] = 20.76 19.54 = 1.22 (Observacin: La varianza
corresponde a una medida de la dispersin de los valores en torno al promedio)

Algunas propiedades de la esperanza

i) E[constante] = constante, V[constante] = 0
ii) E[a + X] = a + E[X], V[a+X] = V[X]
iii) E[aX] = aE[X], V[aX] = a
2
V[X]
iv) E[(X-E[X])] = 0 (demustrelo)
v) E[X+Y] = E[X]+E[Y]
vi) Si X e Y son independientes E[XY] = E[X]E[Y]

Observacin: Si examinamos E[(X-E[X])(Y-E[Y])], vemos que es equivalente a
E[XY+E[X]E[Y]-E[X]Y-E[Y]X] =E[XY] + E[X]E[Y] - E[X]E[Y] - E[X]E[Y] =
= E[XY] - E[X]E[Y]. Si X e Y son independientes, entonces esta cantidad es 0, pero
si son dependientes, entonces es distinta de 0. A esta cantidad se le conoce como
Covarianza entre X e Y y representa la variabilidad conjunta de ambas variables
aleatorias:

COV[X,Y] = E[XY]-E[X]E[Y].

47

Ejercicios Propuestos

1.- Se dividi el pas en 5 regiones y se analizaron las deposiciones de ganado vacuno
obtenindose la siguiente informacin

Regin Total de vacas
en la regin
Deposiciones
con parsitos
Deposiciones sin
parsitos
A1 10000 1240 1867
A2 200000 981 2008
A3 60000 2496 2608
A4 30000 864 981
A5 700000 1021 1564

a) Cul es la probabilidad de que una vaca tenga parsitos en la regin A3? R: 0.489

b) Cul es la probabilidad de que una vaca tenga parsitos en el pas b1) si
suponemos que es igualmente probable que venga de cualquier regin? b2) si
suponemos que la probabilidad de que venga de la regin Ai= n vacas en Ai/n total de
vacas R: 0.422 y 0.389 respectivamente.

2.- Se lanza un dado dos veces. Cul es el espacio muestral? Cul es la probabilidad
de obtener 2 nmeros iguales? Cul es la probabilidad de sacar un 1 y un 5? Cul es
la probabilidad de sacar primero un 1 y despus un 5?
R: 1/6; 2/36; 1/36.

3.- En una pieza hay 100 cachorros. Algunos de ellos Beagle y otros Poodle.
Algunos de ellos sanos y otros enfermos.

Beagle Poodle Total
Sanos 40 30 70
Enfermos 20 10 30
Total 60 40 100
Si una persona
compra un
perro al azar.
Cul es la
probabilidad de
que sea
Beagle?

Son independientes los sucesos el perro es sano y el perro es Beagle? R: 0.6; no.

48
4.- Se va a realizar una ciruga de esfago a 2 gatos. Se sabe que en esta ciruga muere
el 1%. Cual es la probabilidad de que: a) mueran los 2 gatos b) muera slo 1 c)
ninguno muera
R: 0.0001; 0.0198; 0.9801.

5.- Un procedimiento quirrgico slo se puede realizar 3 veces. Si la probabilidad de
que este procedimiento sea exitoso es 0.25. Cul es la probabilidad de salvar al
paciente?
R: 37/64.

6.- La enfermedad x se puede tratar con C o con M. El 80% de los varones prefiere C;
el 90% de las mujeres prefiere M. Si el 60% de los enfermos son varones. Cul es la
probabilidad de tratar un enfermo con M? R: 0.48.

7.- Sea la variable aleatoria X = suma de los puntos al lanzar 2 veces un dado. a)
encontrar P(X=k) para todo k. b) graficar la funcin de cuanta y a funcin de
distribucin c) Encontrar E(X) y V[X] R: 7;5.83.

IV.2.- Distribucin de Bernoulli

Si se tiene un experimento con un resultado dicotmico, por ejemplo xito o
fracaso, y la probabilidad de xito es p, entonces la probabilidad de fracaso es q = 1-p.
Este tipo de experimento se conoce como ensayo de Bernoulli. Si creamos la variable
aleatoria X de tal manera que X = 0 si es un fracaso y X = 1 si es un xito, entonces
podemos ver que su funcin de cuanta y su funcin de distribucin son:

X P(x) F(x)
0 1-p = q 1-p = q
1 P 1

Adems E[X] = 1p+0q = p, y V[X] = 1
2
p +0
2
q p
2
= p-p
2
=p(1-p) = pq.

Definicin Diremos que la variable X definida como lo hemos hecho, asociada a
un experimento dicotmico tiene distribucin de Bernoulli.

IV.3.- Distribucin binomial

Si consideramos un experimento que consiste en n ensayos de Bernoulli, y
definimos la variable aleatoria discreta: X = n de xitos, entonces X tiene distribucin
Binomial. Por ejemplo, si la probabilidad de xito de cada ensayo es p y lo repetimos n
veces, entonces la probabilidad que en estos n ensayos haya k xitos es:

49

k n k
p p
k
n
k X P

|
|
.
|
\
|
= = ) 1 ( ) (

Vemos que una vad con distribucin binomial es caracterizada por 2 parmetros:
n y p, entonces se abrevia B(n,p). Observamos que la distribucin binomial consta de n
ensayos fijos e independientes, cada uno dicotmico en su resultado y con una
probabilidad constante (p) de xito.

Como es de esperar E[X] = np, pues es la suma de n ensayos de Bernoulli.
Adems V[X] = npq.

Demostracin La esperanza E[X] = kP(X=k) =
=

=
=

=
=
=
=

=
=
|
|
.
|
\
|
n k
k
k n k k n k
n k
k
k n k
n k
k
q p
k n k
n
np q p
k n k
n
k p p
k
n
k
1
1
0 0 )! ( )! 1 (
)! 1 (
)! ( !
!
) 1 (

=
=
= + =
|
|
.
|
\
|
= = =
m j
j
m j m j
np q p np q p
j
m
np n m y k j haciendo
0
) ( ; 1 , , 1 ,

La varianza V[X] = k
2
P(X=k) (E[X])
2
= (k
2
- k + k)P(X=k) (E[X])
2
= (k(k-
1)P(X=k) + kP(X=k) (E[X])
2
, lo cual utilizando el mismo juego de sub-ndices
lleva a: n(n-1)p
2
+ np n
2
p
2
= npq.

Esta distribucin es muy importante en ciencias pues es muy habitual poder
reducir un experimento a una situacin dicotmica, por ejemplo cuando contamos el
nmero de individuos con una caracterstica, si la tiene (xito) o si no la tiene (fracaso).
Sin embargo esta distribucin sigue siendo discreta y tiene el problema que se genera al
calcular nmeros combinatorios con grandes valores de n.

Esta distribucin tiende a ser asimtrica para bajos valores de p y n, pero es
simtrica si p y n son altos.

Ejemplo 5.-

Si la probabilidad que un individuo lea el diario es p = 0.2 y se toman al azar 10
individuos, entonces la probabilidad que en stos 10, exactamente 3 lean el diario es:

2013 . 0 8 . 0 2 . 0
3
10
) 3 (
7 3
=
|
|
.
|
\
|
= = X P

50
Observacin Si de un universo de N elementos en los cuales una proporcin p de
ellos tiene un atributo, sacamos n elementos; entonces la probabilidad que en estos n
haya k con el atributo es:

|
|
.
|
\
|
|
|
.
|
\
|
|
|
.
|
\
|
= =
n
N
k
Np
k n
Np N
k X P ) (

Esta variable tiene distribucin hipergeomtrica y E[X] = np y V[X] = npq(N-
n)/(N-1). Es fcil darse cuenta que si N es muy grande (tiende a ) la toma de cada
elemento no altera la probabilidad de atributo del siguiente elemento y, entonces cada
ensayo se vuelve de tipo Bernoulli. As si en una vad con distribucin hipergeomtrica,
N , su distribucin se vuelve binomial (B(n,p)). Esto es tambin evidente al
observar que el lmite cuando N de V[X] es npq. Entonces se puede considerar a
la distribucin binomial como una distribucin asinttica para poblaciones infinitas.

Ejemplo 6.-

Si en una urna hay 10 bolas rojas y 6 azules y se escogen al azar 5, la
probabilidad que en stas 5 haya 2 rojas es:

|
|
.
|
\
|
|
|
.
|
\
|
|
|
.
|
\
|
= =
5
16
2
10
3
6
) 2 ( X P

IV.4.- Distribucin de Poisson

Un hecho importante en la distribucin B(n,p) es que es muy asimtrica para
valores bajos de p, a pesar de valores altos de n. Entonces es interesante estudiar que
sucede si
n y p 0 manteniendo constante np = .
k n k
p p
k
n
k X P

|
|
.
|
\
|
= = ) 1 ( ) ( = n(n-1)(n-2)(n-k+1)(/n)
k
(1-/n)
n-k
/(k!) =

= [
k
/k!][1(1-1/n)(1-2/n)(1-(x-1)/n)](1-/n)
n
(1-/n)
-k

51
y tomando lmite cuando n , = [
k
/k!]111e
-
1 = [
k
/k!]e
-
.

Entonces si N es grande y p pequea (en general np < 0.1) la probabilidad de k
xitos en n ensayos sigue a:

!
) (
k
e k X P
k
= =

Se dice entonces que esta variable tiene distribucin de Poisson. En este caso,
E[X] = V[X] = .

Demostracin
Para la esperanza, se tiene que

= =
=

e e
k
e
k
e k
k
k k
k 1
1
0 )! 1 ( !

Para la varianza,

=

= + = + =
0
2 2 2
0
2 2
] [
!
) ) 1 ( ( ] [
! k k
k k
e e x E
k
e k k k X E
k
e k

Ejemplo 7.-

Si la probabilidad de que una mquina produzca un artculo defectuoso es p =
0.0003, entonces la probabilidad que en 100 artculos haya 2 defectuosos es:

000437 . 0
! 2
03 . 0
) 2 (
2
03 . 0
= = =

e X P

Si un fenmeno ocurre X(t) veces en un intervalo [0,t), como ocurre por ejemplo
en la llegada de llamadas telefnicas, la emisin de partculas, accidentes etc... Y
adems la probabilidad de una ocurrencia de ste fenmeno es proporcional al intervalo
(P(una o ms ocurrencias en [t,t+) ) = + o(), donde o() es la probabilidad de que
ocurra ms de uno), entonces el nmero de ocurrencias (k) en un plazo fijo (t) se
conoce como un proceso de Poisson y tiene distribucin de Poisson con parmetro t:

!
) (
) (
k
t
e t P
k
t
k

=

52
Ejemplo 8.-

Si en una central telefnica llegan 3 llamadas/minuto, entonces la probabilidad
que en 2 minutos lleguen 4 llamadas es:

134 . 0
! 4
) 2 3 (
) 2 (
4
2 3
4
=
=

e P

IV.5.- Variables aleatorias continuas

Definiciones Una variable aleatoria es continua (vac) si su recorrido es infinito y
no-numerable. En este caso no existe una funcin de cuanta sino una funcin de
densidad de probabilidades f(x) definido como:

i) f(x) 0 x,
b
ii) P(a x b) = f(x) dx
+ a
iii) f(x) dx = 1.
-
Podemos observar que la densidad de probabilidad en un punto es 0, y que slo
tienen sentido las probabilidades de intervalos.

La funcin de distribucin de una vac. Se define como:
x
F(x) = f(x)dx
-

Tanto las funciones como las caractersticas de una vac se interpretan del mismo
modo, pero cambian sus definiciones:
+
E[X] = xf(x) dx y V[X] = E[X
2
]-(E[X])
2

-

Una funcin especialmente til en el estudio de las variables aleatorias continuas
es la llamada funcin generatriz de momentos (M
x
(t)) definida como:

= dx x f e t M
tx
x
) ( ) ( . Observamos inmediatamente que la derivada de esta funcin, con
respecto a t, y evaluada en t = 0, corresponde a la esperanza E[X], o primer momento
53
central, y que la segunda derivada evaluada en t = 0, es E[X
2
], o segundo momento
central. Existen tres teoremas de demostracin muy sencilla en referencia a esta
funcin:

1) Si c es una constante y la funcin generatriz de momentos (fgm) de X es M
x
(t),
entonces la fgm de y = X+c = M
y
(t) = e
ct
M
x
(t).

2) Si c es distinta de 0 e y = cX, entonces M
y
(t) = M
x
(ct).

3) Si X
1
, X
2
, X
n
son independientes y todas con igual fgm, M
x
(t), entonces Y
= X
1
+X
2
+.X
n
tiene una fgm dada por:

n
x y
t M t M )] ( [ ) ( =

IV.6.- Distribucin uniforme

Muchas veces en estadstica se usan nmeros aleatorios. Estos son un conjunto de
nmeros [a,b] que tienen todos igual probabilidad de aparecer. Esto genera una
funcin densidad de probabilidad constante f(x) = 1/(b-a) y una funcin de distribucin
F(x) = (x-a)/b-a) en el intervalo [a,b]. Adems es fcil ver mediante integracin que
E[X] = (a+b)/2 y V[X] = (b-a)
2
/12.

IV.7.- Distribucin exponencial

Si consideramos la variable U como el tiempo que transcurre entre dos eventos
en un proceso de Poisson, podemos observar que la probabilidad que este tiempo de
espera sea mayor que un cierto valor u (P(U u) es equivalente a la probabilidad que
en este proceso no haya ocurrencia en el intervalo [0,u) es decir P(U u) = P
0
(u) = e
-u
.
De otra forma 1 F(u) = e
-u
, es decir la vac tiempo de espera en un proceso de
Poisson tiene funcin de distribucin F(u) = 1- e
-u
, y derivando, la funcin densidad de
probabilidad es f(x) = e
-u
. Se dice que una variable con esta funcin densidad tiene
distribucin exponencial. Es fcil ver, simplemente integrando que E[X] = 1/ y V[X]
= 1/
2

IV.8.- DISTRIBUCIN NORMAL

Definicin Una variable aleatoria continua, con funcin densidad:

2
] [ ) 2 / 1 (
) 2 / 1 ( ) (

=
x
e x f

54
Se dice que tiene distribucin normal o de Gauss (campana de Gauss).

Su esperanza es E[X] = y su varianza V[X] =
2
.

Observamos que = V[X], es decir es la desviacin estndar. Como esta
distribucin queda caracterizada por dos parmetros, se abrevia como N(,).

Esta es, lejos, la distribucin ms importante en estadstica. Si graficamos la
distribucin, vemos que tiene forma de campana, con un mximo en y puntos de
inflexin en - y +. Adems es importante que P(- x +) = 0.682, P(-2
x +2) = 0.954 y P(-3 x +3) = 0.997.

Es decir entre 1 y + 1 desviaciones estndar se encuentra el 68.2 % de la
distribucin, entre 2 y + 2 d.s. el 95.4 y entre 3 y + 3 d.s. el 99.7%.

Observamos que adems si X tiene distribucin N(,) entonces la variable
estandarizada Z = (X-)/ tiene distribucin N(0,1). Esto es obvio pues E[Z] = E[(X-
)/] = (E[X]-)/ = 0 y V[Z] = V[(X-)/] =V[(X-)]/
2
= V[X]/
2
=
2
/
2
= 1. En
este caso,
2 /
2
) (
t
Z
e t M

=

Esta distribucin tiene dos orgenes fundamentales que se pueden enunciar a
manera de teoremas.

Teorema de De Moivre

Si X tiene distribucin binomial (B(n,p)) y n, entonces:
55

P(a < x < b) =
Donde = np y
2
= npq

Demostracin La demostracin es extensa por lo que slo se muestran los pasos
fundamentales:

Si en
k n k
p p
k
n
k X P

|
|
.
|
\
|
= = ) 1 ( ) ( , aplicamos la frmula de Stirling para factoriales,
n n n
e n e n n
12 /
2 !

=

, donde es un nmero entre 0 y 1, se obtiene:

n R
e
npq
k X P
/ 2 /
2
2
1
) (
+
= =

, donde
npq
np k
= y el trmino R/n tiende a 0 para n
grandes.

As, si n es grande

= =
2
1
2 /
2 1 2 1
2
2
1
) ( ) (

dx e
npq
P k X k P
x
, lo que
define una distribucin normal con = np y
2
= npq.

Este primer teorema nos dice que la distribucin normal es una distribucin lmite
de una binomial cuando n es grande. En la prctica n > 30 o bien np 5.

Teorema del lmite central (o central del lmite) (expresin general, Laplace
1812, Lyapunov 1901)

Cualesquiera que sean las distribuciones de ciertas variables Xj, con esperanzas
j y varianzas
2
j
, entonces X = Xj es asintticamente normal (N(,)) donde =
j y
2
=
2
j
.

Demostracin Consideraremos slo el caso ms sencillo, donde las Xj tienen la misma
distribucin. En este caso se puede partir por el siguiente corolario:

Corolario 1 Si estas Xj tienen distribuciones iguales, entonces X es
asintticamente normal N(n,n).

2
(1/ 2)[( ) / ]
1/( 2 ) ( )
b
x
a
e

56
Demostracin: En este caso j = n y la varianza es n
2
j
, por lo que la
desviacin estndar es n.

Falta por demostrar la normalidad. X = Xj, se puede estandarizar como:
Z = (X-E[X])/V[X] = (X- n)/n =

=
n n
j
Zj
n
X
n 1 1
1
) (
1
. Entonces se
puede obtener la fgm de Z:
n
zj Z
n
t
M t M )] ( [ ) (
= y como en M
Zj
(t) el primer y segundo
momentos son 0 y
2
se puede desarrollar en serie de Taylor: M
Zj
(t) = 1-
2
t
2
/2 + R, y
reemplazando t por t/ n obtenemos para M
Z
(t):
) 2 / ( ) / 2 (
2
2
2 2
)] , (
/ 2
1
1 [ )] , (
2
1 [ ) (
t t n n
Z
t n R
t n
t n R
n
t
t M

+
+ = + = y tomando lmite cuando n

tiende a infinito se tiene que
2 /
2
) (
t
Z
e t M

= . Como esta es la fgm de una distribucin
normal, entonces concluimos que la distribucin es normal.

Corolario 2 El promedio X = X/n de estas Xj tiene distribucin asintticamente
normal N(,/n).

Demostracin: la esperanza E[X ] = E[X/n] =E[X]/n = n/n = .
La varianza V[X] =V[X/n] = V[X]/n
2
=n
2
/n
2
=
2
/n, y entonces la desviacin estndar
es /n.

Corolario 3 La variable estandarizada Z = (X -)/(/n) tiene distribucin N(0,1)

Demostracin: la esperanza E[Z] = E[(X-)/(/n)] =(E[X]- )/(/n) =
= (-)/(/n) = 0. La varianza V[Z] =[(X-)/(/n)] =(V[X]- 0)/(/n)
2
=
=(
2
/n)/
2
/n) = 1, y entonces la desviacin estndar tambin es 1.

Corolario 4 Si Y es B(n,p) y n , entonces la variable estandarizada Z = (Y-
np)/(npq)) tiene distribucin N(0,1).

Demostracin: Trivial; se sigue inmediatamente del teorema de De Moivre y los
corolarios anteriores.

El teorema del lmite central y sus importantes corolarios nos explican porqu es
normal (habitual) encontrar distribuciones normales en las variables que estudiamos.
Adems mediante el uso de la estandarizacin (Z) de la variable X, es posible calcular
las probabilidades P(a x b)= P((a-)/ z (b-)/). Afortunadamente para
nosotros los valores de las integrales que definen las probabilidades ya se encuentran
57
tabulados y son accesibles en programas computacionales. Algunos valores muy
conocidos, importantes y fciles de recordar son P (z > 1.64) = 0.05 y P(z > 1.96) =
0.025.

Ejemplo 9.-

Supongamos que el peso (W) de los seres humanos tiene distribucin normal con
promedio = 70 Kg y desviacin estndar = 5Kg. Entonces cual es la probabilidad
que un individuo pese ms de 83 Kg?. Como W tiene distribucin normal N(70; 5),
entonces Z = (W-)/ tiene distribucin normal N(0;1) y preguntar por P(W >83) es
equivalente a preguntar por P(Z >(83-70)/5=2.6). En las tablas de reas de la
distribucin normal se puede ver que este valor es: P(Z > 2.6) = 0.0047.

IV.9.- Otras distribuciones importantes

En los siguientes prrafos introduciremos algunas distribuciones y una serie de
teoremas, cuya importancia se ver mas adelante. En general todas las distribuciones de
variables aleatorias continuas se encuentran relacionadas y pueden expresarse como
casos particulares de una ecuacin general (sistema de Pearson). El conocimiento de
estas distribuciones permite posteriormente generar las dcimas o pruebas de
hiptesis.

Una distribucin habitual es la distribucin logartmico-normal o log-normal.
Una variable aleatoria X tiene distribucin log-normal si existe una constante a, tal que
Y = log(x-a) se distribuye normalmente.

Los siguientes teoremas y distribuciones tienen relacin con la funcin gama (),
de importantes aplicaciones en clculo y estadstica:

=
0
1
) ( dx e x k
x k
, k > 0.

Basados en esta funcin, se dice que una variable aleatoria continua X, tiene una
distribucin de parmetros r y si su densidad es

x r
e x
r
x f

=
1
) (
) (
) ( , x >0; r > 0; > 0; y 0 en cualquier otro caso.

En esta distribucin, E[X] = r/ y V[X] = r/
2
y M
x
(t) = (1-t/)
-r
.

58
Si r = 1, f(x) = e
x
, E[X] = 1/ y V[X] = 1/
2
. Cuando ocurre esto, se dice que
la variable tiene distribucin exponencial.

Cuando r = n/2 y = 1/2, se dice que la variable tiene distribucin Chi-
cuadrado con n grados de libertad (
2
n
).

Teorema Si las variables Zj tienen distribucin N(0,1), entonces X = Z
2
j, tiene
una distribucin Chi-cuadrado con n grados de libertad:
2
n
.

Demostracin Veamos primero el caso de una variable Z con distribucin N(0,1) y
llamemos F(Z) y f(Z) a su funcin de distribucin y funcin densidad respectivamente.
En este caso: Y = Z
2
tendra por funcin de distribucin a G(Y):

G(Y) = P(Y y) = P(0 < Y y) = P(-y Z y) = 2 P(0Zy) = 2[F(y)-F(0)].
Entonces la funcin densidad g(Y) corresponde a la derivada de G(Y). O sea,
g(Y) = G(Y) = 2F(y)(1/2(y) = f(y)/y =
y
e
y
1
) 2 / 1 (
) 2 / 1 (

. Observamos ahora
que g(Y=Z
2
) corresponde a una distribucin con r = 1/2 y = 1/2 es decir Chi-
Cuadrado con 1 grado de libertad (
2
1
). Su fgm es entonces M
Y
(t) = 1/(1-2t).

Ahora veamos el caso de la variable X = Y = Z
2
j. En este caso la fgm de X es
M
x
(t) =M
Y
(t) =[M
Y
(t)]
n
= (1-t/(1/2))
-n/2
= (1-t/)
-r
, con r = n/2 y = 1/2; y por tanto es
una distribucin
2
n
. Naturalmente su E[X] = n y V[X] = 2n.

Esta es una distribucin asimtrica en que su simetra depende de n. Mientras ms
grande n, ms simtrica.

Teorema Si una variable aleatoria X cuya varianza es
2
, en una muestra de n
elementos tiene una varianza s
2
, entonces y = (n-1)s
2
/
2
tiene distribucin
2
n-1
.

Demostracin Si desarrollamos:

(xi-)
2
= (xi-x + x -)
2
=(xi-x)
2
+ (x-)
2
+2(xi-x)(x-) =

(xi-)
2
= (xi-x)
2
+ (x-)
2
+ 0 y dividiendo por
2
obtenemos:

((xi-)/)
2
= ns
2
/
2
+ ((x-)/(/n))
2
.

En este desarrollo, como el primer trmino es la suma de n variable aleatorias con
distribucin normal N(0,1) elevadas al cuadrado, este tiene distribucin
2
n
y adems el
59
ltimo trmino tiene distribucin N(0,1) al cuadrado, es decir,
2
1
, entonces ns
2
/
2
tiene
distribucin
2
n-1
.

Definicin Una variable aleatoria continua tiene distribucin t de Student con k
grados de libertad si su funcin densidad es:

2
1 2
) 1 (
) 2 / (
)
2
1
(
) (
+
+

+
=
k
k
x
k k
k
x f

Teorema Si una variable X tiene distribucin normal N(0,1) y una variable Y
tiene una distribucin
2
k
entonces t = X/(Y/k) tiene una distribucin t de Student
con k grados de libertad (t
k
). Su E[t] = 0 y V[t] = k/(k-2). La demostracin de este
teorema requiere de variables bi-dimensionales, lo que esta fuera del alcance de este
libro.

Corolario La variable estandarizada t = (X-)/(s/n) tiene distribucin t
n-1
.

Demostracin Como La variable estandarizada Z = (X-)/(/n) tiene distribucin
N(0,1) y adems Y = (n-1)s
2
/
2
tiene distribucin
2
n-1
, entonces t = X/(Y/(n-1)) =
(X-)/(s/n) tiene distribucin t
n-1
.

Teorema Si n, t
n-1
N(0,1)

Demostracin Si n, s , y entonces por el teorema central del lmite, t
n-1

N(0,1).

Esta distribucin t se le debe a Gossett, quien escriba bajo el seudnimo de
Student y es una de las distribuciones ms importantes, junto con la normal. Es un
distribucin acampanada, ms apuntada que la normal. Sin embargo, en la prctica, si n
> 30 esta distribucin es prcticamente normal.

Definicin Una variable aleatoria continua X tiene distribucin F de Snedecor
con n
1
y n
2
grados de libertad si su funcin densidad es:

2 / ) 2 1 (
1 2
1 2 / 1
2 1
2 / 2
2
2 / 1
1
2 1
) ( ) 2 / ( ) 2 / (
)
2
(
) (
n n
n
n n
x n n
x
n n
n n
n n
x f
+
=

Su E[X] = n2/(n2-2) y V[X] = 2n2(n1+n2-2)/n1(n2-2)
2
(n2-4).
60

Esta es una distribucin muy til usada en las dcimas de varianza y en el anlisis
de la varianza (ANOVA).

Teorema Si U es
2
n1
y V es
2
n1
, entonces F = (U/n1)/(V/n2) tiene una
distribucin F de Snedecor con n1 y n2 grados de libertad(F
n1,n2
). La demostracin
de este teorema requiere de variables bi-dimensionales, lo que esta fuera del alcance de
este libro.

Teorema Si t tiene distribucin t
k
, entonces t
2
tiene distribucin F
1,k
.

Demostracin Como t = X/(Y/k) tiene una distribucin t de Student con k grados de
libertad (t
k
) y en ella X tiene distribucin normal N(0,1) y una variable Y tiene una
distribucin
2
k
entonces t
2
es el cuociente entre X
2
con distribucin
2
1
y Y/k con
distribucin
2
k
. As, por el teorema anterior t
2
tiene distribucin F
n1,n2
.

Teorema El cuociente de las varianzas de dos muestras S = s
2
1
/s
2
2
tiene
distribucin F
n1-1,n2-1

Demostracin Como en una poblacin dos muestras independientes de tamaos n
1
y n
2
,
Y
1
= (n
1
-1)s
1
2
/
2
tiene distribucin
2
n1-1
y Y
2
= (n
2
-1)s
2
2
/
2
tiene distribucin
2
n2-1
,
entonces el cuociente W = [Y
1
/(n
1
-1)]/[ Y
1
/(n
1
-1)] = s
2
1
/s
2
2
tiene distribucin F
n1-1,n2-1
.
61

Ejercicios de variables aleatorias

1. Considere un experimento que consiste en tirar una vez un dado. Siendo X = el valor
obtenido en el lanzamiento una v.a.d., cul es su esperanza y su varianza?
R: 3.5; 2.92.

2. Sea X el nmero de casos nuevos de SIDA diagnosticados en un hospital durante un
da. La distribucin acumulativa para X es

X 0 1 2 3 4 5 6
F (x) 0.1 0.2 0.3 0.6 0.8 0.9 1.0

a) Hallar la probabilidad de que en un da cualquiera,
i) Tres casos nuevos sean diagnosticados.
ii) Por lo menos un caso nuevo sea diagnosticado.
iii) Ningn caso nuevo sea diagnosticado.
iv) Entre dos y cuatro casos nuevos sean diagnosticados.
b) Hallar la funcin de cuanta para X.
c) Determinar E[x] y V[x].
R: a) 0.3; 0.9; 0.1;0.6; c) 2.81; 4.60.

3. Qu requisitos debe cumplir una variable para que en sus anlisis se utilice la
distribucin binomial?

4. Se ha determinado que de cada 100 nacimientos, 20 de los nios nacidos son
hombres y 80 mujeres. Dado que una madre ha dado a luz 8 hijo, cul es la
probabilidad de que tenga 5 hijas?
R: 0.147.

5. Para estudiar la regulacin hormonal de una lnea metablica se inyectan ratas con un
frmaco que inhibe la sntesis de protenas del organismo. En general, 4 de cada 20
ratas mueren a causa del frmaco antes de que el experimento haya concluido. Si se
trata a 10 animales con el frmaco, cul es la probabilidad de que al menos lleguen 8
vivas al final del experimento?.
R: 0.677.

6. En Escherichia coli, una clula de cada 10
5
muta generando resistencia al antibitico
estreptomicina. Observando 556.000 clulas, cul es la probabilidad de que ninguna
mute? cul es la probabilidad de que al menos una mute?
R: 0.00348; 0.9965.

62
7. Se estima que slo uno de cada 50 loros capturados en el sur de Chile para su
utilizacin como animales domsticos sobrevive al cambio. Se capturan 700 pjaros
en un da. Cul es el nmero esperado de sobrevivientes? Cul es la probabilidad
de que sobrevivan entre 10 y 12?
R: 0.1545.

8. Qu caractersticas tiene la distribucin normal?

9. Si la variable X tiene distribucin normal con =21 y
2
=3. Calcule:
a) P (x<22)
b) P (x<18)
c) P (x>22)
d) P (22<x<24)
e) P (16<x<18)
R: 0.719; 0.0418; 0.281; 0.239; 0.0398.

10. En cierta poblacin de primates, el volumen de la cavidad craneal se distribuye
aproximadamente como una normal con media 1200 cm
3
y desviacin estndar
de 140 cm
3
.
a) Hallar la probabilidad de que un miembro de la poblacin seleccionado al azar
tenga una cavidad craneal superior a 1400 cm
3
.
b) Hallar P (1000<x<1050)
c) Hallar P (x<1060)
d) Hallar P (x<920)
e) Hallar el punto x
0
tal que el 20% de los primates tenga una cavidad craneal ms
pequea que x
0
.
f) Hallar el punto x
0
tal que el 10% de los primates tenga una cavidad craneal
superior que x
0
.
R: 0.0764; 0.0659; 0.0228; 1081.7; 1379,9.

11. La densidad del suelo se define como la masa de materia slida seca por unidad de
volumen. Una densidad elevada implica un suelo compacto con escasos poros. Esta
densidad es un factor importante para el crecimiento de las races, la siembra
precipitada y la ventilacin. Sea X la densidad de tierra arcillosa. Los estudios
demuestran que X tiene una distribucin normal con =1.5 y =0.2 g/cm
3
.
a) Cul es la funcin densidad de X? Haga un esbozo de la funcin densidad.
Indique en esa grfica la probabilidad de que X est comprendida entre 1.1 y 1.9.
Halle esta probabilidad. R: 0.9544.
b) Halle la probabilidad de que tomando de forma aleatoria una muestra de tierra
arcillosa, sta tenga una densidad menor que 0.9 g/cm
3
. R: 0.0013.
63
c) Estara sorprendido si una muestra de este tipo de tierra, seleccionada
aleatoriamente, tuviese una densidad de 3.2 g? R: absolutamente.

12. La Escala de Inteligencia Wechsler para Nios (WISC) tiene una media de 100 y una
varianza de 225 para la poblacin general. Si un nio cae en el 10% menor de la
poblacin, generalmente los psiclogos clnicos urgen a los padres de los nios a que
les realicen exmenes en busca de posibles problemas cerebrales. Asumiendo que los
puntajes de WISC estn normalmente distribuidos, cul es el puntaje crtico que los
psiclogos utilizan para hablar con los padres?
R: 80.725.
64
III UNIDAD: INFERENCIA ESTADISTICA
65
V.- ESTIMACIN

La base fundamental de la inferencia estadstica es la obtencin de una muestra
de la poblacin o universo y, a partir de lo que ocurre en ella, inferir, con una cierta
incertidumbre, la validez de una proposicin en la poblacin completa. La muestra es
entonces un subconjunto del universo. Los elementos de la muestra constituyen las
unidades de anlisis, por ejemplo los individuos de una poblacin. Las unidades de
anlisis no necesariamente coinciden con las llamadas unidades de muestreo. Estas
ltimas son unidades operativas, que por ciertas razones constituyen la unidad obtenida
como muestra. Por ejemplo, un investigador puede estar interesado en los glbulos rojos
(unidad de anlisis) pero muestrea individuos (unidad de muestreo), o bien estar
interesado en caractersticas de los individuos (unidad de anlisis) y muestrear
manzanas o barrios de una ciudad (unidad de muestro)...etc. El marco de muestreo
consiste en el listado de las unidades de muestreo que se van a considerar.

V.1.- Estimadores

En la teora de estimacin se considera la existencia de:

i) Parmetros: stos se pueden definir como caractersticas () de una
variable aleatoria, propios de la poblacin. En general se denotan con
letras griegas o maysculas. Los ejemplos ms conocidos son la esperanza,
, la proporcin poblacional P, la desviacin estndar y la varianza
2
.

ii) Estimadores: stos son funciones de una variable aleatoria cuyo fin es
aproximar el valor de un parmetro a partir de las unidades de la muestra
Los ejemplos ms caractersticos son el promedio muestral x , la
proporcin muestral p, la desviacin estndar s y la varianza s
2

muestrales.

As, las medidas de posicin y dispersin que aprendimos en estadstica
descriptiva, aqu adquieren otra connotacin. Si nuestro fin es inferir y no simplemente
describir una muestra, el promedio, la varianza y la desviacin estndar se constituyen
en estimadores de parmetros poblacionales.

Los estimadores tienen cuatro caractersticas de inters:

i) Linealidad: es una caracterstica deseable en un estimador que permite
operarlo algebraicamente. Por ejemplo, es evidente que el promedio es
66
lineal, pues es una combinacin lineal de los valores de una variable
aleatoria (x = hixi).

ii) Sesgo: este corresponde a la diferencia entre la esperanza de un estimador
(E[] ) y el parmetro (): Sesgo = E[] - . Naturalmente es deseable que
los estimadores sean insesgados (Sesgo = 0). Por ejemplo, el promedio es
un estimador insesgado: x = xi/n.
Si la variable x tiene E[x] = , entonces E[x] = E[ xi/n] = (1/n)E[xi] =
(1/n)E[xi] = (1/n)n = , o sea la esperanza del estimador es igual al
parmetro.

iii) Consistencia: un estimador se dice consistente si lim
n
V[] = 0. Es decir,
es deseable que en un estimador, a medida que aumente el tamao muestral
(n), su varianza disminuya. Por ejemplo V[x] = V[ xi/n] = (1/n
2
)V[xi]
= (1/n
2
)n
2
=
2
/n, entonces lim
n
V[x] = 0, es decir el promedio
muestral es un estimador consistente.

Observamos inmediatamente que la desviacin estndar poblacional del
estimador x es s = V[x] = /n, entonces tiene sentido considerar el estimador
Es = s/n, conocido como error estndar.

iv) Varianza mnima: es deseable que un estimador tenga la mnima varianza
posible.

Cuando un estimador cumple estas condiciones, se dice que es un estimador meli:
el mejor estimador lineal insesgado.

Adems del promedio, otro estimador meli es la proporcin muestral p como
estimador de la proporcin poblacional P. Si tenemos una muestra de n elementos y
definimos la variable aleatoria x = 1 si tiene una caracterstica y x = 0 si no la tiene,
entonces se aprecia que p = xi/n, es decir tiene la estructura de un promedio, por lo que
E[p] = P y V[p] = PQ/n.

En cambio, observemos el siguiente desarrollo:

(xi-)
2
= (xi-x + x -)
2
=(xi-x)
2
+ (x-)
2
+2(xi-x)(x-) =

(xi-)
2
= (xi-x)
2
+ (x-)
2
+ 0 y dividiendo por
2
obtenemos:

((xi-)/)
2
= ns
2
/
2
+ ((x-)/(/n))
2
.

67
En este desarrollo, como el primer trmino es la suma de n variable aleatorias con
distribucin normal N(0,1) elevadas al cuadrado, este tiene distribucin
2
n
y adems el
ltimo trmino tiene distribucin
2
1
(ver teoremas), entonces ns
2
/
2
tiene distribucin
2
n-1
. O sea E[ns
2
/
2
] = (n-1) o, lo que es lo mismo, E[s
2
] = (n-1)
2
/n.

En palabras, la varianza muestral s
2
=(xi-x)
2
/n, es un estimador sesgado
de
2
. Entonces, nada mejor que corregirle el sesgo multiplicando este estimador
multiplicndolo por n/(n-1). As, creamos el nuevo estimador s
2
= n/(n-1)s
2
= (xi-
x)
2
/(n-1), y este es insesgado porque E[s
2
] = n/(n-1)E[s
2
] = (n/(n-1))(n-1)
2
/n =
2
.
Esta es la razn por la que se usa n-1 en el denominador de la varianza y la
desviacin estndar muestral: son los estimadores insesgados. En la prctica para n
> 30 son prcticamente iguales.

V.2.- Estimaciones

Las estimaciones o estimas son los valores que toma un estimador para una
muestra determinada. Por ejemplo, el promedio es un estimador y pero el valor
particularx = 5 es una estimacin. Las estimaciones pueden ser de dos tipos:
puntuales, por ejemplo el promedio poblacional es 3, o por intervalos, por ejemplo el
promedio poblacional est entre 2 y 5. Obviamente la primera estimacin es precisa
pero poco confiable y la segunda es ms confiable pero pierde precisin. Estas dos
ltimas, precisin y confianza son las dos caractersticas de una estimacin (no
confundir con estimador).

La estimacin puntual prcticamente no se usa. De ser necesario sta corresponde
en general al valor central del intervalo.

Definicin Llamaremos intervalo de confianza del nivel C = 1- a un intervalo
que tenga una probabilidad o confianza C de contener el valor real de un parmetro.
As, por ejemplo un intervalo del 95% de confianza para el promedio, es un intervalo
que tiene una probabilidad 0.95 de contener al promedio poblacional real.

V.2.1 Intervalo de confianza para una proporcin P y para la diferencia P1-P2

Supongamos que queremos el intervalo de confianza del 95% para la proporcin
poblacional P. Es decir queremos construir un intervalo (a,b) que tenga una probabilidad
0.95 de contener a P.

Sabemos que Z = (p P)/(pq/n) tiene distribucin N(0,1) y adems sabemos que
P(-1.96 z 1.96) = 0.95, es decir:

68
[-1.96 (p-P)/(pq/n) 1.96] = [p 1.96(pq/n) P p + 1.96(pq/n)], de manera que
se puede asegurar con probabilidad 0.95 que P est contenido por el intervalo definido
por (p 1.96(pq/n)).

En trminos generales, entonces el intervalo de confianza del nivel C = 1- para
la proporcin poblacional P es:

] / [
2 / 1
n pq Z p IC =

Notamos que Z
/2
en el caso de C = 0.95 es Z
/2
= 1.96, pero que para otros
niveles son otros valores que se pueden obtener directamente de la tabla de la
distribucin N(0;1) (Z).

Ejemplo 1.-

Si al examinar 30 insectos se encontraron 5 parasitados, como p = 5/30 = 0.167 y
q = 1-0.167 = 0.833, se podra afirmar con un 95% de confianza que la proporcin
poblacional de parasitados se encuentra en el intervalo:

] 30 / 833 . 0 167 . 0 96 . 1 167 . 0 [
95 . 0
= IC Es decir entre 0.033 y 0.3 o entre un
3.3 y 30%. Naturalmente, en este caso si quisiera mayor precisin tendra que aumentar
el tamao muestral.

En el Intervalo de confianza para una diferencia de proporciones P1-P2, por un
razonamiento enteramente anlogo al anterior se llega a:

)] / / ( ) [(
2 2 2 1 1 1 2 / 2 1 1
n q p n q p Z p p IC + =

V.2.2 Intervalo de confianza para el promedio x y para la diferencia x
1
-x
2

Si se conoce la varianza poblacional, entonces por un razonamiento anlogo al
anterior:

] / [
2 / 1
n Z x IC

=

Sin embargo esto no es lo habitual; en general, la varianza es desconocida.

69
Si la varianza es desconocida recordamos que (x-)/(s/n) tiene distribucin de
Student t
n-1
y entonces es fcil llegar a que el intervalo de confianza del nivel C = 1- es
en este caso:

] / [
) 2 / 1 ( 1
n s t x IC =

Aqu t
(1-/2)
tiene el mismo sentido que Z
/2
pero se escribe distinto por razn de
construccin de las tablas t de Student.

Ejemplo 2.-

Si en una muestra de 49 individuos se tiene una glicemia promedio de 1.042 con
una desviacin estndar de 0.03. Entonces puedo afirmar con un 95% de confianza que
el promedio poblacional de la glicemia se encuentra en:

] 49 / 03 . 0 2 042 . 1 [
1
=
IC Es decir entre 1.033 y 1.051.

A estas alturas ya es conveniente observar que todos los intervalos de confianza
tienen la misma estructura: IC
1-
=[ kEs], donde es un estimador, Es su error
estndar y k un valor que determina en una cierta distribucin una probabilidad
determinada. Para los estimadores habituales, promedios y proporciones, que
generalmente siguen distribuciones normales o Student, un buen valor para recordar al
95% de confianza es k = 1.96 2.

Para la diferencia de promedios x
1
-x
2
el intervalo de confianza es:

] ) [(
) 2 / 1 ( 2 1 1
Es t x x IC =

donde ) / 1 / 1 (
2
) 1 ( ) 1 (
2 1
2 1
2
2 2
2
1 1
n n
n n
s n s n
Es +
+
+
=

V.3.- El tamao muestral

Esta misma forma de pensamiento, permite calcular el tamao muestral para una
precisin y una confianza dadas.

Si se acepta que una medida de la precisin es la mitad del ancho del intervalo de
confianza, se observa que la precisin es d = kEs = ,-, y, entonces equivale al valor
absoluto de la diferencia entre el valor real del parmetro y el promedio muestral
(observacin: a mayor valor de d la estimacin es menos precisa).

70
Entonces, por ejemplo si se desea buscar el tamao muestral con una precisin d y
una confianza C = 1- para estimar una proporcin P, es obvio que d = z
/2
(PQ/n), es
decir, despejando n, el tamao muestral adecuado es:

2
2
2 /
d
PQ Z
n

=

Ejemplo 3.-

Si deseamos estimar una proporcin P, que segn estimaciones previas de otros
autores es de alrededor de un 32% y queremos hacerlo con una confianza de un 95% (
= 0.05) y con una precisin de 10 % , entonces P 0.32; Q 0.68; Z
/2
= 1.96 y d =
0.1x0.32 = 0.032. As el tamao muestral necesario es aproximadamente n =
(1.96)
2
(0.32x0.68)/(0.032)
2
= 816.34. O sea alrededor de 817 individuos.

Si nuestro inters es calcular un promedio, entonces d = t
(1-/2)
s/n, y entonces el
tamao adecuado es:

2
2 2
2 /
2
2 2
2 / 1
d
s Z
d
s t
n

=

Para confianzas del 95% se suele aproximar z
2
/2
= 4.

Ejemplo 4.-

Si queremos estimar un promedio con un 95% de confianza, con una precisin del
5% y se tienen estimaciones previas que sugieren un promedio de 45 de una desviacin
estndar de s = 5.4, entonces el tamao muestral requerido es aproximadamente: n =
4(5.4)
2
/(0.05x45)
2
= 51.84 = 52.

Observamos que todos los clculos de tamao muestral son slo aproximaciones y
que todos necesitan de algn conocimiento o estimaciones previas de lo que se pretende
estimar y su variabilidad.

V.2.3.- Estimaciones en Medicina

A menudo en Medicina se usan estimadores para diagnstico, tratamiento, y
factores de riesgo (ver captulo de probabilidades). Muchos de estos estimadores son
proporciones o diferencia de proporciones por lo que sus intervalos de confianza se
calculan en la forma convencional ya sealada:
71

Proporciones Sensibilidad, Especificidad, Valores
predictivos, certeza diagnstica, CER y
EER
Diferencia de proporciones Reduccin y aumento absoluto del riesgo:
ARR y ARA

En otros casos existen tcnicas especiales para el clculo:

Nmeros necesarios : NNT y NNH Ambos estn definidos como los valores
inversos de ARR y ARA respectivamente, por lo que en estos casos, se calculan los
lmites de confianza para ARR y ARA y se calcula su inverso. Por ejemplo si los lmites
de confianza para ARR son [1/8 y 1/2], entonces para NNT son [2 y 8].

Riesgo relativo (RR), Odds ratio (OR) y cuocientes de verosimilitud (LR): En
todos estos casos se prefiere trabajar con los logaritmos (en cualquier base) de las
estimaciones: log RR, log OR y log LR. Se calculan los lmites de confianza para el
logaritmo y a estos valores se les aplica el antilogaritmo, obteniendo los lmites de
confianza buscados. Por ejemplo, si los lmites de confianza para log
10
RR son [0.30 y
0.47] entonces los lmites de confianza para RR son [antilog 0.30 y antilog 0.47] = [2 y
3].

Usando exactamente la nomenclatura del captulo de probabilidades, los
intervalos de confianza para el logaritmo de estos estimadores son:

Para log RR: ]
1 1 1 1
[log
2 / 1
d b c a b a
Z RR IC
+
+
+ =

Para log OR: ]
1 1 1 1
[log
2 / 1
d c b a
Z OR IC + =

Para log LR: ]
1 1 1 1
[log
2 / 1
d c b a d a
Z LR IC
+
+
+ =

72

Ejercicios de estimacin

1. Se tom una muestra que mostr que una variable en los hombres tiene un promedio
de 9.5 mg/dcl y una varianza de 0.25 mg
2
/dcl
2
. Cul es el intervalo de confianza del
95% si el tamao muestral es: a) 5; b) 10; c) 100; d) 1000?
R: [8.88;10.12];[9.14;9.86];[9.402;9.6];[9.47;9.53].

2. De 191 nios con dolor al pecho, 160 tienen electrocardiograma (ECG) normal.
Obtener el intervalo de confianza del 90, 95 y 99% de la proporcin de nios con
dolor al pecho que tienen ECG normal.
R: [0.794;0.882]; [0.786; 0.890]; [0.769; 0.907].

3. El tamao de la muestra desempea un papel importante en la determinacin de la
longitud de un intervalo de confianza. Considerar dos intervalos de confianza del
95% de basndose en muestras de tamao N
1
y N
2
extradas de la misma poblacin.
Si N
1
es mayor que N
2
, qu intervalo de confianza tendr mayor precisin?

4. Se dice que el 11.4% de las vinchucas rojas estn infectadas con un parsito. Qu
tamao muestral necesito para re-estimar esta proporcin con un intervalo de
confianza de 95 % de ancho total 7 %?
R: n = 317.

5. Se estudi el efecto de una droga sobre el cambio de peso en 12 pacientes dando un
promedio de 0.5 kg y una varianza de 0.4 kg
2
. Se necesita estimar la media
poblacional con un intervalo de confianza del 95% no mayor que 0.5 kg. Qu
tamao necesito para obtener esto?
R: n = 25.

6. Considerar 200 muestras de tamao 25 extradas de una poblacin con media
desconocida. Suponiendo que las 200 medias muestrales obtenidas se utilizan para
construir 200 intervalos de confianza del 90%. Cuntos de estos intervalos esperara
que no contuvieran a ?
R: 20.

7. Un medicamento para el tratamiento de la gota se estudia para utilizarlo en la
prevencin de muerte dada por ataques cardacos en pacientes que ya han sufrido
ataques. En el estudio, 733 pacientes recibieron el medicamento y a 742 se les dio un
placebo. Despus de 8 meses, se hall que de 42 muertes por ataques cardacos, 29 se
produjeron dentro del grupo que recibi el placebo y 13 en el grupo que recibi la
73
droga. Generar un intervalo de confianza del 95% para la diferencia de muertes entre
el grupo que recibi el placebo y el que recibi la droga.
R: [0.0041; 0.0379].

8. Se ha realizado un estudio sobre la tasa de supervivencia de los pjaros adultos en los
trpicos y en las zonas templadas. Inicialmente se marcaron 500 pjaros adultos con
cintas en las patas y se liberaron en una regin lluviosa. Al ao siguiente, se
recapturaron 445 (suponer que aquellos pjaros no capturados fueron consumidos por
depredadores). Un experimento similar en Santiago (una regin templada), dio como
resultado una recuperacin de 252 de los 500 pjaros liberados. Hallar el intervalo de
confianza del 90% de la diferencia en las tasas de supervivencia de un ao para las
dos regiones
R: [0.342; 0.429].

9. Se cree que los jvenes adolescentes que fuman comienzan a hacerlo a una edad ms
temprana que las mujeres adolescentes fumadoras. Segn los siguientes datos, usted
apoyara esta suposicin?
Hombres: N=33 ; edad media a la que empiezan a fumar=11.3 aos ;
2
=4
Mujeres: N=14 ; edad media a la que empiezan a fumar=12.6 aos ;
2
=4
R: No.

10. Se ha realizado un estudio para comparar la concentracin de plomo en el agua de
dos casas. En una casa se utiliz una soldadura con el 50% de plomo y el 50% de
estao en las tuberas. En la otra casa no utilizaron esta soldadura. Qu podra decir
a una confianza del 95%?
Lugar 1 (con soldadura de plomo): N=25 ; media=25 ;
2
=12
Lugar 2 (sin soldadura de plomo): N=25 ; media=10 ;
2
=5
R: Que la concentracin de plomo aumenta entre 13.5 y 16.47.
74

VI.- DOCIMASIA O PRUEBA DE HIPTESIS

VI.1.- Bases

Definicin Llamaremos hiptesis a una proposicin lgica. Tiene por tanto un
contenido de verdad (dicotmico si trabajamos con lgica binaria: V o F), pero en
general, desconocido.

Desde esta perspectiva una hiptesis constituye una afirmacin cuya validez o
certeza es desconocida. El fin de la estadstica es llegar a conocer o aproximar la
incerteza de tal afirmacin.

Definicin En trminos estadsticos paramtricos una hiptesis es una afirmacin
que especifica la distribucin de una o varias variables.

En este sentido las hiptesis en trminos estadsticos se refieren a parmetros. Por
ejemplo, cuando afirmamos que los hombres pesan ms que las mujeres, en trminos
estadsticos paramtricos afirmamos que el promedio poblacional del peso masculino es
mayor que el femenino.

La estrategia estadstica se enmarca en una lgica de tipo binario que permite
siempre dividir una hiptesis en dos. Esto lo denominamos dicotoma de la hiptesis:

Hiptesis de nulidad (Ho): es la hiptesis de nulidad del efecto contenido en la
afirmacin. Es en general una hiptesis de igualdad.

Hiptesis alternativa (H
1
): es la hiptesis que contiene la afirmacin.

As, por ejemplo si se afirma que los hombres pesan ms que las mujeres, se
establece inmediatamente la dicotoma Ho: los hombres pesan igual o menos que las
mujeres y H
1
: los hombres pesan ms que las mujeres. En trminos estadsticos
paramtricos nos referimos a los promedios: Ho:
H

M
vs. H1:
H >
M
. Naturalmente
una u otra es verdad, pero no ambas.

Definicin Una dcima o prueba de hiptesis es una regla o procedimiento
estadstico que permite tomar una decisin acerca de la aceptacin o rechazo de la
hiptesis de nulidad.

Bajo esta definicin es claro que toda la estrategia estadstica est destinada al
rechazo de Ho, y que este rechazo es el que permite sostener H
1
. Para esto es
estrictamente necesario que las hiptesis Ho y H
1
sean complementarias.
75

Sin embargo, encontrar una regla que permita tomar una decisin adecuada no es
fcil como podemos ver en el siguiente ejemplo.

Supongamos que el peso de un animal A tiene una distribucin normal N(1, 2) y
que se afirma que un animal B pesa ms que el animal A.

Entonces, seguimos el procedimiento habitual y planteamos:

Ho:
B

A
vs. H
1
:
B
>
A
.

Supongamos que tomamos una muestra de 100 individuos del ave B. Entonces la
idea es encontrar un valor crtico Co para el promedio muestral x
B
sobre el cual
rechazar Ho (y por tanto sostener H
1
). Esto establece un conjunto de valores Rc =[x
B
/
x
B
> Co] que permiten rechazar Ho (zona de rechazo de Ho). Pero....cmo elegir este
valor crtico?

Estudiemos la probabilidad de rechazar Ho para distintos valores del promedio
poblacional del peso de B (), llamada funcin de potencia de la dcima (K()).
Esperamos que la variable peso del animal B tenga una distribucin normal similar al
ave A, conservando su varianza pero con un promedio poblacional distinto (). As el
peso de B sigue una N(, 2). Ahora bien, la probabilidad de pertenecer a la zona de
rechazo es P(x
B
> Co). Adems sabemos que si el peso es N(,2) entonces x
B
es N(,
2/100) = N(,0.2) y entonces P(x
B
> Co) = P((x
B
-)/0.2

> (Co-)/0.2) =
= P(Z >(Co-)/0.2) = K() es la funcin de potencia de la dcima. Esta depende del
valor crtico Co.

Probemos con un valor crtico Co = 1, es decir rechazaremos Ho ( y aceptaremos
que B pesa ms que A) si en la muestra x
B
> 1. La funcin de potencia K() = P(Z>(1-
)/0.2) depende de , obtenindose para varios valores de ste:

K()
Ho
0.7 0.0668 V
0.8 0.1587 V
0.9 0.3085 V
1.0 0.5 V
1.1 0.6915 F
1.2 0.8413 F
1.3 0.9332 F

76
En esta tabla observamos que la probabilidad de rechazar Ho (K()) cuando Ho es
verdadera es muy alta, por ejemplo para = 0.9 hay una probabilidad de 0.3 (30%) y
para = 1 una probabilidad de 0.5!!. Entonces no parece adecuado escoger Co = 1.

Si escogemos Co = 1.2 obtenemos:

K()
Ho
0.8 0.0228 V
0.9 0.0668 V
1.0 0.1587 V
1.1 0.3085 F
1.2 0.5000 F
1.3 0.6915 F
1.4 0.8413 F

En este caso en cambio, cuando Ho es falsa, recin tenemos probabilidades de 0.3
a 0.5 de rechazarla. Entonces lo ideal sera tener un valor crtico Co sobre el cual la
probabilidad de rechazar Ho cuando esta es falsa (P(RHo/HoF) fuera cercano a 1 y que
bajo este, la probabilidad de rechazar Ho cuando esta es verdadera (P(RHo/HoV) fuera
cercano a 0. Sin embargo esto no es posible y slo es posible encontrar valores crticos
de compromiso entre los posibles errores.

As notamos que la validez de Ho es una caracterstica poblacional y que la toma
de decisin se realiza en base a la muestra. Esto produce una disociacin entre estos dos
eventos, originando dos clases posibles de errores. La situacin se puede expresar en la
siguiente tabla:

VALOR DE VERDAD de
Ho
V (H
1
F) F (H
1
V)
DECISIN Rechazo Ho
ERROR I () K = 1-
Acepto Ho
C = 1- ERROR II ()

En esta tabla se describen dos tipos de errores estadsticos: error de tipo I, aquel
que se comete cuando se rechaza Ho (RHo) y esta es en realidad verdadera (HoV). Su
medida es = P
max
(RHo/HoV); y el error de tipo II es el que se comete cuando se
acepta Ho (AHo) y esta es falsa. Su medida es = P
max
(AHo/H
1
V) = 1-P
max
(RHo/H
1
V)
= 1-K(
1
).

Observamos que C = P(AHo/HoV) = 1-. El valor C establece la confianza de la
dcima, y a , el mximo error de tipo I que se est dispuesto a tolerar, se le denomina
77
nivel de significacin cuando se encuentra previamente especificado. Del mismo modo
a K(
1
), el valor de la funcin de potencia en
1
,o simplemente K, se le conoce como
potencia de la dcima.

La docimasia o prueba de hiptesis debe cumplir varias etapas:

i) Planteamiento de la Hiptesis.

ii) Dicotoma de la hiptesis: Ho vs H
1
.

iii) Eleccin del nivel de significacin. En esta etapa se define a priori el nivel de
significacin con que se va a trabajar. En general en ciencias se consideran
como adecuados niveles menores que = 0.1; 0.05; 0.01 (o confianzas
mayores que 90%; 95%; 99%). El ms aceptado es lejos = 0.05. O sea en
ciencias parece aceptable cometer errores de tipo I con probabilidades
menores o a lo sumo iguales a 0.05.

iv) Eleccin de la dcima apropiada (ver ms adelante).

v) En base al resultado de la dcima, tomar una decisin estadstica por una de
dos vas equivalentes:
a. rechazar Ho si la probabilidad de error I es p < 0.05, o
b. rechazar Ho si el valor del estadgrafo que se us como dcima se
encuentra en la zona de rechazo (Rc) definida por un cierto valor crtico
(Co).

vi) Interpretacin estadstica de los resultados. Slo hay dos posibles:
a. De acuerdo a nuestros resultados hay suficiente evidencia para rechazar Ho,
y por tanto sostener H
1
con una probabilidad de error I = p; y
b. De acuerdo a nuestros resultados no hay suficiente evidencia para rechazar
Ho (y por tanto en general aceptamos Ho, pero ojo! Si aceptamos Ho
podemos estar cayendo en el error II por lo que deberamos medir o
alternativamente la potencia de la dcima(K)).

78

VI.2.- Dcimas para una muestra

Dcima para una proporcin (P) Una pregunta muy habitual en ciencias de
cualquier tipo es si cierta proporcin P corresponde o no a un valor dado. Por ejemplo es
habitual pensar que la proporcin de mujeres es mayor que 0.5 o que la prevalencia de
una cierta enfermedad sea menor que una prevalencia dada etc...

Supongamos por ejemplo que se dice que un cierto insecto se encuentra en el 30%
(p
0
) de las viviendas, pero en la localidad en que vivo yo lo veo en casi todas. Entonces
planteo la hiptesis: la proporcin de casas infestadas por este insecto es mayor que un
30%. En trminos estadsticos Ho: P 0.3 vs: H
1
: P > 0.3. Voy a trabajar con un nivel
de significacin de = 0.05.

Supongamos adems que examin 25 viviendas (muestra de tamao n = 25) y
encontr 13 con el insecto.

Como ya sabemos que Z = (p-P)/(PQ/n) es N(0,1), entonces uso el estadgrafo
Z = (p-p
0
)/(p
0
q
0
/n) como dcima.

Esto es porque la probabilidad de encontrar una proporcin p > 13/25 = 0.52 en
una muestra de 25 viviendas bajo el supuesto que Ho es V es: P (Z > (0.52-
0.3)/(0.30.7/25)) = P(Z > 2.41) = 0.008.

Entonces como la probabilidad de rechazar Ho con este valor dado que Ho es
verdadera es menor que 0.05, rechazo Ho y acepto H
1
: la proporcin de viviendas
infectadas es mayor que un 30% y lo afirmo con una confianza mayor que el 95% . En
realidad con una confianza a posteriori de un 99.2%, ya que hemos calculado la
probabilidad de error I como p = 0.008.

Una segunda manera de ver esto es buscando el valor crtico Co tal que P(Z>Co)
= 0.05. Este es Co = 1.64, es decir rechazar la hiptesis Ho para todo valor calculado de
z > 1.64 (zona de rechazo Rc). Como el valor calculado de Z = 2.41, entonces cae en la
zona de rechazo de Ho.

Observacin importante Si la hiptesis H
1
hubiera sido P 0.3 existiran dos
situaciones que la verifican: P< 0.3 y P > 0.3, entonces la zona de rechazo se divide en
los dos extremos de la distribucin dejando una probabilidad 0.025 en cada extremo. En
este caso hay dos puntos crticos simtricos Co = -1.96 y Co = +1.96, rechazando Ho si
Z <-1.96 o si Z > 1.96. En este caso se habla de una prueba de dos colas, y en el caso
79
anterior, de una cola. En la prctica cada vez que en H
1
aparece el smbolo se
trata de una prueba de dos colas, en caso contrario es de una cola.

As, en resumen la prueba adecuada para una muestra en el caso de una
proporcin es:

n
q p
p p
Z
0 0
0

=

Ejemplo 1.-

La prevalencia histrica de una cierta enfermedad infecciosa es de un 8%. Sin
embargo en una localidad se examinaron 196 personas, de las cuales 25 estaban
infectadas. Habr en esta localidad una mayor prevalencia o slo ser un hecho
fortuito?

Planteamos estadsticamente: Ho: P 0.08 vs. H
1
: P > 0.08. Trabajaremos con =
0.05 y el problema es de una cola, por lo que el valor crtico de rechazo es Z
c
= 1.64.
Adems, en la muestra, p = 25/196 = 0.128.

Aplico el estadgrafo Z:

48 . 2
196
92 . 0 08 . 0
08 . 0 128 . 0
=
= Z

Como el valor calculado de Z a partir de la muestra (2.48) es mayor que 1.64,
entonces cae en la zona de rechazo de Ho, y por tanto debo aceptar H
1
. En otras
palabras, puedo afirmar que en dicha localidad existe una mayor prevalencia de esta
enfermedad, con una probabilidad de error de tipo I menor que un 5%.

Dcima para el promedio () En este caso la afirmacin se refiere a una variable
continua distinta de una proporcin, por ejemplo se afirma que el peso promedio de los
hombres es ms de 70 kg.

80
Aqu la hiptesis H
1
es de una de las siguientes formas: a) >o (una cola), b)
<o (una cola) o c) o (dos colas).

Por un razonamiento completamente anlogo al anterior se esperara que el
estadgrafo adecuado fuera Z = (x -o)/(/n), sin embargo en general no conocemos
. Afortunadamente por los teoremas anteriores sabemos que t
n-1
= (x -o)/(s/n)
donde s es la desviacin estndar calculada en la muestra, que si la conocemos. Entonces
la prueba adecuada es :

n
s
x
t
n
0
1

=

Ejemplo 2.-

Supongamos que se ha propuesto que el peso promedio de un hombre es 70 Kg, y
que nosotros pensamos que es mayor. Tomamos una muestra de 60 individuos y
encontramos un peso promedio de 73 Kg, con una desviacin estndar de 1Kg. Entonces
planteamos las hiptesis en trminos estadsticos: H
0
: 70 vs > 70 y usamos el test:
2 . 23
60
1
70 73
59
=
= t . Como el valor crtico de t para una cola, 59 grados de libertad y una

mxima probabilidad de error de tipo I = 0.05, es 1.64, y adems 23.2 >>1.64,
entonces rechazamos H
0
y afirmamos que efectivamente el peso promedio de los
hombres es mayor que 70 Kg.

VI.3.- Dcimas para dos muestras

En este caso se trata de hiptesis que comparan dos situaciones y por tanto para
probarlas es necesario tomar dos muestras. Por ejemplo, si se afirma que en la ciudad A
hay ms prevalencia de cncer que en la ciudad B, es necesario tomar una muestra en A
y otra en B.

El razonamiento estadstico y la forma en que se toma la decisin son enteramente
anlogos a las anteriores por lo que nos limitaremos a escribir las hiptesis Ho y H
1
de
dos colas y los test o dcimas apropiadas.
81
Dcimas para dos proporciones

En este caso, para una prueba de dos colas, las hiptesis H
0
y H
1
se pueden
escribir como:
H
0
: (P
1
-P
2
) = P
0
vs. H
0
: (P
1
-P
2
) P
0
. Lo habitual es que P
0
= 0, pues en general interesa
la pregunta P
1
= P
2
o P
1
P
2
? La prueba a usar en este caso es:

)
1 1
(
) (
2 1
0 0
0 2 1
n n
q p
P p p
Z
+

= donde
2 1
2 2 1 1
0

n n
n p n p
p
+
+
=

Ejemplo 3.-

Interesa saber si dos insectos, A y B, se encuentran parasitados en diferente
proporcin. Se examinan 52 insectos A, de los cuales 10 estaban parasitados, y de 100
insectos B, 36 lo estaban. Entonces se plantea: H
0
: P
A
=P
B
vs. H
1
: P
A
P
B
(P
0
= 0).
Entonces 192 . 0 52 / 10
1
= = p y 36 . 0 100 / 36
2
= = p , por lo
que 303 . 0
100 52
100 36 . 0 52 192 . 0
0
=
+
+
= p . Entonces calculo Z:
14 . 2
)
100
1
52
1
( 697 . 0 303 . 0
36 . 0 192 . 0
=
+
= Z . Entonces ahora se debe tomar la decisin. El

valor crtico de rechazo para un mximo error de tipo I = 0.05 es 1.96, y como es una
prueba de dos colas rechazaremos H
0
, cuando el valor calculado de Z sea < -1.96 o >
+1.96 . En nuestro caso -2.14 < -1.96 y entonces rechazo H
0
y puedo afirmar que existe
suficiente evidencia para sostener que la proporcin de insectos parasitados es diferente.
Podemos observar adems que si nuestra hiptesis H
1
hubiera sido que el insecto B tiene
una mayor proporcin de parasitismo que A. La prueba habra sido de una cola, el valor
crtico habra sido 1.64, y nuevamente habramos rechazado H
0
, en este caso afirmando
que existe suficiente evidencia para sostener que la proporcin de insectos parasitados es
mayor en el insecto B que en A.

Dcimas para dos promedios

En el caso de hiptesis referidas a dos promedios, es necesario distinguir dos
situaciones. La primera en que son, a) dos muestras independientes y la segunda en
que es, b) la misma muestras o muestras relacionadas en dos situaciones experimentales.
Este ltimo caso es muy habitual en medicina donde se estudia la misma muestra con y
82
sin un cierto frmaco, o bien situaciones del tipo antes-despus. En este ltimo caso se
habla de muestras pareadas o dependientes

Muestras independientes

Por razones estadsticas la prueba a usar depende de si las varianzas muestrales se
pueden considerar iguales (homocedasticidad) o bien son diferentes. Una estimacin
razonable para decidir esto es hacer el cuociente s
2
M
/s
2
m,
donde s
2
M
es la varianza mayor
y s
2
m
es la varianza menor, y si es mayor que 4, son diferentes. Sin embargo es posible
docimar directamente la homocedasticidad (ver ms adelante). Las hiptesis para dos
colas son H
0
:
1
-
2
=
0
vs H
1
:
1
-
2

0
y al igual que en el caso de las proporciones lo
habitual es que
0
= 0.

a) Si las varianzas se pueden considerar iguales (homocedasticidad) entonces usamos:

)
1 1
(
2 1
2
0 2 1
2
2 1
n n
s
x x
t
c
n n
+

=
+

donde
2
) 1 ( ) 1 (
2 1
2
2 2
2
1 1 2
+
+
=
n n
s n s n
s
c

Ejemplo 4.-

Se afirma que la especie A pesa ms que la especie B. Entonces se plantean las
hiptesis H
0
:
A

B
> 0 vs H
1
:
A
-
B
0 y se toman muestras de A y de B.
Supongamos que en 46 individuos de A el peso promedio fue 36g con una desviacin
estndar de 6g y que en 50 individuos de B el peso promedio fue 33 g con una
desviacin estndar de 5g. As como el cuociente entre las varianzas es 6
2
/5
2
= 1.44, es
decir es menor que 4, usando nuestra regla simple, podemos suponer homocedasticidad.
Adems podemos estimar la varianza comn s
2
c
como:
27 . 30
2 50 46
25 49 36 45
2
=
+
+
=
c
s . Ahora podemos usar nuestro test:
67 . 2
)
50
1
46
1
( 27 . 30
33 36
94
=
+
= t . Para = 0.05 y una cola, el valor crtico de t es 1.64,

entonces como 2.67 > 1.64, rechazamos H
0
y podemos sostener H
1
, es decir A pesa ms
que B.
Observamos que el valor crtico de t con 94 grados de libertad es 1.64, idntico al
valor crtico para Z en el caso de una cola. Esto no debe extraarnos, pues como hemos
enunciado en un teorema anterior, si el tamao muestral aumenta, la distribucin t se
aproxima a la normal N(0,1) (Z).
83
2
2 2
1 2
1 2
2 2
2 2
1 2
1 2
1 2
1 1
s s
n n
gl
s s
n n
n n
| |
+
|
\ .
=
| | | |
| |
\ . \ .
+

b) si no hay homocedasticidad, entonces usamos:

) (
2
2
2
1
2
1
0 2 1
n
s
n
s
x x
t
gl
+

=

pero los grados de libertad gl los estimamos mediante

Ejemplo 5.-

Usando el mismo caso anterior, pero ahora las desviaciones estndar son: para A
6g y para B 2g. Entonces la razn entre las varianzas es 36/4=9. Entonces no podemos
suponer varianzas iguales. En este caso:

23 . 3
)
50
4
46
36
(
33 36
=
+
=
gl
t y los grados de libertad: 55 15 . 54
1 50
) 50 / 4 (
1 46
) 46 / 36 (
) 50 / 4 46 / 36 (
2 2
2
=
+
= gl
Entonces con = 0.05 y una cola el valor crtico de t es aproximadamente 2.
Como 3.23 > 2, entonces nuevamente rechazamos H
0
y la interpretacin es la misma.

Muestras dependientes (pareadas)

Este caso es equivalente a una dcima para promedio de una muestra. Se crea la
variable auxiliar d = x
1
-x
2
, se calcula su promedio d y su desviacin estndar s
d
. Las
hiptesis en este caso son referidas al parmetro D =
1
-
2
. Por ejemplo, proponer que
H
1
:
1
>
2
, es equivalente a H
1
: D > 0. Entonces el test de hiptesis a usar es:

n s
d
t
d
n
/
1
=

84
Ejemplo 6.-

Se piensa que un frmaco baja la presin arterial. Entonces se estudian 10
individuos, tomndole la presin diastlica antes y despus de la administracin del
frmaco obteniendo:

Individuos Antes (x
1
) Despus (x
2
) d = x
1
-x
2

1 100 95 5
2 95 95 0
3 80 85 -5
4 90 80 10
5 98 90 8
6 105 95 10
7 110 95 15
8 100 92 8
9 90 80 10
10 110 93 17
Total 978 900 78
Promedio 97.8 90
d =7.8
Desviacin estndar 9.5 6.1 s
d
= 6.5

Entonces se pueden plantear las hiptesis de una cola: H
0
: D 0 vs H
1
: D > 0, ya que
pensamos que la presin antes debe ser mayor que despus (
1
>
2
, o D =
1
-
2
> 0).
Calculamos el valor del estadgrafo: 79 . 3
10 / 5 . 6
8 . 7
9
= = t . Como, para = 0.05 el valor
calculado de t (3.79) es mayor que el valor crtico de t, con 9 grados de libertad y una
cola (1.83), rechazamos H
0
y entonces podemos afirmar que efectivamente el frmaco
baja la presin arterial.

VI.4.- Supuestos de las dcimas

Para que las dcimas tengan real validez, se deben cumplir ciertos supuestos
bsicos que provienen del uso de ciertas distribuciones como una t de Student o una
normal estandarizada Z = N(0,1). Las dcimas para una y dos muestras deben cumplir
algunos o todos los siguientes supuestos:

i) independencia
ii) normalidad
iii) homocedasticidad

85
Independencia Es el requisito fundamental de todas las dcimas. Cada elemento
de la muestra debe ser independiente del resto. Es decir los elementos de una muestra no
deben estar relacionados entre s, mas que por el hecho de pertenecer a la misma
situacin experimental. Por ejemplo, si estamos estudiando un parmetro fisiolgico, no
parece conveniente incluir hermanos en la misma muestra porque sus fisiologas pueden
ser semejantes violando el supuesto de independencia. En este caso los elementos de la
muestra no constituyen rplicas sino seudo rplicas. Aunque no siempre es fcil decidir
si los elementos son realmente independientes, por ejemplo en el caso de las plantas de
un prado, el supuesto de independencia lo debe asegurar el investigador. Cuando existen
dudas es posible realizar un estudio de correlacin de los errores a travs de una dcima
de Durbin-Watson (que no se tratar en este libro).

Normalidad Este supuesto se refiere a que se espera que las variables
consideradas en las muestras tengan distribucin normal. Esto proviene de los supuestos
en que se fundamentan las distribuciones que se usan como estadgrafos.
Existen varias pruebas para probar la normalidad de los datos de una muestra. En
este captulo slo mencionaremos tres y en los siguientes describiremos dos de ellas.
Estas son i) Prueba de Lilliefors que consiste en una prueba grfica utilizando una
distribucin normal acumulada, ii) Bondad de ajuste de Kolmogorov-Smirnov e iii)
Bondad de ajuste
2
.

Homocedasticidad Este supuesto consiste en la suposicin de igualdad de
varianzas, que es necesario slo para comparar promedios con suposicin de la
existencia de una varianza comn. En prrafos anteriores habamos dado una regla
simple: si el cuociente entre las varianzas era mayor que 4, entonces las suponamos
distintas. En esta ocasin vamos a ser ms rigurosos y plantearemos las hiptesis Ho:
2
1

=
2
2
(homocedasticidad) vs. H
1
:
2
1

2
2
. Para tomar la decisin se usa el test F de
Snedecor (F en honor a Fisher):

2
2
) 1 ( ), 1 (
2 1
m
M
n n
s
s
F =

, donde S
M
2
representa la varianza mayor y S
m
2
la menor.

Ejemplo 7.-

Supongamos que se tienen datos de altura de dos poblaciones (A y B)de una
especie de rbol:

Poblacin A B
Nmero de rboles 46 68
Altura promedio 3.5 m 4.3 m
Desviacin estndar 0.6 m 1.26 m
86

Planteamos la hiptesis H
1
que los rboles de la poblacin B son ms altos que los
de la poblacin A. Entonces, en trminos estadsticos H
0
:
B

A
vs H
1
:
B
>
A
, por lo
que es una hiptesis de promedios, de una cola, para dos muestras. Surge entonces la
pregunta puedo considerar las varianzas iguales? Entonces, antes de preocuparme por
mi hiptesis principal, planteo las hiptesis: Ho:
2
1
=
2
2
(homocedasticidad) vs. H
1
:
2
1

2
2
y aplico el test: F
67,45
=(1.26)
2
/(0.6)
2
= 4.41 y comparo este valor con el valor
crtico de la distribucin F, con 67 grados de libertad en el numerador y 45 grados de
libertad en el denominador: 1.62. Como 4.41 > 1.62, entonces rechazo la
homocedasticidad (H
0
) y deber considerar las varianzas como diferentes.

Ahora nos preocupamos de la hiptesis principal y aplicamos el test adecuado:

53 . 4
)
46
36 . 0
68
59 . 1
(
5 . 3 3 . 4
=
+
=
gl
t con 103 3 . 102
1 46
) 46 / 36 . 0 (
1 68
) 68 / 59 . 1 (
) 46 / 36 . 0 68 / 59 . 1 (
2 2
2
=
+
= gl
Como 4.53 > 1.64 (valor crtico), entonces rechazo H
0
y afirmo que efectivamente
los rboles de B son ms altos que los de A.
87
Ejercicios de Pruebas de Hiptesis para una y dos muestras

1. Un cierto tipo de cncer tiene habitualmente una letalidad (nmero de muertos por
cada cien enfermos) de 30. Se experimenta una nueva droga en 80 casos, en los
cuales se producen 15 defunciones. Qu puede decir usted sobre la eficiencia de la
droga?
a) Seale la hiptesis de trabajo.
b) Seale el nivel de significacin.
c) Realice la prueba de significacin estadstica. R: Z = -2.19
d) Saque conclusiones. R: La droga disminuye la letalidad.

2. De acuerdo con las leyes de Mendel, el cruzamiento de heterocigotos produce una
descendencia formada por dos tipos de individuos: aquellos con carcter dominante
que representan el 75% y el resto presenta el carcter recesivo. En un experimento
con 500 semillas se obtienen 360 semillas amarillas (dominante) y 140 verdes.
Puede aceptarse que esta distribucin es mendeliana?
R: Z = -1.55, si es mendeliana.

3. Habitualmente la ictericia fisiolgica del recin nacido dura 3.8 das. Al tratar a 100
nios con fototerapia, el perodo ictrico dura 2.8 das con una desviacin estndar de
2.7 das. Es la fototerapia un tratamiento efectivo contra la ictericia?.
R: t
99
= -3.7; la fototerapia es efectiva.

4. Se ha medido la concentracin de una sustancia en clulas tratadas con un compuesto
que se cree sedimenta dicha sustancia, y en clulas no tratadas (controles), dando los
siguientes resultados (en ng/mL): Que puede Ud. decir?

Controles Tratadas
68 66
21 29
100 50
48 77
46 110
7 55
5 91
57 90
96 114
138 50
R: t
9
= 0.89. No hay evidencias de variaciones de concentracin.

88
5. Se ha observado que la administracin de dosis bajas de aspirina en pacientes
sometidos a dilisis renal disminuye la frecuencia de trombosis. As, en pacientes a
los que se les administr un placebo presentaron trombosis en un 70% de los casos y
en aquellos que recibieron aspirina, se observ trombosis slo en el 50% de los casos.
a) Si el nmero de pacientes es de 30 para ambos grupos, cul sera su conclusin
respecto al efecto de la aspirina?
b) Si el nmero de pacientes es 60, cul sera ahora su conclusin?
R: a) Z = -1.58, no hay evidencia; b) Z = -2.24, la aspirina reduce el riesgo de trombosis.

6. Se han realizado mediciones de metabolismo en carrera en felinos provenientes de
dos zonas (norte y sur). De 15 felinos nortinos medidos, se obtuvo un metabolismo
de 0.120.02 [ml O
2
kg
-1
m
-1
] (promedioSD). De 23 felinos sureos, se obtuvo un
metabolismo de 0.150.06 [ml O
2
kg
-1
m
-1
]. Existe diferencia entre los
metabolismos?.
R: No hay homocedasticidad; t
28
=-2.22, si existe diferencia.

7. La contraccin (en mm) de los teros de 8 ratas usando dos hormonas distintas (A y
B) es la siguiente:

tero Hormona A Hormona B
1 28 24
2 30 29
3 25 28
4 34 30
5 35 25
6 26 19
7 31 32
8 32 32

Existe efecto diferencial entre las dos hormonas? Use nivel de significacin del 1%.
R: t
7
= 1.79; no hay evidencias de efecto para el nivel 1%.

8. Se desea saber si una determinada dieta produce o no aumento de peso. Para ello se
toma una muestra de 7 individuos, los cuales son pesados antes de iniciar la dieta y
despus de 3 meses de seguirla rigurosamente. Los resultados (en kg) son los
siguientes:

Individuo Antes Despus
1 95 85
2 90 85
89
3 110 104
4 80 78
5 95 94
6 83 75
7 91 91
Existirn evidencias para suponer que esta dieta produce una disminucin
significativa del peso? (Use nivel de significacin del 1%).
R: t
6
= 3.24; si hay evidencias de reduccin de peso.

10. Se realiz un estudio sobre dos poblaciones de Spalacopus cianus (Cururo)
provenientes de la costa y de la cordillera. Se les midi el largo del pelo a 20
individuos de cada poblacin, resultados que fueron tabulados en la siguiente tabla.

LARGO DEL PELAJE
[MM]
f
costa
f
cordillera

10-12 1 2
12-14 3 5
14-16 6 8
16-18 6 3
18-20 2 2
20-22 1 0
22-24 1 0

Existe diferencia en la longitud del pelo entre ambas poblaciones? (pruebe los
supuestos y elija la dcima adecuada).
R: t
38
= 1.77; no hay evidencias de diferencias.

11. Mientras paseaba por el parque, un seor se puso a contar el nmero de perros que
eran sacados a pasear por sus dueos. Los siguientes datos corresponden al nmero
de perros por persona, separando hombres de mujeres, obtenidos en esta productiva
tarde de ocio.
Hombres: 1 - 1 - 2 - 2 - 2 - 3 - 3 - 3 - 3 - 4 - 4 - 6 - 9
Mujeres: 1 - 1 - 1 - 2 - 2 - 2 - 2 - 2 - 2 - 3 - 3 5

Suponiendo que los datos son normales, determine si existe diferencia en el nmero
de perros sacados a pasear entre hombres y mujeres
R: t
23
= 1.63; p = 0.059.

12. En un anlisis qumico de las aguas del ro Mapocho, se encontr que los valores de
concentracin de coliformes fecales presentaban mayor variabilidad cuando eran
tomados durante la maana que durante la tarde. La muestra tomada en la maana
90
presento una varianza de 23 mg
2
/mL
2
(N=15) y la muestra de la tarde, una varianza
de 20 mg
2
/mL
2
(N=20). Tienen razn los investigadores?.
R: no.
91

VII.- ANLISIS DE DATOS ENUMERATIVOS O FRECUENCIAS

VII.1.- La distribucin
2

Muchas veces en ciencias las hiptesis se refieren a diferencias en cantidades o
frecuencias entre diferentes poblaciones, por ejemplo nmero de enfermos, poblacin
animal, etc. Una distribucin muy til en stos casos es la distribucin
2
, que como
recordamos proviene de una variable aleatoria x con distribucin normal estandarizada,
N(0,1), elevada al cuadrado. Si sumamos n variables de este tipo se obtiene una nueva
variable X = x
2
con distribucin
2
n
, es decir una distribucin cuya forma depende de
un parmetro n llamado grados de libertad.

Si recordamos que Z = (x-)/ tiene distribucin N(0,1), es obvio que Z
2
tiene
distribucin
2
1
y entonces
2
n
= [(x-)/]
2
tiene distribucin
2
n
. Si en esta ltima
variable estimamos directamente de la muestra restringimos en uno los grados de
libertad. Bstenos observar que si nos lo proponemos, se pueden escoger libremente tres
nmeros, pero si se los somete a la condicin de que el promedio es un nmero
determinado, entonces slo se pueden escoger dos libremente pues el ltimo queda
determinado por la condicin (se ha restringido en uno los grados de libertad).

Supongamos que no es muy diferente de
2
(como en una distribucin de
Poisson) y que ambos los estimamos por un valor esperado e a partir de la muestra.
Entonces esperamos que la variable:

X
2
= (o-e)
2
/e , donde o es un valor observado de x y e su esperado, tenga
distribucin
2
n-1
. Este estadgrafo es conocido como Chi-cuadrado.

Veamos esto de otra forma. Supongamos que en una muestra de N individuos hay
N
1
mujeres y N
2
hombres y que a priori esperamos que la mitad fueran mujeres, entonces
o
1
= N
1
, o
2
= N
2
, e
1
= N/2 = e
2
y entonces X
2
= (N
1
-N/2)
2
/(N/2) + (N
2
-N/2)
2
/(N/2) =
= (N
1
-N
2
)
2
/N = 4N(N
1
-N
2
)
2
/4N
2
= [(N
1
-N
2
)/2N]
2
/(1/4N) = (N
1
/N 1/2)
2
/[((1/21/2)/N)]
2

= [(p- P)/(PQ/N)]
2
= Z
2
.

En un ejemplo numrico supongamos que se tienen 35 hombres y 46 mujeres en
una muestra de 81 personas. Entonces si probamos Ho: P = 0.5 vs. H
1
: P 0.5 usamos el
estadgrafo Z = = (p- P)/(PQ/N) = (35/81- 0.5)/(0.50.5/81) = 1.222 y como el valor
crtico de Z para dos colas es Z = 1.96, entonces acepto Ho.

92
Si ahora calculo X
2
considerando que ambos valores esperados son e =
0.581=40.5, obtengo X
2
= (35-40.5)
2
/40.5 + (46-40.5)
2
/40.5 = 1.4938.

Es fcil ver que Z
2
=1.222
2
= 1.4938= X
2
.

Tablas de contingencia

La distribucin
2
cobra su mayor importancia en las tablas de doble entrada o
tablas de contingencia. Estas son la manera habitual de presentar datos enumerativos.
Por ejemplo tres poblaciones A, B y C y en cada una de ellas el nmero de enfermos y
no enfermos.

A B C Total
marginal
Enfermos

No enfermos

Total
marginal
Gran total

En general una tabla de doble entrada se puede escribir as:

C1 C2 ...... Ct T. marginal
R1 N
1,1
N
1,2
...... N
1,t
N
1,0

R2 N
2,1
N
2,2
....... N
2,t
N
2,0

.. .......
Rr N
r,1
N
r,2
N
r,t
N
r,0

T. marginal N
0,1
N
0,2
........ N
0,t
N
0,0

Es fcil darse cuenta que si todos los N se comportan en forma homognea en las
distintas columnas (C), entonces se cumple que las proporciones en cada columna deben
ser semejantes a las proporciones en los totales marginales. Por ejemplo debera ocurrir
que N
1,1
/ N
o,1
N
1,o
/ N
o,o.

Entonces si la respuesta es homognea los valores esperados para cada celda se
pueden determinar como: e
i,j
= (N
i,o
/N
o,o
)N
o,j
.

Existen dos tipos de diseos experimentales que conducen a una tabla de doble
entrada. En el primero se tomas muestras aleatorias sin regular los totales marginales de
ninguna de las dos entradas y lo que interesa es saber si existe asociacin entre las
93
variables de clasificacin (entradas) o independencia. En este caso Ho: independencia
vs. H
1
: asociacin. En cambio en el segundo se escoge una muestra de un mismo tamao
determinado para cada nivel de una primera entrada (total marginal regulado), y en cada
una se determina el nmero que se encuentra en cada nivel de la segunda entrada. En
este ltimo caso interesa la homogeneidad de la repuesta de la segunda variable de
clasificacin, dentro de la primera. En este caso Ho: homogeneidad vs. H
1
: diferencia.

En ambos casos el estadgrafo adecuado es:

=

j i
c r
e
e o
,
2
2
) 1 )( 1 (
) (
donde r es el nmero de filas y c el nmero de columnas.

Observaciones importantes

i) Por su derivacin la prueba Chi-cuadrado en general se debe usar cuando
los valores esperados son 5.

ii) La prueba de hiptesis es siempre de 2 colas.

iii) Cuando se realiza una prueba de independencia vs. asociacin, una buena
medida de la asociacin es: X
2
/(N
o,o
(m-1)), donde m es el menor valor
entre r y c.

iv) El rechazo de la hiptesis Ho en una prueba de homogeneidad indica
diferente respuesta el algn nivel (C) de la primera variable clasificatoria,
pero no informa cual nivel es el diferente. En caso que esto sea relevante se
debe ir sacando en forma iterada la columna que ms contribuye al valor
del X
2
y recalculando el valor de X
2
hasta que este deje de ser significativo.
Las columnas que queden sern homogneas. (Comparaciones mltiples en
2
)

iv) En el caso de una tabla de contingencia de 2x2, cuando no se cumple con
N
i,j
> 5, se debe realizar la prueba exacta de Fisher que proviene de una
distribucin hipergeomtrica

Ejemplo 1.-

Supongamos que se desea saber si existe asociacin entre el color de las flores y la
presencia de abejas. Se realiza un estudio y se obtiene:

94
Blancas Rojas Amarillas Total
Con abejas 45 24 60 129
Sin abejas 36 83 40 159
Total 81 107 100 288

Entonces planteamos las hiptesis H
0
: independencia u homogeneidad de
proporciones vs. H
1
: asociacin entre el color de las flores y la presencia de abejas.
A continuacin hay que calcular los valores esperados para cada celda. Por
ejemplo para la primera celda e = 81(129/288), o sea de el total de 81 flores blancas, si a
la abeja no le importa el color de la flor (independencia), se espera que una proporcin
(129/288) de ellas sea visitada por abejas. Entonces e = 36.3. Para la segunda celda e =
81(159/288) = 44.7. Notamos enseguida que 36.3 + 44.7 = 81. As se puede proseguir el
clculo para cada celda, obteniendo:

Blancas (esperadas) Rojas (esperadas) Amarillas (esperadas) Total
Con
abejas
45 36.3 24 47.9 60 44.8 129
Sin
abejas
36 44.7 83 59.1 40 55.2 159
Total 81 107 100 288

Ahora entonces podemos calcular el valor del X
2
:

7 . 34 ......... ..........
9 . 47
) 9 . 47 24 (
7 . 44
) 7 . 44 36 (
3 . 36
) 3 . 36 45 (
2 2 2
2
2
= +
=

El valor crtico de Chi-cuadrado para 2 grados de libertad y = 0.05 es 5.99, y
como 34.7>>5.99, rechazamos H
0
y afirmamos que existe una asociacin entre el color
de las flores y la presencia de abejas.

Si queremos avanzar ms, observamos que la columna que ms contribuye al
valor del estadgrafo es la de las flores rojas, que tiene una proporcin menor de visitas
de abejas que la esperada. Entonces retiramos la columna y recalculamos los valores
esperados obteniendo:

Blancas (esperadas) Amarillas (esperadas) Total
Con
abejas
45 47.0 60 58.0 105
Sin
abejas
36 34 40 42.0 76
Total 81 100 181
95

Planteamos una nueva hiptesis de independencia versus asociacin y calculamos
el valor de X
2
:

36 . 0
42
) 42 40 (
58
) 58 60 (
34
) 34 36 (
47
) 47 45 (
2 2 2 2
2
1
=
=

Como el valor crtico es ahora 3.84 y 0.36 < 3.84, ahora acepto H
0
y puedo
concluir que las abejas prefieren igualmente las flores blancas y amarillas, pero evitan en
cierta medida las flores rojas.

Prueba exacta de Fisher Supongamos que tenemos la siguiente tabla de doble
entrada:

FACTOR 1

+ - TOTAL
FACTOR 2 (+) A B A+B
FACTOR 2 (-) C D C+D
TOTAL A+C B+D N

Observamos que la probabilidad de que haya A asociaciones (+,+) dados los
totales marginales es:

Desarrollando los nmeros combinatorios se llega a:

P(X= A) = (A+C)!(B+D)!(A+B)!(C+D)!/A!B!C!D!N!.

Entonces la probabilidad de obtener una asociacin igual o mayor, dados los
totales marginales es P = P(X=x), x A.
( )
A C B D
A B
P X A
N
A B
+ + | || |
| |
\ .\ .
= =
| |
|
+
\ .
96

De esta manera entonces, en trminos generales, la prueba exacta de Fisher para
una tabla de contingencia de 2x2 es:

= = = =
1 , 1
! ! ! ! !
! ! ! !
) ( ); (
0 , 0 2 , 2 1 , 2 2 , 1 1 , 1
1 , 0 1 , 0 0 , 2 0 , 1
N x
F
N N N N N
N N N N
x X dondeP x X P P

La hiptesis de nulidad es la independencia (es decir la asociacin es la esperable
por simple azar) vs. H
1
: existe una asociacin mayor (una cola) o distinta (dos colas) que
la esperada por azar. En el caso de una cola la probabilidad de error I es p = P y en el
caso de dos colas p = 2P. Rechazamos Ho si p < 0.05.

Ejemplo 2.-

Supongamos que hubo una intoxicacin en una comida y pensamos que la
mayonesa estaba contaminada. Hacemos un estudio de los casos obteniendo:

Intoxicados No intoxicados Total
Comieron mayonesa 8 2 10
No comieron
mayonesa
2 4 6
10 6 16

Planteamos la hiptesis de una asociacin positiva entre la mayonesa y la
intoxicacin. Es decir, la hiptesis de nulidad es que la probabilidad de intoxicacin es
la misma entre los que comieron y no comieron mayonesa (P = 10/16 = 0.625).

Calculamos 084 . 0
! 16 ! 4 ! 2 ! 2 ! 8
! 6 ! 10 ! 6 ! 10
) 8 ( =

= = X P

Ahora deberamos sumarle P(X=9) y P(X=10), para calcular finalmente P
F
=
P(X=8) + P(X=9) +P(X=10). Sin embargo, como P
F
va a dar un valor mayor que 0.084,
que a su vez es mayor que 0.05 = , debemos aceptar H
0
. Es decir, no existe suficiente
evidencia para afirmar que existe una asociacin entre la mayonesa y la intoxicacin.

VII.2.- Bondad de ajuste de
2
Cuando es necesario saber si una determinada variable
tiene una cierta distribucin, se realiza la prueba de bondad de ajuste.

Si agrupamos en n intervalos los valores de una variable aleatoria X, siempre ser
posible establecer una tabla del tipo:
97

Intervalo Frecuencia (n
i
)
observada
Frecuencia esperada (e
i
)
(yo,y
1
) n
1
E
1

(y
1
,y
2
) n
2
E
2

.......... ....... .......
Total N N

Las frecuencias esperadas corresponden a e
k
= NP(y
k-1
x y
k
), donde las
probabilidades son calculadas de acuerdo a la funcin de densidad de probabilidades o la
funcin de cuanta de la distribucin esperada. El caso ms habitual es esperar una
distribucin normal. Sin embargo para calcular estas probabilidades es siempre
necesario estimar una cantidad p de parmetros, a partir de la muestra, por ejemplo, y
(p = 2). Es por esto que la distribucin
2
usada para probar la bondad de ajuste es:

=

e
e o
p n
2
2
1
) (

Observamos que en este caso el nmero de grados de libertad es igual al nmero
de intervalos menos 1 y menos el nmero de parmetros estimados a partir de la
muestra.

Ejemplo 3.-

Supongamos que estamos interesados en saber si cierta variable tiene una
distribucin normal y se tiene la serie agrupada de la siguiente forma:

Intervalo n
i

2-4 20
4-6 25
6-8 30
8-10 10
10-12 12
12-14 3
Total 100

Aqu las frecuencias relativas (n
i
) corresponden a las frecuencias observadas (o).
Entonces debemos calcular las frecuencias esperadas suponiendo una distribucin
normal. Mediante las tcnicas aprendidas en estadstica descriptiva podemos calcular el
promedio (6.56) y la desviacin estndar (2.74). A continuacin debemos calcular las
probabilidades de que un valor de la variable pertenezca a cada intervalo. Por ejemplo
98
P(2x4) = P((2-6.56)/2.74 z (4-6.56)/2.74) = 0.1277. P(4x6) =0.2445; P(6x8)
= 0.2778; P(8x10) = 0.1977; P(10 x12) = 0.0799 y P(12 x14) = 0.0204.
Entonces las frecuencias esperadas son respectivamente:0.1227x100 = 12.3; 24.5; 27.8;
19.8; 8.0 y 2.0 .

Intervalo Observado
s
Esperados
2-4 20 12.3
4-6 25 24.5
6-8 30 27.8
8-10 10 19.8
10-12 12 8.0
12-14 3 2.0
Total 100

La hiptesis de nulidad H
0
corresponde a un ajuste a una distribucin normal
sujeta a dos condiciones (p = 2): Promedio 6.59 y desviacin estndar 2.74. Entonces
podemos calcular X
2
:

36 . 12 ..........
8 . 27
) 8 . 27 30 (
5 . 24
) 5 . 24 25 (
3 . 12
) 3 . 12 20 (
2 2 2
2
1 2 6
= +
=

Entonces como el valor crtico para tres grados de libertad y = 0.05 es 7.81, y el
valor calculado 12.36 > 7.81, rechazamos la hiptesis de nulidad. Es decir esta variable
no tiene distribucin normal.

VII.3. El
2
para proporciones

En ocasiones es necesario comparar dos o ms proporciones, lo cul puede
hacerse con una prueba de
2
. Ya hemos visto que cuando la hiptesis es de dos colas es
posible comparar 2 proporciones a travs de Z = N(0,1) o bien con un
2
. En el caso de
ms de dos proporciones puede usarse:

q p
p p n
n
i i
n
1 2
1
) (
en donde n p n p
i
i
/
1
=

Observamos que este caso es enteramente equivalente al
2
para una tabla de
contingencia.

99
VII.4.- La prueba G

Una aproximacin alternativa a la prueba de
2
para bondad de ajuste y tablas de
contingencia es la prueba del logaritmo del cuociente de verosimilitudes (log-
likelihood ratio), prueba 2I, o prueba G.

Para iliustrar esta prueba consideremos por ejemplo que en n ensayos de Bernoulli
se obtuvieron f
1
xitos y f
2
fracasos y nos preguntamos si estas frecuencias corresponden
a las frecuencias esperadas de acuerdo a un cierto criterio, por ejemplo si estn en
relacin a:b. Si fuera as la probabilidad de un xito sera p = a/(a+b) y de fracaso q =
b/(a+b). Sin embargo, las proporciones observadas son: ) /( ); /(
2 1 2 2 1 1
f f f q f f f p + = + = .

Entonces la probabilidad de obtener f
1
xitos basados en la hiptesis de nulidad
es:
2 1
1
f f
q p
f
n
p
|
|
.
|
\
|
= y la probabilidad de obtener f
1
xitos basados en lo observado es:
2 1
1

f f
q p
f
n
p
|
|
.
|
\
|
= . As el cuociente entre estas probabilidades (verosimilitud; L) es:
2 1

f f
q
q
p
p
L
|
|
.
|
\
|
|
|
.
|
\
|
= y considerando que las frecuencias f
i
= np
i
se obtiene:

2
2
2
1
1
1

f f
f
f
f
f
L
|
|
.
|
\
|
|
|
.
|
\
|
= , y sacando logaritmo natural:

= = + =
a
i i i
f f f f f f f f f L )
/ ln( ... )
/ ln( )
/ ln( ) ln(
2 2 2 1 1 1

En esta expresin se puede reconocer la definicin de informacin (I) de Shannon.
Por otra parte s ha demostrado que G = 2I = 2ln(L) sigue una distribucin
2
a-1
.
100

Ejemplo 4.- Supongamos que en un experimento gentico se espera una relacin
3:1 para un cierto carcter y se ha obtenido: 80 con el carcter y 10 sin el carcter. En
tonces se propone H
0
: las frecuencias se encuentran en relacin 3:1. Y podemos calcular:

Resultados Observados

Propocin
observada

Proporcin
esperada
Frecuencia
Esperada
Razn
f obs/f esp
Producto
fr x
ln(razn)
Con el
carcter
80 8/9 3/4 67.5 1.18 13.59
Sin el
carccter
10 1/9 1/4 22.5 0.44 -8.11
Total 90 1 1 90 lnL=5.48

Entonces G = 2x5.48 = 10.96 y como sigue una distribucin
2
, en este caso con 1
grado de libertad, es fcil ver que p << 0.01 y entonces rechazamos H
0
.
101

Ejercicios de anlisis de datos enumerativos

1. Un peluquero quiere saber si el color de pelo es dependiente del sexo de las personas
o no. Por eso acude a usted con una serie de datos sobre el sexo y color de pelo de sus
clientes (ver tabla adjunta), y le pide que por favor le resuelva su duda. Qu le dira
usted al peluquero?.

SEXO\COLOR
PELO
Negro Castao Rubio Colorn
Masculino 32 43 16 9
Femenino 55 65 64 16

R:
2
3
= 8.99; p < 0.05. Existe asociacin entre el color del pelo y el sexo.

2. La Secretara de Estudios de la facultad necesita saber si existe alguna relacin entre
el nivel de desercin de los alumnos de primer ao y el hecho que hayan tomado
determinado curso. Por eso, la secretaria acudi a un estadstico con los datos
presentados en la siguiente tabla, y le pidi que le diera una respuesta. Qu cree que
le respondi a la secretaria?

Toma el curso No toma el curso
Se va 37 31
Se queda 26 40

R:
2
1
= 3.03; p > 0.05. No hay evidencias que as sea.

3. Se desea averiguar si existe alguna relacin entre el biotipo de un individuo y la
probabilidad de que tenga alguna lesin gstrica. Para eso se analiz el grupo
sanguneo de individuos sanos (control), con cncer gstrico y con lcera gstrica,
obtenindose los siguientes resultados:

Biotipo Cncer lcera Control Total
Ectomrfico 383 983 2892 4258
Mesomrfico 416 679 2625 3720
Endomesomrfico 84 134 570 788
Endomrfico 25 43 226 294
Total 908 1839 6313 9060

102
Son eventos independientes el grupo sanguneo y la lesin gstrica?

R: No son independientes.
2
6
= 48.61; p << 0.05.

4. En un experimento para determinar el modo de herencia de un mutante, se
obtuvieron 146 descendientes del tipo normal y 30 mutantes cuando se cruzaron
las moscas de la generacin F
1
. Comprobar si los datos concuerdan con la
hiptesis de que la proporcin de individuos normales y mutantes es 3: 1.

R:
2
1
= 5.94; p > 0.05. No concuerdan.

5. En un estudio sobre polimorfismo de inversiones cromosmicas en el saltamontes
Moraba scurra, Lewontin y White (1960), dieron los siguientes resultados para la
composicin de una poblacin en Royalla B en 1958. Estn las frecuencias de
las tres combinaciones del cromosoma EF asociadas a las frecuencias de las tres
combinaciones del cromosoma CD?

R: No. Son independientes.
2
4
= 6.3; p > 0.05

6. En la localidad A se ha realizado una captura exhaustiva de serpientes de la
especie S. Un examen de los 167 machos adultos que han sido recogidos revela
que 35 de stos presentan bandas plidas alrededor del cuello. De la localidad B, a
30 kilmetros de distancia de la A, se obtuvo una muestra de 27 machos adultos
de la misma especie, 6 de los cuales presentaban bandas. Cul es la probabilidad
de que ambas muestras procedan de la misma poblacin estadstica con respecto a
la frecuencia de bandas?
R: p = 0.88.
St/St St/B1 B1/B1
Td/Td 22 96 75
St/Td 8 56 64
St/St 0 6 6
Cromosoma CD
Cromosoma EF
103

VIII.- ESTADSTICA DE DISTRIBUCIN LIBRE O NO-PARAMTRICA

Las dcimas que hemos mencionado hasta ahora, siempre presuponen
distribuciones particulares de la variable aleatoria, o bien sus hiptesis especifican
parmetros o distribuciones. Por esto la estadstica que las usa se denomina estadstica
paramtrica. Pero, qu sucede cuando no se cumplen los supuestos necesarios para
tales dcimas?

Existe un conjunto de dcimas denominadas no-paramtricas o de distribucin
libre que vienen a constituirse en alternativas para stos casos o para ser usadas
directamente. Sin embargo es interesante notar que es diferente no especificar
parmetros que no suponer una cierta distribucin. Si se clasifican las dcimas se puede
establecer el siguiente cuadro:

Supuestos de
Distribucin
Sin supuestos de
Distribucin
Especifica parmetro Ej: t de Student Ej: Dcima Binomial
No especifica parmetro Ej: Wilcoxon Ej: Kolmogorov-
Smirnov

Esta estadstica se utiliza fundamentalmente cuando no se cumplen los supuestos
de la estadstica paramtrica y, lo que en general va ligado, cuando el nmero muestral
es bajo. Tiene ciertas ventajas como la simplicidad de tratamiento para nmeros bajos y
la falta de supuestos acerca de distribuciones o parmetros. Sin embargo, tiene algunas
crticas: i) con n > 10 en general se usan las distribuciones asintticas de los estadgrafos
y no sus propias distribuciones, y stas son paramtricas, ii) son dcimas con menor
potencia (mayor error de tipo II), iii) por ser discretas presentan cierta dificultad a fijar el
nivel de significacin, e iv) en general se basan en la transformacin de los valores a
rangos, siendo sta ltima transformacin irreversible y anisomtrica (no conserva las
distancias).

Existen alternativas no-paramtricas para una muestra (Pruebas de Mediana,
Dcimas Binomiales), pero las ms usadas son las alternativas a las pruebas para 2
muestras o las alternativas para el anlisis de la varianza (ver ms adelante).

104

VIII.1.- Alternativas no paramtricas a las dcimas para dos muestras

Se pueden resumir en el siguiente cuadro:

Muestras pareadas, distribucin asimtrica SIGNOS DE FISHER
Muestras pareadas, distribucin simtrica RANGOS SIGNADOS DE WILCOXON
Muestras independientes SUMA DE RANGOS DE WILCOXON-
MANN-WHITNEY
Datos enumerativos McNEMAR

Prueba de los signos de Fisher

En esta prueba se comparan dos muestras [x
i
] e [y
i
] y se define una diferencia
poblacional
i
= x
i
-y
i
= +
i
, donde
i
representa el error de muestreo. Entonces las
hiptesis pueden ser a) Ho: = 0 vs H
1
: 0, b) Ho: 0 vs. H
1
: > 0 o c) Ho: .0
vs. H
1
: < 0. Se define adems d
i
como la diferencia muestral d
i
= x
i
-y
i
y una variable
auxiliar b
i
que es 0 si d
i
0 y 1 si d
i
> 0.

El estadgrafo es:
=
i
b B

Observamos inmediatamente que B corresponde al nmero de ocasiones de un
total de n en que x
i
> y
i,
y, que al azar se esperara que fuera el 50%. Entonces es
posible calcular directamente la probabilidad de calcular esto mediante una distribucin
binomial (de aqu es que se denomina B). Afortunadamente no hay que hacer ningn
clculo y stas probabilidades se encuentran tabuladas para el nivel de significacin (),
el tamao muestral (n) y la probabilidad (p) que en nuestro caso es p = 0.5 (50%):
b(,n,0.5) .

Si Ho es del tipo a), rechazamos Ho si el valor calculado de B b(,n,0.5) o
B n -b(,n,0.5) , si es del tipo b), rechazamos Ho si B b(,n,0.5) y si es del tipo c)
entonces rechazamos Ho si B n - b(,n,0.5) .

Ejemplo 1.-

Estamos interesados en el efecto de cierto frmacos sobre la presin arterial como
en el ejemplo VI.6. Obteniendo la tabla:

105
Individuos Antes (x
1
) Despus (x
2
)
1 100 95
2 95 95
3 80 85
4 90 80
5 98 90
6 105 95
7 110 95
8 100 92
9 90 80
10 110 93

Se propone que el frmaco baja la presin, es decir Ho: 0 vs. H
1
: > 0.
Entonces creamos las variables auxiliares d = x
1
-x
2
y b, Obteniendo:

Individuos Antes (x
1
) Despus (x
2
) D B
1 100 95 5 1
2 95 95 0 0
3 80 85 -5 0
4 90 80 10 1
5 98 90 8 1
6 105 95 10 1
7 110 95 15 1
8 100 92 8 1
9 90 80 10 1
10 110 93 17 1

Entonces, B = b
i
= 8. El valor crtico para n = 10 es 8 con = 0.054, por lo que
rechazamos H
0
y afirmamos que el frmaco baja la presin. Observamos que como la
distribucin binomial es discreta no se encuentra exactamente el nivel 0.05 para , y en
cierta medida queda a criterio del investigador la aceptacin o rechazo de H
0
(esto
ocurre en general en toda la estadstica no-paramtrica). Si se es riguroso, para B = 8, p
= 0.054 y este valor es mayor que 0.05, por lo que deberamos aceptar H
0
. Sin embargo,
las dcimas binomiales son de baja potencia y, entonces aceptando H
0
con toda
seguridad estaramos cayendo en el error estadstico de tipo II.

Prueba de los rangos signados de Wilcoxon

En esta prueba se considera la misma situacin anterior y las mismas hiptesis,
pero esta prueba requiere una distribucin simtrica de d
i
lo que se puede apreciar
106
observando su histograma de frecuencias (o bien realizando una prueba de simetra de
GUPTA, fuera del alcance de este libro).

En esta prueba adems de considerar la variable b
i
, se ordenan de menor a mayor
los valores absolutos de d
i
(,d
i
,) y se les asigna un orden (rango: Ri), como por ejemplo,
en la siguiente tabla:

d
i
R
i

-5 5
3 3
0 1
-1 2
4 4

En esta dcima se define el estadgrafo T = b
i
R
i
.

Este valor se compara con un valor crtico tabulado Tc(,n). Si Ho es del tipo a)
rechazamos Ho si T Tc(,n) o s T n(n+1)/2 - Tc(,n), si es del tipo b) rechazamos
Ho si T Tc(,n), y si es del tipo c) cuendo T n(n+1)/2 - Tc(,n).

Ejemplo 2.-

Usaremos el mismo caso anterior. Ahora agregamos la asignacin de rangos a las
diferencias d:

Individuos Antes (x
1
) Despus (x
2
) D Rangos(R) B
1 100 95 5 2.5 1
2 95 95 0 1 0
3 80 85 -5 2.5 0
4 90 80 10 7 1
5 98 90 8 4.5 1
6 105 95 10 7 1
7 110 95 15 9 1
8 100 92 8 4.5 1
9 90 80 10 7 1
10 110 93 17 10 1

Observamos que en el caso de empates se les asigna el rango promedio. Por
ejemplo hay tres valores 10, que deberan ocupar los rangos 6, 7 y 8, por lo que a los tres
se les asigna (6+7+8)/3 = 7.

107
Ahora se puede calcular T = R
i
b
i
= 2.5 + 7 + 4.5 + 7 + 9 + 4.5 + 7 + 10 = 51.5.

Como este valor es mayor al valor crtico.. Llegamos a la misma
conclusin anterior.

Prueba de la suma de rangos de Wilcoxon- Mann-Whitney

En este caso tenemos dos muestras independientes [x
i
] e [y
i
] de tamaos n
1
y n
2
.
Se propone que x
i
=
i
y que y
i
=
i
+ , donde
i
es el error experimental y da cuenta
de las diferencias (efecto del tratamiento). Como antes, las hiptesis pueden ser a) Ho:
= 0 vs H
1
: 0, b) Ho: 0 vs. H
1
: > 0 o c) Ho: .0 vs. H
1
: < 0.

En este caso, se ordenan todos los valores juntos ( de las dos muestras) y se les
asigna un rango (R
i
) y se consigna el estadgrafo:

=
o
n
i
R T
1
1

Aqu es importante indicar que la suma se realiza sobre aquella muestra de tamao
n
o
que tiene el menor rango promedio.

Este valor se compara con un valor crtico tabulado w(,n
1
,n
2
) donde n
1
es el
nmero muestral menor (no necesariamente igual a n
o
) y n
2
el mayor. Si Ho es del tipo
a) rechazamos Ho si T
1
w(,n
1
,n
2
) o s T
1
n
o
(N+1) - w(,n
1
,n
2
), si es del tipo b)
rechazamos Ho si T
1
w(,n
1
,n
2
), y si es del tipo c) cuando T
1
n
o
(N+1) - w(,n
1
,n
2
).

En realidad Wilcoxon (T) y Mann-Whitney (U) consideraron estadgrafos
diferentes, pero despus se demostr que la U de Mann-Whitney era U = T
1
-n
o
(n
o
+1)/2 y
por tanto ambas dcimas son equivalentes.

Ejemplo 3.-

Supongamos que se quieren comparar los pesos de dos especies A y B y se
plantea la hiptesis que A pesa ms que B. Se realiza un estudio obteniendo:

108

Especie A (masa: g) Especie B (masa: g)
30 26
28 28
27 30
32 25
29 24
33 22
28 25
26
28
Planteamos la hiptesis Ho: 0 vs. H
1
: > 0 y asignamos los rangos:

Especie A (masa: g) Rango Especie B (masa: g) Rango
30 13.5 26 5.5
28 9.5 28 9.5
27 7 30 13.5
32 15 25 3.5
29 12 24 2
33 16 22 1
28 9.5 25 3.5
26 5.5
28 9.5
Suma de rangos 82.5 53.5
Rango promedio 11.8 5.9

Observamos que n
1
= 7; n
2
= 9 y que n
o
= 9, y entonces T = 53.5. A este valor le
corresponde una probabilidad de error de tipo I < 0.01, por lo que rechazamos H
0.
Es
decir, afirmamos que la especie A pesa ms que la especie B.

Dcima de McNemar

Esta prueba est especficamente diseada para situaciones antes-despus cuando
la variable respuesta es un dato enunerativo, como por ejemplo ver el efecto de una
campaa anti-cigarrillo . En este caso es til la tabla de doble entrada:

DESPUS (+) DESPUS (-)
ANTES (+) A B
ANTES (-) C D
109

Como vemos en esta tabla slo las celdas C y B muestran el cambio (efecto)
producido por el factor de estudio. Y bajo la hiptesis de nulidad de efecto se espera que
C = B = (B+C)/2. Por lo que con estos valores esperados para stas celdas se puede
realizar un prueba
2
1
que despus de algn trabajo algebraico se reduce a:

) (
) (
2
2
1
C B
C B
+
= o
) (
) 1 (
2
2
1
C B
C B
+

= si se quiere corregir la distorsin provocada por
aplicar una distribucin continua a una variable discreta.

Ejemplo 4.-

Se realiz una campaa antidrogas a un grupo de jvenes obteniendo el siguiente
resultado:

(+) despus de la
campaa
(-) despus de la
campaa
Total
(+) antes de la
campaa
15 8 23
(-) antes de la
campaa
2 35 37
17 43 50

Se plantea H
0
: No hay efecto (B = C) vs H
1
: Si se produjo efecto.

Calculamos: 5 . 2
) 2 8 (
) 1 2 8 (
2
2
1
=
+

= y como el valor crtico para = 0.05 es
3.84 y 2.5 < 3.84, aceptamos H
0
. Es decir la campaa no tuvo xito.

110

Ejercicios de estadstica no-paramtrica

1. En un estudio sobre empleo de Sildenafil en pacientes hipertensos se utiliza una dosis
de 6.25 mg. Se anota la presin arterial sistlica de cada paciente antes que reciba el
frmaco (X) y setenta minutos despus de que haya sido administrado (Y). Altera la
presin arterial el uso del Sildenafil?

X (antes) Y (despus) d
i
b
i

175 140
179 143
165 135
170 133
160 162
180 150
177 182

R: No hay evidencia; B = 5; p > 0.05.

2. Se realiza una investigacin sobre los efectos del ejercicio fsico sobre pacientes
cardipatas, midiendo el mximo de oxgeno consumido por cada paciente antes de
comenzar el entrenamiento y despus de seis meses de rgimen. Se obtuvieron los
siguientes datos (suponga simetra):

Sujeto Antes Despus
1 48 40
2 25 26
3 46 57
4 40 30
5 43 50
6 42 55
7 23 25
8 30 55

Existe diferencia en el oxgeno consumido luego del entrenamiento?

R: No hay evidencia; T = 9; p = 0.2.

3. Una sustancia X juega un papel en el desarrollo y mantenimiento de las neuronas. En
este estudio se consider el efecto de la privacin de la sustancia sobre el contenido
protenico total de las races nerviosas de O. degu. Se comparan dos grupos: las
111
nacidas de hembras deficientes en la sustancia (en el tero) y las nacidas de hembras
normales, pero amamantadas por hembras deficientes en la sustancia (en la leche). Se
obtienen los siguientes datos:

Contenido protenico total (mg de protena por raz de ganglio dorsal)

EN EL TERO En la leche
0.12 0.19
0.19 0.21
0.17 0.21
0.20 0.23
0.09 0.20
0.13 0.22
0.21

Indican estos datos, a un nivel =0.05, que el contenido protenico total tiende a ser
menor entre las ratas privadas de la sustancia X en el tero que entre las privadas de ella
en la leche?

R: Si. T
1
= 33; p < 0.05.
112
IV UNIDAD: ANALISIS DE LA VARIANZA, CORRELACION
Y REGRESION
113
IX.- ANLISIS DE LA VARIANZA (ANOVA o ANDEVA)

IX.1.-El Problema de Bonferroni

Muchas veces en ciencias es necesario comparar ms de dos muestras, como por
ejemplo cuando se estudia el comportamiento de una variable en tres poblaciones, o bajo
4 o 5 condiciones experimentales reguladas. En este caso, la primera tentacin es hacer
varias pruebas tomando de a pares. Sin embargo inmediatamente vemos que este puede
ser un nmero elevado de comparaciones, pues si hay N muestras, el nmero de pruebas
que se deben hacer es:

Sin embargo, este no es el nico problema. Analicemos lo siguiente:

Si realizamos una vez la prueba, la probabilidad de cometer error de tipo I es
P(E
1
) = , es decir la probabilidad de no cometer error de tipo I es P(noE
1
) = 1-.

Si la prueba se realiza k veces entonces la probabilidad de no cometer ningn
error I es P(noE
k
) = (1-)
k
y entonces la probabilidad de cometer al menos un error I en
k repeticiones de una prueba es P(al menos 1 E
k
) = 1-(1-)
k
= 1 - [1-k + (k!/(k-
2)!2!)
2
-.........]. Y, como
n
0 para n 2, porque es pequeo, entonces P(al menos 1
E
k
) k. En la siguiente tabla vemos lo que puede significar esto para = 0.05:

K 1 2 3 5 10
P(al menos
1 en E
k
)
0.05 0.09 0.14 0.23 0.4

Observamos que si tenemos 3 muestras k = 3 y tendramos probabilidad de error I
p = 0.14 (14%), con 4 muestras k = 6 y p = 0.3 (30%) etc.

Sin embargo Bonferroni nos da una solucin en el caso de pocas muestras: Si se
quiere trabajar con una probabilidad de al menos 1 error I en k pruebas de un nivel =
0.05, entonces podemos asegurar esto trabajando en cada una de las pruebas con un
nivel de significacin * = /k. Aunque este sistema es muy restrictivo pues restringe
mucho , puede ser muy til para bajo nmero de muestras (hasta 4 aproximadamente).
Esto se conoce como la correccin de Bonferroni. Por ejemplo, si se van a realizar 4
comparaciones y se quiere una error de tipo I de 0.05, entonces en cada comparacin se
debera permitir a lo sumo un error p = 0.05/4 = 0.0125.
2
N
k
| |
=
|
\ .
114

IX.2.- Diseo experimental

El diseo experimental en trminos estadsticos se refiere al acoplamiento entre la
lgica de un diseo experimental cientfico y el mtodo estadstico de anlisis de este
diseo. Es muy habitual que en ciencias encontremos muy buenos diseos cientficos
con malos anlisis desde la perspectiva estadstica, o simplemente diseos para los
cuales la estadstica actual es insuficiente o parcial.

En un experimento en general tenemos una o varias variables respuesta o
dependientes, y variables cualitativas independientes que denominamos factores o
vas. Por ejemplo, puede ser interesante estudiar el efecto de las estaciones del ao
(factor) sobre el metabolismo (variable respuesta).

Los factores pueden ser 1 (1 factor o 1 va), 2 (2 factores o 2 vas) o 3 o ms,
hablando en este caso de diseo multifactorial. Las categoras en que se divide cada
factor se denominan niveles del factor y a las combinaciones (celdas) de los niveles de
los factores se denominan tratamientos. Por ejemplo en la siguiente tabla se muestra
una cierta variable respuesta X frente a diferentes condiciones:

TEMPERATURA
BAJA MEDIA ALTA
HUMEDAD ALTA ------- ------- --------
BAJA ------- ------- --------

En este caso la variable respuesta es X, y se trata de un diseo de dos factores:
temperatura y humedad. El factor temperatura tiene tres niveles: baja, media y alta, y el
factor humedad tiene dos: alta y baja. El nmero de tratamientos es 6 (2x3). A las
unidades muestrales dentro de cada tratamiento se les denomina rplicas.

Cuando los niveles de un factor son todos los posibles, en general fijados por el
experimentador se dice que se trabaja con un modelo tipo I o de efectos fijos, cuando
los niveles son slo una muestra de las categoras posibles se dice que es un modelo II o
de efectos aleatorios. Cuando en algunos factores es de un tipo y en otros de otro, es un
modelo mixto. As por ejemplo, si nos interesa el efecto de la altitud sobre el
metabolismo, y escogemos tres localidades a diferentes alturas, se trata de un modelo de
tipo II, pues las localidades son slo una muestra de todas las posibles alturas. Si en
cambio estudiamos una variable frente a tres condiciones experimentales fijadas por el
investigador, entonces es un modelo de tipo I.

115
IX.3.- Anlisis de la varianza de 1 va o factor (ANOVA de 1 va).

En este caso, el ms simple, se tiene un factor con varios niveles y una variable
respuesta. Como slo hay un factor, los niveles coinciden con los tratamientos.

Supuestos Los supuestos son normalidad de la variable respuesta, que se puede probar
mediante una prueba de bondad de ajuste de
2
o bien Kolmogorov-Smirnov;
independencia que debe asegurarla el investigador mediante un muestreo adecuado; y
homocedasticidad que se puede probar mediante una dcima de Bartlett o bien una
dcima de Hartley, habitualmente disponibles en los programas estadsticos
computacionales.

Modelo El modelo que se plantea es que cada valor de la variable repuesta y
ij
se puede
expresar como la suma entre un promedio paramtrico poblacional , un efecto
provocado por el tratamiento (
i
) y el error experimental o residual (
ij
) Esto se
conoce como el supuesto de aditividad. De esta manera
i
=
i
-, mide el efecto
provocado sobre y
ij
por el tratamiento. El modelo se escribe:

y
ij
= +
i
+
ij

Notacin Es habitual en el ANOVA usar la notacin de la siguiente tabla:

FACTOR
T
1
T
2
..... Tt TOTAL
y
11
y
21
..... y
t1

y
12
y
22
..... y
t2

.... ..... ...... .....
y
1n
y
2n
....... y
tn

TOTALES Y
1o
Y
2o
..... Y
to
Y
oo

PROMEDIOS y
1o
y
2o
..... y
to
y
oo

Observamos que, al contrario que la notacin habitual de matrices donde el
subndice i indica la fila en este caso indica el tratamiento que va en las columnas.
Observamos adems que se usan las minsculas para los promedios y las maysculas
para los totales. Habiltualmente al trmino Y
oo
se le denomina gran total.

Particin de la varianza Trabajemos algebraicamente el trmino (y
ij
-y
oo
)
2
que
corresponde a la suma de desviaciones cuadrticas en torno al promedio (y
oo
) llamado
simplemente suma de cuadrados total (SCT) y que corresponde al numerador de la
varianza (s
2
):

116
(y
ij
-y
oo
)
2
= (y
ij
-y
io
+y
io
- y
oo
)
2
= (y
ij
-y
io
)
2
+ (y
io
-y
oo
)
2
+ 2(y
ij
-y
io
)(y
io
-y
oo
)

(y
ij
-y
oo
)
2
= (y
ij
-y
io
)
2
+ (y
io
-y
oo
)
2
, pues el ltimo trmino es 0.

En palabras, la suma de las desviaciones cuadrticas en torno al promedio general
(SCT) se puede descomponer aditivamente en la suma de las desviaciones cuadrticas
de cada valor individual al promedio de su tratamiento (suma de cuadrados dentro de
tratamiento: SCD) y la suma de las desviaciones cuadrticas de cada promedio de
tratamiento al promedio general (suma de cuadrados entre tratamientos: SCE): SCT
= SCD + SCE. Esto es lo que se conoce como particin de la varianza y es la base de
todo el anlisis de la varianza. Hay que hacer notar que esta particin y aditividad se
produce a nivel de la suma de cuadrados y no de la varianza, pues la varianza total es:
S
2
= (y
ij
-y
oo
)
2
/(nt-1), la varianza dentro de tratamientos es CMD= (y
ij
-y
io
)
2
/(t(n-1))
(intravarianza) y la varianza entre tratamientos es CME = (y
io
-y
oo
)
2
/(t-1)
(intervarianza).

Esquema general del ANOVA

Definicin Llamaremos Fuente de variacin a las fuentes que originan
variabilidad en la variable respuesta. Estas en general corresponden a la variabilidad
originada en el error experimental () y a aquella provocada por los niveles de los
factores y sus interacciones.

El esquema general del ANOVA es una tabla que incluye sucesivamente las
fuentes de variacin (FV), las sumas de cuadrados (SC), los grados de libertad (que
corresponden a los denominadores de las varianzas), las varianzas, cuadrados medios o
medias cuadrticas (CM), el valor del estadgrafo F y la probabilidad de error I (p). En
un ANOVA de una va, balanceado (igual tamao muestral en cada tratamiento), sta es:

FV SC Gl CM=SC/gl F P
T (entre)
nt Y n Y
i
i
/ ) / (
2
00
2
0

t-1 F =
CME/CMD

(dentro o
error)

=
i
i
ij
ij
n Y y /
2
0
2

t(n-1)
TOTAL
nt Y y
ij
ij
/
2
00
2

nt-1

Como dato prctico, observamos que para los clculos en una tabla de ANOVA,
se necesitan tres clculos sencillos:

117
i
i
n Y ) / (
2
0

j i
ij
y
,
2
nt Y /
2
00

Tambin observamos que no se calcula, sino que se obtiene por la diferencia
= SCT SCE

Esperanza de los cuadrados medios y la dcima F.

Es posible demostrar que el valor esperado o esperanza del cuadrado medio del
error (dentro) es E[CMD] =
2
, es decir es la varianza poblacional. Adems si el modelo
del diseo es de tipo I E[CME] =
2
+ n (
i
-)
2
/(t-1) =
2
+() y si es de tipo II
E[CME] =
2
+n
2
.La interpretacin de esto es que se espera que la desviacin

cuadrtica entre tratamientos sea similar a la desviacin cuadrtica dentro de
tratamientos ms un componente aadido por los tratamientos (efecto del tratamiento).

En forma natural surge la idea de realizar el cuociente F = CME/CMD, lo que
estadsticamente tiene gran sentido por cuanto CMD/
2
tiene distribucin
2
t(n-1)
y
CME/
2
tiene distribucin
2
t-1
por lo que F = CME/CMD tiene distribucin de
Snedecor F
t-1,t(n-1)
. As, es posible docimar Ho:
i
=
j
i,j vs. H
1
:
i

j
para algn par i,j
mediante el valor de F.

Ejemplo 1.-

Se quiere saber el efecto de ciertos tratamientos A, B y C sobre la presin arterial
diastlica probndolos en tres grupos de individuos, obteniendo:

A B C
110 100 80
100 90 76
90 86 82
85 97 88
90 100 84
100 96 78

Se plantean las hiptesis H
0
:
A
=
B
=
C
vs H
1
: al menos un par de promedios
distintos.

Se construye la tabla bsica:

118
A B C
110 100 80
100 90 76
90 86 82
85 97 88
90 100 84
100 96 78
Total (Y
i0
) 575 569 488
Promedio (y
i0
) 95.8 94.8 81.3

Calculamos: Y
00
= 575 + 569 + 488 = 1632.

148755 6 / ) 488 569 575 ( ) / (
2 2 2 2
0
= + + =
i
i
n Y
149430 78 ... 76 80 ..... 90 100 ..... 100 110
2 2 2 2 2 2 2
,
2
= + + + + + + + =
j i
ij
y
147968 3 6 / 1632 /
2 2
00
= = nt Y

Entonces construimos la tabla de ANOVA:

FV SC Gl CM=SC/gl F
2,15
P
T (entre)
nt Y n Y
i
i
/ ) / (
2
00
2
0

=148755-147968 =
787
t-1 = 2 787/2 =
= 393.5
F =
CME/CMD
= 393.5/45 =
= 8.74

(dentro o
error)

=
i
i
ij
ij
n Y y /
2
0
2

= 1462 787 = 675
t(n-1) =
15
675/15 =
= 45

TOTAL
nt Y y
ij
ij
/
2
00
2

=149430-147968 =
1462
nt-1 =
17
1462/17 =
= 86

El valor crtico de F
2,15
con = 0.05 es 3.68, y como el valor calculado 8.74 >
3.68, entonces rechazo H
0
y al menos un par de promedios es diferente. Obviamente,
mirando los datos, el grupo C tiene presiones claramente diferentes de los otros dos.
Siguiendo el rigor estadstico, a continuacin habra que hacer comparaciones mltiples
a posteriori.

119
Transformaciones

El anlisis de la varianza es un anlisis muy poderoso y que conduce a resultados
confiables a pesar de considerables desviaciones de la normalidad y homocedasticidad
lo que es especialmente vlido para nmeros de replicas iguales en cada tratamiento
(modelos balanceados) y nmeros muestrales grandes. Por esto se dice que el ANOVA
y en general toda la estadstica paramtrica, son robustos. Sin embargo, en ciencias
siempre interesa tener el mnimo de violaciones posibles de los supuestos por lo que a
veces es necesario transformar la variable.

Cuando existe violacin de la normalidad, es til el siguiente teorema: En
cualquier distribucin de una variable aleatoria y tal que su varianza V se puede
expresar como una funcin de la esperanza E: V = (E), entonces existe una
transformacin:

= =
) (
) (
y
dy
y f T cuya varianza y esperanza son independientes. El resultado es una

nueva variable, con distribucin normal.

Por ejemplo en una distribucin de Poisson V = E y entonces, f(y) = dy/y = 2y.
De esta manera si una variable tiene distribucin de Poisson, conviene aplicarle una
transformacin raz cuadrada para su anlisis con ANOVA. De esta manera surgen
algunas transformaciones recomendadas:

Distribucin
(y)
Transformacin f(y)
Normal C = constante Y
Binomial (proporciones) y(1-y)
arcsen(y)
Poisson (sucesos raros) Y
y
Sin homocedasticidad y
2
ln(y) o ln(y+1)
y
4
1/y o 1/(y+1)
Binomial negativa arcsen(y)
Decreciente y
2

IX4.- Comparaciones mltiples

En general el ANOVA no termina con el rechazo de Ho. Con esto slo sabemos
que existe un efecto de los tratamientos sobre la variable respuesta. Sin embargo a
menudo (sobre todo en modelo de efectos fijos) interesa saber cul o cuales de los
tratamientos produce el efecto. En este caso es necesario realizar comparaciones
mltiples. Estas son de dos tipos: i) definidas a priori o no sugeridas por los datos e
120
ii) definidas a posteriori. Aqu es importante notar que a priori o a posteriori no se
refiere a si se ha hecho o no primero el ANOVA, sino al diseo experimental. A veces
por diseo slo interesa comparar los tratamientos contra un control (a priori), o slo
realizar las comparaciones relevantes (a priori). En cambio otras veces nos interesan
todas las comparaciones para interpretar despus (a posteriori).

Comparaciones a priori

Contrastes ortogonales La idea en este caso es realizar slo comparaciones
independientes entre s (ortogonales). Para esto se define un contraste
j
=c
ij
i
, donde
c
ij
son constantes que definen el contraste de tal manera que c
ij
= 0. Entonces un
estimador de
j
es L
j
=c
ij
y
io
. La hiptesis de nulidad para un contraste es Ho:
j
= 0.
Por ejemplo si se tienen cuatro tratamientos y se quiere comparar el primero con el
tercero se puede elegir c
11
= 1, c
21
= 0, c
31
= -1 y c
41
= 0 y entonces L
1
= y
1o
-y
3o
(la
diferencia de los promedios entre el tratamiento 1 y el 3. Es un contraste porque c
11
+ c
31

= 1-1= 0.

Dos contrastes L
j
y L
k
son ortogonales o independientes si c
ij
.c
ik
= 0. Entonces
un contraste independiente del anterior es L
2
= y
2o
-y
4o
porque c
11
= 1, c
21
= 0, c
31
= -1 y
c
41
= 0 y c
11
= 0, c
21
= 1, c
31
= 0 y c
41
= -1 y entonces c
ij
.c
ik
= 10+01+(-1)0+0(-1) = 0.

Una de las utilidades mayores de los contrastes ortogonales es la posibilidad de
comparar tendencias, por ejemplo si se tienen 4 tratamientos y se quiere evaluar
tendencia lineal, cuadrtica o cbica, basta elegir los c
ij
de acuerdo a la siguiente tabla:

c
ij

Lineal -1 -1 1 1
Cuadrtica -1 1 1 -1
Cbica -1 1 -1 1

El estadgrafo adecuado para probar la hiptesis es una t de Student con los grados
de libertad del error (t
gle
):

=
i i
j
gle
n c CMD
L
t
/
2

Prueba de Dunnet Muchas veces la idea del diseo es comparar los tratamientos
contra un tratamiento control. En este caso el estadgrafo adecuado es t
d
(t,gle,) de
Dunnet (existen tablas especiales):
121

n CMD
y y
t
control i
d
/ 2
0

=

En este caso y
control
representa el promedio en el tratamiento control.

Prueba de Scheff Esta prueba se basa en el concepto de contrastes, definidos de
igual manera que antes:
j
= c
i
i
. Sin embargo en este caso no es necesario que los
contrastes sean ortogonales. Si los contrastes son sugeridos por el diseo, es una prueba
a priori, pero si se realizan todas las comparaciones, es a posteriori. Como es posible
ejecutar mltiples contrastes, se recomienda la correccin de Bonferroni. La prueba de
hiptesis (Ho:
j
= 0) se realiza con una distribucin F
1-,t-1,gle
:

i i
gle t
n c CMD t
L
F
/ ) 1 (
2
2
, 1

Comparaciones a posteriori

Existen muchas pruebas para hacer comparaciones mltiples, sin embargo son dos
las ms utilizadas. Ambas estn basadas en la distribucin del rango Studentizado: Q
= (x
max
-x
min
)/s
x
.

Prueba de Tukey En esta prueba se consideran todas las comparaciones posibles,
usando la distribucin del rango Studentizado Q
1-,t,gle
:

)
1 1
( ) 2 / (
0 0
,
j i
j i
gle t
n n
CMD
y y
Q
+
=

Prueba de Student-Newman-Keuls (SNK) Esta prueba tiene la misma estructura
que la prueba de Tukey, pero considera el nmero de tratamientos t, como un variable.
Por ejemplo, si tenemos cuatro tratamientos (t = 4) y se obtuvo: y
1o
= 27, y
2o
= 19 y
3o
=
15 y
4o
= 13. Como estn ordenadas en forma decreciente al comparar y
1o
con y
4o

participan 4 medias adyacentes (t=4), pero al comparar y
1o
con y
3o
slo participan 3,
entonces t = 3 para esta comparacin, y as sucesivamente.

122
Las pruebas a posteriori, se pueden ordenar segn su potencia en forma
decreciente: SNK, Tukey y Scheff. Sin embargo, en la medida que aumenta su
potencia, tambin aumenta su probabilidad de error de tipo I, por lo que en general, se
recomienda una prueba intermedia (Tukey).

Ejemplo 2.-

Considerando los datos del ejemplo 1 vamos a realizar las comparaciones
correspondientes. Para cada comparacin se establece la hiptesis H
0
:
i
=
j
vs H
1
:
i

j
y se realizan los clculos. Usaremos la prueba de Tukey.

Para comparar A con B:

149 . 0
45
8 . 94 8 . 95
15 , 3
=
= Q

Para comparar A con C:

16 . 2
45
3 . 81 8 . 95
15 , 3
=
= Q

Y para comparar B con C:

01 . 2
45
3 . 81 8 . 94
15 , 3
=
= Q

El valor crtico de Q
3,15
es 3.67, por lo que no es posible rechazar H
0
en ninguno
de los tres casos.

IX.5.- ANOVA de dos vas: la interaccin

El anlisis de la varianza de dos factores (o vas) es conceptualmente similar. En
este se puede probar en forma independiente el efecto de cada factor sobre la variable
respuesta. El modelo se puede expresar como:

y
ijk
= +
i
+
j
+
k(ij)

Sin embargo, cuando existen dos factores, existe la posibilidad de que stos
provoquen un efecto conjunto sobre la variable respuesta. Por ejemplo es posible que el
factor 1 haga aumentar el valor de la variable respuesta, pero que al incorporar el factor
2 este efecto se potencie, o, a la inversa se inhiba. En este caso se habla de la existencia
123
de interaccin entre los factores. La variabilidad proveniente de la interaccin ()
puede ser aislada y docimada en forma independiente. En este caso el modelo se escribe:

y
ijk
= +
i
+
j
+
ij
+
k(ij)

La interpretacin de la interaccin queda clara en la siguiente figura.

En esta figura se muestra la variable respuesta (y) frente a dos factores. El factor 1
(A) con los niveles a1 y a2, y el factor 2 (B) con los niveles b1 y b2. En los grficos
superiores no existe interaccin, pues la respuesta es paralela. En el caso de la izquierda
existe efecto de ambos factores A y B sobre y, en el de la derecha slo del segundo
factor (B). En los grficos inferiores si existe interaccin. En el grfico de la derecha,
existe un aumento de y a causa de cada factor, pero este aumento se potencia en
presencia del segundo nivel del factor 2 (B). En el grfico de la izquierda existe
interaccin que podramos llamar paradojal: en el nivel a1 el factor 2 disminuye y,
pero ocurre lo contrario en el nivel a2 (en este ltimo caso lo ms probable es que el test
no arroje significacin ni en el factor 1, ni en el factor 2, pero s efecto de interaccin.

124
Ejemplo 3.- Se ha medido una variable fisiolgica x en tres localidades A, B y
C a dos especies W y Z. Obteniendo:

A B C
W 3
4
5
4
3
7
8
9
8
7
2
3
1
3
3
Z 2
3
2
1
2
4
3
4
3
2
1
2
2
2
1

Valores promedio:

A B C
W 3.8 7.8 2.4
Z 2.0 3.2 1.6

Se desea saber si existen diferencias en x entre las especies y el efecto de la
localidad sobre sta.

Se realiza ANOVA de dos vas: Localidad y Especie, con interaccin, obteniendo:

F de V SC Gl CM F P
Localidad 66.1 2 33.0 53.6 << 0.001
Especie 43.2 1 43.2 70.1 << 0.001
Interaccin 19.4 2 9.7 15.7 << 0.001
Error 14.8 24 0.62
Total 143.5 29

Del anlisis se desprende que existen diferencias entre las especies, existen
diferencias entre las localidades y este efecto no es parejo en cada especie (existe
interaccin).

El valor de la probabilidad de error I (p: en negritas los valores significativos
(< 0.05)) en las comparaciones mltiples con prueba de Tukey muestra:

125
{1} {2} {3} {4} {5} {6}
A W {1} x .015196 .000138 .828719 .088555 .002275
A Z {2} x .000138 .190434 .963783 .963783
B W {3} x .000138 .000138 .000138
B Z {4} x .599784 .037791
C W {5} x .599784
C Z {6} x

La interpretacin es la siguiente: En la localidad B se encuentran valores ms altos
de x. La especie Z tiende a tener valores ms bajos de x que la especie W. Sin embargo,
esto se manifiesta claramente en las localidades A y especialmente en B donde la
diferencia es muy grande, pero no alcanza a ser significativo en C.

IX.6.- Otros diseos

El anlisis de la varianza no slo es un mtodo de anlisis de la informacin, sino
tambin establece una forma de compatibilizar el anlisis con el diseo del experimento.
As, por ejemplo, para un diseo que considere tres factores y que en uno de ellos tenga
sub-muestras, existe una estadstica adecuada para analizarlo (ANOVA factorial
anidado). A la inversa, conociendo que existe una estadstica para analizar un diseo, se
puede adecuar el experimento a tal diseo, como ocurre por ejemplo con el diseo de
cuadrados latinos.

Al analizar un experimento, es importante usar el modelo adecuado a tal diseo,
identificando adecuadamente las fuentes de variacin. Si stas no son identificadas, la
variabilidad de dichas fuentes ser incorporada a la variabilidad residual (aumenta
CMD) y por tanto, como esta ltima se encuentra en el denominador de la F de
Snedecor, tendr un valor inferior, reduciendo la probabilidad de rechazar Ho, y por
tanto aumentando el error de tipo II. La eficiencia del modelo se puede medir a travs de
E = (CMD sin el modelo)/(CMD con el modelo). Si E = 1, el uso del modelo es
irrelevante.

Diseos factoriales Un diseo es factorial, si tiene ms de 2 vas.
Conceptualmente es igual a los anteriores, pero incorpora cada vez ms posibilidades de
interaccin.

Diseo de bloques aleatorizados Muchas veces un experimento exige que los
tratamientos (T) se repitan en distintas parcelas o bloques (B), por ejemplo el uso de tres
fertilizantes en tres lugares. En este caso los tratamientos se distribuyen aleatoriamente
en cada uno de los lugares, y el efecto del lugar es irrelevante. Un ejemplo de este
diseo se puede resumir en la siguiente tabla:
126

B1 T1 T3 T2
B2 T3 T2 T1
B3 T2 T1 T3

Diseo de medidas repetidas A veces es necesario que los tratamientos los reciba
el mismo individuo u otra unidad de anlisis dependiente de la anterior. Por ejemplo 4
individuos (I) expuestos a tres estmulos (T):

T1 T2 T3
I1
I2
I3
I4

Observamos que es el mismo individuo el que recibe los tres tratamientos. En este
tipo de diseo es necesario excluir a los individuos de respuesta extraa (out-group)
pues violan un supuesto de este diseo: la simetra compuesta. Esta ltima junto a la
homocedasticidad constituyen el supuesto de esfericidad.

Diseos anidados, encajados o jerrquicos Para entender este modelo conviene
definir unidad experimental como aquella unidad que recibe el tratamiento y la unidad
de muestreo como aquella que constituye una rplica.
En los diseos jerrquicos se consideran sub-niveles dentro de cada tratamiento.
Por ejemplo si estamos estudiando las diferencias en cierta caracterstica de individuos
de tres edificios (T) puedo elegir en cada edificio 2 pisos al azar (niveles N):

T1

T2

T3

N1 N2 N1 N2 N1 N2

Observamos que siempre el nivel encajado debe ser de tipo aleatorio (modelo II) y
que no se puede hacer una tabla de doble entrada porque los niveles N1 y N2 son slo
referenciales, por ejemplo, N1 puede ser el 5to piso en T1 y ser el 3er piso de T2. Si el
primer factor es de tipo aleatorio, se habla de un diseo anidado puro. Si el primer factor
es de tipo fijo (modelo I), entonces las unidades experimentales son los niveles del
factor encajado y las rplicas constituyen sub-muestras.

127

Cuadrados latinos y parcelas divididas (split-plot)

Estos son dos diseos especiales que a veces es necesario usar y se pueden
representar en las siguientes tablas.

El cuadrado latino considera un doble bloque (B y b), con sus respectivos niveles:

b1 b2 b3
B1 T1 T2 T3
B2 T2 T3 T1
B3 T3 T1 T2

El diseo de parcela dividida corresponde a un diseo de bloques incompleto (no
incorpora todas las combinaciones posibles) en que se mezclan dos tratamientos (T y t) y
un bloque (B):

B1 T1 t1 T3 t1 T2 t1
t2 t2 t2
B2 T3 t1 T2 t1 T1 t1
t2 t2 t2
B3 T2 t1 T1 t1 T3 t1
t2 t2 t2

IX.7.- Alternativas no paramtricas al ANOVA

Afortunadamente la estadstica paramtrica, especialmente el ANOVA es muy
robusto, de tal manera que es posible tolerar algunas violaciones a los supuestos,
especialmente en modelos balanceados (n iguales en cada celda) y con nmero grande
de observaciones. Sin embargo las comparaciones mltiples no son tan robustas, por lo
que a veces es necesario primero usar transformaciones y, si estas no resultan, utilizar
estadstica no paramtrica. Esta en general se restringe a diseos con bajo nmero de
observaciones.

Prueba de Kruskall-Wallis Es la alternativa no-paramtrica de un ANOVA de una
va. En esta, se transforman todos los valores a rangos y luego se calcula el estadgrafo:

) 1 ( 3
) 1 (
12
1
2
0
+
+
=

n
n
R
N N
H
t
j
j

128
Se puede demostrar que esta prueba es exactamente equivalente a un ANOVA
aplicado sobre los rangos (ANOVA sobre Rangos). Adems si se realiza un ANOVA
sobre rangos, entonces la F obtenida se relaciona con la H a travs de:

H
t H N
t N
F
) 1 )( 1 (

=

Es posible realizar pruebas a porteriori, entre ellas la prueba de Dunn y la de
Nemenyi. Escribiremos esta ltima por su simplicidad y usar la misma distribucin que
el estadgrafo de Tukey:

12
) 1 )( (
0 0
, ,
+
nt nt n
R R
Q
k j
t

Prueba de Friedman Es la alternativa no paramtrica para el ANOVA en bloques y
el ANOVA de medidas repetidas. En esta se rankea entre los tratamientos dentro de
cada bloque o individuo y despus se calcula el estadgrafo:

) 1 ( 3
) 1 (
12
2
0
2
+
+
=

t b R
t bt j
j t

Tambin es posible hacer comparaciones mltiples a posteriori. En este caso se
usa:

12
) 1 )( (
0 0
, ,
+
t t b
R R
Q
k j
t

Otras alternativas Existen algunas alternativas no paramtricas para una y dos vas
cuando la hiptesis H
1
incorpora una tendencia u ordenacin (i.e: H
1
: t1 <t2 < t3 ). En
este caso se usa para el caso de una va la prueba de Jonckheere y para dos vas la
prueba de Page. Cuando se tiene un diseo ms complejo se realiza un ANOVA sobre
rangos.
129
Ejercicios de anlisis de la varianza

ANLISIS DE VARIANZA (ANOVA) DE 1 VA

1. Se realiz un estudio de diversas especies de pjaros que son de similar naturaleza y
comparten un medio comn. El canto de cada especie tiene un conjunto de rasgos
distintivos que permite reconocerla. Una caracterstica investigada es la duracin del
canto en segundos. Se estudian tres especies: A, B y C. Se obtuvieron los siguientes
datos:

A B C
1.11 2.20 0.50
1.23 1.90 0.94
0.90 2.00 0.78
0.95 1.70 0.38
1.00 1.54 0.50
1.10 1.88 0.50
1.20 1.90 0.68
1.30 2.05 0.62
1.10 1.70 0.40

Qu se puede decir respecto a la duracin de los cantos de las distintas especies?
R: Son diferentes; F
2,24
= 122.6; p << 0.05.

2. Un grupo de investigadores analizaron 6 muestras provenientes de 5 lagos distintos
para poder determinar la concentracin de rotferos (individuos por mL). Los datos
son presentados en la tabla de abajo. Segn los datos obtenidos, existen diferencias
en la concentracin de coppodos dependiendo de su procedencia?.

Lago 1 Lago 2 Lago 3 Lago 4 Lago 5
28.2 39.6 46.3 41.0 56.3
33.2 40.8 42.1 44.1 54.1
36.4 37.9 43.5 46.4 59.4
34.6 37.1 48.8 40.2 62.7
29.1 43.6 43.7 38.6 60.0
31.0 42.4 40.1 36.3 57.3
Promedio 32.1 40.2 44.1 41.1 58.3
130

Comparaciones Mltiples (Test de Tukey, = 0.05). Las diferencias significativas se
presenta en negritas.

3. Se estudi una variable x en tres situaciones A, B y C, obteniendo:

A B C
2 6 1
3 7 2
2 8 2
4 7 3
5 8 6

Que puede decir acerca del comportamiento de x en las tres situaciones?

R: Existen diferencias; F
2,12
= 14,6; p < 0.05. La variable x responde igual en las
situaciones A y C, pero es mayor en la situacin B.
Anlisis de varianza de un factor
RESUMEN
Grupos Cuenta Suma Promedio Varianza
Lago 1 6 192.5 32.08 10.27
Lago 2 6 241.4 40.23 6.40
Lago 3 6 264.5 44.08 9.49
Lago 4 6 246.6 41.10 13.44
Lago 5 6 349.8 58.30 9.22
ANLISIS DE VARIANZA
Origen de las variaciones SC gl CM F P F
C
Entre grupos 2193.44 4 548.36 56.15 3.95E-12 2.759
Dentro de los grupos 244.13 25 9.77
Total 2437.57 29
Comparaciones
Diferencia ()
SE T
k
T
k
crtico crtica
5 - 1 26.2 1.28 20.55 4.166 5.31
5 - 2 18.1 1.28 14.16 4.166 5.31
5 - 4 17.2 1.28 13.48 4.166 5.31
5 - 3 14.2 1.28 11.13 4.166 5.31
3 - 1 12.0 1.28 9.41 4.166 5.31
3 - 2 3.9 1.28 3.06 4.166 5.31
3 - 4
4 - 1 9.0 1.28 7.05 4.166 5.31
4 - 2
2 - 1 8.1 1.28 6.35 4.166 5.31
No es necesario
No es necesario
131

4.- Analice de nuevo el ejercicio anterior, pero con estadstica no-paramtrica.

R: Existen diferencias; KW = 8.57; p < 0.05. La variable x responde igual en las
situaciones A y C, pero es mayor en la situacin B.

132

X.- CORRELACIN Y REGRESIN

X.1.- Correlacin

A menudo en ciencias nos encontramos interesados en la relacin o asociacin
entre dos variables cuantitativas. En este caso, tratndose de dos variables aleatorias X e
Y, sabemos que si son independientes la variacin conjunta o covarianza es cero:
COV(X,Y) = 0. Adems el valor mximo que puede tener la covarianza es
COV(X,Y)
max
= (V[X]V[Y]).

Aprovechando stas propiedades podemos definir correlacin entre dos variables
X e Y como la covarianza estandarizada:

] [ ] [
] , [
Y V X V
Y X COV
=

Naturalmente, un buen estimador de , ser el coeficiente de correlacin (r) de
Pearson:

=

=
) )( ( ) ( ) (
) )( (
2 2 2 2 2 2
y n y x n x
y x n y x
y y x x
y y x x
r
i i
i i
i i
i i

Entonces tanto como su estimador (r) varan entre 1 y 1. Adems si X e Y son
independientes, y su estimador (r) son 0.

133

El coeficiente de correlacin mide el grado de asociacin entre dos variables X e
Y, siendo mxima si r 1 como en la situacin A de la figura, o r -1 como en la
situacin C. La diferencia entre stos ltimos dos valores es que un valor positivo indica
asociacin positiva y un valor negativo, lo contrario, es decir aumentos en la primera
variable implican disminuciones en la segunda. Cuando no existe asociacin, es decir Y
es independiente de X como en la situacin B, r 0.

Es importante decidir si existe asociacin o independencia por lo que se debe
realizar la dcima Ho: = 0 vs. H
1
: 0. Y en este caso se usa el estadgrafo:

2
2
1
2
r
n r
t
n

X.2.- Regresin

Muchas veces en la bsqueda de asociacin entre dos variables X e Y, intentamos
establecer una relacin funcional entre ambas, por ejemplo una lnea recta: y = mx + c, o
una parbola y = ax
2
+ bx +c o una exponencial y = ae
bx
o una potencial y = ax
b
. En este
caso no slo buscamos la asociacin sino que pre-suponemos una relacin funcional
entre las variables. Este es el objetivo del anlisis de regresin sea este lineal,
cuadrtico, exponencial o potencial. Lo ms habitual es el anlisis de regresin lineal,
134
sobre todo porque los modelos exponencial y potencial, tan habituales en ciencias, son
reductibles al modelo lineal a travs de logaritmos.

Por ejemplo si a una relacin potencial del tipo Y = aX
b
le aplicamos logaritmo,
se obtiene logY = loga +blogX, y llamando w = logY, z = logX y c = loga, se obtiene la
recta w = c + bz. En el caso de una exponencial Y = C(e
bX
), tomando logaritmo natural
se obtiene lnY = lnC + bX y llamando w = lnY y c = lnC, se obtiene la recta w = c + bX.

Regresin lineal mnimo cuadrtica

El problema bsico consiste en buscar una recta que minimice las desviaciones
desde cada punto a dicha recta. Si suponemos que esta recta tiene una pendiente B
1
y un
intercepto Bo, entonces tendremos para cada x
i
un y
i
= B
1
x
i
+Bo que estima el valor real
de y
i
(ver figura). A la diferencia entre y
i
e y
i
: e
i
= y
i
-y
i
la llamamos residuo.
Observamos que la raz de la suma sobre i del residuo elevado al cuadrado: D =

2 '
) (
i i
y y tiene la estructura de una distancia y entonces interesa la pregunta: para
que valores de B
1
y Bo es mnima D, o, lo que es lo mismo, D
2
?

Estableciendo las ecuaciones: D/B
1
= 0 y D/Bo = 0 (ecuaciones normales), se
obtiene:

135
=
2 2
1
/
/
x n x
y x n y x
B
i
i i

Y adems: x B y B
1 0
=

En trminos estadsticos, lo mencionado es equivalente a plantear el modelo:
y
i
= o +
1
x
i
+ e
i
, con los supuestos de independencia e igual distribucin de los errores
e
i

Entonces, la pendiente B
1
y el intercepto Bo, son estimadores de los parmetros
poblacionales
1
= COV(X,Y)/V[X] y o = y -
1
x. Estos estimadores son meli.
Adems las varianzas de B
1
y Bo se pueden estimar a travs de:

2
2
1
) (
] [

=
x x
S
B V
i
yx
y )
) (
1
( ] [
2
2
0

+ =
x x
x
n
S B V
i
yx
donde

=
2
2
2
n
e
S
i
yx

As, es posible probar las hiptesis Ho:
*
= 0, vs H
1
:
*
0 (donde
*
representa
a
1
o a o) mediante:

] [
*
*
2
B V
B
t
n
=

Observamos que es posible relacionar la pendiente y el coeficiente de correlacin,
ya sea en trminos poblacionales (
1
y ) o muestrales (B
1
y r) a travs de:
1
(V[X]/V[Y]) = . Esto implica que a altos valores del coeficiente de correlacin le
corresponden altos valores de la pendiente B
1
y a la inversa.

X.3.- Regresin y ANOVA

Observemos el siguiente desarrollo algebraico:

= + = =
2 ' 2 2 ' 2 ' 2
) ( ) ( ) ( ) ( y y y y y y y y y y e
i i i i i i i
, lo que ordenado
de otra forma queda:

+ =
2 ' 2 ' 2
) ( ) ( ) ( y y y y y y
i i i i

136

Esto se puede leer de la siguiente forma: La variabilidad total (desde cada y
i
al
promedio y) es igual a la suma de la variabilidad residual (desde cada y
i
al
predicho y
i
) mas la variabilidad debida a la regresin (desde los predichos al
promedio y).

En otras palabras, la variacin total es la suma de la variacin no explicada por
la regresin (residuo) mas la variacin explicada por la regresin.

Como vemos, es posible la particin aditiva de la varianza y entonces establecer
una tabla de ANOVA:

Fuente de
variacin
SC Gl CM F
1,n-2
P
Modelo
(Regresin)
) ( ) (
2 2 2
1
2 '
x n x B y y
i i
=

1 SC/gl CMmodelo/CMresiduo
Residuo
(por diferencia)
n-2 SC/gl
= S
yx
2

Total
2 2 2
) ( y n y y y
i i
=

n-1

Es decir a travs de un ANOVA se puede docimar Ho:
1
= 0 vs H
1
:
1
0.

Al cuociente entre la suma de cuadrados explicada (regresin) dividida por la
suma de cuadrados totales se le denomina coeficiente de determinacin (R
2
):

SCTotal
n SCregresi
R =
2

Este coeficiente representa la proporcin de la variabilidad total que es explicada
por la regresin. Adems R
2
= r
2
, de ah su notacin. Adems al valor S
yx
= (S
yx
2
) se le
denomina error tpico de la estima y representa la desviacin media de los valores en
torno a la recta de regresin.

Ejemplo 1.-

Supongamos que se quiere estudiar la relacin entre dos variables X e Y y se tiene
la siguiente tabla:

X 1 2 3 4 5 6 7 8 9 10
Y 2 5 6 7 9 13 15 15 19 20
137

El primer problema es decidir si se har un anlisis de correlacin o uno de
regresin. Esta duda se resuelve pensando si el objetivo del estudio es simplemente la
bsqueda de una asociacin, y en este caso usar slo correlacin, o si buscamos o
presuponemos una relacin lineal que permita algn grado de prediccin del fenmeno y
realizar anlisis de regresin. En este ltimo caso debemos pensar adems si la recta de
regresin que se obtenga tiene sentido, especialmente en el caso de variables discretas,
donde entre punto y punto no existe nada, y por tanto no hay recta.

Supongamos en este caso que la variable es continua, y que presuponemos una
relacin funcional de tipo lineal, por lo que se har un anlisis de regresin. Por razones
prcticas conviene inmediatamente hacer la siguiente tabla:

X Y X
2
Y
2
XY
1 2 1 4 2
2 5 4 25 10
3 6 9 36 18
4 7 16 49 21
5 9 25 81 45
6 13 36 169 78
7 15 49 225 105
8 15 64 225 120
9 19 81 361 171
10 20 100 400 200
Total 55 111 385 1575 770
Promedio 5.5 11.1 38.5 157.5 77.0

A partir de esta tabla se puede calcular directamente la pendiente B
1
y el
intercepto B
0
:

93 . 1
5 . 5 5 . 38
1 . 11 5 . 5 0 . 77
2
1
=

= B y 485 . 0 5 . 5 93 . 1 1 . 11
0
= = B

As, la recta que mejor representa la relacin entre X e Y es 485 . 0 93 . 1 + = X Y .

Pero interesa saber si esta pendiente B
1
es efectivamente diferente de 0; es decir si
la asociacin que se obtiene en la muestra es realmente inferible a la poblacin.
Entonces estudiaremos las hiptesis H
0
: = 0 vs 0 mediante el ANOVA. Esto es
enteramente equivalente a realizar una prueba de t para la pendiente. Sin embargo se
prefiere el ANOVA porque aporta mayor informacin como se observa a continuacin.
138
Observamos adems que todos los valores para la tabla de ANOVA ya se encuentran
calculados.

Fuente de
variacin
SC Gl CM F
1,8
P
Modelo
(Regresin)
30 . 307 ) 5 . 5 10 385 ( 93 . 1
2 2
=
1 307.3 69.1 << 0.01
Residuo
= 342.9-307.3 = 35.6
10-2= 8 S
yx
2
= 4.45
Total
9 . 342 1 . 11 10 1575
2
=
10-1= 9

Entonces efectivamente la pendiente es diferente de 0, y la asociacin mediada
por la relacin lineal es real. Adems el coeficiente de determinacin (R
2
) es: R
2
=
307.3/342.9 = 0.896. Es decir el 89.6 % de la variabilidad de Y es efectivamente
explicada por el modelo lineal, lo que es muy bueno pus la variabilidad residual
representa slo un 10.4%. Si adems queremos el coeficiente de correlacin, este es
simplemente r = (0.896) = 0.947. El error tpico de la estima es S
yx
= 4.45 = 2.1. Este
ltimo valor nos permite calcular las varianzas y errores estndar de la pendiente e
intercepto.

Por otra parte debemos observar que a partir del valor de F = 69.1 se puede
deducir el valor que habra tenido la t de Student si la hubisemos usado para probar la
misma hiptesis. Esta es simplemente: t = 69.1 = 8.3, y conduce exactamente al mismo
valor de probabilidad de error I (p).

X.4.- Predicciones

Muchas veces el sentido de una regresin es predecir un valor o valores de y para
algn valor o valores de x.

Prediccin de un valor y, para un valor x
k
(y/x
k
) En este caso el intervalo de
confianza del nivel (1-) est dado por:

IC
1-
:

+ +

n x x
x x
n
S t y
i i
k
yx n k
/ ) (
) ( 1
1
2 2
2
2
'

Prediccin del valor y para x
k
En este caso el intervalo de confianza est dado
por:

139
IC
1-
:

+

n x x
x x
n
S t y
i i
k
yx n k
/ ) (
) ( 1
2 2
2
2
'

Ejemplo 2.-

Si en el caso del ejemplo1, interesara calcular a) el valor predicho para x = 12 y b)
el valor promedio de y para x = 15, tendramos:

Para el caso a) el valor predicho para x = 12 sera: y = 1.93(12) + 0.485 = 23.645.
y su intervalo del 95% de confianza sera:
96 . 4 65 . 23
10 / ) 55 ( 385
) 5 . 5 12 (
10
1
1 1 . 2 86 . 1 645 . 23
2
2
=
+ +

Para el caso b) el valor predicho sera y = 1.93(15) + 0.485 = 29.435, y el
intervalo de confianza para el promedio de los valores de y cuando x = 15 sera:

94 . 10 435 . 29
10 / ) 55 ( 385
) 5 . 5 15 (
10
1
1 . 2 86 . 1 435 . 29
2
2
=
+

Es importante observar que en le medida que x
k
se aleja del promedio, la precisin
de la prediccin va disminuyendo, o, lo que es equivalente, el intervalo de confianza se
va haciendo ms amplio.

X.4.- Supuestos y alternativas no paramtricas

En algunas ocasiones la variable independiente (x) es fija y se miden muchos
valores de la variable dependiente (y) para cada valor de x. En este caso se habla de
modelo de tipo I. En otras ocasiones la variable x no controla la variable y, y se hace un
muestreo aleatorio de pares (x,y). En este caso se habla de modelo II.

Independiente del modelo, el supuesto bsico de la regresin es la independencia e
idntica distribucin de los errores. Esta se puede probar con el estadgrafo de Durbin-
Watson. Esto es especialmente relevante cuando las variables independientes son el
tiempo o el espacio y puede existir autocorrelacin (espacial o temporal). La
distribucin esperada de los errores es una Normal, univariada o bivariada, segn sea
modelo I o II.

En caso de no cumplirse los supuestos, se pueden usar otros mtodos, como
anlisis de series temporales en el caso de que la variable independiente sea el tiempo, o
140
mtodo de las semi-medias en otros casos. En el caso de un anlisis de correlacin, se
puede usar el coeficiente de correlacin no-paramtrico de Spearman (r
s
).

Este simplemente corresponde a un coeficiente de correlacin de Pearson (r)
aplicado sobre las variables previamente transformadas a rangos. Se puede demostrar
que si d
i
es la diferencia entre los rangos de x
i
e y
i
: d
i
= x
i
-y
i
, entonces:

n n
d
r
n i
i
i
s
=

=
=
3
1
2
6
1

X.5.- Anlisis de la covarianza (ANCOVA)

En el anlisis de la covarianza se tiene un diseo donde la variable respuesta vara
en funcin de otra variable llamada co-variado. Por ejemplo si se mide una variable y
que vara en funcin de x frente a tres niveles de un factor A se tiene la tabla:

Factor A
A1 A2 A3
Y X Y X Y X

En este caso es un ANCOVA de una va o factor, con tres tratamientos. La
variable respuesta es Y y el co-variado es X.

El modelo de ANCOVA se puede escribir:

ij ij i ij
x x y + + + = ) (
1

Se observa que en este modelo se contempla una relacin funcional entre la
variable respuesta y su covariado mediada por un modelo de regresin.

En su expresin original el inters del ACOVA est centrado en el efecto de los
tratamientos y la regresin sobre la variable respuesta Sin embargo a menudo el inters
se centra en la variable respuesta descartando el efecto del covariado y ms
habitualmente, el inters se encuentra en las variaciones de la respuesta funcional, las
pendientes de regresin, frente a los distintos tratamientos (Homogeneidad de
pendientes. En el ANCOVA al igual que en el ANOVA y en la regresin, es posible la
particin de la suma de cuadrado y docimar por separado cada uno de los efectos. En su
141
forma ms simple el ANCOVA consta de dos tratamientos, una variable respuesta y
con su respectivo co-variado. En este caso la homogeneidad de pendientes se puede
probar alternativamente con una t de Student:

)
1 1
(
2
2
2
1
2
12 11
4 2 1

+
=
+
i i
yxc
n n
x x
S
t

donde
4
2 1
2 1 2
+
+
=
n n
SCresiduo SCresiduo
S
yxc

142

Ejercicios de correlacin y regresin

1. Se realiza un estudio para predecir la estatura final de un individuo a partir de la talla
al nacer obteniendo:

Talla al
nacer
(cm)
36 38 42 44 45 48 50 51 52 53 54 55 56 58
Estatura
final
(m)
1.58 1.64 1.70 1.65 1.65 1.70 1.72 1.76 1.72 1.82 1.80 1.86 1.90 1.88

Qu puede decir de la capacidad predictiva de la talla de nacimiento sobre la estatura
final? Que estatura final esperara de un individuo con una talla de 30.53 cm al
nacimiento? Y su intervalo de confianza?

R: Es buena. EF = 1.093 + 0.0133xTN; F
1,12
= 65.9, p < 0.05; R
2
= 0.833. Se esperara
una EF = 1.5 m; el IC
95%
= {1.389; 1.611}.

2. Se piensa que los grados de conciencia (GC: del 1 al 10) despus de un TEC estn
relacionados con la edad del paciente accidentado. Se realiza un estudio y se obtiene:
Edad 26 34 45 48 57 62 70 72 76 78 80 87
GC 10 8 10 9 7 10 5 4 4 3 1 2

a) Qu tipo de anlisis corresponde a la pregunta?

b) Plante la hiptesis correspondiente.

c) Utilice estadstica paramtrica y despus no-paramtrica.

d) Que puede decir finalmente de su hiptesis?

R: Correlacin; r = -0.86; t
10
= -5.33; p < 0.05; R =-0.89; t
10
= -6.26; p < 0.05.
Efectivamente, estn asociados negativamente, a mayor edad, menor grado de
conciencia despus de un TEC.

143
BIBLIOGRAFIA

Azocar MR (1974) Probabilidad Matemtica. Universidad Catlica de Chile, Instituto
de Matemticas (Apunte).

Brown D & Rothery P (1993) Models in Biology: Mathematics, Statistics and
Computing. John Wiley & Sons, New Jork.

Cochran WG (1980) Tcnicas de Muestreo. Compaa editorial Continental SA,
Mexico.

Cramer H (1945) Mtodos Matemticos en Estadstica. Aguilar SA, Madrid.

Cramer (1966) Elementos de la Teora de Probabilidades. Aguilar SA, Madrid.

Feller W (1968) An Introduction To Probability Theory And Its Applications. John
Wiley & Sons, New Jork.

Hair JF, Anderson RE, Tatham RL & Black WC (1999) Anlisis Multivariante .
Prentice Hall, Madrid.

Hollander M & Wolf DA (1972) Nonparametric Statistical Methods. John Wiley &
Sons, New York.

Manley FJ (1986) Multivariate Statistical Methods, A Primer. Chapmann & Hall,
London.

Sackett DL, Strauss SS, Richardson WS, Rosenberg W & Haynes RB (2001) Medicina
Basada En La Evidencia. Harcourt, Madrid.

Siegel S & Castellan NJ (1988) Nonparametric Statistics For The Behavioral Sciences.
McGraw-Hill, New Jork.

Silva C & Cumsille F (1984) Calculo de Probabilidades. Universidad de Chile, Escuela
de Salud Pblica. (apunte).

Snedecor GW & Cochran WG (1980) Statistical Methods. The Iowa University Press,
Iowa.

Sokal RR & Rohlf FJ (1995) Biometry: The Principles And Practice Of Statistics In
Biology Research. WH Freeman, New Jork.

144
Steel RGD & Torrie JH (1980) Bioestadstica: Principios Y Procedimientos. McGraw-
Hill Latinoamericana SA, Bogot.

Taucher E (1997) Bioestadstica. Editorial Universitaria, Santiago, Chile.

Zar JH (1996) Biostatistical Anlisis. Prentice Hall, New Jersey.
145

ANEXO I.- FORMULAS UTILES

II.- ESTADSTICA DESCRIPTIVA

Frecuencia relativa n n h
i i
/ =

Frecuencia acumulada
=
=
=
j i
i
i j
n N
1

Frecuencia acumulada relativa
=
=
=
j i
i
i j
h H
1

Promedio
n
x
x
i
=
Promedio si la serie ha sido agrupada
= =
i i
i i
y h
n
y n
y

Mediana
L
L L
L
n
N n c
y Me
) 2 / (
'
1
1

+ =

Percentil de orden p
L
L L
L p
n
N np c
y P
) 100 / (
'
1
1

+ =

Varianza
=
2
2
2
x
n
x
s
i

Varianza en una serie agrupada

= =
2 2 2
2
2
y y h y
n
y n
s
i i
i i

Desviacin estndar
2
s s =

Coeficiente de Variacin x s CV / =

Error estndar (Es): n s Es / =
146

III.- PROBABILIDADES

Probabilidad
les casosposib
ables casosfavor
A P = ) (

Aditividad finita: Si A
i
B
i
= , para cualquier i, j, entonces P ( A
i
) = P (A
i
)

Probabilidad Compuesta: P(A B) = P(A) + P(B) P(A B)

Probabilidad de que ocurra al menos un evento: P( A
i
)= 1 P( A
i
C
), lo que se
interpreta como P(alguno) = 1 P (ninguno)

Probabilidad condicional
) (
) (
) / (
B P
B A P
B A P

=

Probabilidad conjunta Si A y B son independientes, entonces P(A B) = P(A) P(B)
(teorema de la y)

Probabilidad total
=
i
i i
B P B A P A P ) ( ) / ( ) (

Teorema de Bayes
=
j j j
i i
i
B P B A P
B P B A P
A B P
) ( ) / (
) ( ) / (
) / (

Chance u odds
p
p
O
=
1

Sensibilidad
b a
a
E P S
+
= + = ) / (

Especificidad
d c
d
noE P Sp
+
= = ) / (

Valor predictivo positivo
c a
a
E P VPP
+
= + = ) / (

147
Valor predictivo negativo
d b
d
noE P VPN
+
= = ) / (

Certeza diagnstica
n
d a
C P
+
= ) (

Razn de verosimilitud (+)
Sp
S
noE P E P noE P E P LR
= + = + + =
1
)) / ( 1 /( ) / ( ) / ( / ) / (

Razn de verosimilitud (-) Sp S LR / ) 1 ( =

]
1 1 1 1
[log
2 / 1
d c b a d a
Z LR IC
+
+
+ =

Chance a posteriori Oo LR Op =

Tasa de evento en el control
c a
a
control evento P CER
+
= = ) / (

Tasa de evento en el grupo experimental
d b
b
ex evento P EER
+
= = ) / (

Riesgo relativo CER EER RR / = ]
1 1 1 1
[log
2 / 1
d b c a b a
Z RR IC
+
+
+ =

Reduccin absoluta del riesgo EER CER ARR =

Nmero necesario a tratar para un beneficio ARR NNT / 1 =

Reduccin relativa del riesgo CER EER CER RRR / ) ( =

Aumento absoluto del riesgo CER EER ARA =

Aumento relativo del riesgo CER CER EER RRA / ) ( =

Nmero necesario de expuestos para un dao ARA NNH / 1 =

148
Razn de disparidades de la chance (Odds ratio)
bc
ad
d b
c a
OR = =
/
/

]
1 1 1 1
[log
2 / 1
d c b a
Z OR IC + =

IV.- VARIABLES ALEATORIAS

Distribucin de Bernoulli E[X] = p, V[X] = pq.

Distribucin binomial
k n k
p p
k
n
k X P

|
|
.
|
\
|
= = ) 1 ( ) (

E[X] = np, V[X] = npq.
Distribucin Hiergeomtrica
|
|
.
|
\
|
|
|
.
|
\
|
|
|
.
|
\
|
= =
n
N
k
Np
k n
Np N
k X P ) (

E[X] = np, V[X] = npq(N-n)/(N-1).

Distribucin de Poisson
!
) (
k
e k X P
k
= =

E[X] = V[X] =

Distribucin exponencial
x
e x f

= ) (
E[X] = 1/ y V[X] = 1/
2

DISTRIBUCIN NORMAL
2
] [ ) 2 / 1 (
) 2 / 1 ( ) (

=
x
e x f
E[X] = y V[X] =
2

V.- ESTIMACIN

Intervalo de confianza para una proporcin P y para la diferencia P1-P2

] / [
2 / 1
n pq Z p IC =

] / / ( ) [(
2 2 2 1 1 1 2 / 2 1 1
n q p n q p Z p p IC + =

149

Intervalo de confianza para el promedio x y para la diferencia x
1
-x
2

Si se conoce la varianza poblacional ] / [
2 / 1
n Z x IC

=

Si no se conoce ] / [
) 2 / 1 ( 1
n s t x IC =

Para la diferencia de promedios
] ) [(
) 2 / 1 ( 2 1 1
Es t x x IC =

donde ) / 1 / 1 (
2
) 1 ( ) 1 (
2 1
2 1
2
2 2
2
1 1
n n
n n
s n s n
Es +
+
+
=

Estimadores en Medicina

Proporciones Sensibilidad, Especificidad, Valores
predictivos, certeza diagnstica, CER y
EER
Diferencia de proporciones Reduccin y aumento absoluto del riesgo:
ARR y ARA

Nmeros necesarios : NNT y NNH Ambos estn definidos como los valores inversos de
ARR y ARA respectivamente, por lo que en estos casos, se calculan los lmites de
confianza para ARR y ARA y se calcula su inverso.

Riesgo relativo (RR), Odds ratio (OR) y cuocientes de verosimilitud (LR)

Para log RR: ]
1 1 1 1
[log
2 / 1
d b c a b a
Z RR IC
+
+
+ =

Para log OR: ]
1 1 1 1
[log
2 / 1
d c b a
Z OR IC + =

Para log LR: ]
1 1 1 1
[log
2 / 1
d c b a d a
Z LR IC
+
+
+ =

Tamao muestral para estimar una proporcin
2
2
2 /
d
PQ Z
n

=

150
Tamao muestral para estimar un promedio
2
2 2
2 /
2
2 2
2 / 1
d
s Z
d
s t
n

=

Para confianzas del 95% se suele aproximar z
2
/2
= 4.

VI.- DOCIMASIA O PRUEBA DE HIPTESIS

VALOR DE VERDAD de
Ho
V (H
1
F) F (H
1
V)
DECISIN Rechazo Ho
ERROR I () K = 1-
Acepto Ho
C = 1- ERROR II ()

Dcimas para una muestra
Dcima para una proporcin (P)
n
q p
p p
Z
0 0
0

=

Dcima para un promedio
n
s
x
t
n
0
1

=

Dcimas para dos muestras

Dos proporciones
)
1 1
(
) (
2 1
0 0
0 2 1
n n
q p
P p p
Z
+

= donde
2 1
2 2 1 1
0

n n
n p n p
p
+
+
=

Dcimas para dos promedios

Muestras independientes

c) Si las varianzas se pueden considerar iguales (homocedasticidad) entonces usamos:

)
1 1
(
2 1
2
0 2 1
2
2 1
n n
s
x x
t
c
n n
+

=
+

donde
2
) 1 ( ) 1 (
2 1
2
2 2
2
1 1 2
+
+
=
n n
s n s n
s
c

151
2
2 2
1 2
1 2
2 2
2 2
1 2
1 2
1 2
1 1
s s
n n
gl
s s
n n
n n
| |
+
|
\ .
=
| | | |
| |
\ . \ .
+

d) si no hay homocedasticidad, entonces usamos:

) (
2
2
2
1
2
1
0 2 1
n
s
n
s
x x
t
gl
+

=

pero los grados de libertad gl los estimamos mediante

Muestras dependientes (pareadas)
n s
d
t
d
n
/
1
=

Dcima de Homocedasticidad
2
2
) 1 ( ), 1 (
2 1
m
M
n n
s
s
F =

VII.- ANLISIS DE DATOS ENUMERATIVOS O FRECUENCIAS

La distribucin
2
para tablas de contingencia

=

j i
c r
e
e o
,
2
2
) 1 )( 1 (
) (

Prueba exacta de Fisher
= = = =
1 , 1
! ! ! ! !
! ! ! !
) ( ); (
0 , 0 2 , 2 1 , 2 2 , 1 1 , 1
1 , 0 1 , 0 0 , 2 0 , 1
N x
F
N N N N N
N N N N
x X dondeP x X P P

La distribucin
2
para bondad de ajuste

=

e
e o
p n
2
2
1
) (

La distribucin
2
para proporciones
q p
p p n
n
i i
n
1 2
1
) (
en donde n p n p
i
i
/
1
=

152

VIII.- ESTADSTICA DE DISTRIBUCIN LIBRE O NO-PARAMTRICA

Prueba de los signos de Fisher
=
i
b B

Prueba de los rangos signados de Wilcoxon
=
i i
R b T

Prueba de la suma de rangos de Wilcoxon- Mann-Whitney
=
o
n
i
R T
1
1

Dcima de McNemar
) (
) (
2
2
1
C B
C B
+
= o
) (
) 1 (
2
2
1
C B
C B
+

=

IX.- ANLISIS DE LA VARIANZA (ANOVA o ANDEVA)

Anlisis de la varianza de 1 va o factor (ANOVA de 1 va).

FV SC Gl CM=SC/gl F P
T (entre)
nt Y n Y
i
i
/ ) / (
2
00
2
0

t-1 F =
CME/CMD

(dentro o
error)

=
i
i
ij
ij
n Y y /
2
0
2

t(n-1)
TOTAL
nt Y y
ij
ij
/
2
00
2

nt-1

Transformaciones

Distribucin
(y)
Transformacin f(y)
Normal C = constante Y
Binomial (proporciones) y(1-y)
arcsen(y)
Poisson (sucesos raros) Y
y
Sin homocedasticidad y
2
ln(y) o ln(y+1)
y
4
1/y o 1/(y+1)
Binomial negativa arcsen(y)
Decreciente y
2

Contrastes ortogonales
=
i i
j
gle
n c CMD
L
t
/
2

153
Prueba de Dunnet
n CMD
y y
t
control i
d
/ 2
0

=

Prueba de Scheff
i i
gle t
n c CMD t
L
F
/ ) 1 (
2
2
, 1

Prueba de Tukey
)
1 1
( ) 2 / (
0 0
,
j i
j i
gle t
n n
CMD
y y
Q
+
=

Diseo de bloques aleatorizados
B1 T1 T3 T2
B2 T3 T2 T1
B3 T2 T1 T3

Diseo de medidas repetidas
T1 T2 T3
I1
I2
I3
I4

Diseos anidados, encajados o jerrquicos

T1

T2

T3

N1 N2 N1 N2 N1 N2

Cuadrado latino
b1 B2 B3
B1 T1 T2 T3
B2 T2 T3 T1
B3 T3 T1 T2

154

Parcelas divididas (split-plot)
B1 T1 t1 T3 T1 T2 t1
t2 T2 t2
B2 T3 t1 T2 T1 T1 t1
t2 T2 t2
B3 T2 t1 T1 T1 T3 t1
t2 T2 t2

Prueba de Kruskall-Wallis: ) 1 ( 3
) 1 (
12
1
2
0
+
+
=

n
n
R
N N
H
t
j
j

Relacin entre Kruskall-Wallis y ANOVA sobre rangos H
t H N
t N
F
) 1 )( 1 (

=

Comparaciones mltiples de Nemenyi (post- K-W)
12
) 1 )( (
0 0
, ,
+
nt nt n
R R
Q
k j
t

Prueba de Friedman ) 1 ( 3
) 1 (
12
2
0
2
+
+
=

t b R
t bt j
j t

Comparaciones mltiples post-Friedman
12
) 1 )( (
0 0
, ,
+
t t b
R R
Q
k j
t

X.- CORRELACIN Y REGRESIN

Coeficiente de correlacin

=

=
) )( ( ) ( ) (
) )( (
2 2 2 2 2 2
y n y x n x
y x n y x
y y x x
y y x x
r
i i
i i
i i
i i

Prueba de Hiptesis
2
2
1
2
r
n r
t
n

Regresin: Pendiente e Intercepto
=
2 2
1
/
/
x n x
y x n y x
B
i
i i
x B y B
1 0
=

155
Varianzas de la pendiente e intercepto

2
2
1
) (
] [

=
x x
S
B V
i
yx
y )
) (
1
( ] [
2
2
0

+ =
x x
x
n
S B V
i
yx
donde

=
2
2
2
n
e
S
i
yx

Pruebas de Hiptesis
] [
*
*
2
B V
B
t
n
=

ANOVA de la regresin
Fuente de
variacin
SC Gl CM F
1,n-2
P
Modelo
(Regresin)
) ( ) (
2 2 2
1
2 '
x n x B y y
i i
=

1 SC/gl CMmodelo/CMresiduo
Residuo
(por diferencia)
n-2 SC/gl
= S
yx
2

Total
2 2 2
) ( y n y y y
i i
=

n-1

Coeficiente de determinacin (R
2
)
SCTotal
n SCregresi
R =
2

Error tpico de la estima
2
2
2
yx
i
yx
S
n
e
S =

Prediccin de un valor y para un valor x
k
(y/x
k
)

IC
1-
:

+ +

n x x
x x
n
S t y
i i
k
yx n k
/ ) (
) ( 1
1
2 2
2
2
'

Prediccin del valor y para x
k

IC
1-
:

+

n x x
x x
n
S t y
i i
k
yx n k
/ ) (
) ( 1
2 2
2
2
'

Correlacin no-paramtrico de Spearman (r
s
)
n n
d
r
n i
i
i
s
=

=
=
3
1
2
6
1

156
ANCOVA

Factor A
A1 A2 A3
Y X Y X Y X

Comparacin de dos pendientes:

)
1 1
(
2
2
2
1
2
12 11
4 2 1

+
=
+
i i
yxc
n n
x x
S
t

donde
4
2 1
2 1 2
+
+
=
n n
SCresiduo SCresiduo
S
yxc

157
ANEXO II.- TABLAS SIMPLIFICADAS

A.- DISTRIBUCION NORMAL (N(0,1))

rea desde z a ; Valores crticos para 1 cola () ( = 0.05) y dos colas () ( = 0.05)

Z Area
0 0.5000
0.1 0.4602
0.2 0.4207
0.3 0.3821
0.4 0.3446
0.5 0.3085
0.6 0.2743
0.7 0.2420
0.8 0.2119
0.9 0.1841
1.0 0.1587
1.1 0.1357
1.2 0.1151
1.3 0.0968
1.4 0.0808
1.5 0.0668
1.6 0.0548
1.64 () 0.0500
1.7 0.0446
1.8 0.0359
1.9 0.0287
1.96 () 0.0250
2.0 0.0228
2.5 0.0062
3.0 0.0013

158
B.- DISTRIBUCION t DE STUDENT

Valores crticos para una ( = 0.05) y dos colas ( = 0.025)

Grados de libertad = 0.05 = 0.025
5 2.01 2.57
6 1.94 2.45
7 1.90 2.36
8 1.86 2.31
9 1.83 2.26
10 1.81 2.23
15 1.75 2.13
20 1.72 2.09
25 1.71 2.06
30 1.70 2.04
1.64 1.96

159
C.- DISTRIBUCION
2

Valores crticos para = 0.05

Grados de libertad Valor crtico
1 3.84
2 5.99
3 7.81
4 9.49
5 11.1
6 12.6
7 14.1
8 15.5
9 16.9
10 18.3
11 19.7
12 21.0
13 22.4
14 23.7
15 25.0
16 26.3
17 27.6
18 28.9
19 30.1
20 31.4
25 37.7
30 43.8

160
D.- DISTRIBUCION F

Valores crticos para = 0.05

Grados De Libertad Del Numerador
Gr. libertad
denominador
1 2 3 4 5 8 10
3 10.13 9.55 9.28 9.12 9.01 8.84 8.78 8.53
4 7.71 6.94 6.59 6.39 6.26 6.04 5.96 5.63
5 6.61 5.79 5.41 5.19 5.05 4.82 4.74 4.36
6 5.99 5.14 4.76 4.53 4.39 4.15 4.06 3.67
7 5.59 4.74 4.35 4.12 3.97 3.73 3.63 3.23
8 5.32 4.46 4.07 3.84 3.69 3.44 3.34 2.93
9 5.12 4.26 3.86 3.63 3.48 3.23 3.13 2.71
10 4.96 4.10 3.71 3.48 3.33 3.07 2.97 2.54
15 4.54 3.68 3.29 3.06 2.90 2.64 2.55 2.07
20 4.35 3.49 3.10 2.87 2.71 2.45 2.35 1.84
25 4.24 3.38 2.99 2.76 2.60 2.34 2.24 1.71
30 4.17 3.32 2.92 2.69 2.53 2.27 2.16 1.62
40 4.08 3.23 2.84 2.61 2.45 2.18 2.07 1.51
50 4.03 3.18 2.79 2.56 2.40 2.13 2.02 1.44
60 4.00 3.15 2.76 2.52 2.37 2.10 1.99 1.39
3.84 2.99 2.60 2.37 2.21 1.94 1.83 1.00

Observacin: Si el nmero de grados de libertad del denominador es mayor que 3, lo que
es lo habitual, entonces cualquier valor calculado de F mayor que 10 permite rechazar
H
0
para = 0.05, sin necesidad de mirar ninguna tabla.
161
E.- DISTRIBUCION DEL RANGO STUDENTIZADO: Q

Valores crticos para = 0.05 para diferentes nmeros de tratamientos (t)

T
Gr. libertad 2 3 4 5 8 10
5 3.64 4.60 5.22 5.67 6.58 6.99
10 3.15 3.88 4.33 4.65 5.30 5.60
15 3.01 3.67 4.08 4.37 4.94 5.20
20 2.95 3.58 3.96 4.23 4.77 5.01
2.77 3.31 3.63 3.86 4.29 4.47

162
F.- DISTRIBUCION de WILCOXON (Rangos signados)

Valor crtico para = 0.05, vs n

N Valor crtico
4 10
5 14
6 19
7 24
8 30
9 37
10 44
15 89

163
G.- DISTRIBUCION DE WILCOXON-MANN-WHITNEY (Suma de Rangos)

Valores crticos ( = 0.05) para diferentes valores de n
1
y n
2

n
2
=2 3 4 5 10
n
1
= 3 10 15
4 12 17 24
5 13 20 27 36
6 15 23 30 40
7 16 24 33 43
8 18 27 36 47
9 20 29 39 50
10 22 32 42 54 127

Curso de Estadística Universitaria 2007

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Curso de Estadística Universitaria 2007

Cargado por

Copyright:

Formatos disponibles

CURSO DE ESTADISTICA UNIVERSITARIA

+ = + = y tomando lmite cuando n

IC Es decir entre 1.033 y 1.051.

= t . Como el valor crtico de t para una cola, 59 grados de libertad y una

= Z . Entonces ahora se debe tomar la decisin. El

= t . Para = 0.05 y una cola, el valor crtico de t es 1.64,

.La interpretacin de esto es que se espera que la desviacin

También podría gustarte