Está en la página 1de 14

Estimacin de mxima verosimilitud (1)

La idea fundamental de este mtodo es tomar como estimacin del parmetro


estudiado el valor que haga mxima la probabilidad de obtener la muestra
observada.

Para ilustrar este mtodo, imaginemos la siguiente situacin: queremos estimar la


probabilidad p de que salga cara en el lanzamiento de una moneda no
necesariamente regular.

Para ello procedemos de la siguiente manera: lanzamos la moneda cinco veces y


obtenemos la siguiente secuencia:

C+CC+

Una manera aparentemente razonable de estimar p sera evaluar la probabilidad


de obtener esta muestra para diferentes valores de p y quedarnos con el valor que
haga mxima dicha probabilidad. En nuestro caso, debemos calcular:

para todos los posibles valores de p, es decir, para todo valor real entre 0 y 1. Es
lo que se muestra en la siguiente tabla, en la que se han simplificado los posibles
valores de p tomando incrementos de 0,1:

Probabilidad de la
Valor de p
muestra observada

0,0 0,0000

0,1 0,0008

0,2 0,0051
0,3 0,0132

0,4 0,0230

0,5 0,0313

0,6 0,0346

0,7 0,0309

0,8 0,0205

0,9 0,0073

1,0 0,0000

Como puede observarse, el valor para el que se obtiene la mxima probabilidad


es 0,6. Por tanto, dicho valor ser la estimacin mximo verosmil (EMV) de p.

Si analizamos este resultado es fcil darse cuenta que la EMV obtenida coincide
con la frecuencia relativa del nmero de caras (Fr (C) = 3/5 = 0,6), por lo que
podemos preguntarnosse trata de un resultado casual o es generalizable? Para
responder a esta cuestin volvamos al clculo de la probabilidad de nuestra
muestra, pero aprovechemos para hacerlo ms general. Supongamos que hemos
efectuado n lanzamientos de la moneda de los que k (k <= n) han sido cara sin
que importe el orden en que han salido. La probabilidad de dicho suceso viene
dada por:
y, si suponemos que los valores n y k son conocidos, esta probabilidad puede
expresarse como una funcin L(p) del parmetro p, exclusivamente. A dicha
funcin se le llama funcin de verosimilitud y puede definirse como la funcin de
densidad conjunta de la muestra (probabilidad de obtener la muestra observada,
en nuestro caso), pero considerada como funcin del parmetro. Por tanto, es
posible maximizarla utilizando las tcnicas conocidas de clculo y asumiendo la
restriccin de que 0 <= p <= 1. Es decir, derivamos L(p) e igualamos a cero.
Aunque, los clculos suelen facilitarse al aplicar el hecho de que si una funcin
(positiva) alcanza un mximo en un punto dado, el logaritmo de dicha funcin
alcanzar un mximo en el mismo punto:

Para ser rigurosos debemos comprobar que se trata de un mximo. Una manera
de hacerlo es demostrar que la derivada segunda de L(p) (o de su logaritmo) en el
punto k/n es negativa. En nuestro caso es fcil ver que la segunda derivada
siempre es negativa:

Es decir, acabamos de demostrar que la frecuencia relativa es el estimador


mximo verosmil de la probabilidad de un determinado suceso (en nuestro
ejemplo que salga cara). La metodologa que acabamos de utilizar para
determinar el estimador mximo verosmil se denomina mtodo de la mxima
verosimilitud.

Mtodo de Mnimo Cuadrado


El uso de tcnicas estadsticas para analizar el comportamiento de los costos
proporciona un anlisis ms cientfico. Solamente se representar en mtodo
de mnimos cuadrados, algunas veces denominado anlisis de regresin
simple, es un enfoque relativamente sencillo pero efectivo. Usamos un
anlisis de regresin para medir la cantidad de cambio promedio en una
variable dependiente. Una de las principales ventajas del anlisis de regresin
sobre la tcnica de punto alto y punto bajo es la inclusin de todos los puntos
de datos, en lugar de slo los puntos altos y bajos, al especificar la relacin.

El mtodo de mnimos cuadrados es el mtodo de regresin que se


usa con mayor frecuencia. Se basa en la ecuacin de la lnea recta (y = a +
bx) donde y representa los costos; a es el componente fijo; b es el elemento
variable; y x es el volumen. Este mtodo es ms apropiado cuando los datos
muestran una variacin uniforme de desviaciones a lo largo de la lnea de
tendencia. Si el costo es fijo, el coeficiente de la pendiente b es de cero; si el
costo es variable, la interseccin a es igual a cero en la funcin de costos. En
el caso de los costos semivariables o fijos, tanto a como b tienen valores
positivos.

Ejemplo Minimos cuadrados


De acuerdo a la informacin mostrada a continuacin, determina cules
sern los costos en una jornada de trabajo de 40 horas?.

MES COSTO HORAS


(Y) (X)

ENERO 400 10.00

FEBRER 500 12.50


O

MARZO 500 17.50

ABRIL 600 20.00

MAYO 1,500 50.00


JUNIO 900 30.00

TOTAL 4,400 140.00

SOLUCIN

MES COSTO HORAS (X)(Y) X2


(Y) (X)
ENERO 400 10.00 4000 100
FEBRER 500 12.50 6250 156
O
MARZO 500 17.50 8750 306
ABRIL 600 20.00 12000 400
MAYO 1,500 50.00 75000 2,500
JUNIO 900 30.00 27000 900
TOTAL 4,400 140.00 133,000 4,363

Y = a + bx

Y = 87.75 + 27.67(x)

Con esta ecuacin de mnimo cuadrado se pueden predecir los costos totales
aproximados de acuerdo a las horas laboradas.

Y = 87.75 + 27.67(40)

Y = 87.75 + 1106.8

Y = $1,194.55

Correlacin

La correlacin trata de establecer la relacin o dependencia que existe entre las dos
variables que intervienen en una distribucin bidimensional.

Es decir, determinar si los cambios en una de las variables influyen en los cambios
de la otra. En caso de que suceda, diremos que las variables estn correlacionadas o
que hay correlacin entre ellas.

Tipos de correlacin

1 Correlacin directa

La correlacin directa se da cuando al aumentar una de las variables la otra


aumenta.

La recta correspondiente a la nube de puntos de la distribucin es una recta


creciente.

2 Correlacin inversa
La correlacin inversa se da cuando al aumentar una de las variables la otra
disminuye.

La recta correspondiente a la nube de puntos de la distribucin es una recta


decreciente.

3 Correlacin nula

La correlacin nula se da cuando no hay dependencia de ningn tipo entre las


variables.

En este caso se dice que las variables son incorreladas y la nube de puntos tiene una
forma redondeada.

Grado de correlacin

El grado de correlacin indica la proximidad que hay entre los puntos de la nube
de puntos. Se pueden dar tres tipos:
1. Correlacin fuerte

La correlacin ser fuerte cuanto ms cerca estn los puntos de la recta.

2. Correlacin dbil

La correlacin ser dbil cuanto ms separados estn los puntos de la recta.

3. Correlacin nula
Concepto de Intervalo Estudios de
de Confianza. cohortes
Estudios de
cohortes II
En el contexto de estimar Casos
un parmetro y controles
poblacional, un intervalo Casos
de confianza es un rango y controles II
Casos
de valores (calculado en y controles III
una muestra) en el cual se Intervalos de
encuentra el verdadero confianza
valor del parmetro, con Variables
una probabilidad confundentes
Anlisis
determinada. estratificado

La probabilidad de que el
verdadero valor del OTROS
TEMAS
Introductorios
Instrumentale
s
introductorios
Paradigmas
epidemiolgic
os
Indicadores
de riesgo EPI
Investigacin
y EPI
Epidemiolog
a descriptiva
Epidemiolog
a analtica
Estudios
experimentales
Luego, el intervalo de confianza para es
(13,2 , 15,8). Es decir, el puntaje promedio
poblacional se encuentra entre 13,2 y 15,8
con una confianza 95%.

III. Intervalo de Confianza para una


Proporcin.

En este caso, interesa construir un intervalo


de confianza para una proporcin o un
porcentaje poblacional (por ejemplo, el
porcentaje de personas con hipertensin,
fumadoras, etc.)

Si el tamao muestral n es grande, el


Teorema Central del Lmite nos asegura que:

O bien:

Donde p es el porcentaje de personas con la


caracterstica de inters en la poblacin (o
sea, es el parmetro de inters) y p es su
estimador muestral.

Luego, procediendo en forma anloga al caso


de la media, podemos construir un intervalo
de 95% de confianza para la proporcin
poblacional p.

Ejemplo:
En un estudio de prevalencia de factores de
riesgo en una cohorte de 412 mujeres
mayores de 15 aos en la Regin
Metropolitana, se encontr que el 17.6% eran
hipertensas. Un intervalo de 95% de
confianza para la proporcin de mujeres
hipertensas en la Regin Metropolitana est
dado por:

Luego, la proporcin de hipertensas vara


entre (0,139 , 0,212) con una confianza de
95%.
IV. Uso de Intervalos de Confianza para
verificar Hiptesis.
Los intervalos de confianza permiten
verificar hiptesis planteadas respecto a
parmetros poblacionales.

Por ejemplo, supongamos que se plantea la


hiptesis de que el promedio de peso de
nacimiento de cierta poblacin es igual a la
media nacional de 3250 gramos.

Al tomar una muestra de 30 recin nacidos


de la poblacin en estudio, se obtuvo:

= 2930
s= 450
n= 30

Al construir un intervalo de 95% de

Un intervalo de confianza es un intervalo que tiene a lo menos un extremo


aleatorio y es construdo de manera tal que el parmetro de inters que se
estima esta contenido en dicho intervalo con una probabilidad 1 , llamada
coeficiente de confianza.

También podría gustarte