Está en la página 1de 4

Coeficiente de determinacin En estadstica, el coeficiente de determinacin, denominado R2 y pronunciado R cuadrado, es un estadstico usado en el contexto de un modelo estadstico cuyo principal

propsito es predecir futuros resultados o testear una hiptesis. El coeficiente determina la calidad del modelo para replicar los resultados, y la proporcin de variacin de los resultados que puede explicarse por el modelo. Hay varias definiciones diferentes para R2 que son algunas veces equivalentes. Las m s comunes se refieren a la regresin lineal. En este caso, el R2 es simplemente el cuadrado del coeficiente de correlacin de !earson, lo cual es slo cierto para la regresin lineal simple. "i existe varios resultados para una #nica varia$le, es decir, para una % existe una &, '... el coeficiente de determinacin resulta del cuadrado del coeficiente de determinacin m#ltiple. En am$os casos el R2 adquiere valores entre ( y ). Existen casos dentro de la definicin computacional de R2 donde este valor puede tomar valores negativos. Caso general *n modelo estadstico se construye para explicar una varia$le aleatoria que llamaremos dependiente a trav+s de otras varia$les aleatorias a las que llamaremos factores. ,ado que podemos predecir una varia$le aleatoria mediante su media y que, en este caso, el error cuadr tico medio es su varian-a, el m ximo error cuadr tico medio que podemos aceptar en un modelo para una varia$le aleatoria que posea los dos primeros momentos es la varian-a. !ara estimar el modelo haremos varias o$servaciones de la varia$le a predecir y de los factores. . la diferencia entre el valor o$servado de la varia$le y el valor predicho la llamaremos residuo. La media cuadr tica de los residuos es la varian-a residual. "i representamos por varian-a residual por siguiente ecuacin/ la varian-a de la varia$le dependiente y la

, el coeficiente de determinacin viene dado por la

"e mide en tantos por ciento. "i la varian-a residual es cero, el modelo explica el )((0 de valor de la varia$le1 si coincide con la varian-a de la varia$le dependiente, el modelo no explica nada y el coeficiente de determinacin es del (0. En varia$les econmicas y financieras, suele ser difcil conseguir un coeficiente de determinacin mayor de un 2(0. Para la regresin lineal !ara la regresin $asta con hacer el cuadrado del coeficiente de correlacin de !earson.

,onde/

es la covarian-a de es la desviacin tpica de la varia$le es la desviacin tpica de la varia$le

Modelo lineal En un modelo lineal, la varia$le dependiente se explica mediante la

ecuacin . "i o$servamos veces tanto la varia$le aleatoria como los factores, podemos ordenar nuestras o$servaciones de la varia$le dependiente en una matrimientras que colocaremos las de los factores en la matri- de regresin . 3ada o$servacin corresponder a una coordenada de y a una fila de . 3ada columna de la matri- de regresin corresponde a las o$servaciones de un factor. En cada o$servacin el modelo cometer un error/

Estos errores se llaman residuos. La varian-a residual es la varian-a de estos residuos.

es la parte de la variacin de es la parte de la variacin de "umando estas dos partes, o$tenemos Bondad del ajuste del modelo .

explicada por el modelo lineal.

que no explica el modelo lineal.

!ara evaluar el a4uste del modelo se puede utili-ar la estadstica coeficiente de determinacin expresada por

que mide la proporcin de la varia$ilidad total explicada por el modelo de regresin planteado, o la la proporcin del total que es de$ida a la regresin. "e espera que esta proporcin sea alta y cerca del sea de$ido al error. La interpretacin de y solo una peque5a parte depende del n#mero de datos/

6"i el n#mero de datos es elevado, el coeficiente se disminuye 6 "i el n#mero de datos es poco, el coeficiente se aumenta. !or lo anterior se de$e tener mucho cuidado cuando el n#mero de datos sea poco porque el coeficiente de determinacin puede ser muy alto y no ser necesariamente as. puede tomar valores muy cecanos a cundo todos los valores de , el

son diferentes, per cuando existen o$servaciones repetidas para un mismo

valor de no puede lograr ser aun cuando el modelo se a4uste $ien a los datos o no impotando cuantos t+rminos use el modelo 7excepto cuando , lo cual es raro en estos casos8. Ejemplo !ara el e4emplo tratado, el valor de porcenta4e es , lo que significa que el es de , cuyo respectivo

de la variacin en la densidad es explicado por su asociacin

ptica 7 8, se atri$uye a su asociacin lineal con la concentracin de $iomasa 7 8. !or lo anterior, el porcenta4e de variacin en lineal con en m s de 99.:0. En Excel se pueden o$tener la medidas anteriores en la salida. Tabla 1. Resumen de estadsticas para el anlisis de regresin de la concentracin vs la biomasa

El coeficiente de determinacin ajustado

El coeficiente de determinacin ajustado

,es una correccin o como el

a4uste del coeficiente de determinacin por el tama5o de muestra

n#mero de par metros del modelo . siempre es menor que y, lo que es m s importante, no se pude ;;for-arse<< a ) con slo agregar m s y m s varia$les independientes al modelo El coeficiente de determinacin a4ustado es o$tenido mediante la expresin

"e de$e tener en cuenta que tanto como son estadsticas de muestra, y que no de$emos depender #nicamente de sus valores para decidir si un modelo es #til o no para predecir . *tilice la prue$a para hacer inferencia es so$re la idoneidad glo$al del modelo de regresin En el e4emplo el valor (.99=9>.

El modelo de regresin y la ecuacin de regresin En el e4emplo, cada restaurante est asociado con un valor de x 7po$lacin estudiantil en miles de estudiantes8 y un valor correspondiente de y 7ventas trimestrales en miles de ?8. La ecuacin que descri$e cmo se relaciona y con x y con un t+rmino de error se llama modelo de regresin. @ste usado en la regresin lineal simple es el siguiente/ Aodelo de regresin lineal simple/ y B C( D C) x D E C( y C) son los par metros del modelo. E es una varia$le aleatoria, llamada error, que explica la varia$ilidad en y que no se puede explicar con la relacin lineal entre x y y. Los errores, E, se consideran varia$les aleatorias independientes distri$uidas normalmente con media cero y desviacin est ndar F. Esto implica que el valor medio o valor esperado de y, denotado por E7&Gx8, es igual a C( D C) x. Ecuacin de regresin lineal simple/ E7yGx8 B C( D C) x 7 H&GxBE7&Gx8 8 La ecuacin estimada de regresin 7lineal simple8 Los par metros, C( y C), del modelo se estiman por los estadsticos muestrales $( y $), los cuales se calculan usando el m+todo de mnimos cuadrados. Ecuacin Estimada de regresin lineal simple/ I B $( D $) x En la regresin lineal simple, la gr fica de la ecuacin de regresin se llama lnea de regresin estimada. I es el valor estimado de y para un valor especfico de x.