Está en la página 1de 16

ALGORITMOS DE REGRESIN

MARTA IBEZ CHAVERRA FREDIS ANDRES ESCOBAR

QUE ES REGRESIN?
Es la tendencia de una medicin extrema a presentarse mas cercana a la media en una medicin. Se utiliza para predecir una medida basndonos en el conocimiento de otra. En informtica la regresin es usada para pruebas de software que intentan descubrir las causas de nuevos errores, basndose en otros atributos del conjunto de datos. La primera forma de regresiones lineales documentada fue el mtodo de los mnimos cuadrados, el cual fue publicado por Legendre en 1805, El trmino regresin se utiliz por primera vez en el estudio de variables antropomtricas: al comparar la estatura de padres e hijos, result que los hijos cuyos padres tenan una estatura muy superior al valor medio tendan a igualarse a ste, mientras que aquellos cuyos padres eran muy bajos tendan a reducir su diferencia respecto a la estatura media; es decir, "regresaban" al promedio.2 La constatacin emprica de esta propiedad se vio reforzada ms tarde con la justificacin terica de ese fenmeno. El trmino lineal se emplea para distinguirlo del resto de tcnicas de regresin

REGRESIN LINEAL

Mtodo matemtico que modela la relacin entre una variable dependiente Y, las variables dependientes Xi y un termino aleatorio . El anlisis de regresin se utiliza para predecir un amplio rango de fenmenos, desde medidas econmicas hasta diferentes aspectos del comportamiento humano.

ALGORITMO DE REGRESIN LINEAL


Permite calcular una relacin lineal entre una variable independiente y otra dependiente, de esta forma puede utilizar la relacin para la prediccin. La relacin toma forma de una ecuacin para la lnea que mejor represente una serie de datos.

EL SIGUIENTE DIAGRAMA MUESTRA UNA REPRESENTACIN LINEAL DE LOS DATOS: Cada punto en el diagrama representa un error asociado con la distancia respecto a la lnea de regresin. En la ecuacin de regresin los coeficientes a y b ajustan el ngulo y ubicacin de la lnea de regresin. De los tipos de regresin la regresin lineal es un mtodo til y conocido para modelar una respuesta a un cambio de algn factor subyacente.

CARACTERSTICAS

Admite la obtencin de detalles No admite la creacin de dimensiones de minera de datos Admite el uso de modelos de minera de datos OLAP

No admite el uso del lenguaje de marcado de modelos de prediccin (PMML) para crear modelos de minera de datos

COMO FUNCIONA EL ALGORITMO?

Al usar un algoritmo de regresin lineal se invoca un caso especial del algoritmo de arboles de decisin, este tiene parmetros que restringen el comportamiento del algoritmo y requieren ciertos tipos de datos de entrada. A diferencia de un modelo de arboles de decisin estndar en donde los datos se dividen en arboles o subconjuntos mas pequeos, el modelo de regresin lineal se utiliza el conjunto de datos completos para calcular las relaciones en el paso inicial.

DATOS REQUERIDOS
Antes de preparar los datos que se van a utilizar en un modelo de regresin lineal es necesario entender los requisitos de este. Se debe saber cuales y cuantos son los datos que se necesitan y como se utilizan. Los requisitos para este modelo son los siguientes: Columna key: todo modelo debe tener una columna numrica o de texto que identifique cada registro de manera nica. No se permiten las claves compuestas. Columna de prediccin: es necesaria por lo menos una columna de prediccin. Se pueden incluir varios archivos de prediccin en un modelo, pero estos deben ser tipos de datos numricos continuos. No se pueden usar tipos de datos de fecha y como archivos de prediccin aunque el almacenamiento nativo para estos datos sea numrico. Columnas de entrada: debe tener datos numricos continuos y se les debe asignar un tipo de datos adecuado.

EJEMPLO
La regresin lineal se puede usar para determinar una relacin entre 2 columnas continuas. Por ejemplo, calcular una lnea de tendencias en los datos de fabricacin o ventas.
Tambin se podra utilizar la regresin lineal como precursor para el desarrollo de modelos de minera de datos mas complejo, con el fin de evaluar las relaciones entre las columnas de datos. Aunque hay muchas maneras de calcular la regresin lineal sin necesidad de usar la minera de datos, la ventaja de usar este algoritmo es que se calculan y se prueban automticamente todas las posibles relaciones entre las variables.

A continuacin se muestra un algoritmo que utiliza la regresin lineal para proyectar un valor futuro.

<?php $xarray=array(1, 2, 3, 4, 5 ); //Das $yarray=array(5, 5, 5, 6.8, 9); //Porcentaje de ejecucin $pm=100; //Valor futuro $x2=0; $y=0; $x=0; $xy=0; $cantidad=count($xarray); for($i=0;$i<$cantidad;$i++){ //Tabla de datos print ($xarray[$i]." ---- ".$yarray[$i]."<br>"); //Calculo de trminos $x2 += $xarray[$i]*$xarray[$i]; $y += $yarray[$i]; $x += $xarray[$i]; $xy += $xarray[$i]*$yarray[$i]; } //Coeficiente parcial de regresin $b=($cantidad*$xy-$x*$y)/($cantidad*$x2-$x*$x); //Calculo del intercepto $a=($y-$b*$x)/$cantidad; //Recta tendencial //y=a+bx //Proyeccin en das para un 100% de la ejecucin: if ($b!=0) $dias_proyectados=($pm-$a)/$b; else $dias_proyectados=999999; //Infinitos $dp=round($dias_proyectados,0); if($dp<=$pm) print $dp."---> Culmina antes de los $pm dias <br>"; if($dp >$pm) print $dp ."---> ALARMA: No culmina antes de los $pm dias <br>";
?>

REGRESIN LOGSTICA

Es un tipo de anlisis de regresin utilizado para predecir el resultado de una variable categrica (puede adoptar un numero limitado de categoras) en funcin de las variables dependientes o predictoras. En esta regresin la variable dependiente es dicotmica (si[1] no[0]) . Es usada mayormente en las ciencias medicas y sociales.

ALGORITMO DE REGRESIN LOGSTICA


La regresin logstica es una tcnica estadstica conocida que se usa para modelar los resultados binarios. El algoritmo de regresin logstica se implementa usando una variacin del algoritmo de red neuronal. Este algoritmo comparte algunas de las cualidades neuronales pero es mas fcil de entrenar. Una de las ventajas de la regresin logstica es que el algoritmo es muy flexible y admite varias tareas analtica diferentes: Usar datos demogrficos para realizar predicciones sobre los resultados, como el riesgo de contraer una determinada enfermedad. Explorar y ponderar los factores que contribuyen a un resultado. Por ejemplo, buscar los factores que influyen en los clientes para volver a visitar un establecimiento. Clasificar los documentos, el correo electrnico u otros objetos que tengan muchos atributos.

CARACTERSTICAS

No admite la obtencin de detalles. No admite la creacin de dimensiones de minera de datos. Admite el uso de modelos de minera de datos OLAP.

No admite el uso del lenguaje de marcado de modelos de prediccin (PMML) para crear modelos de minera de datos.

COMO FUNCIONA EL ALGORITMO

Este algoritmo usa una red neuronal modificada para modelar las relaciones entre las entradas y los resultados. Primero se mide el efecto de cada entrada en el resultado y se examina las diversas entradas en el modelo acabado.

DATOS REQUERIDOS
Es necesario conocer los recursos imprescindibles para este algoritmo, incluida la cantidad de los datos necesarios y la forma en que estos se utilizan. Columna de una sola clave: cada modelo debe contener una columna numrica o de texto que identifique cada registro de manera nica. No se permiten las claves compuestas. Columnas de entrada: cada modelo debe tener al menos una columna de entrada que contenga los valores que se utilizan como factores en el anlisis. Puede tener tantas columnas de entrada como desee, pero un gran numero de columnas podra aumentar el tiempo necesario para entrenar el modelo.

Columna de prediccin: el modelo debe contener al menos una columna de prediccin de cualquier tipo de datos. Los valores de la columna de prediccin tambin se pueden tratar como entradas del modelo, o se puede especificar que solo se utilicen para las predicciones. No se admiten tablas anidadas en las columnas de prediccin, pero se pueden usar como entradas.

También podría gustarte