Está en la página 1de 8

Regresin lineal simple y correlacin El anlisis de regresin se utiliza principalmente con el propsito de hacer predicciones.

El anlisis de correlacin se utiliza para medir la intensidad de la asociacin entre las variables numricas. Diagrama de dispersin: cada valor es graficado en sus coordenadas particulares X, Y. Tipos de modelos de regresin. El modelo de lnea recta puede representarse como: El primer termino (B0), es la interseccin Y para la poblacin; B1 es lapendiente de la poblacin y E es el error aleatorio en Y para la observacini. En este modelo, la pendiente de la recta B1 representa el cambio esperado enY por unidad de cambio en X; esto es, representa la cantidad que cambia lavariable Y con respecto a una unidad de cambio particular en X. B0 representa elvalor promedio de Y cuando X es igual a cero. El modelo matemtico estinfluenciado por la distribucin de los valores X y Y en el diagrama dedispersin. Determinacin de la ecuacin de regresin lineal simple. El mtodo de mnimoscuadrados. A b0 y b1 se los puede considerar como estimaciones de B0 y B1. Porconsiguiente, la ecuacin de regresin de muestra sera: Yi es el valor predicho de Y para la observacin i, y Xi es el valor de X para laobservacin i. Unatcnica matemtica utilizada para determinar los valores de bo y b1 que mejorse ajusten a los datos observados se conoce como mtodo de mnimos cuadrados.Al utilizar este mtodo surgen dos ecuaciones normales: I. II.

El error estndar de estimacin. Elerror estndar de la estimacin, representado como Syx se define como: SST = SSR + SSE En la que SST = Podemos ahora definir el coeficiente de determinacin r2: mide la porcinde variacin que es explicada por la variable independiente del modelo deregresin: Algunosinvestigadores sugieren que se calcule un coeficiente r2 ajustado para reflejartanto el nmero de variables explicatorias del modelo como el tamao de lamuestra. El coeficiente r2 ajustado se calcula de la siguiente manera:r, cuyos valores van de 1 a +1. El coeficiente de correlacin en casos deregresin lineal simple toma el signo de b1.

Suposiciones de regresin y correlacin. Las cuatro principalessuposiciones acerca de la regresin son: 1.Normalidad. 2. Homoscedasticidad. 3.Independencia de error. 4. Linealidad. La primera suposicin, normalidad, requiere que los valores de Y estndistribuidos normalmente en cada valor de X. Siempre y cuando la distribucinde los valores de Yi alrededor de cada nivel de X no sea extremadamentediferente de una distribucin normal, las inferencias acerca de la lnea deregresin y de los coeficientes de regresin no se vern seriamenteafectadas. La segunda suposicin, homoscedasticidad, requiere que la variacinalrededor de la lnea de regresin sea constante para todos los valores de X.La tercera suposicin, independencia de error, requiere que el error seaindependiente de cada valor de X. Por ltimo, la linealidad establece que larelacin entre las variables es lineal. Estimacin del intervalo de confianza para predecir myx. Intervalo de prediccin para una respuesta individual Yi Inferencias respecto a los parmetros de poblacin en regresin ycorrelacin Ho= 1=0 (No hay relacin) H1= 1 0 (Hay relacin) Y la estadstida de prueba para probar la hiptesis est dada por: La estadstica de prueba sigue una distribucin t con n-2 grados delibertad. Un segundo mtodo equivalente para probar la existencia de una relacinlineal entre las variables consiste en establecer una estimacin de intervalode confianza de 1 y determinar si el valor supuesto est incluido en elintervalo. La estimacin del intervalo de confianza se obtendra de lasiguiente manera: Un tercer mtodo para examinar la existencia de una relacin lineal entredos variables implica al coeficiente de correlacin de la muestra, r. Para ellose realiza lo siguiente: Ho: = 0 ( No hay relacin) H1: 0 (Hay relacin) La estadstica de prueba para determinar la existencia de una correlacinesta dada por: La estadstica de prueba sigue una distribucin t con n-2 grados delibertad. Dificultades de la regresin y cuestiones ticas Las dificultades que surgen con frecuencia son: 15. cuadrados. Falta de conciencia sobre las suposiciones de la regresin de mnimos

16. mnimos cuadrados.

Conocimiento de cmo evaluar las suposiciones de la regresin de

17. Conocimientos de cules son las alternativas de la regresin de mnimos cuadrados si no se cumple alguna suposicin individual. 18. 19. La creencia de que la correlacin implica causalidad. El uso del modelo de regresin sin conocer de qu se trata.

16. Aplicaciones estadsticas en administracin de lacalidad y productividad Calidad y productividad: Una perspectiva histrica. Al tema de calidad yproductividad lo podemos dividir en cuatro fases histricas: 1. Podemos pensaren una administracin de primera generacin como administracin mediante laaccin, el tipo administracin practicada por las sociedadescazadoras-recolectoras primitivas en que los individuos producan algo para smismos o para su unidad tribal, siempre que el producto fuera necesario. 2.Luego encontramos la administracin por direccin. Es la poca delsurgimiento de los gremios en Europa (Edad Media). Los gremios administraban elentrenamiento de aprendices y trabajadores y determinaban las normas de calidady fabricacin de los productos hechos por el gremio. 3. La administracin porcontrol, surge aproximadamente con Henry Ford, en el cual los trabajadoresestaban divididos entre aquellos que en realidad hacan el trabajo y aquellosque planeaban y supervisaban el trabajo. Esto le quit responsabilidad altrabajador individual con respecto al tema calidad y dej el tema en manos deinspectores. El estilo de administracin por control contena una estructurajerrquica que pona nfasis en la responsabilidad individual por la obtencinde un conjunto de objetivos predeterminados. 4. Por ltimo encontramos laadministracin por proceso. Llamada a menudo TQM o Administracin de CalidadTotal. Una de las caractersticas principales de este planteamiento consiste encentrar la atencin en una continua mejora de los procesos. Se le daimportancia al trabajo en equipo, atencin al cliente y rpida reaccin a loscambios. Tiene fuerte fundamentacin estadstica. La teora de los diagramas de control. El diagrama de control es un mediopara revisar la variacin de la caracterstica de un producto o serviciomediante 1. la consideracin de la dimensin temporal en la cual el sistemafabrica productos y 2. el estudio de la naturaleza de la variabilidad delsistema. El diagrama de control puede utilizarse para estudiar desempeospasados o evaluar las condiciones presentes o ambas cosas. Los diagramas decontrol pueden utilizarse para diferentes tipos de variables: para las variablescategricas y para las variables discretas. La atencin principal del diagramade control se enfoca en el intento de separar las causas especiales o asignablesde la variacin de las causas comunes o debidas al azar. o Las causas especiales o asignables representan grandes fluctuaciones en los datos que no son inherentes a un proceso. Tales fluctuaciones son ocasionadas por cambios en un sistema. o Las causas comunes o debidas al azar representan la variabilidad inherente que se presenta en un sistema.

Las causas especiales se consideran aquellas que no forman parte de unproceso y son susceptibles de corregir; mientras que las causas comunes puedenreducirse solo cambiando el sistema. Existen dos tipos de errores que losdiagramas de control ayudan a prevenir. El primer tipo de error implica lacreencia de que un valor observado representa una causa especial de la variacincuando de hecho se debe a una causa comn de variacin del sistema. El segundoerror implica tratar a una causa especial como si fuera una causa comn y notomar medidas correctivas cuando son necesarias. La forma ms tpica de un diagrama de control establece lmites de controlque se encuentran dentro de +/-3 desviaciones estndar de la medida de estadsticade inters. En general puede establecerse como: Algunas herramientas para estudiar un proceso: diagrama de esqueleto depescado (Ishikawa) y de flujo de procesos. Un proceso es una secuencia de pasosque describen una actividad desde el inicio hasta su terminacin. o El diagrama de esqueleto de pescado (o Ishikawa): El nombre viene de la manera en que las diferentes causas estn ordenadas en el diagrama. El problema se muestra en la parte derecha y las principales causas se colocan en la parte izquierda. Estas causas a menudo se subdividen. o Diagrama de flujo de proceso. Este diagrama nos permite ver un flujo de pasos de un proceso, desde su inicio hasta su terminacin. Los catorce puntos de Deming: una teora de la administracin por proceso.Deming desarrollo su enfoque basndose en los siguientes catorce puntos: 24. 25. 26. Crear una constancia en el propsito de mejorar el producto y el servicio. Adoptar la nueva filosofa. Dejar de ser dependientes de la inspeccin para lograr la calidad.

27. Terminar con la prctica de otorgar contratos sobre la nica base del precio. En vez de ello minimizar el costo total trabajando con un solo proveedor. 28. produccin y servicio. 29. 30. 31. 32. 33. Mejorar constantemente y para siempre cada proceso de planeacin,

Instituir el entrenamiento en el trabajo. Adoptar e instituir el liderazgo. Eliminar el miedo. Derribar las barreras entre reas de personal. Eliminar lemas, exhortaciones y metas destinados a la fuerza laboral.

34. para la administracin.

Eliminar cuotas numricas para la fuerza laboral y objetivos numricos

35. Retirar barreras que le restan orgullo a la gente respecto a su trabajo. Eliminar el sistema de evaluacin anual o de mrito. 36. 37. transformacin. Instituir un vigoroso programa de educacin y autodesarrollo para todos. Poner a todo el que trabaje en la compaa a trabajar en el logro de la

Diagramas de control para la proporcin y el nmero de elementos que no seajustan:. Los diagramas p y np. o Diagrama p: basado en la porcin de elementos que no cumplen con los requisitos. Para establecer los lmites de control:

Cualquier valor negativo del lmite de control inferior significar que ellmite de control inferior no existe. o Diagrama np: basado en el nmero de elementos que no cumplen con los requisitos. Los lmites de control los establecemos de la siguiente manera: El diagrama R: Un diagrama de control para la dispersin. Los lmites deeste diagrama de control los obtenemos de la siguiente manera: Diagrama X. El diagrama de control para X utiliza subgrupos de tamao n quese obtienen sobre k secuencias consecutivas o periodos. Los lmites de controlse obtienen de la siguiente manera: Resumen Pronstico de series de tiempo. Tipos de mtodos de prediccin: Existen dos planteamientos para la prediccin:cualitativa y cuantitativa. Los mtodos de prediccin cualitativa sonespecialmente importantes cuando no se dispone de datos histricos. Seconsideran altamente subjetivos. Los mtodos de prediccin cuantitativa hacenuso de los datos histricos. Introduccin al anlisis de series de tiempo. Una serie de tiempo es un conjunto de datos numricos que se obtienen en perodosregulares a travs del tiempo. El principal objetivo de una serie de tiempoconsiste en identificar y aislar tales factores de influencia con propsitos dehacer predicciones, as como para efectuar una planeacin y un controladministrativo. Factores componentes del modelo multiplicativo de series temporales. Tendencia: impresin a largo plazo.

Componente cclico: representa la oscilacin o los movimientos a la baja y ala alta que se dan a lo largo de la serie. Los movimientos cclicos varan enlongitud, por lo general de dos a 10 aos. Componente irregular aleatorio: cualquier componente que no sigue la curva detendencia modificada por el componente cclico. Cuando los datos se registran mensual o trimestralmente adems de la tendenciacclica y los componentes irregulares debemos tomar en cuenta el factorestacional. El modelo multiplicativo clsico de las series temporales. Cuando los datos se obtienen anualmente una observacin Yi puede expresarsecomo: Yi=Ti*Ci*Ii; en la que Ti es el valor del componente tendencia, Ci= valor delcomponente cclico; Ii es el valor del componente irregular. Por otra parte cuando los datos se obtienen de manera trimestral o mensual unaobservacin Yi puede estar dada por: Yi=Ti*Si*Ci*Ii, en la que Si es el valor del componente estacional. El primer paso de una serie de tiempo consiste en graficar los datos yobservar su tendencia a travs del tiempo. Primero debemos determinar si parecehaber un movimiento a largo plazo hacia arriba o hacia abajo en la serie. ( esdecir una tendencia), o si la serie parece oscilar alrededor de una lneahorizontal a travs del tiempo. Si este ltimo parece ser el caso entoncesdebe emplearse el mtodo de promedios mviles o el suavizado exponencial, parasuavizar la serie y proporcionarnos una impresin global a largo plazo. Suavizado de las series temporales anuales:. promedios mviles y suavizadoexponencial. Promedios mviles. Este mtodo es altamente subjetivo y dependiente de lalongitud del perodo elegido para la construccin de los promedios. Paraeliminar las fluctuaciones cclicas, el perodo escogido debe ser un valorentero que corresponda a la duracin promedio estimada de un ciclo. Los promedios mviles para un perodo elegido de longitud L consisten en unaserie de medias aritmticas calculadas en el tiempo de tal modo que cada mediase calcula para una secuencia de valores observados que tienen esa longitudparticular, L. El promedio mvil puede calcularse de la siguiente manera: Cuanto ms largo sea el perodo, menor ser el nmero de valores promedio mvilque se pueden calcular y graficar. Por consiguiente, la seleccin de promediosmviles con perodos de longitud mayores a siete aos es, por lo general, nodeseable puesto que habr demasiados puntos de datos que faltan al inicio y alfinal de la serie, haciendo que sea ms difcil de obtener una impresinglobal de la serie completa. Suavizado Exponencial. El suavizado exponencial puede utilizarse para obtener predicciones a cortoplazo. Su nombre deriva del hecho de que nos proporciona un promedio mvilpesado o ponderado exponencialmente a travs de la serie de tiempo, esto es, alo largo de la serie cada clculo de suavizado o prediccin depende de todoslos valores observados anteriormente. Esta es una ventaja con respecto al otro mtodo.Con este mtodo los pesos asignados a los valores observados disminuyen con eltiempo, de modo que cuando se hace el clculo, el valor observado ms recienterecibe el mayor peso. Para suavizar una serie de tiempo en cualquier periodo i tenemos la siguienteexpresin:.

Ei= valor de la serie suavizada exponencialmente que se calcula en el perodoi. Ei-1= valor de la serie suavizada exponencialmente calculado en el perodo i-1 Yi= valor observado de la serie en el perodo i W= peso o coeficiente de suavizado que se asigna de manera subjetiva. W==2/(L+1) El modelo lineal: El modelo cuadrtico: El modelo exponencial: Eleccin de un modelo de prediccin apropiado Trabajo enviado por: Hernan Torino htorino@sinectis.com.ar Si deseamos suavizar una serie mediante la eliminacin de las variaciones cclicase irregular no deseadas, debemos seleccionar un pequeo valor de W. Si, nuestroobjetivo es hacer predicciones debisemos seleccionar el valor ms grande de W(cercano a uno).

Anlisis de series de datos anuales: ajuste de tendencia de mnimoscuadrados y pronstico. Correlacin: medicin de la intensidad de la asociacin En el anlisis de correlacin estamos interesados en medir el grado deasociacin entre dos variables. La intensidad de la relacin se mide mediante el coeficiente de correlacin Mediciones de variacin en regresin y correlacin. Con el fin de examinarque tan bien una variable independiente predice a la variable dependiente,necesitamos desarrollar algunas medidas de variacin. La primera: la suma totalde cuadrados, esta puede dividirse en dos partes: la variacin explicada o sumade cuadrados debida a la regresin (SSR) y la variacin no explicada o suma decuadrados de error (SSE). La suma de cuadrados debida a la regresin. La SSRrepresenta la diferencia entre el valor promedio de Y y el valor promedio de Yque sera predicho a partir de la relacin de regresin).La SSE representaaquella parte de la variacin de Y que noo es explicada por la regresin. SST = SSR + SSE II. El anlisis de regresin lineal simple tiene que ver con la bsqueda de lalnea recta que mejor se ajusta a los datos. El mejor ajuste significa quedeseamos encontrar la lnea recta para la cual las diferencias entre losvalores reales (Yi) y los valores que seran predichos a partir de la lneaajustada de regresin (Yi estimada) sean lo ms pequeas posibles. Debido aque tales

diferencias sern positivas y negativas para las diferentesobservaciones, minimizamos matemticamente la expresin: En donde X es la media de la muestra correspondiente a cada una de las dosmuestras, n es el tamao de la muestra y por ltimo tenemos la varianza de lamuestra. Si suponemos que las varianzas son iguales y que las muestras fueron tomadasde manera aleatoria e independiente se puede utilizar una prueba t de varianzaconjunta para determinar si existe alguna diferencia significativa entre lasmedias de las poblaciones. Si puede calcular la siguiente estadstica de pruebat de varianza conjunta: