Está en la página 1de 71

Introduccin El anlisis de regresin lineal simple se caracteriza porque estudia la relacin rectilnea (lineal) entre dos variables (simple).

Precisamente, el anlisis comienza por determinar visualmente si puede considerarse que hay una relacin rectilnea entre las dos variables mediante graficar los pares de valores en lo que se conoce como diagrama de dispersin o nube de puntos. Si se determina la existencia de la relacin lineal, entonces se procede a encontrar la ecuacin que describir a la recta de mejor ajuste a la nube de puntos. La forma ms sencilla y conveniente para encontrar los parmetros de regresin es a travs de suma de cuadrados, ya que adems de permitir construir la ecuacin, son datos (las sumas de cuadrados) que se utilizan para calcular otras cantidades tiles en el proceso de anlisis como los errores estndar para las inferencias estadsticas; y para el clculo del coeficiente de correlacin. La correlacin, es el anlisis mediante el cual se evala la intensidad y la direccin de la relacin entre dos variables. El presente informe contiene en su parte inicial contenido terico de la estadstica y su aplicacin metodolgica, con el objeto de establecer introductoriamente la finalidad de la aplicacin de cualquier mtodo estadstico. El captulo segundo trata sobre los mtodos de regresin y correlacin para el anlisis conjunto de dos variables, como se indica en el prrafo primero. Como es sabido estos dos mtodos tambin son aplicables al anlisis conjunto de ms de dos variables, conocido como el anlisis de regresin y correlacin lineal mltiple. Debido a que este no es el objeto de estudio de este informe no se presenta este mtodo dentro del contenido de este.
1

El captulo tres contiene un prontuario de las principales frmulas aplicables estos mtodos. Ac se encontraran las frmulas ms simplificadas y directas de los diferentes mtodos que existen para la resolucin simultanea de ecuaciones que de los buscan los parmetros de las ecuaciones de regresin y consecuentemente las de correlacin. Por ltimo se exponen una serie de casos prcticos para el entendimiento de la teora planteada en los captulos anteriores.

ndice General ndice de Contenido


Introduccin ....................................................................................................................... 1 CAPTULO I ....................................................................................................................... 7 1. INTRODUCCION A LA ESTADSTICA .......................................................................... 7 1.1. Estadstica............................................................................................................... 7 1.2. Historia de la Estadstica ......................................................................................... 7 1.3. Clasificacin de la Estadstica ................................................................................. 8 1.3.1 La Estadstica Descriptiva .................................................................................. 8 1.3.2. La Estadstica Inferencial .................................................................................. 9 1.4. Mtodo Estadstico .................................................................................................. 9 1.4.1. Recopilacin de datos ..................................................................................... 10 1.4.2. Organizacin de datos estadsticos................................................................. 10 1.4.3. Presentacin de datos estadsticos ................................................................. 11 1.4.4. Anlisis de los datos estadsticos .................................................................... 11 1.4.5. Interpretacin o conclusiones.......................................................................... 11 1.5. Recopilacin de Datos Estadsticos....................................................................... 12 1.5.1. Poblacin ........................................................................................................ 12 1.5.2. Muestra ........................................................................................................... 13 1.5.3. Estadstico muestral o estadstico ................................................................... 14

1.5.4. Parmetro ....................................................................................................... 14 1.6. Datos Estadsticos: Variables y su clasificacin..................................................... 14 1.6.1. Variables de datos cuantitativos ...................................................................... 14 1.6.2. Variables de Datos cualitativos o atributos ...................................................... 15 1.6.3. Variables discretas o continuas ....................................................................... 16 1.7. Presentacin de datos: Tablas y Grficas ............................................................. 17 1.7.1. Tablas ............................................................................................................. 18 1.7.2. Grficas .......................................................................................................... 22 CAPTULO II .................................................................................................................... 26 2. Regresin y correlacin ............................................................................................... 26 2.1. Regresin Lineal Simple ........................................................................................ 26 2.1.1. Mapa de esparcimiento o nube de puntos....................................................... 27 2.1.2. Ecuacin de la Lnea Recta ............................................................................ 28 2.1.3. Propiedades de los mnimos cuadrados ......................................................... 30 2.1.4 Error estndar de estimacin ........................................................................... 30 2.2 Correlacin Lineal Simple ....................................................................................... 32 2.2.1 Caractersticas del coeficiente de correlacin .................................................. 33 CAPTULO III ................................................................................................................... 36 3. Frmulas y simbologa ................................................................................................. 36 3.1. Simbologa ............................................................................................................ 36 3.2. Frmulas ............................................................................................................... 36 3.2.1. Frmulas de Regresin ................................................................................... 36 4

3.2.2. Frmulas de Regresin ................................................................................... 38 CAPTULO IV .................................................................................................................. 41 4. EJERCICIOS PRACTICOS.......................................................................................... 41 4.1 Ejercicio No.1 ......................................................................................................... 41 4.1.1. Planteamiento ................................................................................................. 41 4.1.2. Resolucin ...................................................................................................... 42 4.2. Ejercicio No.2 ........................................................................................................ 50 4.2.1 Planteamiento .................................................................................................. 50 4.2.2. Resolucin ...................................................................................................... 51 4.3 Ejercicio No. 3 ........................................................................................................ 55 4.3.1. Planteamiento ................................................................................................. 56 4.3.2. Resolucin ...................................................................................................... 56 4.4 Ejercicio No.4 ..................................................................................................... 60

4.4.1. Planteamiento ................................................................................................. 60 4.4.2. Resolucin ...................................................................................................... 61 4.5. Ejercicio No. 5 .................................................................................................... 64

4.5.1. Planteamiento ................................................................................................. 64 Conclusiones ................................................................................................................... 68 Recomendaciones ........................................................................................................... 69 Referencias Bibliogrficas ............................................................................................... 70

ndice de Grficos
Grfico 1 .......................................................................................................................... 23 Grfico 2 .......................................................................................................................... 24 Grfico 3 .......................................................................................................................... 25 Grfico 4 .......................................................................................................................... 28 Grfico 5 .......................................................................................................................... 32 Grfico 6 .......................................................................................................................... 34 Grfico 7 .......................................................................................................................... 34 Grfico 8 .......................................................................................................................... 35

ndice de Tablas Tabla 1 .................................................................................................................. 19 Tabla 2 .................................................................................................................. 20 Tabla 3 .................................................................................................................. 22 Tabla 4 .................................................................................................................. 27

CAPTULO I 1. INTRODUCCION A LA ESTADSTICA

1.1. Estadstica La estadstica puede definirse como un conjunto de principios y mtodos que se orienta a la recoleccin, organizacin, anlisis, interpretacin y presentacin de datos numricos. Los principios y mtodos estadsticos son los diseados para el anlisis de cuantiosos datos numricos, por lo que estos proporcionan procedimientos matemticos de utilidad para analizar los datos, estudiar sus relaciones, deducir sobre estos, establecer el grado de relacin de una variable con otra, realizar pronsticos, establecer el crecimiento de una variable y su grado de homogeneidad, etc. 1.2. Historia de la Estadstica Se puede afirmar que la historia de la estadstica comienza alrededor de 1749 aunque, con el tiempo, han habido cambios en la interpretacin de la palabra estadstica. En un principio, el significado estaba restringido a la informacin acerca de los estados. Este fue extendido posteriormente para incluir toda coleccin de informacin de cualquier tipo, y ms tarde fue extendido para incluir el anlisis e interpretacin de los datos. En trminos modernos, "estadstica" significa tanto conjuntos de informacin recopilada, por ejemplo registros de temperatura, contabilidad nacional, como trabajo analtico que requiera inferencia estadstica. (3:2014)
7

Las actividades estadsticas a menudo se asocian con modelos expresados mediante el uso de probabilidades, y requieren de la teora de probabilidades para tener una firme base terica: Ver Historia de las Probabilidades. Un gran nmero de conceptos de la estadstica han tenido un importante impacto en un amplio rango de ciencias. Estos incluyen el diseo de experimentos y enfoques a la inferencia estadstica como la Inferencia Bayesiana, para cada uno de los cuales se puede considerar que tiene su propia secuencia en el desarrollo de las ideas que subyacen en la estadstica moderna. 1.3. Clasificacin de la Estadstica Tanto para su estudio como para su aplicacin, esta se divide en dos grandes reas: 1.3.1 La Estadstica Descriptiva Esta se ocupa del anlisis de los datos con el propsito de recopilarlos, organizarlos, resumirlos con las tcnicas antes mencionadas pero sin incluir el uso de muestras para hacer inferencias. Esta aplica las tcnicas de recopilacin de datos (que pueden corresponder a muestras pero sin intencin de utilizarlas para hacer suposiciones acerca de la poblacin de donde se obtienen). Se utilizan tambin para la elaboracin de tablas y graficas; el clculo de medidas simples (nmeros nicos) para resumir conjuntos grandes de datos (media aritmtica, proporcin, varianza y otras); el anlisis de regresin y correlacin (sin embargo en el caso particular de este, tambin se pueden hacer estudios mediante muestras con el propsito de hacer inferencias y que, por ello, corresponderan a la estadstica inferencial); el de series de tiempo y el de nmeros ndices . (3:375)
8

En resumen este tipo de estadstica proporciona los procedimientos para transformar los datos obtenidos en forma ms til; comprende la tabulacin, presentacin y anlisis; se puede realizar la descripcin de una serie de datos, como las ventas, utilidades, impuestos, etc. Cuando hay una gran cantidad de datos la estadstica descriptiva permite resumirlos para que se puedan manejar con ms facilidad; 1.3.2. La Estadstica Inferencial Es la parte de la estadstica que ayuda a conocer algn aspecto de la poblacin por medio del conocimiento de una parte de esa poblacin llamada muestra, con el objeto de obtener conclusiones (inferencias) acerca de la poblacin donde se obtienen los datos. Para aplicar la estadstica inferencial se utilizan los mtodos estadsticos de muestreo, por medio de los cuales se establece el tamao de la muestra, se seleccionan los elementos y se realizan estimaciones al total de la poblacin, valindose de una parte de esa poblacin. 1.4. Mtodo Estadstico Una vez identificada la muestra o la poblacin con la que se trabajara deben recopilarse los datos que se usaran en el anlisis. Esta recopilacin de datos consiste, desde el punto de vista estadstico, en tomar una medicin de cada uno de los elementos y despus proceder al anlisis con este conjunto de mediciones. La funcin bsica de la estadstica es servir de medio de informacin para la toma de decisiones, y la aplicacin de las tcnicas de estadstica para el anlisis de datos puede resumirse en un mtodo que consta de los siguientes pasos:

1.4.1. Recopilacin de datos Es importante tener presente la fuente de los datos que se van a utilizar. Es posible tener datos de Fuentes Internas, como datos contables, registros de ventas, de personal, etc. Tambin datos de Fuentes Externas, de esta cuenta se pueden clasificar en por sus rasgos en dos grupos: Datos de Fuentes Primarias, en este caso son los datos obtenidos directamente por las fuentes que los generan y como ejemplo pueden recopilarse mediante los siguientes instrumentos: encuesta, entrevista por telfono, entrevista personal, correo, envi de cuestionario. Los Datos de Fuentes Secundarias, son los que se recogen de fuentes que no son los que originan la informacin, pero pueden ser los recolectores de esta. Un ejemplo de esta clase de datos son los que aparecen en compendios de datos econmicos y financieros que renen en un solo volumen informacin publicada de registros existentes como los censos. Estos pueden obtenerse de diferentes organizaciones gubernamentales y privadas. 1.4.2. Organizacin de datos estadsticos Se refiere, entre otros aspectos, a la verificacin de los datos y a su correcta ordenacin de acuerdo con las necesidades del estudio en cuestin. En esta etapa debe conllevar las siguientes actividades: revisin, control de calidad, clasificacin de datos, tabulacin por medio de tablas generales.

10

1.4.3. Presentacin de datos estadsticos Se hace principalmente a travs de dos medios: tablas y graficas que se expondrn por separado en los siguientes apartados de este captulo. Estos medios de presentacin son de suma importancia para el anlisis consecuente de los datos presentados. 1.4.4. Anlisis de los datos estadsticos Se lleva a cabo utilizando las tcnicas de estadsticas como: medidas estadsticas de tendencia central, dispersin, correlacin. En esta parte es importante hacer notar que al plantear el estudio debe decidirse cual o cuales tcnicas estadsticas se utilizaran, as como determinar cul de estas tcnicas es conveniente aplicar para el correcto anlisis de los datos, ya que no todas las tcnicas son aplicables al anlisis preciso en cada caso especfico que se necesite desarrollar. 1.4.5. Interpretacin o conclusiones Cualquier estudio debe establecer conclusiones tomando en cuenta tanto la clase y la fuente de datos utilizados as como las tcnicas de anlisis empleadas en el proceso de utilizacin del mtodo estadstico. Es tambin importante cuidar la forma (y no solo el fondo) en la presentacin de las conclusiones, ya que el propsito principal de estas actividades consiste en obtener informacin til para la toma de decisiones (1: 4-5), emitir opiniones, comentarios sobre la interpretacin de los datos, realizar pronsticos, etc.

11

1.5. Recopilacin de Datos Estadsticos Es importante tener presente la diferencia entre los elementos de la poblacin, la muestra y las mediciones que se hacen a cada uno de esos elementos, que son las que constituyen, precisamente, los datos materia prima de la estadstica. 1.5.1. Poblacin Tambin llamada universo o colectivo, es el conjunto de elementos de referencia de inters para realizar un estudio determinado. Es el conjunto sobre el que estamos interesados en obtener conclusiones. Algunos ejemplos pueden ser: El conjunto de amas de casa que habitan en determinada ciudad sera una poblacin si se tratara de determinar su nivel de aceptacin para cierto producto. El conjunto de las piezas fabricadas por cierta maquina sera una poblacin si se buscara determinar el porcentaje de artculos defectuosos que produce. El total de las cuentas por cobrar de una empresa sera una poblacin si se intentara determinar el total de cuentas morosas de una empresa. De esto se puede inferir que el concepto de poblacin es relativo pues su definicin depende de lo que se pretende estudiar. Normalmente es demasiado grande para poder abarcarlo por lo que esta se puede abarcar mediante muestras a travs de mtodos especficos a la poblacin que se desea a la que se dirija el estudio.

12

Otro aspecto muy importante a tener en cuenta para realizar estudios por muestreo es definir con claridad cules son los elementos de la poblacin, de manera que no haya confusiones para determinar si algn caso especfico pertenece o no a la poblacin. 1.5.2. Muestra Esta es un subconjunto de los elementos de una poblacin. La principal caracterstica que debe tener una muestra estadstica til es: ser representativa d la poblacin de donde se extrae, porque el principal propsito de la obtencin de muestras consiste en hacer inferencias sobre la poblacin correspondiente. A continuacin se presentan las ms comunes tcnicas de seleccin de muestras. a) Probabilstica, al azar, o aleatoria: es cuando cada elemento de la poblacin tiene una oportunidad conocida de ser seleccionado en la muestra. Si la poblacin cuenta con 40 elementos la oportunidad conocida de ser incluido en la muestra de cada elemento ser 1/40 la seleccin de cada elemento es al azar, no interviene el criterio personal. Este tipo de muestra es el que se debe usar para realizar inferencia o induccin estadstica; y b) De criterio, no probabilstica o de juicio: es cuando los elementos de la poblacin son seleccionados de acuerdo al criterio personal, en este caso los datos a describir se refieren solo a la muestra; y no se debe realizar inferencia o induccin a la poblacin.

13

1.5.3. Estadstico muestral o estadstico Es una medida de una muestra, por ejemplo, el promedio del ingreso por hogar en la muestra. 1.5.4. Parmetro Es una medida de una poblacin, por ejemplo el promedio de ingreso por hogar en la poblacin. 1.6. Datos Estadsticos: Variables y su clasificacin A la medicin que interesa a un estudio especfico se le denomina Variable y a esta se le puede definir como la caracterstica que se mide al hacer determinadas observaciones. Las variables se representan en datos numricos que pueden tomar diferentes valores en su dominio, o en un intervalo, generalmente son representados por las letras X o Y. La denominacin de variable refleja los diversos valores que pueden obtenerse al hacer la medicin. Dependiendo de los diferentes tipos de variables, estos conducen a diversas mediciones, hacen necesario revisar con ms detalle los tipos de variables que aparecen en estudios estadsticos y que, a su vez llevan a una de clasificaciones y a su vez estas llevan una subdivisin como se detalla a continuacin. 1.6.1. Variables de datos cuantitativos Se refieren a cantidades, ejemplo: Nmero de vehculos, nmero de facturas, nmero de depsitos monetarios, entre otros. Estos tipos de variables admiten otra clasificacin segn su escala de medicin:

14

a) Escala de Intervalo: Esta escala admite todo tipo de operaciones aritmticas (adicin, sustraccin, divisin y multiplicacin).esta capacidad de los datos dados en escala de intervalo se debe a que, diferencias iguales en distintas partes de la escala son iguales entre s. Por ejemplo, en la escala centgrada de temperatura, la diferencia entre cero y diez grados centgrados de temperatura es la misma existente entre 80 y 90 grados. b) Escala de Razn: esta escala tiene capacidades de la escala de intervalo (+, -, x y ), y adems un cero absoluto que seala la carencia total de la caracterstica que mide (=, , y ). Este cero absoluto de las escalas de razn implica una capacidad que las escalas de intervalo no tienen, ese atributo le da el nombre, permite establecer la igualdad entre dos razones de la escala. Por ejemplo, 2/3 de centmetro son equivalentes a 10/15 de centmetro. 1.6.2. Variables de Datos cualitativos o atributos Se refieren a cualidades, las cuales pueden expresarse cuantitativamente, ejemplo: Religin, color, estado civil, etc. No es posible cuantificar el color de los ojos de una persona, pero es posible cuantificar cuantos son de determinado color. Estos tipos de variables admiten otra clasificacin segn su escala de medicin: a) Escala Nominal: en esta la medicin consiste en determinar si los casos especficos pertenecen a una cierta categora o no y, por ello, para los datos nominales solo se pueden establecer relaciones de pertenencia o, en
15

otras palabras, solo se puede establecer si un caso cae en una categora o no. Por ejemplo: la clasificacin de genero (hombre o mujer), nacionalidad, (guatemalteco, irlands, sueco, etc.) b) Escala ordinal: Adems de las relaciones de pertenencia o no pertenencia a una categora, pueden establecerse relaciones de mayor que o despus (>) y menor que o antes que (<), ya que se conoce el orden de las categoras. Esta mayor cantidad de relaciones entre los datos hace que la escala ordinal sea ms descriptiva que la escala nominal. 1.6.3. Variables discretas o continuas Esta distincin de las variables es considerablemente sencilla y se refiere a la precisin con los que la variable puede ser medida. a) Discreta: Se refiere a los datos que no permiten fraccionamiento, por su naturaleza se expresa en cantidades fcilmente distinguibles unas de otras. Su medicin se representan con nmeros enteros, ejemplo: nmero de personas, nmero de escritorios, nmero de vehculos, etc. Si un grupo de empresas suma 50 empleados, no es correcto expresarlo con fraccin 50.5 empleados. b) Continua: se refiere a datos que si pueden ser fraccionados, es decir que pueden expresarse con tal precisin que llega un momento en el que es difcil distinguir entre un nmero y el siguiente. Pueden tomar diferente valor en un intervalo, ejemplo: ventas, utilidades, impuestos, etc.

16

En general las variables discretas se refieren a cantidades: artculos, elementos, personas, etc. Y las continuas se refieren a medidas: monetarias, peso, estatura, etc. 1.7. Presentacin de datos: Tablas y Grficas Esta es la forma ms conveniente de resumir conjuntos de datos, ya que permite condensar la informacin y, al mismo tiempo facilitan la apreciacin de su contenido. Por lo general, para construir grficas es necesario resumir primero los datos en una tabla y, por ello, la relacin entre estas dos formas de presentacin de datos es estrecha. Sin embargo hay ocasiones que en la presentacin final se prefiera alguna de las dos formas: Cuando se desea transmitir una idea rpida y sencilla se utiliza una grfica, Cuando es necesario analizar los datos con mayor detenimiento o precisin, las tablas son ms tiles. Cuando la presentacin de los datos adquiere un carcter ms complejo, se puede presentar ambas tcnicas adicionando comentarios para su mejor apreciacin. Para la elaboracin de tablas y grficas hay que tomar en consideracin aspectos tales como, el propsito de esta (a quien va dirigida, cul es la informacin importante que no debe pasar desapercibida, etc.); la clase de datos que se quiere presentar; colocacin de estos para facilitar el anlisis, y otros.

17

1.7.1. Tablas Es una forma de resumen y presentacin de datos, que se utiliza para la presentacin formal de datos y contiene los siguientes elementos: ttulo o encabezado, subttulo, cuerpo, fuente de los datos, encabezados, notas.

Existe una gran variedad de estas, ya que es posible elaborarlas de diversas maneras, colocando la informacin en muchas formas distintas e incluyendo varios elementos segn sea necesario o conveniente. Sin embargo, uno de los principales criterios de clasificacin para propsitos estadsticos es el que se refiere a cuantas variables contiene la tabla. De acuerdo con este criterio se tendran tablas de una sola entrada (una sola variable), doble entrada (dos variables) y de entras mltiples (ms de dos variables). A los conjuntos de datos que se presentan en tablas se les llaman series, de manera que puede hablarse de series simples y series de datos agrupados. Estas ltimas son tablas de datos en las que se resumen estos de acuerdo con la frecuencia con la que se repiten o segn determinados intervalos de valores. En otras palabras, a estas series de datos agrupados se les puede dividir a su vez, en series de datos y frecuencias, y series de clases y frecuencias.

18

A las series que utilizan frecuencias se les conoce tambin como distribucin de frecuencias, porque las frecuencias permiten apreciar la forma en la que se distribuyen o comportan los datos (puede apreciarse, por un lado, si estn cargados hacia un extremo o el otro, si estn aglutinados cerca del centro, o si estn distribuidos de manera uniforme). 1.7.1.1. Series Simples En esta serie se enlistan los datos sin ningn tipo de agrupacin, por lo que pueden llegar a ser numerosos. Primero se deber encontrar el dato menor de la serie y luego ordenrsele en forma ascendente o descendente Ejemplo:
Tabla 1 Remuneracin por hora segn profesin u oficios zona geogrfica A

Profesiones, Oficios y Trabajos especiales Mecnico en reparacin de automviles y camiones, oficial Bulldozer y/o traxcavo, operador Maestro en escuelas primarias particulares Draga, operador Trabajo social, tcnico(a) Reportero(a) en prenda diaria impresa Reportero(a) grfico(a) en prenda diaria impresa

Salario por Hora Q 54.23 Q 55.10 Q 55.28 Q 55.67 Q 59.16 Q 107.52 Q 107.52

*Fuente encuesta nacional de empleos y salarios, INE 2013

1.7.1.2. Series de datos y frecuencias Este tipo de tablas presenta una ventaja considerable sobre las tablas simples. En las tablas de frecuencia se agrupan los datos de manera que si existen observaciones (datos con el mismo valor) no se enumeran cada una de ellas sino que se menciona una sola vez el valor repetido, y a este se le asocia el nmero de repeticiones (frecuencia de aparicin). El nombre de estas tablas se debe a que en una columna se identifican los datos, los valores que toma la variable (x), y en una
19

segunda columna se especifica la frecuencia (f), con la que aparece cada valor. Obsrvese que esa X que se usa como encabezado de los valores de la variables es la forma comn de identificar la columna que contiene los datos, mientras que la f identifica la frecuencia de aparicin de cada uno de aquellos.
Tabla 2 Salarios mnimos por hora zona geogrfica A

Salarios de la zona A X 54.23 55.3 54.228 107.52 Suma de las frecuencias

Frecuencia f 1 3 1 2 7

*Fuente encuesta nacional de empleos y salarios, INE 2013

La suma de las frecuencias es precisamente el nmero total de los datos incluidos en la serie simple. La ventaja de esta tabla es que permite presentar los datos de manera ms resumida y compacta. 1.7.1.3. Series de Clases y Frecuencias En esta serie se procede a establecer X, no solo por valores nicos, sino por intervalos o clases de valores. Cuando los datos son numerosos conviene agruparlos en clases, siendo recomendable que no tenga ms de quince clases ni menos de 3, muchas clases pierden el sentido de agrupamiento y pocas reducen su anlisis. Para elaborar este tipo de distribucin de frecuencias se realizaran los siguientes pasos: a) Primero: Ordenar los datos, de menor a mayor o viceversa, realizando un conteo de las observaciones por medio de tarjetas.
20

b) Segundo: determinar la amplitud constante de las clases, utilizando la frmula del profesor Herbert Sturgers. Esta frmula sugiere un intervalo constante, a diferencia de utilizar el criterio personal. i= Rango (1+3.322(log n)

Dnde: i= Intervalo Constante Rango=Valor mayor valor menor + 1 n= Nmero de elementos de la muestra Log= Logaritmo Decimal 1+3.322= Constante c) Tercero: definir los lmites de clases, se refiere a determinar si la primera clase debe tener como lmite inferior el menor valor observado o si conviene que sea un tanto inferior. Es recomendable que al elaborar una distribucin de frecuencias en clases se tome en cuenta lo siguiente: i. Que no tenga dos o ms clases consecutivas o contiguas con igual frecuencia; ii. Que no existan clases con frecuencia cero; iii. Que las frecuencias no sean oscilantes o muestren altibajos, ascendentes hasta alcanzar frecuencias mximas y luego descendentes; iv. Mayor aplicacin de la clase dominante; v. No menos de tres clases ni ms de quince; y vi. Los puntos medios o marcas de clase que sean nmeros enteros.

21

Al utilizar la serie de datos y frecuencias que se construy previamente en la tabla anterior puede construirse, contando cuantos de los datos caen dentro de cada intervalo, esta nueva tabla ser el ejemplo de este numeral y resumir an ms los datos originales de los salarios mnimos profesional del rea A.
Tabla 3 Distribucin de frecuencias agrupadas de salarios mnimos por hora zona A

Salarios de la zona A X 25 a menos de 50 50 a menos de 75 75 a menos de 100 100 o mas Suma de las frecuencias

Frecuencia f 1 3 1 2 7

*Fuente encuesta nacional de empleos y salarios, INE 2013

1.7.2. Grficas La representacin grfica de la distribucin de frecuencias ayuda a tener una visin agradable con la que se pueden formular ideas del comportamiento de los datos. Existen diferentes grficos, los ms usuales son el Histograma y el Polgono de frecuencias, as tambin el de frecuencias acumuladas, denominado ojiva.

22

1.7.2.1. Histograma Es un grfico de barras de una distribucin de frecuencias. Los lmites reales de clase se colocan en el eje horizontal (X) y el nmero de observaciones en el eje vertical (Y). Graficando los datos de la mejor opcin.

Grfico 1 Salarios Minimos por Hora, zona A, 2013

4 3

Frecuencias

3 2 2 1 1 0 25 a menos de 50 a menos de 75 a menos de 50 75 100 100 o mas

Salarios

*Fuente encuesta nacional de empleos y salarios, INE 2013

1.7.2.2. Polgono de Frecuencias Es un grfico lineal, trazado sobre las marcas de clase, pueden obtenerse uniendo los puntos medios del histograma, o bien utilizando las marcas de clase.

23

Grfico 2 Salarios Minimos por Hora, zona A, 2013

Frecuencias

3 3 2 2 1 1 0

Salarios

*Fuente encuesta nacional de empleos y salarios, INE 2013 1.7.2.3. Grfico de Frecuencias Acumuladas (ojiva) Una vez que se cuenta con las frecuencias acumuladas, se puede representar grficamente, esta curva recibe el nombre de ojiva.

24

Grfico 3 Gastos por el Consumo de Gasolina en Q.

50 45 40

Frecuencia

35 30 25 20 15 10 5 0

59.50

64.50

69.50

74.50

79.50

84.50

89.50

Consumo de Combustible en Q.

La distribucin de frecuencias no siempre se logra un comportamiento simtrico (una distribucin acampanada), una mitad de los datos a la derecha y otra a la izquierda. Esta tambin puede tener un comportamiento asimtrico, la asimetra se refiere a la falta de simetra con respecto a un eje vertical al centro, si un grfico de barras tiene cola derecha larga y una cola izquierda corta, se dice que es asimtrico hacia la izquierda.

25

CAPTULO II 2. Regresin y correlacin Si se desea estimar una variable con base a la otra se trata de regresin y si se desea conocer la relacin existente entre variables entonces se refiere a la correlacin. El anlisis a dos variables corresponde al anlisis de correlacin lineal simple; si se analizan ms de dos, ser entonces regresin y correlacin mltiple. Este captulo se refiere al anlisis de dos variables o sea simple, por ejemplo: ventas y comisiones sobre ventas; horas trabajadas y produccin; publicidad y ventas, etc. Los mtodos de regresin y correlacin, constituyen otra herramienta estadstica para la toma de decisiones, en virtud que proporcionan matemticamente indicadores que conllevan a conocer el comportamiento de una variable respecto a otra, si una aumenta o disminuye que pasa con la otra, y obtener resultados esperados. 2.1. Regresin Lineal Simple Permite estimar una variable llamada Predictando (Y) con relacin a otra llamada Predictor (X). Una manera de conocer el comportamiento de las variables es la observacin a travs de graficar las variables, permitir conocer si su comportamiento es lineal a travs de una lnea recta o una curva.

26

2.1.1. Mapa de esparcimiento o nube de puntos

Es la representacin grfica del predictor y el predictando o sea de las variables consideradas, es decir, los datos de dos variables, marcadas en una grfica Como primer punto cuando se cuenta con dos variables, es representarlas grficamente parque esto permite tener una apreciacin visual del comportamiento lineal o no; tambin se puede apreciar si su comportamiento es positivo o negativo, importante porque si es negativo el valor del coeficiente de regresin b en la ecuacin de regresin tendr signo negativo.
Tabla 4 Valor consumo de combustible segn km recorridos Empresa X

Valor consumo de combustible Q. X 275 260 310 400 425

Kms. Recorridos Y 300 290 325 400 410

27

Grfico 4 Mapa de Esparcimiento o Nube de Puntos Combustible y kilmetros Recorridos

450 400 Kms. Recorridos 350 300 250 200 150 100 50 0 275 260 310 400 Valor Consumo de Combustible 425

2.1.2. Ecuacin de la Lnea Recta Cuando se requiere estimar Y en funcin de X, es necesario ajustar un conjunto de datos a una lnea recta, utilizando el mtodo de mnimos cuadrados, a travs de la ecuacin de la lnea recta. (Y=a + b x). Cuando se usa como ecuacin de regresin se escribe as:

Yc
Dnde: Yc= Variable estimada o calculada

=a+bx

a y b= Coeficiente de regresin, a = origen y b= pendiente X= Predictor o variable en base a la que se estima el predictando Y.

28

Una vez obtenidos los valores de a y b, se despeja la ecuacin y se obtiene la Yc (Y estimada o Y calculada) para ello se multiplica b por X y se le suma el valor de a. Para encontrar los coeficientes de regresin se pueden utilizar varias frmulas, teniendo sumo cuidado en la identificacin de las variables X e Y. a) Ecuaciones normales y =na+ bx xy = a x + b x b) Frmulas de los parmetros a= (x ) (y) (x) (xy) n( x) - (x) n xy (x) (y) (x)

b =

n( x ) -

c) Frmulas abreviadas b= XY - n(promedio x)(promedio y) X Dnde: Y= Variable estimada o calculada X= Predictor o variable en base a la que se estima el predictando Y. Y= Predictor o variable que se desea estimar n=Nmero de casos o parejas de las variables a y b= Coeficientes de regresin X= Predictando
29

n(promedio x)

2.1.3. Propiedades de los mnimos cuadrados a) La suma del cuadrado de las desviaciones de Y respecto a la Yc, al cuadrado es mnima, comparada con cualquier otro valor que no sea Yc. (Y Yc) = mnima

b) La suma algebraica de las desviaciones de los valores originales respecto a los clculos es cero. (Y Yc) = 0 Dnde: Y= Predictando Yc= Y calculada o estimada 2.1.4 Error estndar de estimacin La ecuacin de regresin permite estimar los valores del predictando ( Y), en funcin de los valores del predictor (X).Sin embargo no se sabe el grado de error de las estimaciones para lo cual se utiliza la medida estadstica denominada Error Estndar de Estimacin. Si Sy/x = 0, se dir que existe estimacin perfecta, mientras sea el valor Sy/x, la estimacin estar ms cercana a la realidad. El error estndar mide el grado de dispersin de los valores originales de Y alrededor de la lnea de regresin. Frmula General: Syx = (Y - Yc) N

30

Dnde: Sy/x= Error estndar de estimacin Y= Predictando o variable que se desea estimar Yc= Valores de Y calculada en ecuacin n= Nmero de parejas de la variable

Frmula Abreviada: Syx = y - y.a - xy.b n Dnde: Sy/x= Error estndar de estimacin X= Valores del predictor, o variable dependiente Y= Predictando o variable que se desea estimar a= Origen de la ordenada b= Pendiente de la recta n= Nmero de parejas de la variable

2.1.3.1 Propiedades del Error Estndar de Estimacin (S y/x) Yc Sy/x, agrupa aproximadamente al 68.26% de los puntos Yc 2 (Sy/x), agrupa aproximadamente al 95.46% de los puntos Yc 3 (Sy/x), agrupa aproximadamente al 9972% de los puntos

31

Grfico 5 Ejemplificacin de las propiedades del error de estimacin (S y/x)

450 400 Kms. Recorridos 350 300 250 200 150 100 50 0 275 260 310 400 Valor Consumo de Combustible 425

Yc 3 (Sy/x)

Yc 2 (Sy/x)

Yc Sy/x

2.2 Correlacin Lineal Simple


Estudia el grado de relacin entre dos variables, un alto grado de correlacin no indica relacin causa-efecto entre variables, se puede obtener alta correlacin que en la prctica no tiene significado real, el grado de correlacin indica un resultado matemtico, que de acuerdo al conocimiento de las variables o tema analizado sirva como una herramienta para la toma de decisiones, por esta razn se debe realizar el anlisis de variables que guarden una relacin lgica. Se puede obtener el grado de correlacin de una variable con relacoin a otra, por ejemplo: la inversin utilidad, salarios- produccin - ingresos-gastos-. Las medidas estadsticas que permiten medir la relacin son dos coeficientes. a) Coeficiente de determinacin (r); b) Coeficiente de correlacin, smbolo r; r = r

32

Ambos coeficientes permiten establecer el grado de asociacin o vinculacin cuantitativa que existe entre dos o ms variables. Para determinar los coeficientes de correlacin existen varias frmulas. Se citan algunas de ellas: Frmula general o directa

a (y) + b (xy) - n (y promedio)


y - n (y promedio)

Al resultado se antepone el signo de b en la ecuacin de regresin determinada. Frmula con desviaciones r = (X promedio X) (Y promedio Y)

(X promedio X) (Y promedio Y)

Otras frmulas r = (Yc promedio y) (Y promedio y)

2.2.1 Caractersticas del coeficiente de correlacin Para r: a) Si r > 0, correlacin positiva b) Si r < 0, correlacin negativa c) Si r = 0, no existe correlacin
33

d) Si r=-1, correlacin perfecta negativa e) Si r= 1, correlacin perfecta positiva f) Si 1 r 1, la correlacin es fuerte o dbil, segn se acerque a cero.
Grfico 6 Ejemplificacin de Correlacin Perfecta Negativa (r= -1)

450 400 Kms. Recorridos 350 300 250 200 150 100 50 0 275 260 310 400 Valor Consumo de Combustible 425

Grfico 7 Ejemplificacin de Correlacin Perfecta Positiva (r=1)

450 400 Kms. Recorridos 350 300 250 200 150 100 50 0 275 260 310 400 Valor Consumo de Combustible 425

34

Grfico 8 Ejemplificacin de No Correlacin Existente (r= 0)

450 400 Kms. Recorridos 350 300 250 200 150 100 50 0 275 260 310 400 Valor Consumo de Combustible 425

35

CAPTULO III 3. Frmulas y simbologa 3.1. Simbologa a) Yc = Y estimada o calculada

b) a y b = Coeficientes de regresin c) a d) b e) x f) y g) n h) X i) Y = Origen = Pendiente = Predictor = Predictando = Numero de pares ordenados de las variables. = Promedio de x = Promedio de y

j) Sy/x = Error estndar de estimacin k) r l) r = Coeficiente de determinacin = Coeficiente de Correlacin

m) VNE = Variacin no Explicada n) VE o) VT = Variacin Explicada = Variacin Total

3.2. Frmulas
3.2.1. Frmulas de Regresin a) Ecuacin De Regresin: YC =a+bx

b) Ecuaciones Normales y =na+ bx xy = a x + b x


36

c) Frmulas De Los Parmetros a= (x ) (y) (x) (xy) n( x) (x)

b =

n xy -

(x) (y) (x)

n( x ) -

d) Frmula Abreviada:

b=

XY - n(promedio x)(promedio y) X n(promedio x)

a = promedio y b (promedio x)

c) Propiedades De Los Mnimos Cuadrados:

(Y Yc) = mnima

(Y Yc) = 0

37

d) Error Estndar De Estimacin

1. Frmula abreviada; Syx = y - y.a - xy.b n 2. Frmula General; Syx = (Y - Yc)

N e) Intervalo de confianza:

Yc = Z (Sy/x)

3.2.2. Frmulas de Regresin a) Coeficiente de determinacin: Con variacin explicada y variacin total:

r =

(Yc promedio Y) (Y promedio Y)

38

Con variacin no explicada y variacin total:

r =

(Yc promedio Y)

(Y promedio Y) Frmula Directa:

a (y) + b (xy) - n (y promedio)

y - n (y promedio)

Frmula con Desviaciones:

(X promedio X) (Y promedio Y)

(X promedio X) (Y promedio Y)

Frmula con Variacin explicada y variacin total:

39

r = (Yc promedio y)

(Y promedio y)

Frmula con Variacin explicada y Variacin Total:

r = r

3.2.3. Frmulas de Variaciones VNE = (Y Yc)

VE =

(Yc promedio Y)

VT =

(Y promedio Y)
40

CAPTULO IV 4. EJERCICIOS PRACTICOS 4.1 Ejercicio No.1 4.1.1. Planteamiento La informacin acerca de los costos y produccin en miles de Quetzales, de una empresa es la siguiente: Ao 2000 2001 2002 2003 2004 Costo Por Unidad Q1.00 Q2.00 Q3.00 Q4.00 Q5.00 Prod. En Miles de Unidades 20 15 12 11 7

Con la informacin anterior calcular: a) Representar grficamente las dos variables;


41

b) Encontrar la ecuacin de regresin por medio de ecuaciones normales; c) Obtener la ecuacin de regresin por medio de la frmula de los parmetros; d) Obtener la ecuacin de regresin por medio de la frmula abreviada; e) Estimar la produccin para un costo de Q 3.75 f) Determinar el error estndar de regresin por frmula abreviada; g) Determinar el error estndar de regresin por frmula general; h) Hallar el intervalo para el 68.26% de los casos; i) Determinar el coeficiente de correlacin y su interpretacin. 4.1.2. Resolucin a) Representar grficamente las dos variables;

Produccin (Miles Q)

25 20 15
Series1

10 5 0 0 1 2 3 Costo Unitario 4 5 6

Desarrollo:

xy

20

400

20

42

2 3 4 5 15

15 12 11 7 65

4 9 16 25 55

225 144 121 49 939

30 DATOS 36 44 35 165 N x y x y = = = = = 5 15 65 55 939

xy

165

b) Encontrar la ecuacin de regresin por medio de ecuaciones normales; FRMULA 94 Y = na + x b XY = x a + x b 65 = 5 a + 15b

165 = 15 a + 55b

15/5 = 3 al cual se le cambia signo a negativo (-) y se usa como factor que multiplica a toda la ecuacin de la siguiente forma:

-195 = - 15 a - 45b (-3) Factor que multiplica a la Ecuacin

43

165 = -30 = b = -30 10 Encontrar a;

15 a + 55b 10b = b= -3

65 = 5 a + 15 (-3) 65 = 5 a - 45 65 + 45 = 5 a 110 = 5a

Valor de b

a = 110 5

a=

22

La Ecuacin de regresin de la Produccin en funcin del costo = Yc = 22 3x Obtener a y b por frmula de los parmetros: FRMULA 95 Obtener a a= (x) (y) (x) (xy) n( x) a = (x) = 1100 50

(55) (65) (15) (165) = 3575 2475 5 (55) - (15) 275 - 225

a = 22 Obtener b
44

b =

n (xy) n( x) -

(x) (y) (x) 825 975 275 225 = -150 50

b=

5 (165) (15) (65) 5 (55) - (15)

b = -3 La Ecuacin de regresin de la Produccin en funcin del costo = Yc = 22 3x

Obtener la ecuacin de regresin por medio de la frmula abreviada; Frmula 96

Ao

xy

Yc Y - Yc (Y-Yc)

2000 2001 2002

1 2 3

20 15 12

1 4 9

400 225 144

20 30 36

19 16 13

1 -1 -1

1 1 1

45

2003 2004

4 5

11 7 65

16 25 55

121 49 939

44 35 165

10 7 65

1 0 0

1 0 4

TOTAL 15

Promedio de X = 15/5 = 3 Promedio de Y = 65/5 = 13 Encontrar b; b= XY - n(promedio x)(promedio y) X n(promedio x)

b=

165 5(3) (13) 55 - 5 (3)

b=

165 195 55-45

b=

-30

b=

-3

46

10 Encontrar a; a = promedio y b (promedio x) a = 13 -3 (3) a = 13 + 9 = 22 La ecuacin de regresin buscada que con la siguiente expresin: YC = 22 - 3 X

Encontrar Yc: 2000 2001 2002 2003 2004 Yc = 22 3(1) = 19 Yc = 22 3(2) = 16 Yc = 22 3(3) = 13 Yc = 22 3(4) = 10 Yc = 22 3(5) = 7 Y - Yc = 20 19 = 1 Y Yc = 15 16 = -1 Y - Yc = 12 13 = -1 Y Yc = 11 10 = 1 Y Yc = 7 7 = 0

Estimar la produccin para un costo de Q 3.75. FRMULA 93 Y = Yc = Yc = a + bx 22 3 (3.75) 22 11.25 = 10.75

Determine el error estndar de regresin por frmula abreviada;


47

FRMULA 100 Syx = Y - Y(a) - XY.(b)

n Syx = 939 ( 65) 22 165 (-3)

5 Syx = 939 1430 + 495

5 Syx = 4

5 Syx = 0.894427191

Determine el error estndar de regresin por frmula general; FRMULA 99

Syx = (Y Yc)

n Syx = 4

48

Syx =

0.894427191

Estimar por intervalo la produccin para un costo de Q 6.00, para el 68.26% de los casos; Frmula 101 Yc = a + bx Yc Sy/x

Yc = 22 3 (6)

0.894427191

Yc = 22 - 18 Yc = 4

4 4

0.894427191 = 3.11 + 0.894427191 = 4.89

La produccin estimada para costos de Q 6.00 oscila entre 3.11 y 4.89 miles de unidades. Determinar el coeficiente de correlacin y su interpretacin. Frmula 104

a (Y) + b (XY) - n (Y promedio)

Y - n (Y promedio)

49

(22) 65 + (-3) 165 - 5 ( 13)

939 - 5 (13)

0.957447

0.978492 * 100 = 97.85%

Por ser r mayor que cero se dice que la correlacin es positiva alta.

4.2. Ejercicio No.2 4.2.1 Planteamiento La informacin acerca de los ingresos y gastos diarios en miles de Quetzales, de una empresa es la siguiente:

Ingresos Q. Miles 25 30 40 35 20

Gastos Q. Miles 20 22 35 30 18

50

Con la informacin anterior calcular: a) Representar grficamente las dos variables; b) Encontrar la ecuacin de regresin; c) Obtener a y b por frmula; d) Estimar los gastos para un ingreso de Q5000.00 e) Determinar el error estndar de regresin; f) Determinar el coeficiente de correlacin y su interpretacin. 4.2.2. Resolucin Representar grficamente las dos variables;

40 35 30 25 20 15 10 5 0 0 10 20 30 40 50 Ingresos (Miles Q)

Gastos (Miles Q)

Series1

51

Desarrollo:

xy N x

DATOS = = = = = = 5 150 125 4750 3333 3970

25 30 40 35 20 150

20 22 35 30 18 125

625 900 1600 1225 400 4750

400 484 1225 900 324 3333

500 660 1400 1050 360 3970

y x y xy

Encontrar la ecuacin de regresin; Y = Na + x b XY = x + x b 125 = 5a+ 150 b

3970 = 150 a + 4750 b


52

150/5 = 30 al cual se le cambia signo a negativo (-) y se usa como factor que multiplica a toda la ecuacin de la siguiente forma:

-3750 = - 150 a - 4500 b (-30) Factor que multiplica a la Ecuacin 3970 = 150 a + 4750 b 220 = b = 220 250 Encontrar a; = 250 b b= 0.88

125 = 5 a + 150 (0.88) 125 = 5 a + 132 125 - 132 = 5 a 7 = 5a a=-7 5

Valor de b

a=

-1.4

La Ecuacin de regresin de la Produccin en funcin de los costos = Yc = -1.4 + 0.88x Obtener a y b por frmula; Obtener a a= (x ) (y) (x) (xy)

53

n( x) a =

(x) - 1750 1250

( 4750 ) (125) (150) (3970) = 5 (4750) - (150)

a = -1.4

Obtener b b = n xy n( x ) b= 5 (3970) (150) (125) 5 (4750) - (150) (x) (y) (x) = 1100 1250

b = 0.88 Estimar los gastos para un ingreso de Q5000.00 Y = Yc = Yc = a + bx -1.4 + 0.88 (5) -1.4 + 4.4 = 3 Miles

Determinar el error estndar de regresin; Syx = y - y.a - xy.b N


54

Syx =

3333 (125) 1.4 3970 (0.88) 5

Syx =

3333 + 175 3493.6 5

Syx =

14.4 5

Syx =

1.697

Determinar el coeficiente de correlacin y su interpretacin. r = a (y) + b (xy) - n ( y promedio)

y - n (y promedio)

(-1.4) 125 + (0.88) 3970 - 5 (25)

939 - 5 (13)

193.6

208 r = 0.96476 * 100 = 96.48%

Por ser r mayor que cero se dice que la correlacin es positiva alta. 4.3 Ejercicio No. 3
55

4.3.1. Planteamiento Una empresa desea saber la relacin existente entre los gastos en publicidad y sus ingresos anuales, desendose estimar los ingresos con base a los gastos. La informacin es la siguiente Gastos en Publicidad Q Miles 4 10 3 4 2 1 Ingresos Q Miles 32 42 31 35 26 21 anterior calcular:

AO 2000 2001 2002 2003 2004 2005 Con la informacin

a) Representar grficamente las dos variables; b) Encontrar la ecuacin de regresin; c) Estimar los ingresos anuales para 2006, si se gasta en publicidad Q 5000.00. d) Determinar el error estndar de regresin; e) Hallar el intervalo para el 68.26% de los casos; f) Determinar el coeficiente de correlacin y su interpretacin. 4.3.2. Resolucin Representar grficamente las dos variables;

45 40 35 30 25 20 15 10 5 0 0 2 4 6 8 10 12 Gastos en Publicidad Q Miles

Ingresos (Miles Q)

Series1

56

Desarrollo:

Ao

Y XY

Yc

Y-Yc

2000 2001 2002 2003 2004 2005

4 32 128 16 10 42 420 100 3 31 93 9

1024 1764 961 1225 676 441 6091

31 44 29 31 27 25 187

1 -2 2 4 -1 -4 -0.01

4 35 140 16 2 26 52 1 21 21 4 1

TOTAL 24 187 854 146

Encontrar la ecuacin de regresin por medio de la frmula abreviada;


57

Promedio de X = 24/6 = 4 Promedio de Y = 187/6 = 31.17 2.1 Encontrar b; b= XY - n(promedio x)(promedio y) X n(promedio x)

b=

854 6(4) (31.17) 146-6 (4)

b=

854 748.08 146-96

b=

105.92 50

b=

2.1184

Encontrar a; a = promedio y b (promedio x) a = 31.17 2.1184 (4) a = 31.17 8.4736 = 22.6964 La ecuacin de regresin buscada que con la siguiente expresin: YC = 22.6964 + 2.1184 X Estimar los ingresos anuales para 2006, si se gasta en publicidad Q 5000.00. Y = a + bx
58

Yc = Yc =

22.6964 + 2.1184 (5) 22.6964 + 10.592 = Q 33.29 miles

Determinar el error estndar de regresin;

Syx = y - y.a - xy.b N Syx = 6091 ( 22.6964) 187 2.1184 (854)

6 Syx = 6091 4244.23 1809.11

6 Syx = 37.66

6 Syx = 2.5

Hallar el intervalo para el 68.26% de los casos; Yc Sy/x

33. 29 2.5
59

33.29 2.5 = 30.79 33.29 + 2.5 = 35.79 Determinar el coeficiente de correlacin y su interpretacin. r = a (y) + b (xy) - n (y promedio)

y - n (y promedio)

22.6964 (187) + 2.1184 (854) - 6 (31.17)

6031 - 6 (31.17)

0.856034252

0.925 * 100 = 92.52%

De acuerdo al coeficiente encontrando existe una correlacin positiva altamente significativa en orden de 92.52%, por acercarse a 1, que es la mxima correlacin. 4.4 Ejercicio No.4

4.4.1. Planteamiento
60

La empresa Chapinlandia le proporciona a usted como asesor financiero de la empresa la siguiente informacin en miles de quetzales:

AO 2000 2001 2002 2003 2004

Costos Q Miles 50 60 65 70 90

Ventas Q Miles 65 70 75 85 105

Con la informacin anterior calcular: a) Determinar la ecuacin de regresin para estimar las ventas; b) Determinar las ventas para un costo de Q 120000.00; c) Determinar el grado de asociacin entre las dos variables. d) Interpretar el coeficiente hallado en el inciso anterior; e) El error estndar de estimacin; 4.4.2. Resolucin Determinar Ecuacin de Regresin: Encontrar a:

61

a = (x) ( xy) (y) (x2) ( x)2 n(x2) a = (335) (27725) (400) (23325) (335)2 - 5 (23325) a = -42125 -4400 a = 9.57

Encontrar b: b = (y) ( x) n (xy) ( x)2 n(x2) b = (400) (335) 5 (27725) (335)2 - 5 (23325) b = -4625 -4400 b = 1.05 Yc = 9.57 + 1.05 X

62

Determinar las ventas para un costo de Q 120,000.00;

Y (20,000) = 9.57 + 1.05 (120) Y (20,000) = 135.71 Determinar el grado de asociacin entre las dos variables. = 400 = 80 5 r = a ( y) + (b)( xy) n()2

( y2) n( )2 r = (9.57) (400) + (1.05) (27725) (5) (80)2

(33000) (5) (80)2 r = 972.301136

1000 r = 0.97230114

r = 0.9861

63

Interpretar el coeficiente hallado en el inciso anterior; Coeficiente de correlacin positivo, lo que implica que al aumentar una variable costos la otra ventas tambin aumenta. El error estndar de estimacin; Syx = y2 a y b xy N Syx = (33000) (9.57) (400) (1.05) (27725) 5 Syx = 60.75 5

Syx = 12.15

Syx = 3.49 4.5. Ejercicio No. 5

4.5.1. Planteamiento La empresa La Ganadera, S.A., presenta los gastos publicitarios y volumen de ventas en miles de quetzales a los primeros meses del ao 2006.

64

Gastos Publicitarios 5 7 8.3 9.5 10

Volumen de Ventas 750 660 850 775 823

Con la informacin anterior calcular: a) Determinar la ecuacin de regresin lineal. b) Determinar el grado de asociacin entre las dos variables. c) Interpretar el inciso anterior. d) Calcular el error estndar de estimacin. e) Determinar las ventas para un gasto publicitario de Q. 20,000.00.

Determinar la ecuacin de regresin lineal.

Gastos N Publicitarios 1 2 5 7

Volumen de xy ventas(y) 750 660 3750 4620 25 49 562500 435600 x2 y2

65

3 4 5

8.3 9.5 10 39.8

850 775 923 3958

7055 7362.5 9230

68.89 90.25 100

722500 600625 851929

32017.5 333.14 3173154

No especifica el mtodo as que se utiliza por medio de la frmula: Encontrar a: a= (x) ( xy) (y) (x2) ( x)2 n(x2) a= (39.8) (32017.5) (3958) (333.14) (39.8)2 5 (333.14) a= 542.1457

Encontrar b:

b=

(y) ( x) n (xy) ( x)2 n(x2)

b=

(3958) ( 39.8) 5 (32017.5)

66

(39.8)2 5 (333.14)

b = 31.33848

Yc = 542.1457 + 31.33848x

Determinar el grado de asociacin entre las dos variables. r = a ( y) + (b)( xy) n()2

( y2) n( )2 r = 542.1457 (3958) + (31.33848)(32017.5) 5(791.6)2

(3173154) 5(791.6)2 r = 0.63323 Interpretar el inciso anterior. Existe una correlacin positiva, es decir la relacin de crecimiento de una variable es proporcionalmente directa al crecimiento de la otra. Calcular el error estndar de estimacin.

Syx =

Y - Y (a) - XY (b)
67

Syx =

3173154 - (3958)(542.1457) - (32017.5)(31.33848)

5 Syx = 69.22649

Determinar las ventas para un gasto publicitario de Q. 20,000.00. y = 542.1457 + 31.33848x

y (20) = 542.1457 + 31.33848 (20) y (20) = 1168.91 Las ventas estimadas para un gasto publicitario de Q. 20,000.00 son de Q1,168,910.00

Conclusiones En el anlisis visual de mapa de dispersin, si la relacin lineal de dos variables analizados de la nube de puntos, que representa valores pareados de estas; se puede ajustar en apariencia a una lnea recta. Existe una relacin que puede ser medida en funcin a su tendencia sobre el grfico. A esta se le llama Regresin Lineal Simple.
68

Existen varios mtodos para el clculo de regresin entre los que se encuentran: El ajuste manual de la recta a los puntos, el despeje simultneo de dos ecuaciones normales, y el mtodo de mnimos cuadrados.

La ecuacin de regresin permite estimar y pronosticar otros valores de la variable dependiente Y, para ciertos valores de la variable X tambin.

El anlisis de regresin y el de correlacin estn estrechamente ligados. Tanto que el primero se encarga de buscar las desviaciones verticales de cada observacin con la lnea ajustada y el segundo revisa ya no solo el tipo de relacin, sino la intensidad y el sentido de la relacin entre las variables.

Aunque el mtodo que se expone en este informe para estudiar la correlacin. Cabe mencionar que, a travs de los clculos por frmula del cociente de variaciones, resulta mucho ms claro comprender qu es lo que mide la correlacin si se le contempla como cociente de variaciones.

Recomendaciones El procedimiento para realizar el clculo de las regresiones lineales simples es mejor desarrollado mediante el mtodo de mnimos cuadrados el cual garantiza que las distancias verticales entre cada uno de los puntos y la recta de regresin sean mnimas.
69

El mtodo ms simple para determinar la correlacin es el del Producto Momento de Pearson (conforme frmula que se desarrolla en el contenido de este informe), ya que calcularle a partir del cociente de variaciones exige que se construya la ecuacin de regresin, para luego estimar los valores estimados Y.

Referencias Bibliogrficas

Daz Mata, A. (2013). Estadstica aplicada a la administracin y la economa. Mxico: McGraw Hill.

70

Reyes Donis, J. L. (2009). Estadstica I. Guia de Estudio. Guatemala. Wikimeida Project. (12 de Febrero de 2014). MediaWiki. (Fundacion Wikimedia Inc.) Recuperado el 13 de Febrero de 2014, de Wikipedia, Enciclopedia Libre: http://es.wikipedia.org/wiki/Historia_de_la_estad%C3%ADstica

71

También podría gustarte