Está en la página 1de 28

FUNDAMENTOS Y APLICACIONES DEL ANLISIS DE LA VARIANZA. 1- Varianza: 1.

1- Antecedentes histricos: El trmino varianza fue establecido por Ronald Fisher en un artculo de 1918 titulado The Correlation Between Relatives on the Supposition of Mendelian Inheritance. 1.2- Concepto: En teora de probabilidad, la varianza o coeficiente de variacin (que suele representarse como 2) de una variable aleatoria es una medida de su dispersin definida como la esperanza del cuadrado de la desviacin de dicha variable respecto a su media. La varianza se relaciona con la desviacin tpica o desviacin estndar, la cual se denota a travs de la letra griega denominada sigma y que ser la raz cuadrada de la varianza.

La principal funcin y utilidad que se le puede encontrar a la varianza es que nos permite saber y determinar qu es normal, qu es grande, qu es pequeo, aquello que es extra grande o bien aquello que es extra pequeo. Est medida en unidades distintas de las de la variable. Por ejemplo, si la variable mide una distancia en metros, la varianza se expresa en metros al cuadrado. La desviacin estndar, la raz cuadrada de la varianza, es una medida de dispersin alternativa expresada en las mismas unidades y hace referencia a la media de las desviaciones cuadrticas de una variable aleatoria, con relacin al valor medio de esta:

1.3- Definicin: Dada una variable aleatoria X con media = E(X), se define su varianza, Var(X) (tambin representada como o, simplemente 2), como

Al desarrollar la funcin anterior se obtiene la siguiente definicin alternativa (y equivalente):

Si una distribucin no tiene esperanza, como ocurre con la de Cauchy, tampoco tiene varianza. Existen otras distribuciones que, aun teniendo esperanza, carecen de varianza. Un ejemplo de ellas es la de Pareto cuando su ndice k satisface 1 < k 2. 2- Varianza (Continua-Discreta): 2.1- Caso continuo: Si la variable aleatoria X es continua con funcin de densidad f(x), entonces

Donde

Y las integrales estn definidas sobre el rango de X. 2.2- Caso discreto: Si la variable aleatoria X es discreta con pesos x1 p1, ..., xn pn, entonces:

3- Caractersticas Generales: La varianza depende de todos los valores de la distribucin, as como de la media. En los casos en los que no sea posible calcular la media aritmtica, no ser posible tampoco obtener la varianza por ser funcin de la media. La varianza tiene el inconveniente de que no viene expresada en las mismas unidades que los datos, debido a que las desviaciones estn elevadas al cuadrado. Si los datos fueran en metros, la varianza vendra dada en metros cuadrados. Toman siempre valores positivos, pero solo se aplican a variables cuantitativas. Si todos los valores de las variables son iguales, esta vale cero. Es sensible a la variacin de los valores de las variables. La interpretacin fsica no es tan fcil como la media, al ser medidas cuadrticas corresponde con el momento de inercia.

4- Propiedades de la varianza: 4.1- Propiedades tericas: La varianza es siempre positiva o cero. La varianza de una constante es cero. La varianza de la suma o diferencia de una variable y una constante es igual a la varianza de la variable. La varianza de un producto de una constante por una variable es igual al cuadrado de la constante por la varianza de la variable.

4.2- Propiedades tericas descritas por formulas: : Siendo a y b nmeros reales cualesquiera. De esta propiedad se deduce que la varianza de una constante es cero, es decir:

covarianza de X e Y. covarianza de X e Y. Var (k X) = k2 Var (X) para todo nmero real k. Var (k) = 0 para todo nmero real k.

: Donde Cov(X,Y) es la

: Donde Cov(X,Y) es la

5- Formulas de la varianza: 5.1-Varianza muestral: En muchas situaciones es preciso estimar la varianza de una poblacin a partir de una muestra. Si se toma una muestra con reemplazamiento de n valores de ella, de todos los estimadores posibles de la varianza de la poblacin de partida, existen dos de uso corriente:

Cuando los datos estn agrupadas:

A los dos (cuando est dividido por n y cuando lo est por n-1) se los denomina varianza muestral. Difieren ligeramente y, para valores grandes de n, la diferencia es irrelevante. El primero traslada directamente la varianza de la muestra al de la poblacin y el segundo es un estimador insesgado de la varianza de la poblacin. Por lo tanto:

Mientras que:

5.2- Varianza para datos agrupados:

Para simplificar el clculo de la varianza se utiliza las siguientes expresiones que son equivalentes a las anteriores.

5.3- Mtodo abreviado para el clculo de la varianza: Si una variable X toma unos valores para los cuales las operaciones de clculo de media y varianza son tediosas, se puede realizar los clculos sobre una variable Z definida como:

Una vez que han sido calculadas que:

, obtenemos

teniendo en cuenta

5.4- Grados de libertad

Los grados de libertad de un estadstico calculado sobre n datos se refieren al nmero de cantidades independientes que se necesitan en su clculo, menos el nmero de restricciones que ligan a las observaciones y el estadstico. Es decir, normalmente: n-1. Ejemplo. Considerando una serie de valores de una variable,

Que han sido tomados de forma independiente. Su media es y se ha calculado a partir de las n=5 observaciones independientes xi, que estn ligadas a la media por la relacin:

Luego el nmero de grados de libertad de la media es n-1=4. Al calcular la varianza, se han de sumar n cantidades:

Sin embargo esas cantidades no son totalmente independientes, pues estn ligadas por una restriccin:

El nmero de grados de libertad del estadstico es el nmero de observaciones de la variable menos el nmero de restricciones que verifican, as que en este caso, los grados de libertad de la varianza sobre los n=5 datos son tambin n-1 =4. Un principio general de la teora matemtica dice que si se desea calcular de modo aproximado la varianza de una poblacin a partir de la varianza de una muestra suya, se tiene que el error cometido es generalmente ms pequeo, si en vez de considerar como estimacin de la varianza de la poblacin, a la varianza muestral:

Considerando lo que se denomina cuasivarianza muestral, que se calcula como la anterior, pero cambiando el denominador por el nmero de grados de libertad, n-1:

5.5- Tipificacin: Se conoce por tipificacin al proceso de restar la media y dividir por su desviacin tpica a una variable X. De este modo se obtiene una nueva variable

De media

y desviacin tpica

, que se denomina variable tipificada.

Esta nueva variable carece de unidades y permite hacer comparables dos medidas que en un principio no lo son, por aludir a conceptos diferentes. Ejemplo: Si se desea comparar el nivel acadmico de dos estudiantes de diferentes Universidades para la concesin de una beca de estudios, en principio sera injusto concederla directamente al que posea una nota media ms elevada, ya que la dificultad para conseguir una buena calificacin puede ser mucho mayor en un centro que en el otro, lo que limita las posibilidades de uno de los estudiante y favorece al otro. En este caso, lo ms correcto es comparar las calificaciones de ambos estudiantes, pero tipificadas cada una de ellas por las medias y desviaciones tpicas respectivas de las notas de los alumnos de cada Universidad. 5.6- Varianza con dos poblaciones: En ocasiones es importante comparar dos poblaciones para ver si una es ms variable que la otra en alguna medida especfica. La hiptesis nula es que las dos poblaciones tienen la misma varianza, y la hiptesis alternativa es que una tiene mayor varianza que la otra. Se obtienen muestras aleatorias de cada poblacin y se calculan las varianzas mustrales.

Estos valores se usan entonces en la ecuacin siguiente para calcular el estadstico de la muestra: Cociente F F = S12 / S22 Donde: * S12 = Varianza de la muestra 1 * S22 = Varianza de la muestra 2 Por convivencia, para encontrar los valores de F, por lo general se pone en el numerador la varianza muestral ms grande. El estadstico de prueba dado por la ecuacin anteriormente nombrado, es el cociente F. Si la hiptesis nula de varianzas poblacionales iguales es cierta, la razn de las varianzas mustrales se obtiene de la distribucin F terica. Al consultar la tabla F se puede evaluar la probabilidad de este suceso. Si parece probable que el cociente F pueda haberse obtenido de la distribucin muestral supuesta, la hiptesis nula no se rechaza. Si es poco probable que el cociente F se haya obtenido de la distribucin supuesta, la hiptesis nula se rechaza. La distribucin F especfica que se aplica a una prueba en particular queda determinada por dos parmetros: los grados de libertad para el numerador y los grados de libertad para el denominador. Cada uno de estos valores es n-1. Si se conocen estos valores y se elige un valor alfa, al valor crtico de F se puede encontrar en la tabla F. 5.6- Regresin con varianza constante: Cuando se trabaja con dos o ms variables, es importante conocer la relacin entre ellas. Si una o ms variables son aleatorias, no habr una relacin unvoca entre los valores de dos de las variables es decir, dado un valor de una variable (la variable controlada), hay un posible rango de valores de la otra- y por lo tanto se requiere una descripcin probabilstica. La relacin probabilstica de las variables, que se describe con la media y la varianza de una variable aleatoria en funcin de los valores de la otra variable, se conoce como anlisis de regresin. Cuando el anlisis se limita a funciones lineales, se trata de una regresin lineal, pero la regresin puede ser tambin de tipo no lineal. En algunos casos, problemas de regresin no lineal pueden convertirse en lineales mediante una transformacin de las variables originales.

Cuando se ubican en una grfica bidimensional las parejas de datos de dos variables X y Y, debe tenerse en cuenta que los valores de Y por ejemplo, dependen de X, y por tanto los datos de Y han de analizarse (para determinar la media, la varianza, etc.) con la debida consideracin de X. En la figura 1 se observa una tendencia general de los valores de Y, a aumentar directamente proporcionales con X (X puede ser determinstica o aleatoria). Entonces la media de los valores de Y aumentar con el aumento de los valores de X, aunque los valores reales de Y no necesariamente tienen que incrementarse directamente con los valores de X. Suponiendo que esta relacin es lineal, es decir:

Donde y son constantes, y la varianza de Y puede ser independiente o ser funcin de X. Esta ecuacin se conoce como la regresin lineal de Y sobre X. Vamos a considerar el caso con = constante.

Muchas rectas, pueden satisfacer la funcin del valor medio de Y, dependiendo de los valores de y . La mejor lnea ser la que pase entre los puntos de los datos con el mejor ajuste. En la figura1, se muestra la diferencia entre cada valor observado y la recta

, es decir, . Entonces la mejor lnea es aquella con la diferencia total mnima, y se obtiene minimizando la suma de los errores (diferencias) cuadrados, o sea minimizando:

Donde n es el nmero de puntos de los datos. Este es el mtodo conocido como de los mnimos cuadrados. Para obtener los estimados de la ecuacin anterior: y se procede a derivar

Figura 1. Anlisis de Regresin lineal de datos de dos variables De donde se obtiene las siguientes ecuaciones:

Donde La lnea de regresin de los mnimos cuadrados es entonces:

Esta lnea de regresin es vlida solamente en el rango de valores de x observados. Las ecuaciones (1) a (5) se refieren a la regresin de Y sobre X. Si X y Y son ambas variables aleatorias, puede obtenerse tambin la regresin de X sobre Y, siguiendo el mismo procedimiento; en este caso se obtendra la ecuacin de regresin de . Sin embargo las dos ecuaciones siempre se interceptan en . . En general, esta es una ecuacin lineal diferente de

Ya que la tendencia general de la relacin se explica con la lnea de regresin de la ecuacin (5), la varianza alrededor de esta lnea es la medida de dispersin, que es la varianza condicional .

Para el caso en el cual la varianza condicional se asume constante en el rango de inters de x, un estimado imparcial de la varianza es

Que es igual a:

Y por lo tanto, la desviacin estndar condicional es Los coeficientes , . 6- Anlisis de la varianza: y

. , y

, son estimados de los valores reales de

El anlisis de la varianza (ANOVA, segn terminologa inglesa) es una coleccin de modelos estadsticos y sus procedimientos asociados, en el cual la varianza est particionada en ciertos componentes debidos a diferentes variables explicativas. Las tcnicas inciales del anlisis de varianza fueron desarrolladas por el estadstico y genetista R. A. Fisher en los aos 1920 y 1930 y es algunas veces conocido como Anova de Fisher o anlisis de varianza de Fisher, debido al uso de la distribucin F de Fisher como parte del contraste de hiptesis. Existen tres clases conceptuales de estos modelos: El Modelo de efectos fijos asume que los datos provienen de poblaciones normales las cuales podran diferir nicamente en sus medias. (Modelo 1)

El Modelo de efectos aleatorios asume que los datos describen una jerarqua de diferentes poblaciones cuyas diferencias quedan restringidas por la jerarqua. Ejemplo: El experimentador ha aprendido y ha considerado en el experimento slo tres de muchos ms mtodos posibles, el mtodo de enseanza es un factor aleatorio en el experimento. (Modelo 2)

El Modelo de efectos mixtos describen situaciones que ste puede tomar. Ejemplo: Si el mtodo de enseanza es analizado como un factor que puede influir donde estn presentes ambos tipos de factores: fijos y aleatorios. (Modelo 3)

6.1- Supuestos previos: El ANOVA parte de algunos supuestos que han de cumplirse: La variable dependiente: debe medirse al menos a nivel de intervalo. Independencia de las observaciones. La distribucin de los residuales debe ser normal. Homocedasticidad: homogeneidad de las varianzas. La tcnica fundamental consiste en la separacin de la suma de cuadrados (SS, 'sum of squares') en componentes relativos a los factores contemplados en el modelo. Como ejemplo, mostramos el modelo para un ANOVA simplificado con un tipo de factores en diferentes niveles. (Si los niveles son cuantitativos y los efectos son lineales, puede resultar apropiado un anlisis de regresin lineal)

SSTotal = SSError + SSFactores


El nmero de grados de libertad (gl) puede separarse de forma similar y se corresponde con la forma en que la distribucin chi-cuadrado ( o Ji-cuadrada) describe la suma de cuadrados asociada.

glTotal = glError + glFactores


6.2- Modelo de efectos fijos: El modelo de efectos fijos de anlisis de la varianza se aplica a situaciones en las que el experimentador ha sometido al grupo o material analizado a varios factores, cada uno de los cuales le afecta slo a la media, permaneciendo la "variable respuesta" con una distribucin normal.

6.3- Modelo de efectos aleatorios:

Los modelos de efectos aleatorios se usan para describir situaciones en que ocurren diferencias incomparables en el material o grupo experimental. El ejemplo ms simple es el de estimar la media desconocida de una poblacin compuesta de individuos diferentes y en el que esas diferencias se mezclan con los errores del instrumento de medicin. 6.4- Pruebas de significacin: El anlisis de varianza lleva a la realizacin de pruebas de significacin estadstica, usando la denominada distribucin F de Snedecor. 6.5- Contrates de hiptesis en un anlisis de la varianza de dos factores: Del mismo modo que se hizo en el anova de una va, para plantear los contrastes de hiptesis habr que calcular los valores esperados de los distintos cuadrados medios. Los resultados son: Modelo I MS MSA Valor esperado

MSB

MSAB MSE Por lo tanto, los estadsticos MSAB/MSE, MSA/MSE y MSB/MSE se distribuyen como una F con los grados de libertad correspondientes y permiten contrastar, respectivamente, las hiptesis: No existe interaccin (MSAB/MSE)

No existe efecto del primer factor, es decir, diferencias entre niveles del primer factor (MSA/MSE)

No existe efecto del segundo factor (MSB/MSE)

Si se rechaza la primera hiptesis de no interaccin, no tiene sentido contrastar las siguientes. En este caso lo que est indicado es realizar un anlisis de una va entre las ab combinaciones de tratamientos para encontrar la mejor combinacin de los mismos. 6.6- Tipos de suma de cuadrados en el anlisis de la varianza: La suma de cuadrados se emplea con el fin de efectuar una descomposicin de la variabilidad total atribuible a la variable respuesta Y, en los diferentes componentes o factores controlados o manipulados por el investigador x, y la adicin del error experimental, que constituye la fuente de variacin que aglutina a todos los componentes no controlados dentro del modelo de clasificacin experimental. Cada uno de los trminos es pues una suma de desviaciones cuadrticas, que denominar de forma abreviada como suma de cuadrados (SC). La primera SC del lado de la derecha corresponde a las desviaciones de cada observacin respecto de la media de su propio grupo, por lo que se la conoce como "dentro del grupo" o "intra grupo" (en ingls within). El segundo sumando de la derecha corresponde a las desviaciones de la media de cada grupo respecto de la media global, por lo que cuantifica las diferencias medias entre los grupos, y se conoce como suma de cuadrados "entre grupos" (en ingls between):

SCTotal = SCIntra grupo+SCEntre grupos


El cuadrado medio intra-grupo, equivalente a una varianza, lo calculamos dividiendo la suma de cuadrados entre los grados de libertad

Si la media de todos los grupos es la misma, MSE tambin es una estimacin de la varianza comn .

Esto se puede entender mejor de una forma intuitiva si se considera el caso particular en el que todos los grupos tienen el mismo tamao n. Se sabe que la desviacin estndar al cuadrado (varianza) de la media obtenida en muestras de tamao n extradas de una poblacin normal es /n (es lo que se conoces

como error estndar de la media), por lo tanto estimacin de /n y por tanto

ser una es una estimacin de .

6.7- Cuadrados medios de la varianza: Los cuadrados medios definidos a partir de las sumas de cuadrados de los tratamientos y del error, respectivamente, son:

Con valores medios

Estos valores medios sealan que cuando la hiptesis H0 es cierta, lo cual equivale a i = 0 para i=1,2,...,k ; tanto MSA como MSE son estimadores centrados de 2. Sin embargo, cuando H0 es falsa, MSA sobrestima esta varianza. 6.8- Estimaciones de la varianza: El conocimiento de las varianzas es un elemento de especial inters, tanto para los usuarios de estadstica, como para los diseadores. La estadsticas obtenidas a travs de encuestas probabilsticas permiten al usuario decidir acerca de los grados de validez o confianza de los datos en relacin, como el uso que se va hacer de ellos, as como al diseador le permita entre varios procedimientos alternativos o en su caso mejorar un diseo ya establecido. Cuando se estiman muchas caractersticas poblacionales con diseos complejos de muestreo, la aplicacin de las formulas ordinarias de los estimadores de la varianza, puede ocasionar tediosos problemas de clculo.

Por ello se han desarrollado algunas tcnicas que aplican formulas ms sencillas, aunque se pierda cierta precisin. Algunas de estas tcnicas son: * El mtodo de la serie de Taylor. * El mtodo de Grupos Aleatorios. * El mtodo JACKKNIFE. * El BOOTSTRAP. 6.9- Aplicaciones en las siguientes reas: biologa, climatologa, ingeniera, control de calidad, mdica, entre otras: La varianza por ser una media de dispersin es aplicable en todos los teoremas y clculos de probabilidades como lo son Binomial, Poisson, distribucin de probabilidad de una variable continua o discreta, Bernoulli, distribucin normal, entre otras. Es decir, la varianza al igual que el valor esperado son dos valores esenciales para hallar los clculos de probabilidad. Por otro lado cada uno de los teoremas nombrados anteriormente tienen aplicacin ms efectivas que otros segn sea el grado de complicacin del problema que se desee resolver y segn sea el campo que le corresponda a la problemtica, ya sea en las reas de biologa, climatologa, ingeniera, control de calidad, mdica, entre otras. Sobre la base de las consideraciones anteriores, se puede deducir que la varianza tiene aplicacin en todas las reas como la biologa, climatologa, ingeniera, control de calidad, mdica, entre otras , pero su uso y aplicacin variaran segn sea el entorno del teorema o calculo de probabilidad que se est aplicando de acuerdo al rea y problemtica que se desee hallar un margen de probabilidad determinado.

7- Ejemplos de Clculo de la Varianza: 1- Hallar la la varianza de la series de nmeros siguientes:

2, 3, 6, 8, 11.

12, 6, 7, 3, 15, 10, 18, 5.

2- Calcular la varianza de la distribucin: 9, 3, 8, 8, 9, 8, 9, 18

3- Un dado de seis caras puede representarse como una variable aleatoria discreta que toma, valores del 1 al 6 con probabilidad igual a 1/6. El valor esperado es (1+2+3+4+5+6)/6 = 3.5. Por lo tanto, su varianza es:

4- Calcular la varianza y desviacin tpica de las siguientes cantidades medidas en metros: 3,3,4,4,5 Para calcular dichas medidas de dispersin es necesario calcular previamente el valor con respecto al cual vamos a medir las diferencias. ste es la media:

La varianza es:

Siendo la desviacin tpica su raz cuadrada:

5- Calcular la varianza de la distribucin de la tabla: xi [10, 20) [20, 30) [30,40) [40, 50) [50, 60 [60,70) [70, 80) 15 25 35 45 55 65 75 fi 1 8 10 9 8 4 2 42 xi f i 15 200 350 405 440 260 150 1 820 xi2 fi 225 5000 12 250 18 225 24 200 16 900 11 250 88 050

6- Obtener la varianza y desviacin estndar de la siguiente muestra, que nos indica el nmero de cigarros que son consumidos en promedio al da por un conjunto de 20 encuestados:

2 10

4 2

10 4

6 2

0 3

4 2

1 5

0 5

3 8

6 0

La media es igual a

Reportamos la tabla de la diferencia de cuadrados 3.4225

: 4.6225

0.0225 37.8225 4.6225 14.8225 0.0225 8.1225 14.8225 0.7225 3.4225 0.7225 3.4225 1.3225 1.3225

37.8225 3.4225 0.0225 Por lo que

17.2225 14.8225

Por lo para determinar la desviacin estndar basta con obtener la raz cuadrada, con lo que finalmente la desviacin estndar es igual a: Cigarros. 8- Seleccin, Diseo y clculo de la varianza: A continuacin se procede a mostrar datos de Ingenieros del Instituto Politcnico Santiago Mario, extensin Porlamar, donde se muestran los siguientes datos que se utilizaran como datos para el anlisis de la varianza:

* Nombre y Apellido. * Tipo de Ingeniero. * RI- Rama de la Ingeniera. * SA- Sueldo Actual. * FG- Fecha de graduacin. El mtodo de obtencin de datos fue una entrevista personal dentro de las instalaciones fsicas del instituto, ya que los datos que se requirieron para realizar dicho ejercicio es informacin bsica y personal que no requera de una

encuesta sumamente grande. Se les informo a los ingenieros que suministraron dicha informacin la razn y el uso que se le dara a los datos que el alumno le solicito los cuales ellos accedieron a responder las preguntas para que el alumno pudiera realizar el proyecto. Cdigo numrico preestablecido de la variable rama de la ingeniera (RI) en que se gradu el ingeniero, ya que esta variable debe ser transformada del nombre de la carrera a un nmero.

1 4 7

Agrnomo Computacin Farmacutica

2 5 8

Ambiental Elctrica Forestal

3 6 9 12 15 18

Civil Electrnica Geologa Mecnico Petrolero Qumica

10 Industrial 13 Metalrgico 16 Petroqumica Qumica19 Refinera 22 Sistemas Tabla A-1

11 Informtica 14 Minas 17 Produccin Relaciones20 Industriales 23 Telecomunicaciones

21

Sanitario

A continuacin se muestra una tabla con los datos recolectados de los ingenieros del IUPSM: Tipo Ingeniero. Nombre-Apellido Jos Pena Ing. Mecnico Richard Mrquez Ing. Industrial Ing. Sistema Ing. Civil Tabla A-2 Adrian Garca Mauricio Rinaldi 12 11 22 3600 4000 4500 4500 2006 1998 2000 1995 RI 12 SA 3800 FG 2000

Francisco Higuera 3

Los datos seleccionados para realizarle el anlisis de la varianza fueron el SA (Sueldo Actual) y FG (Fecha de Graduacin). Por otra parte, se realizara el anlisis de estas dos variables nombradas anteriormente pero por tablas separadas, de la siguiente manera: a- Clculo del ANOVA (1): Tipo Ingeniero. Nombre-Apellido Jos pena Ing. Mecnico Richard Mrquez Ing. Industrial Ing. Sistema Ing. Civil Tabla A-3 b- Clculo del ANOVA (2): Tipo Ingeniero. NombreApellido Jos pena Ing. Mecnico Richard Mrquez Adrian Garca RI 12 FG 2000 Adrian Garca Mauricio Rinaldi 12 11 22 3600 4000 4500 4500 RI 12 SA 3800

francisco higuera 3

12 11

2006 1998 2000 1995

Ing. Industrial Ing. Sistema Ing. Civil Tabla A-4

Mauricio Rinaldi 22 francisco higuera 3

El siguiente anlisis que se presentar de las 2 tablas anteriores, se resolvieron siguiendo el modelo de la siguiente tabla de anlisis ANOVA:

Tabla A-5 A.1- Anlisis del ANOVA (1) : a continuacin se muestra los resultados del anlisis de la Tabla A-3. Resultados. 1 2 Suma Valor medio, x/k Nk Ing. Mecnico 3800 3600 7400 3700 2 4000 4000 1 4500 4500 1 Ing. Industrial 4000 Ing. Sistemas 4500

Media aritmtica de todos los resultados, x//= 3975 Nmero total de resultados, N= 4 Expresiones para el clculo del ANOVA de un factor (K indica el nmero de laboratorios y N el nmero total de resultados). Fuente Anlisis entre datos los tipos de Ingenieros. Suma de cuadrados Grados de Libertad. Varianza Fcal

SSlab= 427500

MSlab= 213750

F= 106875

Anlisis interno entre los datos de los tipos de Ingenieros. Total

SSR= 20000

MSR= 20000

SST= 447500

MST= 149166,6667

Tabla A-6 Al detallar los valores medios de los sueldos actuales, se puede observa que existen diferencias entre los valores de SA entre los diferentes tipos de profesin (Mecnico Industrial- Sistemas). Por otro lado los el anlisis entre datos los tipos de Ingenieros y el anlisis interno entre los datos de los tipos de Ingenieros estn perfectamente analizados, calculados y distribuidos, y se puede dichos valores de los diferentes anlisis con respecto al total, que correspondi exactamente con el valor hallados por las frmula para determinar el valor total del anlisis de los datos y su relacin segn los diferentes tipos de ingenieros. En cuanto al coeficiente F=(a), el valor hallado por los procesos de anlisis de la varianza fue: F= 106875 b.1- Anlisis del ANOVA (2) : a continuacin se muestra los resultados del anlisis de la Tabla A-4. Resultados. 1 2 Suma Valor medio, x/k Nk Ing. Mecnico 2000 2006 4006 2003 2 1998 1998 1 2000 2000 1 Ing. Industrial 1998 Ing. Sistemas 2000

Media aritmtica de todos los resultados, x//= 2001

Nmero total de resultados, N= 4 Expresiones para el clculo del ANOVA de un factor (K indica el nmero de laboratorios y N el nmero total de resultados). Fuente Analisis entre datos los tipos de Ingenieros. Analisis interno entre datosde los tipos de Ingenieros. Total Tabla A-7 Al detallar los valores medios de los aos de graduacin, se puede observa que existen diferencias entre los valores de FG entre los diferentes tipos de profesin (Mecnico Industrial- Sistemas), excepto en la comparacin de los aos de graduacin del un ingeniero de sistemas con un ingeniero mecnico que son iguales, pero indiferentemente la media de FG de los ingenieros mecnicos y el ingeniero de sistemas son distintas. Por otro lado los el anlisis entre datos los tipos de Ingenieros y el anlisis interno entre los datos de los tipos de Ingenieros estn perfectamente analizados, calculados y distribuidos, y se puede dichos valores de los diferentes anlisis con respecto al total, que correspondi exactamente con el valor hallados por las frmula para determinar el valor total del anlisis de los datos y su relacin segn los diferentes tipos de ingenieros. En cuanto al coeficiente F=(a), el valor hallado por los procesos de anlisis de la varianza fue: F= 0,5 Suma de cuadrados Grados de Libertad. Varianza Fcal

SSlab= 18

MSlab= 9 F= 0,5

SSR= 18

MSR= 18

SST= 36

MST= 12

Anlisis de los resultados: El anlisis de los resultados fueron realizados a travs de las formulas mostradas en partes anteriores, donde se siguen las especificaciones exactamente como lo rige el ANOVA, esto es en cuanto a la estructura organizacional y seguimiento de los paso para el cuerpo de los clculos, por otra parte, los clculos fueron realizados a travs del programa Excel para evitar cualquier tipo de error en cualquier operacin matemtica que pudiera alterar los resultados de las tablas y los resultados de la obtenidos del estudio realizado. Nombre-Apellido Marvelin Moya Eduardo Torres Pilar Marcano Antonio Garcia Ana Hernandez Nahomy Rondon Francisco Narvaez Jhoana Alvarez Cecilia Rojas Francelina Avila Yusmargele Hinojosa Jos Pena richard marquez Cesar Suarez Jesus Fermin Maylin Guerra SA 3400 3200 2500 4600 4800 2500 4000 3500 3000 3200 FG 2000 2002 2009 1990 1995 2007 1995 1997 2500 2000 Tipo Ingeniero. Ing. Quimico Ing. Quimico Ing. Quimico Ing. Civil Ing. Civil Ing. Civil Ing. Civil Ing. Mecanica Ing. Mecanica Ing. Mecanica RI 18 18 18 3 3 3 3 12 12 12

3200 3800 3600 3000 3000 3500

3200 2000 2006 2007 2007 2005

Ing. Mecanica Ing. Mecanica Ing. Mecanica

12 12 12

Ing. Electronico 6 Ing. Electronico 6 Ing. Electronico 6

Hernesto Arroyo Karen Pea Jhonatan Hernandez Jairo Martine Vicmar Martinez Juan Martinez Rosmary Astudillo Nora Rodriguez Jualianny Carvajal Ronald Cedeo

3800 3000

2003 2004

Ing. Sistemas. Ing. Sistemas.

22 22

2500 2200 3000 2500 4000 3000 3000 4600

2009 2008 2003 2006 1995 2005 2006 1991

Ing. Sistemas. Ing. Sistemas. Ing. Sistemas. Ing. Sistemas. Ing. Sistemas. Ing. Industrial Ing. Industrial Ing. Industrial

22 22 22 22 22 11 11 11

Los datos seleccionados para realizarle el anlisis de la varianza fueron el Sueldo Actual (SA) y Fecha de Graduacin (FG). Por otra parte, se realizara el anlisis de estas dos variables nombradas anteriormente pero por tablas separadas. a- Clculo del ANOVA (3):

Resultados. 1 2 3 4 5 6 7 Suma

Ing. Civil 4600 4800 2500 4000

Ing. Mecanica 3500 3000 3200 3200 3800 3600

Ing. Sistemas 3800 3000 2500 2200 3000 2500 4000

15900

20300 3383.33 6

21000 3000 7

Valor medio, 3975 x/k Nk 4

Media aritmtica de todos los resultados, x//= 3364.71 Nmero total de resultados, N=17 Expresiones para el clculo del ANOVA de un factor (K indica el nmero de laboratorios y N el nmero total de resultados). Fuente Suma de cuadrados Grados de Varianza Libertad. Fcal

Analisis entre datos los SSlab= tipos de 2422989.4515 Ingenieros. Analisis interno entre datosde los tipos de Ingenieros. Total

MSlab= 1211494.7257 f= 2.6191109756 MSR= 462559.52381

SSR= 6475833.3334 14

SST= 8898822.7849

16

MST= 556176.42406

Tabla A-8 En cuanto al coeficiente F=(a), el valor hallado por los procesos de anlisis de la varianza fue: F= 2.6191109756