Está en la página 1de 10
Cuando se trata de analizar informacién, correspondiente @ distribuciones obtenidas de |i observaciin de poblaciones en general, nos podemos encontrar con 3 situaciones: Que queramos comparar distribuciones. Universo Univewo Fie [isuitucion 1 | mnparet Universo — [Pavitacin 2 "Que queramos comparar individuos que procedan de distintas listribuciones. Distribueiin 1 b> | tncividuo 1 | mate Diantesin? Joe [navn et = Que queramos asociar individuos con distintas distribuciones. Distaibucién 1 Individues Asociar | = ~“ Distribseiin 2 Para analizar cada una de las situaciones combinaciones de estadizrafos de posici seiialadas en el parrafo anterior se utilizan las jén y dispersién, que permiten, en algunos ca- 308, olvidarse de las unidades de medidas en que cada tno de ellos se resume. Cooficiente de Variacion ‘Comparar de forma absoluta, estadipratos de posicién o de dispersién puede. en al- ‘gunos casos, acarrear confusiones porque, ‘por ejemplo, pueden estar expresados en distintas unidades de medida Por ejemplo, una distribucién donde el ‘menor ingreso es 1.000 y el mayor 1.100, es mucho mas homogénea, que otrs dis- tribucion donde el menor ingreso es 100 y el mayor 200. En el primer caso, la dife- tencia entre el dato menor y el mayor es un 10%, respecto del dato menor, El coeficiente de variacién o desviacié: puede tomar valores tan grandes como se mientras que en el segundo caso, la dife- rencia es de un 100%. Es necesario enton- ces, disponer de un esiadigrafo que tore en cuenta Ia tendencia central de la distri- bucidn. Se define asi el Coeficiente de Variscién (0 variabilided), como Ja razén entre la des- viaciOn tipica o estindar y la media arit- mética: Desv. Estandar CN. (Desv. Tipiea= ————— Media Aritmiética m tipica relative, como también se le Tlama, qniera, ya que no hay una relacién de depen- dencia entre la media y la desviacién esténdar. Por otra parte, en el caso de una distri- bucién donde la media aritmética fuera n para calificar la dispersion. Por ello, dich absolute del cociente entre la desyiacién estindar (©) y la media aritm: CcVv= iegativa, no tiene sentido considerar el signo 10 estadigrafo puede definirse como el valor ica (X ). Ee. => Veamos siguiente el ejemplo: El promedio aritmético de las remesas o embarques semanales de le fibrica A, durante el aio pasado, fue de 220 unidades y Ia desviacién estindar fue de 31. El mismo promedia de las remesas semanales de la fibrica B fue de 340 y su desviacidn estindar del. { En qué fibrica fue mayor la variabilidad de semana a semana? 4l —=0,12 340 B Del andlisis de los datos se refleja que la vanabilidad fue relativamente mayor en la fabrica A; aunque también se puede decir que las ventas en la empresa B son mas homogéneas, lo que significa por otra parte, que éstas -Ias ventas- son mas predecibles Para comparar observaciones individuales, provenientes de diferentes poblaciones, ¢s ttl usar un valor que, independientemente de Ia unidad de medida u compararse. Este estadigrafo se denomina puntaje z y se expresa como ae oO Por ejemplo, supongamos que se desean comparar los resultados relatives de las 2 fa. bricas anteriores, bastindose en los envios de una semane particular. Zz Durante ésta, supéngase que las remesas fueron de 290 piezas en A y de 388 en B Entonces: 290-220 A =2 2A) a 23 388-340 | aio 2(B) Batons en A los envios de la semana en euestién tuvieron 2,3 veces la desviacion eee de su media writmética. En B, les remesas tuvieron tinicamente 1,2 veces la desviaci6n esténdar por encima de su media aritméticn, Por lo tanto, puede decirse que, relat i te va que, relativamente, la fibrica A tuvo una semana mucho En algunos cases se requiere determinar, con un cierto grado de seguridad, a cual de ciertas poblaciones pertenece un particular individuo (dato). Pars tal efecto se pueden construir intervalos de la forma: [¥+ko] donde k es una constante. que puede asumir diferentes valores, los que determinan el grado de confianza que se tiene de que un determinado valor de la variable quede den- tuo del intervalo asi construido. ‘Algunos de los valores mas comunes son, cuando se asume que la poblacién tiene una distribucién aproximadamente normal. [¥-lo:i +10] ‘Sik = 1; el intervalo contiene al 67% de los datos. [x-20;¥ +26] Sik=2;el intwrvalo conticn al 95% de los datos. [¥-30;% +30] Sik~3; el intervalo contiene al 99% de los dates. jemplo: ‘Una empresa A vende mensualmente en promedio (MS) 3.248 y tiene una desviucion ‘estandar igual ao = (MS)63, Ora empresa B obtiene ventas mensuales promedio de (MB) 3.810y tiene tina desviacion estindar de o = (MS) 176. Veremos a continuacién que usando los intervalos de confianza podemos determinar con cierta seguridad (95%) a qué empresa pertenece una venta diaria de (MS) 3.700 * Intervalo de confianza Empresa A (MS): [3248 + 2*63] = [3122 ; 3374] = Intervalo de confianza Empresa B (MS): [3810 + 2*176] = [3458 ; 4162] Por lo tanto, con un 95% de confianza o seguridad, la venta mencionada pertenece a Ja empresa B, dado que 3.700. se encuentra entre los limites del correspondiente i tervalo de confianza, = Repita el proceso a un 65% y un 99% de confiabilidad. Comente los resulta- dos, ANALISIS DE RELACION ENTRE VARIABLES Una de las téenicas ussdas con’ mis fre- cuencia en investigacién ecandmica y co- ‘mercial para busear una relacién entre dos ‘0 mas variables, ligadas de un modo cau- sal, 6 el andlisis de regresién, que par- tiendo del caso mas simple y particular de dos variables, una de las cuales es pronos- ticada conociendo los valores de Ja otra, _ se puede llegar a la del caso de varias va- riables predietoras, conocido como regre- sion miiltiple, ‘Generalmente sucede que las personas mis altas son las de mayor peso, 1o que hace pensar que existe una relacién entre altu- ray peso. Qué clase de relacién es? Es proporcional 0 ,Existe alyiin otto tipo de relacién? Una de las téenicas estadisticas més usa- das es el undlisis de correlacién, madclo que se utiliza cuando las variables son u- méricas u ordinales. Este modelo se usa para 2 variables, denomindndose en este ‘e280 como correlacién lineal simple, el que se puede extender a mas de dos variables, fen Cuyo aso los coeficientes de correla- cin lineal simple se complementan con Jos de correlacién miltiple y parcial El andlisis de corretacion tiene dos aspectos: Como medida del grado de covariabilidad de dos variables Xe Y. y. Como medida de la bondad de ajuste de una recta de regresién a las observa- ciones. ‘También se puede desear conocer el gra- do de esa relaci6n (correlacién si las va- riables son numéricas 0 asociacién si ellas son atributos), mediante la medicion a tra- vésde un coeficiente que permita ordenar Jos grados de influencia par importancia que éstas tienen, Si este grado de relacion es elevado, se podria por ejemplo, con ta altura de la persons estimar 0 pronosticar, ccon bastante exactitud, su peso. De Ja misma manera pensemos en los ingresos y los gastos de consumo. Se sabe ‘que cuando aumentan los ingresos hay ten- encia a pastar mas. ;Que tipo de relacion existe entre los ingresos y los gastos de consumo? Es proporcional ode algiin otro tipo de relacion conocida? Fn segundo lugar Es muy estrecha esta relacion entre Tos ingresos y los gastos de consumo? - Coeficiente de Correlacién y Covarianza: Sean X © ¥ dos variables con una distri- Cov(X,¥) = Six-¥) -F), cuya formula de trabajo es: Cow X.Y) = xy El coeficiente de correlacién lineal sim- ple que se simboliza por: Cov(X:¥) 6-0, Sila relacion entre X e Y es lineal, enton- ces Cov(X,Y) > 0 0 Cov(X,¥) <0, impli- card que Xe Y covarian en la misma direc- cidn 0 en la opuesta respectivamente. a) Signifieado de la Correlacion: El coeficiente de corrclacién varia entre -l y +1. pasando por 0, |. magnitud del coeficiente indica el grado de relacién, y el signo sefiala la direccién (directa o in- versa) de dicha relacién, El coeficiente mas pequefio es 0,0 e indi- calla no existencia de relacion, De este mi- nimo el cocficiente aumenta en una de las 2 direcciones, hasta +1,0, cuando {a rela- iin es directa, y hasta -1,0 cuando la re= lacion es inversa. Hay que destacar que ambas eantidades (+1,0 y -1,0) indican igual grado de relacién y que ambas son Los valores de un caeficicnte de correla: cién no tienen significado absolute sino relativo, pues a veces wn coeficiente de 0.65, por ejemplo, nos indica que existe uuna gran correlacién, mientras que en otros ‘casos, puede indicar precisamente lo con- trario, Esto depende de la naturaleza de los fendmenos que se desea comparar, En lo que nos interesa, que es comparar Jos rendimientos en asignaturas diferen- tes, que podria significar un indice de confiabilidad de las pruebas aplicadas, al- unos autores sugieren como referencia la Perfectas, solamente que eh sentido con- tabla siguiente, pero con mucha flexibili- trario.. dad: de 0,80en adelante ...... muy alta correlacin de 0,60 a 0,79 ome alta correlacién de 0,40 2 0,59 alguna correlacion de 0,200.39 con. muy baja correlacién Nota: para cocficientes de correlaciéa negatives se usa la misma escala, pero en rela- cién inversa, De cualquier manera debe considerarse que la significacién de wn valor del coefi- siente de correlaciin, depende del tamaiio de Ia muestra con la que se est traba- Jando, Se suele también considerar lo que se llama coefictente de determinacién (R’), que se puede interpretar como el grado de explicaciOn de la variabilidad de una variable en funcién de la otra, cuando existe una variable dependiente y otra independiente Ejemplo: Fl gobiemo esta realizando un anilisis para determinar el grado de relacin que existe entre el ingreso y gasto familiar, suponiendo que la principal variante en el consumo ¢s ¢] ingreso, Para ello se tomé una muestra que arrojé los siguientes resulta- dos (MS): ay7 17330 X= 155 Y=110 5,213 5-164 280 17330-17050 = 280 r= ——————~0.8_ R’=0.64= 64% 21.3164 Cov(x,¥) Por lo tanto, dado los resultados del estudio y considerando que se trabajé con una muestra adecuada, se puede concluir que existe uns relacién muy alta entre los ingresos ¥ gastos familiares. Ademés esta relaciOn es direcia, Io que significa que si aumentan {os ingresos también aumentan los gastos o viceversa, También podemos decir que, una variaciOn en los gastos esta explicada en un 64% por una variacién en los ingresos, Por liltimo, esto quiere decir que también existen otras variables que influyen en los gastos(36%), pero la de mayor incidencia es el ingreso, isis de Regresién: El problema que se plantea es el de esta- blecer una relacién entre dos o mas va~ riables, en forma de una ecuacién, de tal Manera que, basindose en el conocimien- to de los valores de una o varias de ellas pueda conocerse el valor de la otra, Se pretende por lo tanto, realizar una predic ‘skin que permita pronosticar, lo mas acer- tadamente posible, la variable de interés. La variable (o variables) que se toma(n) ‘como base de estimacién se llama(n) ge- neralmente independiente(s), en tanto que la variable cuyo valor se va a estimar se llama variable dependiente, Cuando se formula una ccuacién para estimar ¥ 9 partir de X, semejante ecuacién se llama luna regresién de ¥ respecio de X. El anilisis de regresion se clasifica gene- ralmente en dos tipos; simple y miltiple. La regresiin simple es. aquella en que en- tran solamente 2 variables, La regresién miiltiple es aquella en que intervienen tres ‘o-més variables, una de las cuales es ta va- riable dependierite, la que se va a asociar con los valores de todas las demds. Se unalizard solamente el caso en que esia relacién sea lineal, es decir, que se pueda ‘justar a través de una recia ode un plano * ( hiperplano), va que en algunas ocasio- nes la relacion puede ser curvilinea, por lo que su relacion funcional puede ser una funcién de segundo grado 0 exponencial, Jogaritmica, ete, Cuando se analiza la relacién entre dos va- riables, suele ser deseable presentar los datos muestrales mediante un diagram de dispersi6n, que da una impresion visual de la posible relacién sugiriendo el tipo de mo- delo que puede ajustarse mejor los dati El procedimiento usual consiste en tomar la variable independiente X sobre el. eje horizontal y Ia dependiente ¥ sobre el eje vertical ‘Nube de Puntos Método de los minimos cuadrados El método mas comin para clog la recta es el de emninimi>s cuadrados». La expresi6n vrivimos cuadrados se debe a que la suma de cuadrados de las desviaiones verticales de los puntos respecto de esta recta, es menor que [a sums de los cuadradas de dichas desviaciones respecto de cualquier otra recta. sgesabe que una recia de estimacién: y*,=R, +B. 5 “queda completamente definida ser conocen los estadigrafos (coeficiete de posicion) interseceién con y. ¥ B, (coeficiente de regresion), pendicnte de Ia reets Los valores de B, ¥B,-que hacen lo mas pequeta posible lsum de Jos cuadrados de wea serene ene Tos valores teas y observados (J, 956 obtiene resolviendo el sistema: zy np, + B Be xy =B,2x +B, =x Desarollando esta expresion pueden también determimarse CT formulas para cl cél- vio de los parametros de la recta de regresion, que som las siguientes: cov (X,Y) g,-— B x Ejemplo: para determinar la relacién que existe ont Jos ingresos(x) y gastos(y) dentro be tae familias del pais, tenemos la siguiente recta de regresiOn exttaida de le informa- ‘jon muestral usando el método de los minimos cuadrados(MS): 37,6 + 0,5x _ Bleoeficiente de posicign 37.6, ss a intersencion com

También podría gustarte