Está en la página 1de 5
TECNICAS DE INVESTIGACION DE MODELOS ESTADISTICOS Por Foster Cady En sada experiment, el investigndor ss enfrents con el problema de descubrir su resultados itativos. El presente trabajo describe lor diferentes origenes las ctupas biscas tn le formulaciin det modelo estadistco; con un modelo estadistizo, cada abservaci6n realiznda fn nim expetimente puede darse a entender y el error al azar puede sefalarse. También, en ol ‘ojo $2 exponen slgunas téenieas para manejar diferentes tipos de modelos x se discuten ciertas complicciones en esta aperncin 2Qvé es UN moDELO? Un modelo matemético es una presentacién cuantitativa de un fendmeno de la naturaleza. Por ejemplo, se ha encontrado que la altura de fos niiios es una funcién lineal de la altura de los padres, o sea: w= a+ Bx. Fn economfa, una re- {acién que se usa comdnmente es el Cobb-Douglas, 4 = @X*, donde 4 es el valor verdadero de la salida, X es el valor dle la entrada y a y 8 son cocfcientes. En agronomia, una relacién entre el rendimiento y el fertiizante es la ecuacién fax rmosa de Mitscherlich, log a=log («— yu) = BX, donde «es el mayor sendimiento posible, jes el rendimiento verdadero que se obtiene de un nivel dado de X y 8 es un coeficiente. Nétese que éstos son modelos mateméticos. En cada modelo, la “variable dependiente” es y, el valor verdadero. Sisse trabaja todo el tiempo con los valores verdaderos, entonces no se tendrian problemas: se medirfan varias w's para los valores dados de las X's y entonces se resolverian para los coeficientes. Ahora bien, en las ciencias biolégicas y en las iencias sociales, no se puede medir y, pero se puede medir ¥, el valor observado. La relacin entre wy Yes: Yeute donde ¢ es un componente al azar. ‘Ast, la Rama de Fstadistica nacié con «. Podemos hablar acerca de un mo- delo estadistico, que es una descripcién cuantitativa de un valor observado. Com- prende fodas las componentes que son partes del valor observado, incluyende la «. Por ejemplo, aqui estén seis lépices nuevos. Queremos hacer una descripeién de cada valor medido del largo de cada lépiz. Cada valor medido serfa el mismo, excepto para el error al azar. El error al azar incluye cosas tales como la falla de Ta persona al leer los calibres correctamente, la falla de la fabrica al prodacir 1i- pices exactamente del mismo largo, ete. Entonces ¥% 2s la suma de dos cantidades: ute. Este es un modelo estadistico. Los dos componentes son los tinicos que se ne- cesitan para la descripeién de un valor observado. Sin embargo, supongamas que se ponen en agua tres lépices durante dos dias y tres lépices, no. Después de los 31 52 FOSTER CADY dos dias medimos los largos. {Cudl es el modelo, o cudl es la descripeién para ‘cualquiera de las obse Podriamos considerar que hay dos poblaciones: una poblacién de los lépices gue han estado en agua, y otra, de los que no han estado, Por consiguiente: x Sabemos que el error al azar esté presente; esto es, los tres valores de los lipi- ces en el agua serin diferentes y los tres valores para los otros lépices, también serin diferentes. Entonces: 12, Vy = mites 12,5, usualmente no nos gusta el modelo en esta forma y eseribimos: Yuet uw tes ° Yur ute te Usando este modelo, queremos calcular los estimadores y el andlisis de la va- rianza y hacer prucbas de hipétess. Obsérvese el orden de los pasos. El experiment —+ el modelo — la estima- cidn de los parémetros —+ el anilisis de la varianza — las pruebas de la hipé- esis. El orden es muy importante, El modelo depende del experimento. El and- lisis depende del modelo. Hay una correspondencia de uno a otro entre los pasos. Por ejemplo, el anilisis tiene que estar de acuerdo con el modelo: ellos son la mis- Podemos escribir el modelo en la forma de regresién miltiple: YoeeX ty uth Sete ° = Be Noi t Bi Nut B2 Xa +6 Fs conveniente usar modelos que puedan expresarse en la forma del modelo de regresin miltiple, porque sabemos oimo manejar este tipo de modelo. Usa- mos el método de los minimos cuadrados para encontrar los estimadores. Nétese que en este modelo, los pardmetros son lincales. En la Teoria Estadistica, sabe- ‘mos mucho acerca de las propiedades de los estimadores y cémo probar las fune ciones lineales de los mismos. Hay otra razén por la cual nos gusta este tipo de modelo: es muy flexible. Por ejemplo, es posible tener el siguiente modelo: Yi = BX oi + Bi Xi + Be Xai + 83Nsi + BN t 8s Xe t 6: donde Xu=3 yo Xw=¥ie De hecho, cualquier cosa puede usarse como’ y el modelo de regresién dard la relacidn lineal entre ¥’ y V ajustada para los otros factores en el modelo. MODELOS ESTADISTICOS 5a {Como se escRIse EL MopELO? De MANERAS DIFERENTES 1.—De wn experimento disefiade. Por ejemplo, en un disefio bloques al azar, sabemos que los factores importantes son los tratamientos ¥ las estratiicacio- nes del material experimental 2—De la teorta en algunos de los campos. Por ejemplo, Mitschedlich, basade cen observaciones en un invernadero, presenté la teoria de que la respuesta a un aumento dado de fertilizante era proporcional a la disminucién del rendimiento maximo, Mitscherlich formulé esta ecuacién diferencial: aX sa») De esta ecuacién, el modelo dado anteriormente se formula por integracién. 3.De lor datas. Unas veces la teoria no existe y otras el investigador es un poco perezoso. Por consiguiente, se coleccionan muchos datos antes de fijarse en Ja pregunta: {Cuél es el modelo? La decisién se toma poniendo todas las varia- bles en un programa de regresién miéltiple y se tiene el modelo, Los PROBLEMAS EN LA CONSTRUCCION ¥ USO DEL MODELO 1 Modelos no-lincales. Unas veces, el modelo que se formula de la teoria cen un campo resulta un modelo con un pardmetro que no es lineal. Por ejemplo, en la funcién Cobb-Douglas, Y = aX, nétese que el parimetro es un exponen- te. Por consiguiente, no es posible estimar los pardmetros en la manera que él acostumbra, 0 sea por el método de los mfnimos cuadrados. Hay en la literatura ‘otros caminos para la estimacién, pero hay problemas en estimar la varianza del parémetro no-lineal. Usualmente, se toma el log de ambos miembre: log Y= loga + Glog X ahora tenemos una ecuacin lineal donde el log « es la interaccién y 6 es la pen- diente de la relacidn lineal entre log Y y log X- Sin embargo, para probar una hipStesis acerea de los estimadores, necesitamos suponer que el error es aditivo en el modelo logaritmico, lo cual quiere decir que el error es multiplicativo en el primer modelo; esto es, Y= @ X* K. Un “ereor mul- tiplicativo” quiere decir que el error es proporcional a ¥. Esta es una suposicién que puede ser correcta en algunos casos, pero no aplicable a todos. El error para probar la vignificacién de los estimadores. 2a—-Kjemplo. Un experimento en que se usa un disefio bloques al azar para varias localidades. El anélisis para cada localidad es: Bloques =) ‘Tratamientos Wn Error 6-H) 54 FOSTER CADY las localidades se combinan: ol ECM. Localidades (Z). a-p Bloques /Z Mo) Tratamientos wp OH bo + bor TXL Q-DEHN FH b% Error w—-Hi-H Cuando los datos se manejan con el anélisis de la varianza, no hay problema cen saber cual es el uso correcto para probar. Los tratamientos se prueban contra T x Ly la interaccién se prueba contra el error. Sin embargo, cuando el anélisis se hace empleando un programa de regresién miiltiple, el programa normalmente usaré las desviaciones de regresién como error y probard todos los estimadores con el mismo error. 2b—Muchas veces al investigados se le olvida que las desviaciones de la regre- si6n, usando el programa de regresién miltiple, son una mezela de tipos diferentes del error, es decir, error experimental y error de muestreo. En un anilisis de la varianza, el investigador generalmente separaré estos dos tipos de error y usaré el ervor experimental para probar. Pero en muchos casos, usando et programa de regresién miltiple con un modelo, usaré las desviaciones de la regresin, que cons- tituyen principalmente error de muestreo, y no pensaré que usando este error re- sultardn mas estimadores significativos de los que hay realmente. 3.—Usando lor dator para encontrar el modelo. Una situacién. Un investiga- dor tiene unos datos y su escuela tiene una computadora. Sus datos incluyen una Y-y 20N’s, Entonces, sin pensar, se usa este modelo: Y= BNo+ BN + Ba Xot+ ... + Ba,No + Bi Este es el primer problema. Este modelo dice que la relacidn entre Y y cada Xes lineal. Quizds Xio es una variable importante pero la relacién no es lineal. Por consiguiente, el primer paso es hacer muchos diagramas para que las lacienes no lineales y las interacciones entre las variables puedan encontrarse. estad{stico puede ayudar, pero solamente el investigador puede describir el m delo. Después de este paso, todavia hay muchos problemas. Usualmente las varia- bles no son independientes en el sentido estadistico. Entonces, los estimadores de los pardmetros en el modelo a veces tienen valores que no son racionales. Por ejemplo, el investigador piensa que la relacién entre Y y Xs serfa positiva, pero cl estimador bs es negativo debido a las interrelaciones entre las variables X's. El investigador tiene que recordar que las veinte variables deben considerarse en con- junto y es muy dificil interpretar una variable aisladamente. La interpreta correcta de una 6 es la relacién entre ¥ y X ajustada por las otras variables en el modelo. Nada més. Supongamos que el investigador quiere empezar con las 20 variables, pero el rminando las que no son itonces, hace muchos modelos diferentes. MODELOS ESTADISTICOS Hay varios métodos para hacer esta reduccién en el mimero de las variables. Un articulo reciente de Biometrics (junio de 1966, pig. 268), compara cuatro métodos Todos étos tienen el problema de que, después de tratar muchos modelos, los ni- veles de significacién para probar los estimadores en cada modelo no son los nive les escogidas de 5 0 1%, porque el mismo conjunto de los datos se usa para est ‘mar los pardmetros en cada modelo. Una solucién es usar la mitad de los datos para encontrar el modelo reduc entonces, la otra mitad se usa para probar la significacién estadistica de los esti madores en el modelo final 4—Al probar que un cierto modelo ex suficiente. Una situacién, Un investi dor quiere proba que un modelo cuadratico es suficiente para describir la relacién entre ¥ y X; y Xz, por ejemplo, nitrogeno y fésforo. El modelo es: Vim Bo + 8X1 + Be Xe t+ BsNG + BNF + Bs Xi Xo t+ ei EI némero minimo de las combinaciones de tratamientos es seis. Sin embargo, con sélo seis observaciones © con repeticién de las mismas, el modelo ajusta los datos exactamente, Fl investigador debe tener més combinaciones de tratamientos para que haya oportunidad de que el modelo no ajuste los datos exactamente. Las repeticiones son necesarias para una estimacién del error ex Supongomos 15 combinaciones de tratamientos usados con dos repeticiones. El anilisis de la varianza es: ‘Modelo (no incluyendo la media) Falta de ajuste Error 1 Si la relacién # de falta de ajuste contra el error no es significativa, entonces el modelo cuadratico es suficiente. Referencias citudas Andnimo. 1961, Stetus ond methods of research in economic and agronomic aspects of fertiliser ‘esponse and use. Pablication 918. National Academy of Sciences. National Research Counel Washington, D.C Gaayoiin, Fexseiin. 1961. Jn introduction to linear statistical models. MeGraw Hill Co, Heapy, Eat 0. & Jows Le Dittox. 1961. Agricultural production functions, Towa State University Press, Ame, Towa. Mason, Davip D. 1956. Functional models and experimental designs Jor characterising response Turtes and surfaces, Chapter 3 fn “Methodological procedures in the economic analysis of fectilier use data.” Towa Stute University Press Ames, lova Warsi, Jon M. & O1ive Fray Doss, 1966, Elimination of sariates in Ginear diserimination problems. Biowseties, Vol. 22: 268 245,

También podría gustarte