Gab 2013

IV Encuentro Iberoamericano de Biometra y XVIII Reunin Cientfica del GAB
Mar del Plata, Argentina Septiembre 2013 0



Editor: Grupo Argentino de Biometra (GAB), Regin Argentina de la Sociedad Internacional
de Biometra: Calle 60 s/n, La Plata, Buenos Aires, Argentina. Personera Jurdica N 22.712

2013, Grupo Argentino de Biometra.

Editado por Mara del Carmen Romero, Claudia Marinelli y Roxana Cepeda. 1 Edicin. La
Plata, Grupo Argentino de Biometria, 2013.

ISBN: 978-987-23883-6-2

Organizan:

Grupo Argentino de Biometra.

Regin Argentina de la International Biometric Society.

Regin de Centro Amrica y del Caribe de la International Biometric Society.

Regin Espaola de la International Biometric Society.

Grupo Chileno de la International Biometric Society.

El Encuentro fue declarado de Inters Legislativo Provincial por la Honorable Cmara de
Diputados de la Provincia de Buenos Aires. (Decreto 1359/13-14-0)

El Encuentro fue declarado de Inters Turstico por el Ente Municipal de Turismo de la
ciudad de Mar del Plata con fecha 25 de junio de 2013 (N 314).

El Encuentro ha sido declarado de inters del Honorable Concejo Deliberante del Pdo. de
Gral. Pueyrredon (Resolucin: 3544)

El Ing. Agr. (Ph.D) Ral Edgardo Macchiavelli ha sido declarado Visitante Notable de la
Ciudad de Mar del Plata (Registro N O-15.731)

Fue declarado de inters acadmico por:
Facultad de Ciencias Econmicas (RCA N 212/2012), UNICEN.
Facultad de Ciencias Exactas (HCA N 382/2012), UNICEN.
Facultad de Ciencias Veterinarias (RCA N 038/2013), UNICEN.
Facultad de Ciencias Econmicas (OCA N 3.332/2012), UNMdP
Facultad de Ciencias Agrarias (OCA N 1667/2012), UNMdP
Instituto Nacional de Tecnologa Agropecuaria (INTA, Resolucin N 068/2013)


Auspiciantes

Agencia Nacional de Promocin Cientfica y
Tecnologa, a travs del FonCyT, RC2012 N
0145.

International Biometric Society

Advanta Semillas y Nutrisun Oil

Monsanto

InfoStat

Instituto Nacional de Semillas


COMISIN DIRECTIVA DEL GRUPO ARGENTINO DE BIOMETRA, REGIN
ARGENTINA DE LA IBS

Presidente: Julio Alejando Di Rienzo
Vicepresidente: Mara Gabriela Cendoya
Secretario: Silvia Shring
Tesorera: Mara Ins Urrutia

COMISIN DIRECTIVA DE LA REGIN DE CENTRO AMRICA Y DEL CARIBE DE LA
IBS
Presidente: Jhonny Demey
Vicepresidente: Luis Alberto Lpez

COMISIN DIRECTIVA DE LA REGIN ESPAOLA DE LA IBS

Presidente: Mara Luz Calle Rosingana
Vicepresidente: David V. Conesa Guilln
Secretario: Nuria Porta Bleda
Tesorera: Xavier Barber Valles

COMISIN DIRECTIVA DEL GRUPO CHILENO DE LA IBS

Coordinador: Francisco Torres
Secretario: Susana Eyheramendy
Tesorera: Francisco Torres


COMISIN ORGANIZADORA LOCAL
Mara Gabriela Cendoya
Beatriz Lupn
Mara del Carmen Romero

Claudia Marinelli
Rosana Cepeda
Sandra Pesciarelli
Silvia Agustinelli
Edgardo Rodrguez

COMIT CIENTFICO
Mnica Balzarini (Regin Argentina)
Sergio Bramardi (Regin Argentina)
Rodolfo Cantet (Regin Argentina)
Fernando Casanoves (Regin Argentina)
Rolando de la Cruz (Grupo Chileno)
Jhonny Demey (Regin Centro Amrica y del Caribe)
Julio Di Rienzo (Regin Argentina)
Susana Eyheramendy (Grupo Chileno)
Purificacin Galindo (Regin Espaola)
Jos Lus Gonzlez Andujar (Regin Espaola)
Luis Fernando Grajales Hernndez (Regin Centro Amrica y del Caribe)
Martn Grondona (Regin Argentina)
Ral Macchiavelli (Regin Centro Amrica y del Caribe)
Silvia Mazza (Regin Argentina)
Cristian Meza (Grupo Chileno)
Mara Gloria Monterubbianesi (Regin Argentina)
Laura Pla (Regin Centro Amrica y del Caribe)
Lila Ricci (Regin Argentina)
Silvina San Martino (Regin Argentina)
Francisco Torres (Grupo Chileno)


CONFERENCISTAS INVITADOS
Dr. Sergio Bramardi (Facultad de Ciencias Agrarias y Forestales,
Universidad Nacional de la Plata, Facultad de Ciencias
Agrarias, Universidad Nacional del Comahue,
Argentina)
Dra. Clarice Borges Demtrio (Departmento de Cincias Exatas, ESALQ,
Universidade de So Paulo, Brasil)
Dr. J. R. Demey (Laboratorio de Biometra y Estadstica, Instituto de
Estudios Avanzados IDEA, Caracas, Venezuela)
Dra. Purificacin Galindo (Departamento de Estadstica Universidad de
Salamanca. Salamanca, Espaa)
Dr. Raul Macchiavelli (College of Agricultural Sciences, University of Puerto
Rico, Mayagez, Puerto Rico)
Dr. Pablo Verde (Coordination Centre for Clinical Trials, Heinrich-Heine
University, Dsseldorf, Germany)
Lic. (MS.c) Elsa M. Rodrguez (Grupo Economa Agraria, Fac. de Ciencias
Econmicas y Sociales, UNMdP, Argentina)

IV CONCURSO DE JVENES BIOMETRISTAS
Coordinado por Silvia Shring, Ctedras de Estadstica y Diseo Experimental, Fac. de
Cs. Naturales, UNSalta, Argentina.

MESA DE ANLISIS DE DATOS
Coordinado por Teresa Boca, INTA Castelar, Argentina.

MINI CURSOS
"Splines con penalizaciones: teora y aplicaciones en bioestadstica".
Docente Responsable: Dra. Mara Durban Reguera.

QEco: una herramienta para el anlisis de comunidades ecolgicas.
Docentes Responsables: F. Casanoves, J. Di Rienzo, L. Pla, M. del C. Romero y S.
Vilchez Mendoza

ANLISIS IN-SITU
"Tcnicas de visualizacin en R".
Docente Responsable: Dr. Pablo Verde


"Curvas de sobrevida de fragilidad compartida en el anlisis de factores genticos y
ambientales asociados a la longevidad humana".
Docente Responsable: Dra. G. Garibotti.

"Anlisis de productividad de pasturas usando modelos mixtos en diseos complejos".
Se desarrollar en InfoStat.
Docentes responsables: F. Casanoves, R. Maquiavelli, J. Di Rienzo.

MESA REDONDA
"Anlisis Estadstico de Datos Genmicos".
Dr. Rodolfo Cantet. Dra. Luca Gutierrez.



INDICE DE RESUMENES EXTENDIDOS DE TRABAJOS

AJUSTES DE VALORES-P POR MULTIPLICIDAD EN EL CONTEXTO DE DATOS
DEPENDIENTES Y MAPEO ASOCIATIVO

Pea Malavera Andrea - Gutirrez Lucia - Balzarini Mnica ..... 297

ALTERNATIVAS METODOLGICAS PARA EL ANLISIS DE LA DISTRIBUCIN
DEL PESO DE PERAS CV. ABATE FETEL

Menni M. Fernanda - Gittins Cecilia. G - Calvo Paula C......... 167

ANLISIS DE AGRUPAMIENTO JERRQUICO PARA MUESTRAS DE
SECUENCIACIN DE ARN

Reeb Pablo - Steibel Juan P. - Bramardi Sergio ..... 310

ANLISIS DE DATOS LONGITUDINALES A TRAVS DE DISTANCIAS USANDO
ECUACIONES DE ESTIMACIN GENERALIZADA

Melo Sandra - Melo Oscar - Melo Julio ....... 218

ANLISIS DE LOS ESPACIOS DE REPRESENTACIN DEL ANLISIS
FACTORIAL MLTIPLE , STATIS Y ANLISIS DE PROCRUSTES
GENERALIZADO A PARTIR DE UNA APLICACIN EN EL CAMPO DE LA
AGRONOMA

Zuliani Roxanna - Fuentealba Jenny - Lavalle Andrea - Bramardi Sergio ...... 99

ANLISIS DE LOS FACTORES QUE AFECTAN EL USO DE SITIOS
POTENCIALES DE REPRODUCCIN DEL SAPITO DE LAS SIERRAS
(MELANOPHRYNISCUS AFF MONTEVIDENSIS) EN LOS RELICTOS DEL
PASTIZAL SERRANO

Cepeda Rosana - Marinelli Claudia - Simoy Veronica - Cortelezzi Agustina -
Berkunsky Igor - Kacoliris Federico ......

93

ANLISIS DE SENSIBILIDAD EN ESTIMADORES Y TESTS EN UN MODELO DE
CALIBRACIN COMPARATIVA HETEROSCEDSTICO

Gimnez Patricia ...... 112

ANLISIS DEL CONSUMO DE ALCOHOL EN ARGENTINA MEDIANTE UN
MODELO CON RESPUESTA CATEGRICA ORDENADA

Garca Arancibia Rodrigo - Depetris Guiguet Edith Rossini Gustavo Vicentin
Jimena ......
198

ANLISIS DEL PATRN DE RIQUEZA DE ESPECIES DE LAS CACTCEAS DE
ARGENTINA

Shring Silvia - Sajama Jess - Barrionuevo Andrea - Sosa Cecilia - Alonso
Pedano Mariana Gorostiague Pablo Vinante Diego - Ortega Baes Pablo ...

352

ANLISIS ESPACIO-TEMPORAL DEL CRECIMIENTO Y MORTALIDAD EN UN
BOSQUE ADULTO EN EL CENTRO-SUR DE CHILE

Salas Christian - Donoso Pablo Soto Daniel Gilabert Horacio Miranda
Marcelo ......

401

ANLISIS ESTADSTICO DE LA VARIACIN MORFOLGICA INTRAESPECFICA
EN BOSTRYX STELZNERI (DOHRN, 1875) (GASTROPODA:
STYLOMMATOPHORA: ORTHALICIDAE)

Miranda Mara Jos - Bentez De Parra Lidia Mara ....... 23



ANLISIS ESTADSTICO DE REPETITIVIDAD DEL NDICE DE SORCIN DE
FSFORO (ISP)

Pose Nlida Cendoya Mara Gabriela Zamuner Ester ..... 53

ANLISIS FACTORIAL, ANLISIS DEL IMPACTO Y TRI, EN LA CREACIN DE
VERSIONES CORTAS DE CUESTIONARIOS DE CALIDAD DE VIDA
RELACIONADA CON LA SALUD.

Vicente Galindo Enrique - Vicente Galindo Purificacin ........ 246

ANLISIS MULTIVARIADO PARA PREDICCIN EN CALIDAD DE LECHES
BOVINAS

Sancho Ana Mara Rossetti Luciana Rizzo Sergio Descalzo Adriana Mara. 360

ANLISIS MULTIVA PARA LA CARACTERIZACIN DE VARIACIONES
ESPACIALES MAGNTICAS DE SEDIMENTOS CONTAMINADOS DE LA BASE
MARAMBIO (ANTRTIDA)

Natal Marcela Chaparro Mauro Chaparro Marcos ....... 60

ANLISIS TEMPORO-ESPACIAL DE REPORTES DE ENTEQUE SECO EN LA
PCIA DE BS AS.

Passucci Juan - Moreno Fabiana Spth Ernesto Frade Virginia - Rodriguez
Edgardo, M. .........

121

APLICACIN DE ANLISIS MULTIBIPLOT A LA EVALUACIN DE RECURSOS
FITOGENTICOS

Marticorena Marta Bramardi Sergio - Defacio Raquel ...... 240

APLICACIN DE LA ESTRUCTURA FACTOR ANALYTIC EN EL ANLISIS DE
ENSAYOS MULTI-AMBIENTALES

Paccapelo Mara Valeria ...... 304

APLICACIN DE MTODOS CUASIEXPERIMENTALES PARA LA EVALUACIN
DE LA ASIGNACIN UNIVERSAL POR HIJO

Alegre Patricia - Fernndez Blanco Ana ....... 230

APLICACIN DE MODELOS LINEALES MIXTOS PARA EL ANLISIS DE LA
VARIABILIDAD ESPACIO-TEMPORAL DE PROPIEDADES DE SUELO
INTRALOTE

Crdoba Mariano - Bruno Cecilia Balzarini Mnica .. 288

APLICACIN DE MODELOS MIXTOS A LA EVALUACIN DE TCNICAS DE
VINCULACIN Y APRENDIZAJE NO TRAUMTICO EN POTRILLOS CRIOLLOS
BAJO CRA SEMI EXTENSIVA

Abbiati Nora Paz Sergio Flores Mariana Refojo Daniela .. 278

APLICACIN DEL MODELO TWEEDIE A UN ESTUDIO DE CONTAMINACIN DE
AGUAS

Patat Mara Laura Ricci Lila ...... 47

APLICACIONES ESTADSTICAS PARA EPIDEMIOLOGA EN EL SOFTWARE
INFOSTAT

Gonzlez Laura Tablada Elena Margot Perrachione Marcos - Muoz
Morales Duberney .......

216



RBOLES CONSENSO Y SU APLICACIN EN LA DETERMINACIN DE LA
ESTABILIDAD DE LOS GRUPOS OBTENIDOS EN UN ANLISIS CLUSTER

Soto Rodrigo - Vicente Villardn Jos Luis ...... 320

CALIDAD SENSORIAL DE CARNE BOVINA: EFECTO DEL BIOTIPO,
CATEGORA, EDAD Y MADURACIN

Pereyra Ana Mara Picallo Alejandra Beatriz Coss Mara Elena Coste
Elena Beatriz - Gambetti Paola Carolina - Fernndez Madero Julieta Rozen F.
B. - Rocha V. M. - Basso L.R . ..

282

CARACTERIZACIN ESPACIAL DE VARIABLES FISICOQUMICAS EN CINAGA
DE LAS QUINTAS UBICADA EN CARTAGENA, COLOMBIA.

Velandia Daira Luz Paternina Iliana Mara Farias Alessandra Valdelamar
Juan Carlos .......

155

CHAEA-32: PROPUESTA BASADA EN ANLISIS MULTIVARIANTES
Vega M Concepcin Patino M Carmen Vicente M Purificacin Galindo
Purificacin .......

210

CLASIFICACIN DIFUSA DE MORFOS LAGO Y RO DEL CAMARON
SAMASTACUS SPINIFRONS

Yaez Miguel Rudolph Erich Colihueque Nelson ......... 135

COMPARACIN DE COMPONENTES DE VARIANZA USANDO BASES DE
DATOS COMPLETAS E INCOMPLETAS MEDIANTE SIMULACIN

Ibaez Mercedes Alicia - Di Renzo Miguel Angel Balzarini Mnica Graciela . 170

COMPARACIN DE INCIDENCIAS DE CNCER EN BARRIOS DE BAHA
BLANCA ENTRE 2003 Y 2007

Serralunga Gabriela Yez Loreto Gonzlez Soledad ... 285

COMPARACIN DE LA MEDICIN DE PORCENTAJE GRASO CORPORAL EN
HUMANOS POR DOS MTODOS

Albeza Ramn E Snchez Diana C Fonseca Miriam B ....... 142

COMPARACIN DE SEIS MODELOS DE CURVAS DE LACTANCIA EN BOVINOS
HOLANDO Y HOLANDOXJERSEY EN ARGENTINA

Beribe Mara Jos Carignano Hugo - Roldan Dana - Lopez-Villalobos N
Raschia Mara Agustina Poli Mario .......

250

COMPARACIN DE TCNICAS DE ANLISIS MULTIVARIADO Y REDES
NEURONALES ARTIFICIALES CON DATOS DE CONJUNTOS MLTIPLES

Curia Lisandro Lavalle Andrea Bramardi Sergio - Costa Trtara Sabrina
Curti Ramiro ......

227

COMPONENTES PRINCIPALES RESTRINGIDAS Y NO RESTRINGIDAS
ESPACIALMENTE EN EL ESTUDIO DE ESTRUCTURA GENTICA DE UN
ENJAMBRE HBRIDO DE PROSOPIS SP.

Teich Ingrid Balzarini Mnica ......... 344

CONSTRUCCIN DE ENVELOPES PARA EVALUAR EL AJUSTE DE MODELOS
DE CONTEOS INFLADOS EN CEROS Y SU APLICACIN AL CONTEO DE UNA
ESPECIE DE AVE ANTRTICA

Alderete Mariela Del Carmen - Lencina Viviana Garca Borges - Demetrio
Clarice Singer Julio Orgeira Jos Luis ......

397


CREACIN DE UNA LIBRERA EN EL AMBIENTE COMPUTACIONAL R PARA EL
ANLISIS DE EXPERIMENTOS CON DIFERENTES ARREGLOS FACTORIALES

Dinon Mara Anabella - San Martino Silvina Monterubbianesi Mara Loria . 106

CULTIVO DE PECES EN JAULAS Y ANLISIS DE MODELOS MIXTOS COMO
HERRAMIENTAS PARA MEJORAR LA PRECISIN DE LAS ESTIMACIONES Y
DISMINUIR EL NMERO DE ANIMALES UTILIZADOS EN ENSAYOS DE
PISCICULTURA

Snchez Sebastin Ortiz Julio C. Santinn Juan J. Simn Jorgelina
Hernndez David R. Domitrovic Hugo A....

109

CURVAS DE CRECIMIENTO DEL PERMETRO CEFLICO EN NIOS DE 0 A 3
AOS. UNA NUEVA APROXIMACIN

Gonzlez Laila Yaned - Tejedor Fabio - Lpez Luis Alberto Infante Clementina 201

DETERMINACIN DE META-QTLS DE RESISTENCIA A LOS PRINCIPALES
PATGENOS DEL TOMATE (SOLANUM LYCOPERSICUM L.) MEDIANTE
ANLISIS IN SILICO

Balzano-Nogueira Leandro Santana Mara Anglica Carbonell Emilio
Demey Jhonny .........

390

DIFERENCIACIN SEGN COLOR EN MATERIALES GENTICOS DE GRANOS
DE MOSTAZA BLANCA

Vignera Mara Laura Filippini Olga Susana - Curioni Ana ...... 131

DIFERENTES ESTRATEGIAS DE MUESTREO EN UN PRONSTICO
TEMPRANO DE COSECHA EN VIAS

Llera Joaqun Antonio Morelli Mara Claudia Martinengo Nora Beatriz
Cnovas Laura Luca Galiotti Hugo Sosa Matas - Matus Susana ...

179

DISEO Y VALIDACIN DE UN INSTRUMENTO PARA MEDIR LA INTELIGENCIA
EMOCIONAL EN LOS ESTUDIANTES DE LA ESCUELA DE EDUCACIN DE LA
UNIVERSIDAD DE LOS ANDES (VENEZUELA)

Viloria Hermes Rangel Ilka Galindo Purificacin ...... 330

DISEOS PTIMOS A DOS VAS DE CLASIFICACIN SIN INTERACCIN CON
RESPUESTA BETA

Ramos Carlos Lpez Luis Alberto ...... 195

DISEOS PTIMOS PARA MODELOS CON RESPUESTA BETA EN
MODELAMIENTO CONJUNTO DE MEDIA Y PRECISIN

Zrate Mara Fernanda Lpez Luis Alberto ...... 151

EFECTO DE LA AUTOCORRELACIN ESPACIAL SOBRE LA ESTIMACIN DE
LOS PARMETROS EN LOS MODELOS DE PRESENCIA/AUSENCIA DE
ESPECIES

Cerezo Blandn Alexis Perelman Susana ........ 323

EFECTO DE LA AUTOCORRELACIN SOBRE EL TAMAO EFECTIVO DE
MUESTREO EN OBSERVACIONES ESPACIALES

Boca Rosa Teresa ........ 314

EFECTO DE LA PRESENCIA DE DATOS FALTANTES EN LA INTERPRETACIN
DE COMPONENTES DE VARIANZA DE LA INTERACCIN GENOTIPO POR



AMBIENTE
Prieto Victor Burgueo Juan ........ 213

EFECTO DEL ESTADO FISIOLGICO SOBRE VARIABLES REPRODUCTIVA EN
UNA LINEA MATERNAL DE CONEJOS

Fernndez Eduardo Birchmeier Ana - Abbiati Nora Martinez Rubn .... 260

EFICACIA DEL USO DE LA VENTILACIN NO INVASIVA EN LA UTIP DEL
HOSPITAL CASTRO RENDN: ANLISIS BAYESIANO DE PREVENIR EL USO
DEL RESPIRADOR MECNICO ARTIFICIAL

Morelli Candelaria - Caro Patricia Figueroa Laura ......... 161

EFICACIA RELATIVA DE MODELOS DE MAPEO ASOCIATIVO PARA VARIABLES
NO GAUSSIANAS

Gonzlez-Reymndez Agustn Gutirrez Luca Castro Ariel ..... 294

EFICIENCIA DEL TIPO DE DISEO SOBRE LA HEREDABILIDAD DE LA
RESISTENCIA A SCLEROTINIA DEL CAPTULO DE GIRASOL

Delgado Santiago German Cendoya Mara Gabriela Castao Fernando
Salaberry Teresa Quiroz Facundo ........

102

EL ANLISIS FACTORIAL MLTIPLE PARA TABLAS DE CONTINGENCIA EN
INDAGACIONES SOBRE EL INFINITO MATEMTICO.

Baccal Nora Montoro Virginia Juan Mara Teresa ...... 96

EL USO DE LAS TECNOLOGAS DE LA INFORMACIN Y LA COMUNICACIN
(TICS) EN EL PROCESO ENSEANZA APRENDIZAJE DE LA BIOESTADISTICA

Burbano Pantoja Victor Miguel Angel - Valdivieso Miranda Margoth Adriana
Pacheco Martha Del Pilar .......

41

ELASTICIDADES GASTO EN ALIMENTOS: ESTIMACION DE UN SISTEMA
CENSURADO DE DEMANDA

Rossini Gustavo - Depetris De Guiguet Edith - Garcia Arancibia Rodrigo ...... 355

ENSAYO DE UNIFORMIDAD EN POLLOS PARRILLEROS EN CONDICIONES DE
PRODUCCIN

Palacios Luciano Martnez Carla Filippini Olga Susana .. 118

ESTIMACIN VA REGRESIN NO LINEAL DEL TAMAO PTIMO DE
PARCELA EN EXPERIMENTO DE CAMPO CON BATATA

Humada Gonzlez Guido Gustavo - Ramalho De Morais Augusto - Caballero
Mendoza Csar Arnaldo - Rodrigues Liska Gilberto ......

183

ESTIMACIN DE ESCALAS CON CORRECCIN POR SESGO
Echeverra Luca - Pace Guerrero Ignacio Berges Miriam ......... 127

ESTIMACIN EN ENCUESTAS CON TELFONOS FIJOS Y MVILES: UNA
APLICACIN PRCTICA

Arcos Antonio Rueda Mara Del Mar Trujillo Manuel ....... 387

ESTIMACIN MXIMO-VEROSIMIL DE MODELOS DE DISPOSICIN A PAGAR
DE TIPO DOUBLE-BOUNDED

Brescia Vctor - Casellas Karina Lema Daniel ........ 380



ESTUDIO COMPARATIVO DE LA DINMICA DEL CRECIMIENTO DE UNA
POBLACIN PLAGA A TRAVS DE MTODOS DE CONTROL BIOLGICO,
UTILIZANDO MODELOS LINEALES GENERALIZADOS Y ANLISIS DE
SOBREVIVENCIA

Filippini Olga Susana Delfino Hugo Giorgini Diana Alejandra ............... 147

ESTUDIO DE LA EVOLUCIN DEL NDICE DE LIBERTAD ECONMICA EN
ARGENTINA USANDO BIPLOT DINMICO

Egido Jaime Galindo M Purificacin ........ 76

ESTUDIO TEMPORAL DEL NMERO DE ADMISIONES DE EMPLEADOS EN EL
BRASIL

Nakamura Edmilson Akiyoshi Nakamura Luiz Ricardo - Lpez Bautista
Ezequiel Quaresma Edilan De Sant'ana - Savian Taciana Villela ....

364

ESTUDIOS MORFOMTRICOS EN MIMOSA DIVERSIPILA (MIMOSOIDEAE,
LEGUMINOSAE)

Arenas Luis Morales Matas ....... 272

EVALUACIN DE LA INTERACCIN GENOTIPO-AMBIENTE DE HBRIDOS DE
MAZ MEDIANTE APROXIMACIN PARAMTRICA Y ANLISIS MULTIVARIADO

Corcuera Vctor Ral Kandus Mariana Salerno Juan Carlos - Moreno Ferrero
Vicente .......

176

EVALUACIN DE LA VARIABILIDAD GENTICA EN LNEAS DE MAZ MEDIANTE
ANLISIS DE CONGLOMERADOS

Kandus Mariana Corcuera Vctor Salerno Juan Carlos ....... 326

EVALUACIN DE PRADERAS DE ALGAS MARINAS MEDIANTE ANLISIS
FACTORIAL MLTIPLE. DOS DEFINICIONES PARA LOS GRUPOS DE
VARIABLES

Saravia Jos Ramn ....... 204

EVALUACIN DE TERNEZA MUSCULAR EN BOVINOS EMPLEANDO LOS
MTODOS TRADICIONAL Y PICROSIRIUS RED

Blanco Mara Del Rosario Abbiati Nora Rovegno Mara Soledad Marotta
Pablo ......

266

EXPLORACIN DE LA RELACIN ENTRE EL COEFICIENTE DE CORRELACIN
Y EL DIFERENCIAL DE SELECCIN DIRECCIONAL PARA SU USO EN META-
ANLISIS DE ESTUDIOS DE SELECCIN NATURAL

Palacio Facundo Ordano Mariano ...... 233

EXPLORANDO LA ESTIMACIN DE EFECTOS PRINCIPALES A PARTIR DE UN
CBC SOBRE EL CONSUMO DE PAPA FRESCA PRODUCIDA CON BAJO
IMPACTO AMBIENTAL

Lupn Beatriz Gonzlez Julia Rodrguez Elsa M. ...... 340

FACTORES ASOCIADOS AL RENDIMIENTO ACADMICO EN LA CARRERA DE
INGENIERA AGRONMICA DE LA UNNE

Gimnez Laura I. Almiron Mara Del Carmen Bobeda Griselda R.R.
Dalurzo Humberto ......

139

FUNCIN DISCRIMINANTE SOBRE LAS COMPONENTES PRINCIPALES EN
VARIABLES HEMORREOLGICAS DE PACIENTES DIABTICOS CON



LESIONES OCULARES
Vaira Stella Maris Contini Liliana Ester Carrera Larisa Ivn Etchepare Ral
Carrera Liza Natalia .........

317

GRFICO DE CONTROL DE REGRESIN APLICADO AL MONITOREO DE
NOTIFICACIONES DE CASOS DE SIDA EN EL ESTADO DE PAR (BRASIL)

De Mello Marcello Neiva Dias Carlos Tadeu Dos Santos - Lpez Bautista
Ezequiel Abraham Quaresma Edilan De Santana .....

372

HACIA UN ESTUDIO DE CARGA AMBIENTAL DE LA ENFERMEDAD
Snchez Diana Carolina ....... 207

IDENTIFICACIN DE FACTORES RELACIONADOS CON LA DIABETES E
HIPERTENSIN ARTERIAL EN LA POBLACIN DE SANTARM, PAR (BRASIL)

Quaresma Edilan De Sant'ana - Lpez Bautista Ezequiel Abraham - Nakamura
Luiz Ricardo - Neiva De Mello Marcello Dias Carlos Tadeu Dos Santos .

368

IDENTIFICACIN DE LIMITANTES A LA EXPRESIN DEL POTENCIAL DE
RENDIMIENTO EN GIRASOL EN URUGUAY MEDIANTE GGE BIPLOTS Y PLS
REGRESSION

Gonzlez Barrios Pablo Prez Osvaldo Castro Marina Ceretta Sergio
Vilar Diego Gutirrez Luca ......

236

IMPUTAO DE OBSERVAES EM EXPERIMENTOS GENTIPOXAMBIENTE
UTILIZANDO A DECOMPOSIO POR VALORES SINGULARES

Garca-Pea Marisol - Dos Santos Dias Carlos Tadeu ...... 115

IMPUTAO DETERMINSTICA EM EXPERIMENTOS MULTIAMBIENTAIS
Arciniegas Alarcn Sergio - Dos Santos Dias Carlos Tadeu ..... 124

INTEGRACIN ESPACIAL EN EL MERCADO INTERNACIONAL DE ACEITE DE
SOJA

Coronel Mariano Depetris Edith - Garca Arancibia Rodrigo ...... 263

INTENSIDADES DE MICROARREGLOS MODELADAS POR DISTRIBUCIONES
GPOT-NORMALES

Ricci Lila Kelmansky Diana ........ 44

INTERPRETACIN DE LA INTERACCIN GENOTIPO X AMBIENTE EN QUINOA
MEDIANTE EL USO DE REGRESIN POR MNIMOS CUADRADOS PARCIALES

Curti Ramiro Shring Silvia - Bramardi Sergio J. Andrade Alberto J. - De La
Vega Abelardo - Velzquez Berta - Costa Trtara Sabrina Bertero H.
Daniel ........

307

LA DISTRIBUCIN BETA GENERALIZADA COMO MODELO DE ANLISIS DE
SOBREVIVENCIA

Gonzlez Campos Jos Alejandro - Carvajar Muquillaza Cristian ...... 20

LA IMPORTANCIA DE LA INTERDISCIPLINARIEDAD ENTRE ESPECIALISTAS
DE LAS REAS DE SALUD Y ESTADSTICA: EXPERIENCIA EN EL ANLISIS Y
DISEO DE UNA BASE DE DATOS DE ANOMALAS CONGNITAS

Calfinier Gastn Carvajal Natalia Trinidad - Saso Mara Virginia Aranda
Gisella Daiana Silva Giselle Belen Torrecilla Marangel Caro Patricia -
Morelli Candelaria - vila Silvia - Ponce Zaldua Eugenia ........

164



MAPEO DE ASOCIACIN CON VARIANZAS HETEROGNEAS EN EL EFECTO
FENOTPICO

Bruno Cecilia Balzarini Mnica ....... 358

MODELACIN DE DATOS DE ELECCIN DISCRETA
Liseras Natacha Belmartino Andrea Berges Miriam ........ 35

MODELACIN DE LA ABUNDANCIA DE ECTOPRASITOS EN ROEDORES
MEDIANTE EL USO DE MODELOS LINEALES GENERALIZADOS
INFLACIONADOS DE CEROS

Avila-Proser Vladimir - Silva de la Fuente Ma. Carolina Moreno Lucila -
Gonzlez-Acua Daniel ......

144

MODELLING IN-VITRO GROWTH OF FILAMENTOUS FUNGI IN
PHENANTHRENE PRESENCE

Romero Mara Cristina Urrutia Mara Ines - Reynaldi Francisco J. Reinoso
Enso H. .......

275

MODELO AUTOREGRESIVO ESPACIO-TIEMPO LINEAL GENERALIZADO
BASADO EN DISTANCIAS CON PERTURBACIONES AUTOREGRESIVAS
ESPACIO-TIEMPO

Melo Oscar Melo Carlos Mateu Jorge ....... 186

MODELO CONDICIONAL PARA DATOS LONGITUDINALES APLICADO A
PREDICTORES DE XITO Y FRACASO EN LA VENTILACIN NO INVASIVA EN
LACTANTES

Caro Patricia Morelli Candelaria Figueroa Laura Laffaye Federico .... 192

MODELO LINEAL GENERALIZADO MIXTO PARA CONSTRUIR PRONOSTICO
DE PRODUCCIN DE VARIABLE DE RESPUESTA ORDINAL SUBJETIVA EN EL
ALTOVALLE DE RIO NEGRO Y NEUQUN

Gimnez Gustavo Rubio Natalia Tassile Valentn Lavalle Andrea Garca
Alberto .......

189

MODELO PARA LA DETERMINACIN DEL REA FOLIAR DE IPOMOEA NIL.
ROTH. USANDO MEDIDAS DE LAS HOJAS

Raa Erica Ochoa Mara Del Carmen Sobrero Mara Teresa Chaila
Salvador Leranoz Esteban ......

300

MODELO PARA LA DISPERSIN DE LA CLOROFILA EN EL LAGO DE VALENCIA
DE VENEZUELA, USANDO UNA TCNICA DE PARTCULA LAGRANGANA.

Farias lessandra Velandia Daira Len Jos Rafael ....... 158

MODELOS DE RESPUESTA ORDINAL BASADO EN VARIABLES
METEOROLGICAS PARA ESTIMAR NIVELES DE FUMONISINA B TOTAL (FBT)
EN GRANO DE MAZ QUE INGRESA A LAS TERMINALES PORTUARIAS DE LA
REGIN PAMPEANA

Sancho Ana Mara Rojas Dante Moschini Ricardo Filippini Olga Susana
Ricca Alejandra Patricia ......

348

MORPHOLOGYCAL INDEX TO ASSESS THE EFFECT OF CHROMIUM IN
HANSENULA SPP. CULTURES

Romero Mara Cristina Urrutia Mara Ines - Della Vedova Romina Reinoso
Enso H. ......

269



NUEVO ESTIMADOR PARA LA RAZN DE ODDS
Correa Morales Juan Carlos - Gonzlez Caas Carolina - Arredondo Meja Jhon
Eder .......

64

PERFORMANCE MEDIA Y ESTABILIDAD DE LINEAS DE SOJA VIA AMMI Y GGE
BIPLOTS

Rojas Elizabeth Bologna Susana Soldini Diego - Di Renzo Miguel Salines
Luis ........
86

PROBABILIDAD DE OCURRENCIA DE PRECIPITACIONES PLUVIALES
MXIMAS EN SAN LORENZO - PARAGUAY

Humada Gonzlez Guido Gustavo - Rodrigues Liska Gilberto - Ayala Aguilera
Lder Ramalho - De Morais Augusto .......

333

PROPIEDADES ORGANOLEPTICAS Y ALMACENAMIENTO DE CERVEZA. UN
MODELO FACTORIAL PARA SU ANLISIS

Contini Liliana Paonessa Adriana Scotta Marcelo Simoniello Fernanda
Avila Olga ......

221

REGIN DE SIGNIFICANCIA MEDIANTE PROCEDIMIENTO DE JOHNSON-
NEYMAN EN UN MODELO GLMM APLICADO A RESULTADOS
EDUCACIONALES EN CHILE

Araya Hctor Alibaud Sebastin ........ 224

REGRESIN GAMA APLICADA AL ANLISIS DE TASA DE GERMINACIN EN
SEMILLAS DE SOJA

Humada Gonzlez Guido Gustavo - Rodrigues Liska Gilberto - Ayala Aguilera
Lder - Ramalho De Morais Augusto ........

173

RELACIN PESO-DIMETRO DE FRUTOS EN VARIEDADES DE MANDARINA Y
LIMN DE LA PROVINCIA DE CORRIENTES

Bobeda Griselda Gimnez Laura Gaiad Jose Emilio Chabbal Marco
Montoya Alejandra Mazza Silvia ........

291

REPETIBILIDAD DE CARACTERES REPRODUCTIVOS DE PHALARIS
AQUATICA L. SU UTILIDAD EN LA SELECCIN DE PLANTAS PERENNES.

Spara Adriana Fernanda Abbott Liliana Alicia Vernengo Eduardo Anibal
Wolff Renata .........

26

RESPUESTA DEL ARROZ (ORYZA SATIVA L.) A LA APLICACIN DE 3 DOSIS
DE FSFORO, 2 FUENTES Y 4 NIVELES DE CALCIO

Lpez Bautista Ezequiel Abraham Quaresma Edilan De Santana Nakamura
Luiz Ricardo - De Mello Marcelo Neiva - Piedade Snia Mara De Stefano

376

REVISIN SISTEMTICA Y META-ANLISIS DE POLIMORFISMOS GENTICOS
Y RIESGO DE CNCER DE CABEZA Y CUELLO

Brunotto Mabel Bono Alejandra Zarate Ana Mara - Barra Jose Luis Berra
Silvina ........

32

SELECCIN DE ATRIBUTOS EN CLASIFICACIN SUPERVISADA. USO DE LA
ENTROPA CONDICIONAL

Romero Mara Del Carmen - Di Rienzo Julio Alejandro Clausse Alejandro .... 73


SELECCIN DE GENOTIPOS DE AGROPIRO ALARGADO POR NDICES DE
ESTABILIDAD FENOTPICA

Abbott Liliana Alicia Pistorale Susana ....... 29

SELECCIN DE PROTENAS RELACIONADAS A LA RESISTENCIA A
PATGENOS: UN ENFOQUE BIPLOT APLICADO A LA PROTEMICA
COMPARATIVA

Balzano-Nogueira Leandro Santana Mara Anglica - Diez Nardy - Galindo-
Villardn M. Purificacion - Vicente-Villardn Jos Luis Demey Jhonny ...

394

SELECCIN DE UN VOCABULARIO SENSORIAL ESPECFICO PARA EL
ANLISIS DE OLOR Y FLAVOR DE AJOS HORNEADOS

Pereyra Ana Mara Coste Elena Beatriz Picallo Alejandra Beatriz Altendorff
Laura ...................................

254

SOSTENIBILIDAD MUNDIAL VISTA DESDE LA PERSPECTIVA BIPLOT
Galindo Mara Purificacin Gallego Isabel Rodrguez Miguel ........ 50

THE ANALYSIS OF A THREE-WAY MULTIVARIATE DATA BY PARTIAL TRIADIC
ANALYSIS AND TUCKER3 MODEL: AN EXAMPLE ENRICHED WITH
ZOOPLANKTON DATA

Mendes Susana Galinndo Villardn M Purificacin Marques Snia
Azeiteiro Ulisses Maranho Paulo Leandro Srgio - Fernndez Gmez M
Jos .......

79

TREE-BASED METHODS IN THE ANALYSIS OF SURVIVAL DATA. APPLICATION
TO THE STUDY OF DISPARITIES IN SURVIVAL OF PEDIATRIC CANCER
PATIENTS

Garibotti Gilda Moreno Florencia Dussel Vernica Orellana Liliana ...... 70

UN MODELO DE REGRESIN PARA EL APRENDIZAJE COMO ESTRUCTURA
FUZZY

Manrquez Ronald - Gonzlez Jos ......... 38

UNA APLICACIN DEL MUESTREO SISTEMTICO Y DEL GRFICO DE
BURBUJAS PARA EVALUAR LA DISTRIBUCIN ESPACIAL DE LARVAS DE
MOSCA BLANCA BEMICIA TABACI (GENNADIUS) EN CULTIVO DE PIMIENTO
EN INVERNADERO EN LULES, TUCUMN, ARGENTINA

Arce Osvaldo Ernesto - Ghiggia Lelia Ins Macian Ana Josefina Fernndez
Juan Antonio Paz Myriam Rosana Jaime Adriana Patricia ........

90

UNA PRUEBA DE BONDAD DE AJUSTE DEL TIPO DE CORRELACIN-
REGRESIN Y SU APLICACIN A DATOS CON CENSURA DEL MEDIO
AMBIENTE

Castro Kuriss Claudia ...... 57

USANDO EL SOFTWARE R PARA LA CALIBRACIN: UNA COMPARATIVA
Arcos Antonio Rueda Mara Del Mar Molina David . 384

USO DE LA REGRESIN CUANTIL PARA ESTABLECER FACTORES
ASOCIADOS AL INCREMENTO DEL NDICE DE MASA CORPORAL EN NIOS
PREESCOLARES.

Angarita Adriana Henrquez Carlos Felipe - Prada Gloria Esperanza
Gutierrez Mnica Patricia .......

336


UTILIDAD DEL TEST DE APNEA EN EL DIAGNSTICO DE MUERTE
ENCEFLICA

Nez Myriam Ponteville Christiane Previgliano Ignacio Cabezas
Viviana Antik Ariel ........

243

UTILIZACIN DE DISEOS DE TESTIGOS APAREADOS EN MEJORAMIENTO
GENTICO VEGETAL

Bologna Susana Rojas Elizabeth Bongiovanni Marcelo - Martinez Alvarez
Diego - Escudero Sandra Rubira Franco .........

82

VALIDACIN DEL AUTOREPORTE DE ANSIEDAD EN NIOS Y
ADOLESCENTES CHILENOS NO CONSULTANTES. UNA APLICACIN DE
ECUACIONES ESTRUCTURALES

Schiattino Irene Silva Claudio Toledo Gloria - Von Mhlenbrock Soledad -
Aldunate Consuelo Larraguibe - Marcela ......

67

VENTAJA DE LA MODELACIN DE LA ESTRUCTURA DE COVARIANZAS EN UN
ENSAYO COMPARATIVO DE RENDIMIENTO

Aguate Fernando Crdoba Mariano - Balzarini Mnica ......... 257

INDICE DE CONFERENCIAS

BIOMETRA Y GENTICA: ANLISIS MULTIVARIADO A TRES MODOS PARA LA
CARACTERIZACIN DE RECURSOS FITOGENTICOS

Sergio J. Bramardi ...... 406

COMBINING PIECES OF EVIDENCE IN CLINICAL RESEARCHES AND META-
ANALISIS OF DIAGNOSTIC TEST

Pablo Verde ........ 417

CONSUMO DE ALIMENTOS SUSTENTABLES. DESAFOS PARA LA MEDICIN
DE ATRIBUTOS DE CALIDAD Y POSICIONAMIENTO EN EL MERCADO

Elsa M. Rodriguz .......... 409

DETECCIN DE QTLS A TRAVS DE TCNICAS DE META-ANLISIS
J. R. Demey ........ 416

FORMULATING MIXED MODELS FOR EXPERIMENTS, INCLUDING
LONGITUDINAL EXPERIMENTS

Chris Brien

- Clarice Demtrio ............
408

PARAMETRIC AND NON-PARAMETRIC MIXED MODELS FOR DISEASE
INCIDENCE AND SEVERITY: MODELIND PLANT DISEASES IN TROPICAL
CROPS.

Ral Macchivelli .......... 411

RECIENTES DESARROLLOS EN ANLISIS DE TABLAS DE TRES VIAS: DEL
COSTATIS al COTUCKER

M Purificacin Galindo-Villardn ........... 412



RESUMENES EXTENDIDOS DE TRABAJOS
PRESENTADOS



LA DISTRIBUCIN BETA GENERALIZADA COMO MODELO DE
ANLISIS DE SOBREVIVENCIA

Jos Alejandro Gonzlez Campos
1
, Cristian Carvajal Muquillaza
2

1
Universidad de Playa Ancha, Valparaso, Chile, Departamento de Matemtica y Estadstica,
Facultad de Ciencias Naturales y Exactas
2
Universidad de Playa Ancha, Laboratorio experimental de Saberes Matemticos y
estadsticos

labesam.upla@gmail.com

RESUMEN
Este artculo es una propuesta de un nuevo modelo para el anlisis de sobrevivencia, para
variables aleatorias con soporte limitado o compacto. Este trabajo busca ampliar el campo
de la modelacin, intentando cada vez ms atender a las caractersticas reales de los datos.
Proponemos el modelo beta generalizado, que es caracterizado y aplicado a un conjunto de
datos reales de abandono universitario de los estudiantes de la Universidad Estadual de
Campinas, UNICAMP, Brasil. Una caracterstica de mucho inters en incorporar el modelo
beta generalizado como un modelo de anlisis de sobrevivencia es su flexibilidad en la
modelacin, adems en el proceso de caracterizacin de sus momentos, se encuentran
expresiones cerradas, transformndose en un modelo definitivamente atractivo.

Palabras clave: Anlisis de Sobrevivencia, distribucin beta, Newton- Raphson,
Teorema de Fubini.

Introduccin
Particularmente cuando trabajamos con un modelo de vida o una funcin de sobrevivencia,
asociamos al modelo un soporte positivo, dando espacio a lo posible. Lamentablemente o
afortunadamente la infinitud no es parte de la actualidad, pues generalmente los soportes
son limitados, por ejemplo en la rea agrcola el momento de la cosecha define el limite
superior o el soporte del tiempo de vida [6]. Actualmente, se busca que los modelos puedan
representar fielmente las caractersticas y comportamientos de los datos, dejando de lado
caractersticas ideales como la simetra y pasando a proponer nuevos modelos que
efectivamente representen las caractersticas de los datos [3]. La distribucin beta
generalizada presentada es este artculo es referente a la generalizacin del soporte, lo que
es diferente a las generalizaciones presentadas por [1], la distribucin beta generalizada
exponencial presentada por [9], a la distribucin Beta-normal presentada por [8] y es
diferente del modelo de vida presentado por [9], pues en esos artculos, la generalizacin es
definida como una particular composicin de la beta con alguna distribucin, conociendo que
el recorrido de una distribucin es el intervalo [0; 1], es decir si G(x) es una funcin de
distribucin, entonces la generalizacin beta,
F (x), es expresada por: ( )
( )
( )
( )
1
1
0
1
1
,
G x
F x w w dw
B
|
o
o |

=
}
, donde ( ) , B o | , representa
la funcin beta. En la teora de probabilidades y estadstica, la distribucin beta representa
una familia de distribuciones de probabilidad continuas con soporte en el intervalo (0; 1). La
densidad beta es caracterizada por dos parmetros positivos, indicados generalmente por
o y | , que son parmetros de localizacin y escala. Ver por ejemplo [4],[5],[6] y [7]. Ella
puede tener variados comportamientos dependiendo del valor de los parmetros, desde
comportamientos simtricos hasta totalmente asimtricos. De manera natural interesa
extender estas propiedades a soportes diferentes, por esto es presentada una
generalizacin de la distribucin beta, para posteriormente caracterizarla como una funcin
de sobrevivencia.


El modelo
La distribucin beta generalizada nace de manera natural para dar flexibilidad al soporte de
la beta estndar, donde su funcin de densidad es definida como:
( )
( )
( ) ( ) ( )
( ) ( )
( )
( )
1 1
, 1
u v
X a b u v
u v
f x x a b x I x
b a u v

+
I +
=
I I
Donde, de la misma forma que en
el caso estndar, los parmetros u y v son positivos,
( )
( )
, a b
I x representa la funcin
indicadora del soporte, es decir
( ) , x a b e . La distribucin beta estndar ahora es una
situacin particular de la distribucin beta generalizada cuando (a; b) = (0; 1). Tambin es
posible observar que
( ) 0 x a > y
( ) 0 b x > , por tanto
( ) 0
X
f x > para todo
( ) , x a b e ,
finalmente
( )
( ) ( ) ( )
( ) ( )
1 1
1
1
b
u v
u v
a
u v
x a b x dx
b a u v

+
I +
=
I I
}
, mostrando que efectivamente es
una densidad.
Otro importante resultado de este trabajo es su relacin con otras variables aleatorias, como
muestra en siguiente cuadro.

Resultados y Conclusiones
Los datos corresponden a abandonos de los alumnos de la Universidade Estadual de
Campinas, UNICAMP, Brasil, entre los aos 2005 y 2010, con una muestra de n = 377
tiempos de abandono. La escala de los tiempos es semestral, en la cual cada semestre
indicado representa el tiempo en el cual el alumno abandona voluntariamente la carrera. El
soporte es asumido conocido, es decir b-a = 12.
La propuesta del modelo Beta Generalizado como modelo de vida es ampliar las
posibilidades de modelacin en problemas de anlisis de sobrevivencia y posibilitar el uso
de la flexibilidad de la distribucin beta en la modelacin, adems de eso el modelo beta
generalizado y en particular el modelo beta estndar ofrece una amplia variedad de


herramientas en la incorporacin de co-variables como es presentado en [2]. Una importante
conclusin de este trabajo es la entrega de una herramienta coherente con la filosofa
actual de modelacin, donde antiguamente los datos tenan que ser ajustados a un modelo,
mas ahora los modelos son los que deben ajustarse a los datos [3], luego pensar en
modelos de soporte infinito, para situaciones de esta tipo traen problemas de sub y sobre
estimacin.
En el grafico anterior es visualizado
el problema de la sub e sobre
estimacin, en donde la curva de
color rojo represente un modelo
tpico de anlisis de sobrevivencia
como es el caso del modelo log-
normal, la curva de color negro
representa el comportamiento real de
los datos y la curva de color verde el
ajuste producido por la densidad
Beta Generalizada, observemos que
en las fases iniciales de los
semestres de abandono, se produce
una sobre estimacin, lo que
naturalmente trae consecuencias
sobre la funcin de sobrevivencia y
de riesgo, lo que definitivamente
sita al modelo beta generalizado
como de mejor ajuste para este tipo
de problemas de anlisis de sobrevivencia con soporte limitado. Otra importante propiedad
de este modelo es la relacin que tiene con la generalizacin del teorema del binomio de
Newton y la generalizacin de la funcin hipergeomtrica, lo que permite tener expresiones
cerradas. Finalmente el conocimiento cerrado de los momentos de una variable aleatoria
Beta Generalizada, de forma simple, hace de este modelo ms atractivo para el proceso de
modelaje.

Bibliografa
[1] Cordeiro, G., Castellares, F., Montenegro, L., & de Castro, M. (2012): The beta
generalized gamma distribution, Statistics: A Journal of Theoretical and Applied Statistics.
[2] Ferrari S. & Cribari-Neto F.(2004). Beta regression for modelling rates and proportions,
Journal of Applied Statistics, pages 799-815.
[3] Arellano-Valle,R. Genton, M.(2005). On fundamental skew distributions. Journal of
Multivariate Analysis 96, 93-116.
[4] Oguamanam, D.C.D.; Martin, H.R., Huissoon, J.P. (1995). On the application of the beta
distribution to gear damage analysis. Applied Acoustics 45 (3): 247-261.
[5] Sulaiman, M.Yusof; W.M Hlaing Oo, Mahdi Abd Wahab, Azmi Zakaria (December 1999).
Application of beta distribution model to Malaysian sunshine data. Renewable Energy 18 (4):
573-579.
[6] Haskett, J.; Yakov A. Pachepsky (1995). Use of the beta distribution for parameterizing
variability of soil properties at the regional level for crop yield estimation. Agricultural
Systems 48 (1): 73-86.
[7] Gullco, R.; Malcolm A (December 2009). Use of the Beta Distribution To Determine Well-
Log Shale Parameters. SPE Reservoir Evaluation & Engineering 12 (6): 929-942.
[8] Eugene, N., Lee, C. and Famoye, F., (2002). Beta-normal distribution and its applications.
Commun. Statist. - Theory and Methods, 31, 497-512.
[9] Nadarajah, S. and Kotz, S. (2005). The beta exponential distribution. Reliability
Engineering and System Safety, 91, 689-697.



ANLISIS ESTADSTICO DE LA VARIACIN MORFOLGICA
INTRAESPECFICA EN BOSTRYX STELZNERI (DOHRN, 1875)
(GASTROPODA: STYLOMMATOPHORA: ORTHALICIDAE)

MARA JOS MIRANDA
1
, LIDIA BENITEZ DE PARRA
2

1
CONICET, Instituto de Biodiversidad Neotropical, Universidad Nacional de Tucumn
2
Facultad de Cs Naturales e I. M. Lillo, Ctedra de Matemtica, Universidad Nacional de
Tucumn

mirandamjo@hotmail.com

RESUMEN
Son muchas las especies de moluscos gasterpodos que presentan polimorfismo en su
morfologa de conchilla. Bostryx stelzneri (Dohrn, 1875), es una especie de gasterpodo
terrestre ampliamente distribuida en Argentina. Dicha especie exhibe gran variabilidad
morfolgica, sobre todo si se la considera en toda su rea de distribucin. A lo largo del
tiempo esta diversidad conquiolgica llev a que muchas de sus variaciones de forma sean
consideradas como subespecies o incluso especies distintas. Los objetivos de este trabajo
son: analizar cuantitativamente los caracteres de conchilla correspondientes a diferentes
variedades morfolgicas de B. stelzneri, a fin de determinar si existen diferencias
significativas entre ellas y determinar cules son las que permiten identificar a dichas
variedades. A tal fin se efectu la medicin de siete variables morfolgicas de conchilla en
especmenes adultos de distintas localidades. Los datos morfomtricos fueron analizados
mediante un anlisis discriminante, a travs del software InfoStat (versin 2010). Los
resultados indicaron que las especies B. stelzneri altispira y B. stelzneri peristomatus son
estadsticamente diferentes entre s y respecto a las dems entidades consideradas
(p<0,00001). Para las mismas el 100% de los datos resultaron bien clasificados, mientras
que para B. stelzneri hector y B. stelzneri stelzneri, solo fue del 80% y 88%,
respectivamente. La variable dimetro menor result la de mejor poder discriminatorio.

Palabras clave: Bostryx, polimorfismo, morfometra, anlisis discriminante.

Introduccin
Son muchas las especies de moluscos gasterpodos terrestres que presentan evidente
polimorfismo en la morfologa de su conchilla [8]. Tales variaciones han sido atribuidas a
diversos factores: ecolgicos, ambientales, seleccin natural por predadores, seleccin
sexual y diferencias genticas, entre otros [3], [14], [4], [2]. Si bien hace casi cien aos que
comenzaron a realizarse los primeros estudios referidos a la variacin en los patrones de la
conchilla de dicho grupo [3], la variabilidad conquiolgica en los moluscos de Argentina,
usualmente solo fue descripta en un estilo narrativo, con apenas algunos datos
morfomtricos [1]. A pesar de esto, las conchillas a menudo proporcionan datos
morfomtricos relevantes utilizados en taxonoma y en inferencia de relaciones filogenticas
[11].
Bostryx stelzneri (Dohrn, 1875), es una especie de molusco gasterpodo terrestre
ampliamente distribuida en reas xerfilas de Argentina (Catamarca, Jujuy, La Rioja, Salta,
San Luis y Tucumn). La descripcin original de esta especie fue realizada en 1875 por
Dohrn, como Bulimulus (Scutalus) stelzneri. Dicho autor resalt la existencia de gran
variabilidad morfolgica dentro de esta especie, sobre todo respecto a su tamao. Dicha
variabilidad es an mayor si se considera a la especie en toda su rea de distribucin. La
forma tpica de esta especie, B. stelzneri stelzneri (Dohrn, 1875) es considerada una forma
grande, ensanchada y a veces muy globulosa, de espira corta y que a veces puede
ofrecerse un tanto alargada [13]. Sin embargo, los caracteres conquiolgicos sealados para


esta entidad presentan gran variabilidad. A lo largo del tiempo esta diversidad conquiolgica
llev a que muchas de sus variaciones morfolgicas sean consideradas subespecies o
incluso especies distintas. As, Bulimulus (Scutalus) peristomatus Doering, 1879 y Bulimulus
hector Holmberg, 1909, fueron originalmente descriptas como especies distintas, en base a
sus caractersticas de cochilla. En 1945, Hylton Scott [10], realiz un estudio detallado de B.
hector e indic que los caracteres determinados, permiten identificar a esta especie como
subespecie de B. stelzneri. De la misma manera, Parodiz [13] realiz una comparacin entre
caracteres conquiolgicos de especmenes de B. peristomatus, B. hector y B. stelzneri, de
diversas localidades argentinas e indic que las mismas corresponden a variaciones de
Neopetraeus stelzneri (= Bostryx stelzneri), diferenciadas solo por su tamao.
Contrariamente, Miquel [12] indic que tales variaciones morfolgicas son propias de la
especie, sin atribuirles a stas un nivel taxonmico.
Los objetivos de este trabajo son: 1- Analizar cuantitativamente caracteres de conchilla de
diferentes variedades morfolgicas de la especie Bostryx stelzneri, con la finalidad de
determinar si existen diferencias significativas entre ellas, 2- Determinar cuales son aquellas
variables morfolgicas que diferencian e identifican a dichas variedades.

Materiales y Mtodos
Se examinaron tanto conchillas secas como especmenes conservados en alcohol de la
especie Bostryx stelzneri, depositados en la Coleccin Malacolgica del Instituto-Fundacin
Miguel Lillo, Tucumn, Argentina (IFML-UNT). Se encontr que parte de los ejemplares
examinados, previamente fueron identificados como B. stelzneri stelzneri, B. stelzneri
peristomatus, B. stelzneri hector y B. stelzneri altispira. El material restante, sin previa
identificacin, fue determinado taxonmicamente, en base a caracteres morfolgicos de
conchilla (forma de la misma, esculturas, forma de la abertura, etc.). A tal fin se emplearon
las descripciones originales de las distintas variedades mencionadas [7], [5], [9], [13] y se
realizaron comparaciones con material identificado y depositado en la Coleccin del IFML.
Las conchillas fueron examinadas bajo microscopio estereoscpico Leica MZ6.
Posteriormente se efectu el anlisis conquiliomtrico de las mismas, a travs del empleo de
un calibre de 0,05 mm de precisin (todas las medidas expresadas en mm). Las variables
consideradas fueron las estndar utilizadas en malacologa: Altura total de la conchilla (H),
Altura de la ltima vuelta (HBw), Altura de la espira (Hs), Dimetro mayor (DM), Dimetro
menor (dm), Altura de la abertura (Hab) y Dimetro de la abertura (Dab). Slo especmenes
adultos fueron incluidos en el anlisis, considerando como adultos a todos aquellos
especmenes cuyo peristoma se encuentra completamente formado. Se analizaron
especmenes de B. stelzneri hector procedentes de las localidades de Tumbaya y Tilcara
(Jujuy); especmenes de B. stelzneri peristomatus procedentes de Sierra de Pocho
(Crdoba); especmenes de B. stelzneri stelzneri procedentes de las localidades de
Tinogasta (Catamarca), Independencia y Chilecito (La Rioja), Cachi y Rosario de Lerma
(Salta) y especmenes de B. stelzneri altispira de Rosario de Lerma.
Se analizaron estadsticamente las cuatro entidades a fin de detectar si existen diferencias
significativas entre ellas, como as tambin determinar, de las siete variables consideradas,
cuales tienen mayor poder discriminatorio. Se us un anlisis discriminante ya que el mismo
es til para discriminar en base a las variables seleccionadas, grupos definidos a priori y
poder representar las observaciones en un espacio donde las diferencias entre los mismos
sean mximas. Este anlisis permite tambin determinar cul es el subconjunto de variables
que mejor explica la variabilidad entre los grupos. Muestra asimismo las tasas de error de
clasificacin (estimadores de la probabilidad de una mala clasificacin) obtenidas al
clasificar las observaciones en los grupos en cuestin, a partir del uso de la funcin
discriminante obtenida. Lo que resulta de gran importancia es poder clasificar nuevos
individuos en las entidades consideradas a priori, sobre la base de una regla de
clasificacin, que no es otra cosa que la funcin discriminante, combinacin lineal de las
variables independientes originales seleccionadas por su poder discriminante. A tal fin se
emple el software estadstico InfoStat [5].



Los resultados indicaron que B. stelzneri altispira y B. stelzneri peristomatus son
estadsticamente diferentes entre s y con el resto de las entidades consideradas
(p<0,00001). Para las mismas el 100% de los datos resultaron bien clasificados, mientras
que para B. stelzneri hector slo el 80% y para B. stelzneri stelzneri el 88% de
clasificaciones correctas fueron obtenidas. La variable dimetro menor (dm) result la de
mayor poder discriminatorio de dichas entidades entre s.

Bibliografa
[1] Cazzaniga, N.J., Piz, J., Ghezzi, N.S. (2005). Intraespecific clinal variation in
Plagiodontes patagonicus (Gastropoda: Orthalicidae, Odontostominae), an endemic species
from Argentina. Journal of Natural History, 39(24): 2203-2216.
[2] Chiba, S; Davison, A. (2007). Shell shape and habitat use in the North-west Pacific land
snail Mandarina polita from Hahajima, Ogasawara: current adaptation or ghost of species
past?. Biological Journal of the Linnean Society, 91: 149-159.
[3] Davison, A. (2002). Land snail as a model to understand the role of history and selection
in the origins of biodiversity. Population Ecology, 44: 129-136.
[4] Davison, A.; CHIBA, S. (2006). Labile ecotypes accompany rapid cladogenesis in an
adaptive radiation of Mandarina (Bradybaenidae) land snails. Biological Journal of the
Linnean Society, 88: 269-282.
[6] Doering, A. (1879). Apuntes sobre la fauna de Moluscos de la Repblica Argentina, 4.
Boletn Academia Nacional de Ciencias de la Repblica Argentina, 3: 63-84.
[7] Dohrn, H. Miscellen von H. Dohrn (1875). Als Fortsetzung der Zeitschrif fr
Malakozoologie Herausgegeben von Dr. L. Pfeiffer. Malakozoologische Blaetter, 22: 202-
203.
[8] Goodfriend, G.A. (1986). Variation in land-snail shell form and size and its causes: a
review. Systematic Zoology, 35: 204-223.
[9] Holmberg, (1909). Moluscos geophila Argentina nova. Apuntes Historia Natural, Buenos
Aires, 1: 9-12.
[10] Hylton Scott, M.I. (1945). Funula malacolgica de Tilcara. Revista Museo de La
Plata, (N. S.), 4 (zool. 28): 195-211.
[11] Madec, L., Bellido, A, Guiller, A. (2003). Shell shape of the land snail Cornu aspersum in
North Africa: unexpected evidence of a phylogeographical splitting. Heredity, 91: 224-231.
[12] Miquel, S.E. (1993). Las especies del gnero Bostryx Troschel, 1847 en la Repblica
Argentina (1ra. parte) (Gastropoda Stylommatophora: Bulimulidae). Archiv fr
Molluskenkunde, 121: 157-171.
[13] Parodiz, J.J. (1948). Contribuciones al conocimiento de los moluscos terrestres
Sudamericanos, 6. Comunicaciones Zoolgicas del Museo de Historia Natural de
Montevideo, 2 (46): 1-22.
[14] Schilthuizen, M. (2003). Sexual selection on land snail shell ornamentation: a hypothesis
that may explain shell diversity. Evolutionary Biology, 3: 13.



REPETIBILIDAD DE CARACTERES REPRODUCTIVOS DE
PHALARIS AQUATICA L. SU UTILIDAD EN LA SELECCIN DE
PLANTAS PERENNES

SPARA F.
1
; ABBOTT L.
2
; VERNENGO, E.
1
; WOLFF, R.
1

1
Departamento de Tecnologa, Universidad Nacional de Lujn
2
Departamento de Ciencias Bsicas, Universidad Nacional de Lujn

ferspara@yahoo.com.ar

RESUMEN
Phalaris aquatica L. es una especie forrajera perenne, que presenta una alta variabilidad
debida a su constitucin gentica (tetraploide), su reproduccin algama y su naturaleza
poco homognea. Segn diversos autores el proceso de domesticacin de falaris es muy
reciente, por lo que conserva caractersticas propias de especies no cultivadas, las que
muestran estrategias de supervivencia vinculadas con la dispersin de su semilla. Esto
afecta la recoleccin de semillas, por lo cual la especie es sometida a seleccin para
mejorar los caracteres reproductivos. El ensayo se realiz en el campo experimental de la
UNLu (Buenos Aires) durante 3 aos, en un DBCA con 10 tratamientos y 3 repeticiones. Las
mediciones se realizaron en noviembre y diciembre de 2010, 2011 y 2012. El objetivo del
trabajo fue obtener el coeficiente de repetibilidad y el coeficiente de determinacin fenotpica
para los caracteres: nmero de panojas (NP), largo de hoja bandera (LHB), ancho de hoja
bandera (AHB), largo de panoja (LP), peso de panoja (PP), nmero de semillas por panoja
(NS) y peso de 1000 semillas (P1000). El coeficiente de repetibilidad se calcul a partir del
nmero de mediciones y de los cuadrados medios de la varianza genotpica y ambiental,
obtenidos de un ANOVA simple. Los coeficientes de repetibilidad fueron: 0,61 para NP, 0,65
para LHB, 0,70 para AHB, 0,88 para LP, 0,37 para PP, 0,63 para NS y 0,88 para P1000. Los
valores confirman cierto grado de influencia del ambiente. El coeficiente de determinacin
genotpico fue alto para todos los caracteres (entre 0,82 y 0,95), salvo para PP que fue de
0,63. Este carcter no se presta para una seleccin exitosa. Tres mediciones repetidas
resultaron suficientes para proporcionar una confiabilidad de 85% a los datos utilizados para
la seleccin de los mejores clones, excepto para PP, donde sera necesario realizar 10
mediciones.

Palabras clave: mejoramiento gentico, repetibilidad, Falaris.

Introduccin
Phalaris aquatica L. es una especie forrajera perenne, que se caracteriza por una alta
variabilidad debida a su constitucin gentica tetraploide, a su reproduccin algama y a su
naturaleza poco homognea. Segn diversos autores nacionales y extranjeros, el proceso
de domesticacin de falaris es muy reciente (Oram et al., 1985; Bertin y Rosso, 1991), por lo
que conserva algunas caractersticas propias de las especies no cultivadas, las que suelen
presentar estrategias para su supervivencia vinculadas con la dispersin de su semilla.
Estos mecanismos afectan de manera negativa a la recoleccin de la semilla. Debido a esto
la especie ha sido sometida a procesos de seleccin para caracteres reproductivos.
La naturaleza poco homognea que caracteriza a esta especie despert el inters por
aplicar el coeficiente de repetibilidad, ms utilizado en el mejoramiento animal (Cardellino y
Rovira, 1987), a los datos obtenidos en esta forrajera perenne, a fin de conocer el grado de
confianza que se les puede otorgar en el momento de seleccionar cada uno de los
caracteres.
El coeficiente de repetibilidad se define como el coeficiente de correlacin entre medidas
repetidas sobre un mismo individuo, por ejemplo cada ao en la misma estacin. Esto
permite reducir la incidencia del ambiente temporario respecto al genotipo evaluado. Su


valor vara de 0 a 1, siendo 1 cuando el carcter se expresa con mxima constancia
(Resende, 2002). Valores altos de repetibilidad para determinado carcter indican que es
posible predecir el valor real del individuo utilizando un nmero relativamente pequeo de
mediciones (Cagnelutti y Castilhos, 2004).

Materiales y Mtodos
El ensayo se realiz en el campo experimental de la Universidad Nacional de Lujn (Lujn,
Buenos Aires), durante 3 aos, en un DBCA con 10 tratamientos (clones) y 3 repeticiones.
Las mediciones se realizaron en noviembre y diciembre de 2010, 2011 y 2012. El clima se
caracteriza por ser templado y hmedo, aunque durante el ao 2011 se registraron escasas
lluvias, provocando una sequa importante desde julio hasta fines de ese ao.
Los caracteres reproductivos medidos en cada clon fueron: nmero de panoj as por planta
(NP), largo de hoja bandera (LHB), ancho de hoja bandera (AHB), largo de panoja (LP),
peso de panoja (PP), nmero de semillas por panoja (NS) y peso de 1000 semillas (P1000).
Segn el carcter evaluado, el dato por planta es el valor promedio de varias mediciones.

El coeficiente de Repetibilidad se calcul a partir del nmero de mediciones y de los
cuadrados medios de la varianza genotpica y ambiental, obtenidos de un ANOVA simple.

= Cuadrado medio de los clones
= Cuadrado medio del error
= Nmero de mediciones = 3

Tambin se calcul el coeficiente de determinacin genotpico , que indica el porcentaje
de certeza de la prediccin del valor real de los individuos seleccionados en base a n
mediciones, as como el nmero de mediciones necesarias para diversos valores de
confiabilidad.

En la Tabla 1 se presentan los resultados para los caracteres evaluados durante 2010 a
2012.
Los caracteres que mostraron alta Repetibilidad fueron LP, P1000 y AHB, todos con un
elevado coeficiente de determinacin genotpica ( 0,87).
Los resultados de ste anlisis permiten poner en evidencia la naturaleza variable en la
expresin de varios de los caracteres estudiados. El carcter con menor repetibilidad es sin
duda el peso de la panoja (PP), lo que se debe a que la panoja tiende a desarticularse a la
madurez y por tanto a no retener la semilla.



TABLA 1. Valores del coeficiente de repetibilidad , de determinacin genotpica y
nmero de mediciones de los caracteres reproductivos evaluados durante los aos
2010 a 2012.

Carcter

80% 85% 90% 95%
N de panojas 0,61 82,43 2,56 3,62 5,75 12,15
Largo hoja bandera 0,65 84,78 2,15 3,05 4,85 10,23
Ancho hoja bandera 0,70 87,50 1,71 2,43 3,86 8,14
Largo de panoja 0,88 95,65 0,55 0,77 1,23 2,59
Peso de panoja 0,37 63,79 6,81 9,65 15,33 32,35
N semillas/panoja 0,63 83,63 2,35 3,33 5,29 11,16
Peso 1000 semillas 0,88 95,65 0,55 0,77 1,23 2,59

Con 3 mediciones repetidas se obtiene un 85% de confiabilidad al evaluar el carcter, y esto
fue as para todos los caracteres estudiados salvo el peso de la panoja (PP), para el cual
deberan tomarse al menos 10 mediciones repetidas.
Se concluye que el coeficiente de repetibilidad es muy til en este tipo de plantas perennes,
porque orienta la seleccin en cuanto a la confiabilidad de los valores obtenidos. En este
experimento los resultados son satisfactorios para todos los caracteres excepto para el peso
de la panoja, para el cual una seleccin no tiene inters prctico ni dara avances
importantes en la mejora del carcter.

Bibliografa
Bertn, O. y Rosso, B. (1991). Evaluacin de cultivares de Phalaris aquatica L. en la
produccin de semilla. Estacin Experimental Agropecuaria de Pergamino. INTA. Informe
Tcnico N 249: 14 pp.
Cardellino, R. y Rovira J. (1987). Mejoramiento Gentico Animal. Editorial Agropecuaria
Hemisferio Sur. Montevideo, Uruguay. Cap. 7.
Cargnelutti, A. e Castilhos, Z.M. (2004). Anlise de repetibilidade de caracteres forrageiros
de gentipos de Panicum maximum, avaliados com e sem restrio solar. Cincia Rural,
Santa Maria, v. 34, p. 723-729.
Oram, R.N., Schroeder H.E. and Culvenor, R.A. (1985). Domestication of Phalaris aquatica
L. as a pasture grass. XV International Grassland Congress: 220-221.
Resende, M.D. (2002). Gentica biomtrica e estadstica no melhoramento de plantas
perennes. Brasilia: Embrapa Informacao Tenolgeca, 975p.



SELECCIN DE GENOTIPOS DE AGROPIRO ALARGADO POR
NDICES DE ESTABILIDAD FENOTPICA

LILIANA ABBOTT
1
, SUSANA PISTORALE
1

1
Universidad Nacional de Lujn, Departamento de Ciencias Bsicas

genetica@unlu.edu.ar

RESUMEN
En los programas de mejoramiento gentico, el conocimiento de la interaccin genotipo-
ambiente es de gran importancia en la fase de seleccin y recomendacin de cultivares. Sin
embargo, no proporciona informacin detallada sobre el comportamiento de cada cultivar
debido a las variaciones ambientales. Por lo tanto, el anlisis de la estabilidad fenotpica se
vuelve necesario para la identificacin y recomendacin de materiales de calidad superior en
entornos diferentes. El anlisis de la estabilidad es un procedimiento estadstico que permite
identificar cultivares de comportamiento ms estable y que respondan previsiblemente a las
variaciones ambientales. Varios mtodos estadsticos han sido propuestos y son
importantes porque proveen informacin sobre el comportamiento de cada genotipo en cada
ambiente. Fueron evaluados 16 genotipos de agropiro alargado en un DBCA con tres
repeticiones. Por planta individual se analiz la produccin de materia seca en cinco cortes
durante 2010 y 2011. La interaccin genotipo-ambiente fue altamente significativa e indica
un comportamiento diferencial de los genotipos evaluados en los cinco cortes. Una vez
comprobada la interaccin se aplicaron los siguientes metodologas para evaluar la
estabilidad: el ndice de superioridad de Lin & Binns, el ndice de Huehn (no paramtrico), la
ecovalencia de Wricke, el ndice de Annicchiarico, el ndice Tradicional de Yates & Cochram
y el mtodo de Eberhart & Russell. Los resultados obtenidos muestran que los ndices de
Lin & Binns, Annicchiarico y Tradicional coincidieron en sealar como ms estables los cinco
genotipos que tuvieron un rendimiento superior a la media general. Considerando que las
tres metodologas son fciles de aplicar e interpretar se sugiere su uso para seleccionar
genotipos de agropiro alargado en programas de mejoramiento gentico.

Palabras clave: interaccin genotipo-ambiente, produccin de materia seca,
mejoramiento gentico.

Introduccin
Para una efectiva seleccin de los recursos vegetales, en los programas de mejoramiento
gentico existe la necesidad de evaluar y describir sus variaciones. Debido a que la mayora
de los caracteres de importancia agronmica presentan distribucin contina, poseen
herencia polignica y son muy influenciados por las variaciones del ambiente resulta
necesario conseguir la mxima informacin sobre las diferencias genticas entre genotipos y
sus respuestas en diversos ambientes. Esto se denomina interaccin genotipo-ambiente e
indica que el comportamiento de los genotipos no fue consistente a travs de los ambientes
(Ferreira et al., 2006). En este sentido, cuando el fitomejorador detecta interaccin, para
asegurar el xito de su recomendacin requiere hacer un estudio ms detallado referente a
la estabilidad fenotpica de los genotipos. Cruz y Regazzi (2001) definen la estabilidad como
la capacidad que tienen de mostrar un comportamiento altamente previsible de acuerdo con
el ambiente.
Las pruebas de estabilidad hacen posible identificar genotipos de inters y la eleccin del
mtodo para la caracterizacin de los genotipos depende de los datos experimentales
disponibles, de la precisin requerida y del tipo de informacin deseada por el mejorador. Es
importante que se utilice ms de un mtodo pues cada uno presenta peculiaridades que
pueden contribuir a mejorar el anlisis y, en algunos casos, los mtodos pueden ser
complementarios entre s (Pereira et al., 2009).


En este trabajo fueron utilizados siete mtodos de anlisis de la estabilidad fenotpica para
la produccin de materia seca de agropiro alargado.

Materiales y Mtodos
Fueron evaluadas diecisis genotipos de agropiro alargado usando un DBCA con tres
repeticiones y siete plantas por genotipo para determinar la estabilidad de la produccin de
materia seca en cinco fechas de cosecha. Los mtodos analizados fueron: (1) ndice de
superioridad de Lin y Binns calculado a partir de la suma de cuadrados de las diferencias
entre un genotipo y el genotipo de mayor rendimiento en un ambiente dado. Con este
mtodo, la mxima respuesta en un ambiente se convierte en el testigo a considerar. Se
calcula con la siguiente ecuacin: . (2) El ndice de Huehn (no paramtrico)
se basa en la asignacin de rangos por ambientes, se calcula la suma de diferencias
absolutas de los rangos del genotipo i con respecto a otros genotipos a travs de los
ambientes y la varianza entre rangos del genotipo i sobre ambientes. Una variedad es
clasificada como estable si sus rangos son similares a travs de ambientes y presentan
mnima varianza. La frmula para el clculo es: . (3) La
ecovalencia de Wricke proporciona la contribucin de cada genotipo, en todos los
ambientes, a la suma de cuadrados de la interaccin, se calcula
segn . (4) El ndice de estabilidad de Annicchiarico estima
la probabilidad de cada genotipo de presentar medias superiores a un estndar fenotpico
preestablecido, el cual generalmente considera la media general de los experimentos. Se
estima con la siguiente frmula: . (5) El mtodo Tradicional propuesto por
Yates & Cochram consiste en una estimacin de la variacin de ambientes dentro de cada
genotipo, segn la siguiente frmula: . (6) El mtodo de Eberhart &
Russell se basa en el anlisis de la regresin lineal simple. Estima la varianza de las
desviaciones de la regresin de cada genotipo y representa una medida de variabilidad,
interpretada como falta de estabilidad. Los desvos se calculan segn la siguiente frmula:
.

El anlisis de variacin conjunta revel diferencias altamente significativas para ambientes,
genotipos y la interaccin genotipo-ambiente. El efecto significativo de la interaccin revel
que los genotipos presentaron comportamiento diferenciado en las distintas fechas de
cosecha lo que justifica los anlisis de estabilidad. En la Tabla 1 se muestran los valores de
los ndices de estabilidad calculados.

Los ndices de Lin & Binns, Annicchiarico y Tradicional coincidieron en sealar como los
ms estables los mismos cinco genotipos que a su vez tuvieron un rendimiento superior a la
media general. Scapin et al. (2000) sostiene que la metodologa de Lin & Binns puede ser
una buena alternativa para evaluar el rendimiento de un cultivar en la presencia de
interaccin genotipo ambiente. La definicin de superioridad es similar a la definida en los
objetivos de un programa de mejoramiento ya que un cultivar superior debera estar entre
los ms productivos en el mayor nmero posible de ambientes.



Tabla 1. Coeficientes de estabilidad fenotpica para la produccin de materia seca de
agropiro alargado evaluados en cinco cortes durante dos aos. Media general = 191,17 g.
Los valores entre parntesis indican el ranking.

Genotipo Media R

R

R

R

R

R

R
125 185,85 10 4,58 9 0,78 1 92,78 10 6,32 9 11,75 9 6,36 7
137 194,29 8 3,36 7 5,15 12 96,82 8 7,24 6 35,50 15 14,97 16
513 188,52 9 3,84 8 1,76 4 93,98 9 6,74 8 17,25 14 8,70 13
530 248,79 1 0,34 1 24,71 16 124,33 1 11,01 1 31,50 14 6,56 9
68 227,63 3 1,50 3 3,81 7 114,24 3 8,20 3 5,50 3 7,40 11
79 229,83 2 1,12 2 5,92 13 115,22 2 8,61 2 11,00 8 9,25 15
88 225,54 4 2,35 4 1,13 2 113,46 4 7,53 4 4,00 2 7,08 10
680 167,90 12 9,72 12 5,00 10 84,14 12 4,40 12 10,00 6 1,44 3
91 178,96 11 10,01 13 8,21 14 90,29 11 4,37 13 44,75 16 1,07 1
106 166,12 13 9,66 11 4,49 9 83,34 13 4,41 11 14,75 10 3,76 5
107 207,45 6 4,67 10 1,48 3 104,43 6 6,25 10 18,50 12 6,39 8
120 206,53 7 2,97 6 2,15 6 103,43 7 7,17 7 9,00 5 1,32 2
431 142,64 15 11,77 15 4,07 8 71,07 15 3,92 15 0,75 1 9,14 14
450 111,91 16 21,28 16 24,13 15 55,94 16 2,22 16 8,50 4 5,93 6
606 212,01 5 2,69 5 2,12 5 106,28 5 7,34 5 10,75 7 2,74 4
10 164,95 14 10,10 14 5,11 11 82,81 14 4,27 14 29,00 13 7,89 12

= ndice de Lin & Binns = Ecovalencia de Wricke
= ndice de estabilidad de Annicchiarico = Mtodo Tradicional
= ndice de estabilidad de Huehn = Eberhart y Russell

En negrita, los cinco genotipos ms estables segn cada mtodo

Bibliografa
Cruz, C. D. e A. J. Regazzi. 2001. Modelos biomtricos aplicados ao melhoramento
gentico. Universidade Federal de Viosa. Ed. UFV. Viosa, Minas Gerais, Brasil.
Ferreira, D. F.; Demtrio, C. G. B; Manly, B.F.J.; Machado, A. A.; VENCOVSKY R. (2006).
Statistical models in agriculture: biometrical methods for evaluating phenotypic stability in
plant breeding. Cerne, Lavras, (12): 373-388.
Pereira, H.S.; Melo, L.C.; Faria, L.C. de; Del Peloso, M.J.; Costa, J.G.C. ; Rava, C.A.;
Endland, A. 2009. Adaptabilidade e estabilidade de gentipos de feijoeiro-comum com gros
tipo carioca na Regio Central do Brasil. Pesquisa Agropecuria Brasileira, (44): 29-37.
Scapin, C.A.; Olivera, V.R.; Braccini, A.L. Cruz, C.D.; Andrade, C.A. and Vidigal, M.C. 2000.
Yield stability in maize and correlations among the parameters of the Eberhart and Russell,
Lin and Binns and Huehn models. Genetics and Molecular Biology (23): 387-393.



REVISIN SISTEMTICA Y META-ANLISIS DE POLIMORFISMOS
GENTICOS Y RIESGO DE CNCER DE CABEZA Y CUELLO

BRUNOTTO M
1
, BONO A
2
, ZARATE AM
1
, BARRA JL
3
, BERRA S
4

1
Departamento de Biologa Bucal y
2
Departamento Patologa Bucal, Fac.Odont, UNC
3
CIQUIBIC, UNC-CONICET, Departamento de Qumica Biolgica, Fac. Cs.Qcas, UNC
4
Instituto de Investigaciones en Ciencias de la Salud (INICSA-CONICET)

brunottomabel@gmail.com

RESUMEN
El propsito de este trabajo fue determinar los polimorfismos genticos que pueden ser
asociados con cncer de cabeza y cuello en pacientes adultos, descriptos en artculos
originales de estudios observacionales. Se realiz una revisin sistemtica y meta-anlisis
utilizando modelos de efectos fijos y aleatorios. Se identificaron un total de 2287 estudios
potencialmente relevantes, de los cuales solamente 21 cumplan con todos los criterios
establecidos, y se identificaron un total de 20 genes-polimorfismos y 97 genotipos. Los
genotipos que presentaron asociacin significativa fueron los relacionados a procesos
inflamatorios o procesos celulares como proliferacin, diferenciacin y sobrevida de las
clulas. De los estudios que presentaron homogeneidad se destacan los realizados en
relacin al polimorfismo del gen CYP1A1, con funcin enzimtica relacionada al
metabolismo de los hidrocarburos policclicos aromticos, derivados del humo del cigarrillo y
tabaco. Nuestros resultados nos permiten concluir que el genotipo heterocigota del gen
CYP1A1 es un factor de riesgo para el cncer de cabeza y cuello.

Palabras clave: meta-anlisis/polimorfismos/lesin maligna.

Introduccin
El ltimo documento emitido por la Organizacin Mundial de Salud, en el ao 2010, ha
afirmado que mundialmente el cncer bucal y la enfermedad periodontal figuran entre las
afecciones ms comunes del gnero humano, y que no hay en el mundo pas ni territorio
que est libre de ellas, por lo cual constituyen un problema de salud pblica [1]. Genes
asociados a proliferacin o apoptosis celular participan en el desarrollo del cncer y pueden
servir como marcadores de esta patologa. La identificacin de un patrn predictivo
resultara de suma utilidad para el diagnstico temprano, recurrencia o progresin de la
enfermedad en los pacientes. Los estudios observacionales, en general, solo evalan
algunos pocos genes y principalmente los relacionados con un proceso celular, por lo cual
estrategias metodolgicas como revisiones sistemticas y meta-anlisis, que consideran
conjuntamente el resultado de varias investigaciones, permiten conclusiones ms generales
y fuertes para identificar algn tipo de patrn de marcadores de diagnstico y/o teraputica
en la clnica. El propsito de este trabajo fue determinar polimorfismos genticos que
pueden ser considerados de riesgo en pacientes adultos con cncer de cabeza y cuello,
particularmente los relacionados con el metabolismo de carcingenos, descriptos en
artculos originales de estudios observacionales, mediante revisin sistemtica y meta-
anlisis de efectos fijos y aleatorios.

Desarrollo
Diseo: revisin sistemtica y meta-anlisis de estudios originales publicados casos-control
en pacientes adultos de ambos gneros, con edades entre 25 a 80 aos, con cncer de
cabeza y cuello diagnosticados segn los criterios de ICD-10C00-C14 WHO u otra fuente
fehacientemente especificada, en los que se identificaron polimorfismos genticos.
Estrategia de bsqueda para la identificacin de los estudios: Se utiliz una combinacin de


vocabulario controlado y trminos de texto libres como: oral cancer,oral potentially malignant
disorders, leukoplakia,oral lichen, smoke, alcohol, polymorphism, risk, mutation, oncogene,
tumor supresor gene, squamous cell carcinoma, head and neckcancer. Bases de datos
revisadas: MEDLINE, Cochrane y CancerLit -Enero de 2007 a Enero de 2013. No hubo
restricciones de idioma. Adems se realizaron bsquedas manuales en revistas y tesis
publicadas y en la bibliografa de todos los artculos seleccionados para identificar literatura
gris. Seleccin de los estudios: Se examinaron los ttulos y resmenes de todos los informes
identificados por medio de bsquedas electrnicas. Todos los estudios que cumplieron con
los criterios de inclusin (Valoracin de presencia/ausencia de mutacin y/o polimorfismo
gentico en proto-oncogenes mediante tcnica de la Reaccin de la Polimerasa en Cadena
(PCR) y el anlisis de los productos en geles de agarosa, Riesgo Relativo / Odd Ratios
estratificado segn hbitos de riesgo de alcohol-tabaco; Intervalos de confianza 95%)
fueron evaluados a fin de establecer su validez y posterior extraccin de datos. Evaluacin
de la Calidad de los Estudios: Segn delineamientos de Scottish Intercollegiate Guidlines
Network y MOOSE para estudios caso-control. Dos profesores (A Bono y AM Zarate)
evaluaron en forma independiente y a doble ciego los informes completos para establecer si
los estudios cumplan con los criterios de calidad. Los desacuerdos se resolvieron mediante
la participacin de un tercer profesor (JL Barra) y por reiteracin, discusin y consenso.
Extraccin y Sntesis de los Datos: Se extrajeron nombre de los autores, pas/regin donde
se realiz el estudio, ao de publicacin, nmero de casos y controles, media/mediana de la
edad en casos y controles, proporcin de cada gnero, tipo de seleccin de los casos y
controles; y nmero de sujetos por genotipo en los casos y controles. Los resultados de los
estudios fueron expresados en Odd Ratios, Intervalos de Confianza, p-valor. La
heterogeneidad de los estudios (verdadera varianza del efecto del tamao a travs de los
estudios) fue medida mediante el estadstico Q (mide si la varianza observada excede la
varianza esperada) y el estadstico I
2
(
2
100%
Q df
I x
Q
| |
=
|
\ .
), indica el porcentaje de variabilidad
de los efectos estimados debido a la verdadera heterogeneidad ms que al error de
muestreo) [3]. La heterogeneidad fue evaluada para cada polimorfismo gentico estudiado.
El meta-anlisis fue realizado utilizando un modelo de efectos aleatorio estimado por el
mtodo de DerSimonian Laird y de efectos fijos por el mtodo de Mantel-Haenszel,
usando el paquete meta del programa R versin 2.15.3 (marzo 2013) [4].

Revisin Sistemtica: Se identificaron un total de 2287 estudios potencialmente relevantes,
de los cuales, solamente 21 cumplan con todos los criterios establecidos. En los 21
artculos, el nmero total de casos fue 8834 y de controles 10138. Observndose que el
nmero total de sujetos del gnero masculino fue mayor que los del gnero femenino. En
dos de los estudios solo se recogieron datos de varones. Estudios realizados en Francia
mostraron una mayor incidencia en los varones que en las mujeres. Contrariamente en India
se observa mayor incidencia en mujeres que varones. La edad promedio vari entre 50-60
aos en ambos grupos. Se identificaron en los pacientes con diagnstico de cncer de
cabeza y cuello un total de 20 genes-polimorfismos y 97 genotipos estudiados. Los
genotipos que presentaron asociacin significativa fueron los relacionados a procesos
inflamatorios o que participan en procesos celulares de proliferacin, diferenciacin y
sobrevida de las clulas. De estos genes que presentaron asociacin significativa, para este
trabajo, se muestran los resultados que corresponden al gen CYP1A1.
Meta-anlisis: Dos de los estudios caso-control, sobre el genotipo heterocigota (m1/m2) del
gen CYP1A1, con un total de 120 casos y 345 controles, presentaron homogeneidad.
Observndose un valor para el estadstico Q (gl=1) de 0,44, p-valor=0,508 y para I
2
= 0%.
En la Fig. 1 se observa que, con ambos modelos, el genotipo heterocigota del gen CYP1A1
se asocia a riesgo de cncer de cabeza y cuello. El OR pooled observado, en el modelo a
efectos fijos, fue de 2,16; IC 95% [1,39-3,34], p-valor=0.0006. En este estudio si bien se
aplicaron los dos modelos, se describen slo los resultados del modelo a efecto fijos por


presentar homogeneidad los dos estudios seleccionados. El modelo de efectos fijos, supone
que todos los estudios provienen de una poblacin comn, y que el tamao del efecto no es
significativamente diferente entre los distintos ensayos. En el caso de probar
heterogeneidad, el modelo de efectos aleatorios puede ser ms apropiado, ya que se
incorpora tanto la variacin al azar dentro de los estudios como la variacin entre los
diferentes estudios [3].
Es conocido que en el proceso carcinognico intervienen tanto factores genticos como
medio ambientales. El gen CYP1A1 tiene funcin enzimtica asociada al metabolismo de los
hidrocarburos policclicos aromticos, derivados del humo del cigarrillo y tabaco,
reconocidos agentes carcinognicos. Los resultados obtenidos en nuestro trabajo permiten
confirmar con mejor precisin que este factor gentico est asociado al cncer de cabeza y
cuello.

Number of studies combined: k=2
OR 95%-CI z p.value
Fixed effect model 2.1587 [1.3942; 3.3423] 3.4499 0.0006
Random effects model 2.1481 [1.3850; 3.3314] 3.4148 0.0006

Quantifying heterogeneity:
Tau
2
< 0.0001; H = 1; I
2
= 0%
Test of heterogeneity:
Q d.f .p.value
0.44 1 0.5082

Figura 1.Forestplot de ORs para genotipo heterocigota del gen CYP1A1 y el riesgo de cncer de cabeza y cuello en 2 estudios
caso-control.

Bibliografa
[1] Petersen PE (2009) Oral cancer prevention and control--the approach of the World
Health Organization. Oral Oncol. 45(4-5):454-60.
[2] Beerenwinkel N, Antal T, Dingli D, Traulsen A, Kinzler KW., Velculescu VE, Vogelstein
B, Nowak MA (2007) Genetic progression and the waiting time to cancer. PloS Comput Biol.
3: e225.
[3] Higgins JPT, Green S. (2011). Cochrane Handbook for Systematic Reviews of
Interventions Version 5.0.2. The Cochrane Collaboration. URL http://handbook.cochrane.org/
[4] Viechtbauer W (2010) Conducting meta-analyses in R with the metafor package. Journal
of Statistical Software, 36(3), 1-48. URL http://www.jstatsoft.org/v36/i03/.

Bajo riesgo
Alto riesgo


MODELACION DE DATOS DE ELECCION DISCRETA

NATACHA LISERAS
1
, ANDREA BELMARTINO
2
, MIRIAM BERGES
3

1,2,3
Facultad de Ciencias Econmicas y Sociales, Universidad Nacional de Mar del Plata

nliseras@mdp.edu.ar

RESUMEN
Se propone la estimacin de un modelo de eleccin discreta, el cual permite modelar la
eleccin realizada por un consumidor entre J(t,i) alternativas mutuamente excluyentes.
Dicho modelo se deriva de la teora de la utilidad aleatoria, que expresa a la utilidad como
una funcin lineal en los parmetros ms un trmino de error. En el presente trabajo, se
aplica un modelo de eleccin discreta para estimar la disposicin a pagar (DAP) por los
atributos diferenciales de los productos del sector textil-confecciones.

Palabras clave: eleccin mltiple, utilidad aleatoria, disposicin a pagar.

Introduccin
La teora del comportamiento del consumidor indica que los individuos son capaces de elegir
entre distintas situaciones posibles aquella que maximice su satisfaccin o utilidad, dada su
restriccin presupuestaria. Asimismo, siguiendo el enfoque de Lancaster (1966), los
individuos demandan bienes por el conjunto de atributos que poseen, incluido el precio,
donde las caractersticas especficas de los bienes son las que le brindan utilidad.
En el marco de la teora de la utilidad aleatoria, la funcin de utilidad que los consumidores
maximizan a partir de sus elecciones en el mercado, se puede expresar como: c = +
itj itj itj
U V ,
donde i representa al individuo que elige la alternativa j en el conjunto de eleccin t (Greene,
2005). El componente determinstico consiste en un vector de coeficientes de utilidad que
representan la importancia de cada atributo, mientras que los errores, que representan la
heterogeneidad entre individuos, se suponen independientes y con la misma distribucin de
valor extremo (supuesto iid):
( ) ( ) ( )
c c = exp exp
itj itj
F . As, la probabilidad de que el
individuo i elija la alternativa j en la eleccin t es
( > =

Pr
itj itm
U U m j . Bajo la distribucin
Gumbel de valores extremos independientes para los errores, la probabilidad se especifica
como | |
( )
( )
( )
|
|
=
= =
,
1
exp
Pr
exp
itj
it
J i t
itj
j
x
y j
x
, o modelo logstico multinomial (MNL), donde y
it
es el
ndice de la eleccin realizada (Hensher et al., 2006; Train, 2003).
La funcin de log-verosimilitud a maximizar es:
( )
1 1
log log
J i N
ij ij
i j
L d P
= =
=
, donde P
ij
representa la
probabilidad antes definida y d
ij
=1 si y
it
=j. Las estimaciones se obtienen mediante el mtodo
de Newton.
El supuesto de errores iid equivale a que se cumpla la propiedad de independencia de
alternativas irrelevantes (IIA), la cual establece que el cociente de cualquier par de
probabilidades estimadas de seleccin es independiente de la presencia de otras
alternativas en el conjunto de eleccin. El contraste de Hausman permite evaluar el
cumplimiento del supuesto y, en el caso de tratarse de alternativas interdependientes, el
modelo logit anidado reemplaza al MNL (Hausman & McFadden, 1984).
Los coeficientes estimados del modelo logit multinomial miden los efectos de las variables
sobre la funcin de utilidad, la que puede emplearse para calcular la media estimada de la
disposicin a pagar (DAP) por cada uno de los atributos. Las medidas de la DAP se calculan
como el cociente entre dos parmetros estimados, los cuales deben ser estadsticamente
significativos (Hensher et al., 2006). El coeficiente correspondiente al precio va en el


denominador:
( )
/
A P
| | , y la DAP se interpreta como el cambio en el precio (P) necesario
para compensar el cambio en el atributo analizado (A) mientras que el resto de las variables
se mantienen constantes. La varianza de la DAP se aproxima mediante el mtodo delta
(Vermeulen et al., 2008):
( ) ( ) ( ) ( )
2
2
1
var var var 2 cov var
P
A A A
A A P P
P P P
DAP
| | |
| | | |
| | |
|
| |
| | | | | |
|
= ~ + | | |
| | |
|
\ . \ . \ .
\ .
.

Desarrollo
La aplicacin consiste en estimar la disposicin a pagar (DAP) por los atributos calidad,
diseo y posicionamiento de marca de los productos del sector textil-confecciones, mediante
un anlisis de eleccin mltiple (choice analysis).
A efectos de la elaboracin del cuestionario, siguiendo el enfoque de preferencias
declaradas, se opta por un experimento sin etiquetas (unlabeled). La enumeracin completa
de los posibles conjuntos de eleccin se calcula como L
A
, en dnde L es el nmero de
niveles y A es el nmero de atributos. Los atributos se definen con dos niveles cada uno: (i)
calidad: media / alta; (ii) diseo: pocos detalles / muchos detalles; (iii) marca: menos
posicionada y conocida / ms posicionada y conocida; (iv) precio: $150 / $300. Por lo tanto,
en este caso: L
A
= 2
4
= 16 tratamientos.
A continuacin, se genera el diseo experimental, el cual cumple con la condicin de
ortogonalidad. Luego de generar el diseo para los 16 tratamientos, se descartan 4 por no
corresponderse con alternativas que se obtengan en el mercado. Finalmente, se construyen
10 cuestionarios aleatorizando los tratamientos a su interior, de modo que cada tratamiento
aparezca igual nmero de veces y de que aparezcan distintas combinaciones de atributos
que permitan un mayor abanico de respuestas.
La poblacin objetivo est constituida por mujeres residentes en la ciudad de Mar del Plata,
en un rango de edad de 20-65 aos, dentro de un estrato socio-econmico medio-alto,
decisoras de compra de indumentaria con marca y diseo. Se disea una muestra
estratificada por zonas geogrficas con cuotas de edad. Se obtuvieron 180 respuestas
vlidas. Los conjuntos de eleccin (choice sets) multiplican la cantidad de respuestas,
debido a que cada encuestada se enfrenta a 4 conjuntos de eleccin, lo que permite estimar
la DAP por atributos diferenciales con 720 observaciones. El relevamiento se efectu en
noviembre de 2011.
Dado que los tratamientos no poseen etiquetas, tiene ms sentido estimar una funcin
genrica para la clase de producto, que una funcin de utilidad especfica para cada
alternativa no definida. Por lo tanto, se estima un solo parmetro por atributo
independientemente del nmero de alternativas (Hensher et al., 2005). Como los parmetros
se formulan genricos, lo correcto es excluir las constantes del modelo de modo que se
restringe a cero el efecto promedio no observado para todas las alternativas.

La funcin de utilidad estimada es:
0,331 0,237 0,006 0,031
(0,053) (0,052) (0,0001) (0,058)
ijt
ijt ijt ijt ijt
U Calidad Diseo Precio Marca = +

Los coeficientes resultan estadsticamente significativos para calidad, precio y diseo, no as
para la variable marca. Los resultados indican que el nivel de utilidad del consumidor
aumenta a medida que se incrementa la calidad del producto o cuanto la prenda posee
detalles de diseo. Lo contrario sucede, como es de esperar, cuando aumenta el precio,
debido a que la utilidad del consumidor disminuye. No se rechaza el supuesto de
independencia de alternativas irrelevantes.
La DAP estimada indica que, manteniendo los dems atributos contantes, la variacin en el
precio de una prenda asociada al pasar de calidad media a calidad alta es $58,4, mientras


que la variacin en el precio al pasar de una prenda con pocos detalles de diseo a una
prenda con ms detalles de diseo es $41,8.
Si estos valores se interpretan en funcin a los precios medidos en los sets de eleccin i.e.,
prendas de $150 y $300-, representan 19%-39% del precio del bien en el caso de calidad y
14%-28% del precio en el caso de diseo. A su vez, segmentando por estrato etario, se
observa que la DAP aumenta con la edad de las consumidoras.
Que la marca no sea estadsticamente significativa es un resultado compatible con la
estructura de la oferta marplatense de indumentaria, cuyas empresas exhiben, en trminos
generales, un menor posicionamiento competitivo en comparacin con las firmas lderes del
sector (Liseras et al., 2011; Belmartino et al., 2012).

Bibliografa
Belmartino, A., Liseras, N. y Berges, M. (2012). "Estimacin de la disposicin a pagar por los
atributos diferenciales de los productos del sector textil-confecciones". XLVII Reunin Anual
AAEP. ISSN 1852-0022 |ISBN 978-987-28590-0-8. Publicado en Actas.
Hausman, J. & McFadden, D. (1984). Specification tests for the multinomial logit model.
Econometrica, 52: 219-240.
Hensher, D., Rose, J. & Green, W. (2006). Applied choice analysis. Cambridge University
Press, Reino Unido.
Greene, W. (2005). Class Notes, part 9. In: Discrete Choice Modeling. New York University.
Stern School of Business. http://pages.stern.nyu.edu/~wgreene/DiscreteChoice.htm
Lancaster, K. (1966). A new approach to consumer theory. Journal of Political Economy,
74(2): 132-157.
Liseras, N., Graa, F., Belmartino, A. y Gennero, A. (2012). Diferencias en el
posicionamiento competitivo entre empresas de indumentaria: evidencia de dos ciudades
argentinas. Revista TEC Empresarial, 6: 3 (33-47). ISSN: 1659-2395
Train, K. (2003). Discrete choice methods with simulation. Cambridge University Press, New
York.
Vermeulen, B., Goos, P., Scarpa, R. & Vandebroek, M. (2008). Efficient and robust
willingness to pay designs for choice experiments: some evidence from simulations.
Research Report KBI 0809, Department of Decision Sciences and Information Management,
Katholieke Universiteit Leuven, 18pp.


UN MODELO DE REGRESIN PARA EL APRENDIZAJE COMO
ESTRUCTURA FUZZY
JOS ALEJANDRO GONZLEZ CAMPOS
1

RONALD ALEJANDRO MANRQUEZ PEAFIEL
1

1
Departamento de Matemtica & Estadstica / Facultad de Ciencias Naturales & Exactas,
Universidad de PLAYA ANCHA, CHILE. Valparaso-Chile

labesam.upla@gmail.com

RESUMEN
Este trabajo presenta una propuesta de estudios de regresin aplicados en educacin,
donde la respuesta es aprendizaje, que cual es considerada como una estructura fuzzy,
supuesto terico que atiende a la naturaleza imprecisa de las mediciones de un fenmeno
abstracto, generando una propuesta de modelacin en un contexto mucho ms real. Esta
concepcin y propuesta metodolgica enriquecen las proyecciones de la modelacin,
anlisis y comprensin del fenmeno del aprendizaje.

Palabras clave: Nmero Fuzzy, Funcin de Membership, Estimacin estadstica y
Regresin fuzzy.

Introduccin
De modo general podemos decir que, en un problema concreto, muchos nmeros son
idealizaciones de informaciones imprecisas, envolviendo valores numricos.
Estos son los casos de frases como "en torno de", aproximadamente es. Por ejemplo,
cuando se mide la estatura de un individuo, lo que se obtiene es un valor numrico cargado
de imprecisiones.
Tales imprecisiones pueden haber sido causadas por los instrumentos de medicin, por los
individuos que estn tomando las mediciones, por los individuos que estn siendo medidos
etc. Finalmente se opta por un "valor preciso" (un nmero real) h para indicar la estatura. Sin
embargo, seria ms prudente decir que la estatura es entorno de h o que la estatura es
aproximadamente h (Barros 2010).
En el proceso de comprender el fenmeno del aprendizaje, se han propuesta muchos
mecanismos o metodologas que buscan la cuantificacin del aprendizaje, ver por ejemplo
Gonzlez (2012), en el que se plantea que para medir el aprendizaje este debe ser
considerado como un sistema dinmico en constante interaccin con diversas realidades, lo
que sin duda hace ms difcil este intento de medir con precisin, si de manera concreta ya
existe imprecisin en las mediciones, con mayor razn existir con esta condicin o
elemento propio de la naturaleza abstracta del hombre.
Sin embargo, la interaccin de dos dimensiones, aparentemente sin ningn vnculo, como lo
es la experiencia que el docente adquiere en el aula, en ese contacto da a da con sus
alumnos y los recientes avances en los modelos matemtico-estadsticos, especficamente
el planteamiento de estructuras numricas que obedecen a esta naturaleza difusa en la
medicin del aprendizaje, lo que se transforma en un gran paso en el proceso de
modelacin y comprensin del fenmeno del aprendizaje, estas estructuras numricas son
conocidas como nmeros fuzzy.
La aplicacin considera como variable regresora las horas de video juegos en la semana
anterior a una prueba y la evaluacin del aprendizaje como estructura fuzzy.



Caracterizacin de la Regresin Fuzzy
A comienzos de los aos 80, Tanaka propone los primeros modelos de regresin lineal
fuzzy, basado en la teora de posibilidades y la teora de conjuntos fuzzy (Tanaka, Uejima &
Asai 1982).
En relacin a las ideas de Zadeh, Tanaka considero que los fenmenos del mundo real eran
principalmente caracterizados por incerteza fuzzy. Diferentemente del paradigma de
modelacin estadstica, donde la incerteza es considerada un elemento aditivo para la
relacin determinada entre las variables que el consider como imprecisin reflejada en el
modelo por medio de los parmetros fuzzy. As formul un modelo de regresin, donde la
relacin funcional entre las variables dependiente e independiente es representada como
una funcin lineal fuzzy, en donde sus parmetros son nmeros fuzzy (Zadeh; 1978).
En el contexto de modelo de regresin lineal fuzzy se tiene la siguiente estructura.
0 1 1 2 2
...
i i i p ip
y A Ax A x A x = + + + + , donde i puede tomar los valores i = 1; 2;; n. donde
ij
x son nmeros reales (crips),
i
y es un nmero fuzzy que puede ser simtrico, es decir
[ ; ]
i i i i i
y c s c s = + o de manera general asimtrico [ ; ]
i i i i i
y c q c p = + ,
i
c es el valor centro
(media o moda),
i
s ,
i
q y
i
p son las respectivas propagaciones, y [ ; ]
m m m m m
A a r a r = + o
[ ; ]
m m m m m
A a r a t = + son los parmetros fuzzy respectivos, que tienen la misma funcin de
membership que
i
y .
En nuestro contexto el aprendizaje es la respuesta, que hemos identificado
i
y y hemos
establecido su naturaleza fuzzy. Cada
ij
x representa una realizacin de una variable causa,
que asumiremos que es un nmero real, por ejemplo, la cantidad de horas de estudios en la
semana anterior a la prueba, el nmero de horas de video juegos por da, ingreso familiar,
sexo, etc.
m
A representa el o los parmetros, que tambin son nmeros fuzzy, que vienen a
caracterizar el modelo de regresin y a explicitar el efecto que tiene cada una de las
variables
ij
x sobre la respuesta
i
y .

Respecto de la notacin, tenemos que: X representa la matriz de diseo, es decir ella
contiene las realizaciones de cada uno de las variables explicativas o causales, C
representa un vector que contiene todos los valores centrales de los nmeros fuzzy
respuesta, S representa el vector de expansiones, es decir aquel que contiene las segundas
componentes de los nmeros fuzzy respuesta, l representa el efecto de las funciones de
membership, que en nuestro contexto es establecida por el docente, como la mejor fuente
de estructuracin del comportamiento de esta funcin. Para tener mayor detalle de los
procesos y de la metodologa se recomienda leer Zadeh (1978).



Conclusiones
Una conclusin de suma importancia para esta propuesta, es la posibilidad de poder
visualizar el comportamiento de las expansiones, lo que enriquece significativamente el
anlisis, pues muchas veces los efectos de las variables explicativas, no es tan solo en un
valor medio caracterstico de la regresin, si no en el relativismo o incerteza que esta
produce en ese cambio, adems de determinar cuando el efecto de las variables
explicativas es global.

Agradecimientos
El autor Jos Alejandro Gonzlez Campos, quisiera agradecer al Laboratorio Experimental
de Saberes Matemticos, Lab[e]saM y Al Laboratorio de Anlisis de Datos saberes
Estadsticos, LADYSE, Universidad de Playa Ancha, Tambin a la Coordinacin de
Perfeccionamiento de Personal de Educacin Superior, CAPES y a la Universidad Estadual
de Campinas, UNICAMP, IMECC.

Bibliografa
[1] Barros, L. Bassanezi, R. (2010). Tpicos de logica fuzzy e biomatemtica. Segunda
edicin. UNICAMP-IMECC.
[2] Gonzlez, J. Galvis, D. Medina, J. Moreno, N. (2012). Modelo Estocstico de las
interconexiones conceptuales en un proceso de aprendizaje en el aula. Estud. pedagg.
vol.38, n.2, pp. 69-84.
[3] Cabrera, E. Gonzlez, J. Montenegro, E. (2010). Test informatizados y el registro del
tiempo de respuesta, una va para la precisin en la determinacin del nivel de logro de un
saber matemtico. Estud. pedagg. vol.36, n.1, pp. 69-84.
[4] Fernndez, A. (1997). Uso de la Distribucin normal en la evaluacin del aprendizaje. Estud.
pedagg., no.23, pp.51-63.
[5] Arellano-Valle,R. Genton, M.(2005). On fundamental skew distributions. Journal of
Multivariate Analysis 96, pp. 93-116.
[6] Ojeda, M. (2003). La modelacin estadstica. Universidad Veracruzana, Universidad
Jurez Autnoma de Tabasco. Mxico. pp 71-76.
[7] Cronbach, L. J. (1951). Coefficient alpha and the internal structure of
tests. Psychometrika, 16(3), 297334.
[8] Garcia, S. (2002). La Validez y la Confiabilidad en la Evaluacin del Aprendizaje desde la
Perspectiva Hermenutica. Rev. Ped, vol.23, n.67, pp. 297-318.
[9] Soto, C. Jimenez, C. (2011). Aprendizaje supervisado para la discriminacin y
clasificacin difusa. Dyna rev.fac.nac.minas. vol.78, n.169, pp. 26-33.
[10] Acampora, G. Fenza, G. Muoz, E. Romera, B. (2010). Mejoras en el uso de
aprendizaje con rboles fuzzy: un ejemplo de su aplicacin en la toma de decisiones de un
sistema coordinado. ESTYLF, Huelva. pp 643-648.
[11] Tanaka, H. Uejima, S. Asia, K. (1982). Linear regression analysis with Fuzzy model,
IEEE Trans. Systems Man.12 (6) pp 903907
[12] Zadeh, L. (1978). Fuzzy sets as a basis for a theory of possibility. Fuzzy Sets and
Systems, vol1, pp 3-28.


EL USO DE LAS TECNOLOGAS DE LA INFORMACIN Y LA
COMUNICACIN (Tics) EN EL PROCESO ENSEANZA
APRENDIZAJE DE LA BIOESTADISTICA

VICTOR MIGUEL ANGEL BURBANO PANTOJA
1
, MARGOTH ADRIANA VALDIVIESO
MIRANDA
2
, MARTHA DEL PILAR PACHECO
3

1
Docente Escuela de Matemticas y Estadstica, Estudiante de Doctorado Ciencias de la
Educacin, Director Grupo de investigacin Interdisciplinario en Ceincias "GICI" Universidad
Pedaggica y Tecnolgica de Colombia
2,3
Docentes Escuela de Matemticas y Estadstica, Investigadoras grupo "GICI",
Universidad Pedaggica y Tecnolgica de Colombia

victorburbanop@yahoo.es
margoth.valdivieso@uptc.edu.co
mppacheco85@hotmail.com

RESUMEN
Por lo general al abordar temticas relacionadas con la Bioestadstica, los estudiantes
presentan dificultades en la comprensin de estas temticas, sin embargo hay herramientas
que facilitan su desarrollo, por ello es conveniente utilizar paralelamente a su transcurso las
Tics, afrontando software estadstico ya sea libre o privado, que facilite el proceso de
enseanza-aprendizaje. Por tanto el profesor debe tener conocimiento previo de los temas
que va a abordar con sus estudiantes, como lo menciona Juan, et tal (2006): "La finalidad de
todo este esfuerzo docente no es otra que la de facilitar el aprendizaje de conceptos y
mtodos estadsticos aplicados, sin por ello perder el rigor que toda asignatura cuantitativa
debe tener: el uso correcto de cualquier software estadstico requiere que el investigador
posea una base terica adecuada, de forma que sta le capacite para analizar con
profundidad los resultados y extraer las conclusiones correctas", y en correlacin con
Shulman (1987), Pinto (2010), Gonzlez e Isoda (2012) y Ges-Newsome (1999), quienes
afirman que, el profesor ha de conjugar el conocimiento acerca de cmo los estudiantes
aprenden, el conocimiento de las estrategias pedaggicas y representaciones para la
enseanza y el conocimiento acerca de la materia a ensear, particularmente en dichos
tpicos.
En el presente trabajo se muestra la importancia del uso de las Tics, que permite facilitar el
proceso de enseanza-aprendizaje de la bioestadstica, utilizando el software libre
Geogebra, que tiene inmerso libreras relacionadas con estadstica y probabilidad,
posibilitando acercarse a lo tan preciado por los docentes, la calidad educativa.

Palabras clave: Bioestadstica, proceso enseanza-aprendizaje, software libre,
Geogebra.

Introduccin
La Bioestadstica es la ciencia que aplica la estadstica en la Biologa, por tanto es
importante su buen desarrollo y comprensin por parte de los estudiantes, quienes sern
profesionales que realicen sus actividades de manera idnea; por ello los docentes deben
tener un conocimiento previo y adecuado para transmitirlo; dicho proceso se apoya por
medio del uso de las Tics, principalmente con la ayuda de software libre, que por sus
facilidades es ms asequible para los estudiantes de todos los niveles educativos, como lo
indica Snchez y Garrido (2011): El software libre nos da la libertad ms de usarlo,
modificarlo, distribuirlo y mejorarlo para que la comunidad se beneficie, adems en el mbito
de la Estadstica, se puede encontrar una gran variedad de software estadstico libre que


adems evoluciona a una velocidad sorprendente gracias a la gran participacin de los
propios usuarios.
Adems es importante resaltar que es conveniente utilizar paralelamente al desarrollo de las
temticas, un software que apoye, facilite y afiance, temas relacionados con el anlisis
exploratorio de datos, clculo de probabilidades, distribuciones muestrales entre otros, para
ello se puede utilizar software estadstico libre o software libre que contenga libreras de
estadstica y probabilidad como el software Geogebra, coadyuvando al proceso de
enseanza-aprendizaje, ya que al unir la teora y la practica el proceso es ms efectivo;
como lo afirma el profesor Abel Ortega (2011): "Para el aprendizaje efectivo de la
matemtica se necesita trabajar desde dos dimensiones, la teora y la prctica, binomio
indispensable para asegurar el xito del mismo. La primera proporciona la visin y confianza
y la segunda fija la seguridad y la experiencia para el dominio del curso".
Geogebra es un software interactivo de matemtica que rene dinmicamente geometra,
lgebra y clculo, lo ha elaborado Markus Hohenwarter en el 2001, junto a un equipo
internacional de desarrolladores, para la enseanza de matemtica escolar, en la
universidad de Atlantic Florida [5], [6], es un software que ha sido explorado en estadstica y
probabilidad, dado que potencia la didctica en el aula y que facilita la comprensin de
temas relacionados con sta rea, por ello se propone consolidar ms su uso, por los
buenos resultados obtenidos, despus de haberlo utilizado con los estudiantes de
Bioestadstica de la Licenciatura en Ciencias Naturales y Educacin Ambiental de la
Universidad Pedaggica y Tecnolgica de Colombia, quienes mostraron un progreso muy
significativo en los temas tratados y su apreciacin con respecto a la facilidad al utilizarlo fue
positiva.

Desarrollo
En el presente trabajo se indica una muestra del proceso que se realiz con los estudiantes
desde el inicio de las clases, donde se parti paralelamente con el uso del software libre
Geogebra y el desarrollo de la parte terica, en principio se indic a los estudiantes la forma
de descargar el software (Figura 1.) [10], la cual tarda unos minutos, luego se present la
zona de trabajo y la introduccin de datos (Figura 2.), que no present dificultad ya que se
parece a la interface de Excel o de otros softwares estadsticos, se procedi a realizar el
anlisis exploratorio de datos, facilitando la comprensin y el anlisis de la informacin,
tambin se desarroll clculo de probabilidades (Figura 3.), se construyeron grfica de
algunas distribuciones de probabilidad (Figura 5.), se determinaron intervalos de confianza y

Figura 1. Figura 2. Figura 3

.
Figura5.
Figura 4.


se plantearon hiptesis (Figura 4.) de temas relacionados con el rea de estudio y de
ejercicios que los estudiantes plantearon realizando trabajo de campo.

Geogebra es un software libre, que fortalece la didctica en el aula y que facilita la
comprensin de temas relacionados con la estadstica y la probabilidad, por ello se propone
consolidar ms su uso, luego de obtener muy buenos resultados, despus de haberlo
utilizado con los estudiantes. Por ello el profesor puede utilizar este software para realizar
con sus estudiantes un trabajo de forma amena, agradable, sin esa sensacin de temor que
adquieren al iniciar un curso de bioestadstica y ms an cuando se aborda temas
relacionados con probabilidad o Estadstica; motivndolos para que indaguen y progresen
en los conceptos que les resulten ms sugestivos en su rea de conocimiento.
Por otro lado, la apreciacin de los estudiantes con respecto a la facilidad de utilizar y
manipular Geogebra fue positiva ya que aseguraron que es una aplicacin muy sencilla para
trabajar temas relacionados con estadstica y probabilidad, resultado obtenido al realizar una
encuesta verbal despus de terminar el curso, en la cual se pregunt, cul es su percepcin
con respecto a la facilidad de utilizar Geogebra para los temas relacionados con
Probabilidad y Estadstica?, en su totalidad los estudiantes respondieron que fue una
herramienta fcil de utilizar y que lo ms importante fue la interpretacin y anlisis de
resultados, se mostraron muy interesados en la parte de las grficas de las distribuciones de
probabilidad y el clculo de probabilidades; por otro lado se observ en las calificaciones
obtenidas por los estudiantes su progreso en la asignatura de Bioestadstica, comparando
las calificaciones de los estudiantes con los que no se utiliz esta herramienta.

Bibliografia
[1]Shulman, S. (1987). Knowledge and teaching: foundations of the new reforms. Harvard Educational
Review, 57(1), 1-22.
[2] Pinto, J. (2010). Conocimiento didctico del contenido sobre la representacin de datos
estadsticos: estudio de casos con profesores de estadstica de las carreras de psicologa y
educacin. Tesis doctoral, Universidad de Salamanca. Espaa.
[3] Isoda, M., & Gonzlez, O. (2012).

[Survey on elementary, junior and high school teachers statistical literacy: The need forteacher
training in variability]. Journal of Science Education in Japan, 36(1), 61-76
[4] Gess-Newsome, J. (1999). Pedagogical content knowledge: an introduction and orientation. En
Gess-Newsome, J. y Lederman, N. G. (Eds.), Examining Pedagogical Content Knowledge: the
construct and its implications for science education (pp.3-17). Dordrecht: Kluwer Academic Publishers.
[5] Hohenwarter, Markus. y Hohenwarte, Judith. (2009). Documento de ayuda de GeoGebra. Manual
Oficial de la Versin 3.2. Florida.
[6] Fallas, William. (2010). "La herramienta geogebra". Historia del Geogebra, NA. Versin obtenida el
01/04/2013. http://geogebra-fisica.blogspot.com/2010/07/historia-del-geogebra_03.html
[7] Juan, ngel A. Huertas, M Antonia. Steegmann, Cristina. Terradez, Manuel. (2006). "Uso e
integracin de las TIC en asignaturas cuantitativas aplicadas: La experiencia de los estudios de
informtica y multimedia de la UOC". Teora de la educacin: educacin y cultura en la sociedad de la
informacin, vol (7(1)). Universitat Oberta de Catalunya (UOC). Versin obtenida el 06/04/2013.
http://campus.usal.es/~teoriaeducacion/rev_numero_07/n7_articulos.htm
[8] Snchez, Carmen. Garrido, Cantalejo. (2011). "Divestadsitica". La moda del Software libre.
Escuela Andaluza de Salud Pblica, Granada. Versin obtenida el 08/04/2013.
http://www.divestadistica.es/es/la_moda_del_software_libre.html
[9] Ortega, abel. (2011). "Las Tic en las Matemticas - Fsica". Usando Geogebra, Per. Versin
obtenida el 01/04/2013. http://matematicaabelortega.blogspot.com/p/usando-geogebra.html
[10] Descarga libre de Geogebra. "Utilitarios de Matemticas y Ciencias para ensear y aprender".
(2013). International GeoGebra Institute. http://www.geogebra.org/cms/es/



INTENSIDADES DE MICROARREGLOS MODELADAS POR
DISTRIBUCIONES GPOT-NORMALES

LILA RICCI
1
, DIANA KELMANSKY
2

1
Universidad Nacional de Mar del Plata, Facultad de Ciencias Exactas y Naturales,
Departamento de Matemtica
2
Universidad de Buenos Aires, Facultad de Ciencias Exactas y Naturales, Instituto de
Clculo

lricci@mdp.edu.ar

RESUMEN
En la modelizacin de datos reales se tropieza frecuentemente con la falta de Normalidad de
los mismos, acompaada de heteroscedasticidad. En el caso particular de intensidades
provenientes de experimentos de microarreglos, para que sea vlido el uso de las tcnicas
clsicas se han propuesto transformaciones que corrigen las situaciones mencionadas. La
transformacin logaritmo en base 2 funciona bien para los valores altos, no as para los
pequeos; a su vez el logaritmo generalizado funciona bien para valores pequeos y no tan
bien para los altos. Una familia de transformaciones presentada recientemente y que
permite optimizar la seleccin de la transformacin dentro de un espacio paramtrico
continuo es la gpot. Un enfoque alternativo a las transformaciones consiste en trabajar con
los datos en la escala original, buscando modelos ms abarcativos. En este sentido se
propuso la familia de modelos glog-Normales que ajusta bien a datos que tengan a glog
como transformacin estabilizadora de la varianza. Esto fue generalizado con la propuesta
de una familia de densidades de probabilidad tales, que las variables aleatorias
correspondientes tienen a las transformaciones gpot como estabilizadoras de la varianza.
Anlogamente a las de Box y Cox, las v.a. obtenidas por esta transformacin son Normales
truncadas. Las densidades propuestas constituyen un modelo con pseudo dispersin propio,
que fue definido por Jorgensen (1997). Mostraremos que estos modelos se ajustan bien
tanto a datos de microarreglos como a datos de concentraciones qumicas.

Palabras clave: modelos con dispersin propios; microarreglos; distribuciones
truncadas.

Introduccin
En la modelizacin de intensidades de microarreglos los datos presentan distribuciones no
Normales, que son adems heteroscedsticos. Para que sea vlido el uso de las tcnicas
clsicas se han propuesto algunas transformaciones que remedian estas situaciones como
o arco coseno hiperblico (glog), que funcionan bien en ciertos rangos y no tan bien
en otros. Finalmente, la familia de transformaciones gpot dada por

fue propuesta por (Kelmansky y Martnez, 2012), tiene a glog como caso particular y es muy
verstil debido a la amplitud de valores posibles para p.

Un enfoque alternativo a la bsqueda de transformaciones Normalizadoras consiste en


trabajar con los datos en la escala original, buscando modelos que se ajusten a su
distribucin; esta opcin tiene la ventaja de preservar la escala natural, de modo que las
interpretaciones de los resultados son directas, por otra parte se ahorran clculos al no tener
que transformar ni anti-transformar. En este sentido Leiva, Sanhueza, Kelmansky y Martnez
(2009) proponen la familia de modelos que se transforman en Normales mediante una re-
parametrizacin de la transformacin glog eliminndose as la dependencia entre la media y
la varianza.
En un trabajo reciente (Kelmansky y Ricci, 2012) se propuso una familia de modelos que
tiene a las transformaciones gpot como estabilizadoras de la varianza y a los modelos glog-
Normales como caso particular. En las secciones siguientes se describen las principales
propiedades de estos modelos y se muestran tambin grficos de las funciones de densidad
para algunos valores de los parmetros. Tambin se examina el ajuste de los mismos a
datos reales.

Modelos que tienen a gpot como transformacin estabilizadora de la varianza

respectivamente, su densidad est dada por
( )
( )
|
|
.
|
\
|
|
|
.
|
\
|
=
, / 1
2
2
2
1
exp
2
1 1
, ,
p
X
X
X
X
X X X
I
x
K
x f
o
o t
o

es de la forma
( ) ( ) ( ) ( )
|
|
.
|
\
|
=

o
o o ,
2
1
exp
1
, ,
2
2 / 1 2 2
y d y V a
K
y f
X
X
X
X Y (1)

Luego la densidad de Y pertenece a una familia con pseudo dispersin propia (Jrgensen,
1997, pgina 176). Llamaremos modelos gpot a aquellas familias de v.a. que tengan
densidades tipo (1).

Momentos
Para obtener los momentos de los modelos gpot, es til representarlos en funcin de v.a.
Normales-truncadas, cuyos momentos son conocidos. Sea , donde
y
0 = p . La funcin inversa es


y ahora la esperanza de Y puede expresarse como
( ) ( ) ( ) ( ) ( ). 1
2
1
1
2
1
/ 1 / 1 p p
pX E pX E Y E

+ + =

Re expresando la esperanza tenemos que

( ) .
2
1
exp 1 1
2 2
1
2
/ 1 / 1
2
dx
x
n
x
n
x
K
Y E
X
X
p p
n
X X
|
|
.
|
\
|
|
|
.
|
\
|
|
|
.
|
\
|
|
.
|
\
|
+
|
.
|
\
|
+ } =

to

Resolviendo esta integral se concluye que solo existe cuando ( ) ( ) e , 1 ,-1 - p , siempre
considerando valores de p no nulos.

Aplicaciones
La familia de densidades propuesta fue motivada por la modelizacin de intensidades de
microarreglos, sin embargo su aplicacin es ms general. Presentamos dos ejemplos: el
primero corresponde a intensidades de un gen proveniente de datos de un experimento de
microarreglos ("H25K_2: Yale University" del proyecto MAQC) y el segundo a
concentraciones de amonaco en el Reino Unido de los aos 2005 y 2011. En ambos
ejemplos mostramos el ajuste de los datos al modelo estimado mediante:
a) la superposicin de histogramas y las correspondientes curvas de densidad y
b) la superposicin de las curvas de distribuciones empricas y las del modelo ajustado.

Bibliografa
Jrgensen, B. (1997). The Theory of Dispersion Models. Chapman & Hall.
Freeman, J., Modarres, S., (2006) Inverse Box-Cox: the power-normal distribution.Statistics
& Probability Letters, V76, pp 764-772.
Kelmansky, D.M., Martnez, E.J., (2012). Generalized Power Transformations. Unpublished
manuscript.
Kelmansky, D.M., Ricci, L., (2012). Caracterizacin de las distribuciones gpot-Normales
dentro de los modelos con dispersin propios. X Coloquio Latinoamericano de Sociedades
de Estadstica, Crdoba.
Leiva, V., Sanhueza, A., Kelmansky, D., Martinez, E., (2009). On the glog-normal distribution
and its association with the gene expression problem. Computational Statistics and Data
Analysis, Volume 53, Issue 5 1613-1621.


APLICACIN DEL MODELO TWEEDIE A UN ESTUDIO DE
CONTAMINACION DE AGUAS

PATAT, MARA LAURA
1
; RICCI, LILA
1

1
Departamento de Matemtica, Universidad Nacional de Mar del Plata

mlpatat@mdp.edu.ar

RESUMEN
Para medir la calidad de las aguas recreativas, la normativa de la OMS sugiere el clculo del
percentil 95 en la evaluacin de la conformidad de las aguas recreativas con las normas
microbiolgicas. Este valor debe ser inferior a un valor especfico para cumplir con los
niveles estndar. El conteo de bacterias en agua no se distribuye normalmente por el
contrario es una distribucin muy asimtrica. Slo despus de la transformacin logartmica
se obtiene una distribucin normal. Otra alternativa consiste en calcular los percentiles no
paramtricos, como el de Hazen, Blom, Tukey o Weibull. Bsicamente, los mtodos no
paramtricos se aplican ordenando los datos en orden ascendente. El percentil 95 rara vez
da un rango exacto, se suele calcular por interpolacin entre observaciones adyacentes de
datos. La desventaja de aplicar estadstica no paramtrica es que en general se pierde o
ignora informacin inherente al conjunto de datos.
Una forma alternativa de evitar la transformacin de los datos es el modelado de los mismos
a travs de una adecuada distribucin. Una familia de distribuciones que puede modelar
datos continuos con marcada asimetra sin perder la escala original de los mismos, es la
familia Tweedie. Esta familia de distribuciones constituye una herramienta importante en la
estadstica dado que las distribuciones del error en los modelos lineales generalizados, son
casos particulares de la misma.Nuestro inters es estimar los percentiles de la distribucin
de los datos en la escala original, es decir, a partir del modelo adecuado de la distribucin
Tweedie.

Palabras clave: calidad de aguas recreativas, percentil 95, familia Tweedie

Introduccin
Cuando hablamos de calidad de aguas recreativas, nos estamos refiriendo a la calidad
microbiana de las mismas, es decir, a la presencia de bacterias en el agua tales como
coliformes fecales, estreptococos, coliformes totales y enterococos. Para evitar la incidencia
de brotes de enfermedades, se desarrollaron valores gua. Estos valores se derivan de
estudios que relacionan la exposicin, la calidad del agua y las enfermedades contradas
ante la presencia de las bacterias. Para medir la calidad de aguas recreativas, muchas
agencias han escogido basar sus criterios de acuerdo al percentil 95. Se puede emitir juicio
sobre la calidad del agua recreativa, dependiendo de si el valor del percentil excede o no el
valor gua. Los percentiles representan los valores de la variable que dejan por debajo un
determinado porcentaje. El percentil 95 entonces, es el valor de la variable que deja el 95%
de los valores por debajo de l.Como la distribucin del conteo de bacterias presenta una
marcada asimetra, en la prctica, los percentiles se calculan utilizando el mtodo
logartmico-normal, es decir, se aplica la transformacin logartmica a los datos para que los
mismos adquieran distribucin normal. El percentil obtenido de esta manera es llamado
percentil paramtrico. Una limitacin de este mtodo es que perdemos la escala original de
los datos.Una alternativa es calcular los percentiles no paramtricos como el de Hazen,
Blom, Tukey o Weibull; la desventaja es que generalmente ignoran informacin relativa a los
datos, obtenindose estimaciones menos precisas. Un mtodo ms apropiado y que hace
mejor uso de todos los datos, es estimar el percentil a partir de las propiedades de un
modelo paramtrico que permita distribuciones asimtricas.
Nosotros proponemos aplicar un modelo de la familia Tweedie. La caracterstica ms


importante de estos modelos es que precisamente se adaptan perfectamente a
distribuciones continuas asimtricas. El modelo de la familia Tweedie depende de un
parmetro p cuyo valor define la distribucin que mejor ajusta a un conjunto de datos
observados. Las distribuciones Gamma, normal, Poisson e inversa Gausiana son casos
particulares dentro de esta familia.
A partir de un conjunto de datos reales provenientes de playas de la ciudad de Mar del
Plata, estimamos el valor ptimo de dicho parmetro, para luego hacer simulaciones y
calcular los percentiles. Como resultado de las simulaciones, observamos que el percentil
calculado a partir de la distribucin Tweedie presenta menor error cuadrtico medio respecto
de los otros, lo que hace que el estimador sea mejor en el momento de hacer inferencias.
Como los cuatro grupos de bacterias analizados presentan valores similares del parmetro,
slo mostraremos los resultados provenientes de los coliformes fecales.
El aporte original de este trabajo es que respetamos la escala original de los datos y
estimamos el percentil 95 a partir de la distribucin Tweedie, que se ajusta adecuadamente
a los datos reales.

Desarrollo
Modelo Tweedie. Los modelos de la familia Tweedie son modelos exponenciales con
dispersin cuya densidad est dada por ))) ( ( exp( ) , ( ) , , ( u k u u
p p p
y y c y p donde
eR u es el parmetro de posicin, 0 > el parmetro de dispersin y la funcin ) (u k

p

que est dada por
{ }
=
=
=
2 , 1 ) ) 1 ((
2
1
2 ) log(
1
) (
1
2
p p
p
p
p e
p
p
p
u
u u k
u

Para una variable aleatoria Y con distribucin Tweedie se usar la notacin Y
~ ) , ( | u
p
W
T donde .La media y la dispersin de Y son
p
p Y E

= =
1
1
) ) 1 (( ) ( u y
) (
1
) (
| |
V Y V
p
= = donde
p
V = ) ( es la funcin de varianza que nicamente
caracteriza la variable. La familia de los modelos Tweedie incluyen las distribuciones ms
conocidas e importantes como la normal (p=0), Poisson(p=1), gamma (p=2) y la inversa
Gaussiana (p=3).
La aplicacin ms inmediata de estos modelos es cuando los datos son continuos y
positivos. Sin embargo, es claro que la expresin de la funcin de densidad no es fcil de
trabajar. Esta es quizs la razn principal que limita el uso de estos modelos en aplicaciones
de datos reales. Fuera del intervalo (0,1), cada valor real de p tiene una familia asociada y
dado un conjunto de datos, es posible, mediante el clculo del perfil de verosimilitud,
encontrar el valor del parmetro p tal que la familia Tweedie correspondiente sea la ms
adecuada a los mismos. Dunn y Smith proponen un mtodo para obtener una buena
aproximacin de los parmetros. Este mtodo proporciona una seleccin de
representaciones muy "a medida" a los conjuntos de datos con distribuciones sesgadas,
eligiendo el valor ptimo de p.
Percentil 95: Cuando los datos tienen distribucin normal, el percentil 95 se puede calcular
fcilmente a partir de la media (m) y la desviacin estndar (s) de los mismos utilizando la
siguiente frmula: P = m + z*s (P: percentil paramtrico) donde z es el correspondiente
cuantil de la distribucin normal estndar y su valor es 1.6449. Como el recuento de
bacterias no sigue una distribucin normal, se aplica a menudo la transformacin
logartmica para obtenerla. De esta manera se estima el percentil pero con los datos
transformados, por lo tanto P=m + z*s donde m y sson la media y la desviacin de los


datos transformados, respectivamente. Con lo cual, el percentil de los datos en la escala
original es: .Otra forma de obtener los percentiles se basa en la estadstica no
paramtrica.
Hay varias maneras de calcularlos:
Hazen: r = 0,5 + P * n/100
Blom: r = 8.3 + P * (n +1 / 4) / 100
Tukey: r = 1/3 + P * (n 1/3) / 100
Weibull: r = P * (n +1) / 100
donde n es el tamao de la muestra.
Una vez que el valor de r es conocido, el percentil se calcula como sigue:
donde ri indica la parte entera de r y rf la parte fraccionaria de
r.
Proponemos calcular el percentil a partir de la distribucin Tweedie de la siguiente manera:
1. Obtener el valor ptimo del parmetro p, va el perfil de verosimilitud, del conjunto de
datos
2. Calcular el percentil terico 95 tal que Es decir:

A partir de un conjunto de datos reales provenientes de playas de la ciudad de Mar del
Plata, estimamos el valor ptimo del parmetro p del modelo de la familia Tweedie, para
luego hacer simulaciones y calcular los percentiles no paramtricos, el paramtrico y el
obtenido a partir del modelo Tweedie. Como resultado de las simulaciones, observamos
que el percentil calculado a partir de la distribucin Tweedie presenta menor error cuadrtico
medio respecto de los otros, lo que hace que el estimador sea mejor en el momento de
hacer inferencias.
El aporte original de este trabajo es que respetamos la escala original de los datos y
estimamos el percentil 95 a partir de la distribucin Tweedie, que se ajusta adecuadamente
a los datos reales.

Bibliografa
[1]Hunter, P.R.2002. Does calculation of the 95th percentile of microbiological results offer
any advantage over percentage exceedence in determining compliance with bathing water
quality standards? Letters in Applied Microbiology, 34, 283-286.
[2] Tweedie, M. 1984. An index which distinguishes between some important exponential
families. Statistics: Applications and new directions. Proceedings of the Indian Statistical
Institute Golden Jubilee International Conference 579-604. Calcuta.
[3] McCullagh, P. y Nelder, J. 1989. Generalized Linear Models.Chapman & Hall.
[4] Jrgensen, B. 1992. The theory of exponential dispersion models and analysis of
deviance. Monografas de Matemtica no 51. IMPA, Rio de Janeiro, Brasil.
[5] Feller, W. 1978. Introduccin a la Teora de Probabilidades y sus Aplicaciones.
Volumen II. Ed. Limusa.
[6]Jrgensen, B. 1997. The Theory of Dispersion Models.Chapman & Hall.
[7] Dunn, P.K. y Smyth, G.K. 2005. Series evaluation of Tweedie exponential dispersion
model densities Statistics and Computing 15(4): 267-280.
[8] R Development Core Team, 2006. R: A language and environment for statistical
computing. R Foundation for Statistical Computing, Vienna, Austria,http://www.r-project.org/.
[9]Dunn, P. 2004. Tweedie exponential family models.R package version1.02.
[10] Bartram, J. and Rees, 2000. Monitoring Bathing Waters. London: E & FN Spon.
[11] Ellis, J.C., 1989. Handbook on the Design and Interpretation of Monitoring Programmes.
Report NS 29: Medmenham, England: WRc Environment, Water. Research Centre.
[12] G McBride and G Payne, NIWA, Hamilton, NZ, September 2002 & May 2009.



SOSTENIBILIDAD MUNDIAL VISTA DESDE
LA PERSPECTIVA BIPLOT

PURIFICACIN GALINDO-VILLARDN
1
, ISABEL GALLEGO-LVAREZ
2
y MIGUEL
RODRGUEZ-ROSA
3

1,3
Departamento de Estadstica
2
Departamento de Administracin de empresas
Universidad de Salamanca, Salamanca (Espaa)

pgalindo@usal.es; igallego@usal.es; miguel_rosa90@usal.es

RESUMEN
Un tema, cada vez ms en auge en todo el mundo, es el de la sostenibilidad el cual puede
ser abordado tanto desde la perspectiva empresarial como desde la perspectiva de los
pases. En la presente investigacin nos centramos en esta ltima y analizaremos distintos
indicadores de sostenibilidad. Para ello utilizamos un ndice de Sociedad Sostenible que
recoge informacin de los 21 indicadores que representan los aspectos econmicos,
sociales y medioambientales para un buen funcionamiento de la sociedad, segn Van de
Kerk y Manuel (2012) [1]. Se estudian 151 pases pertenecientes a diferentes reas
geogrficas. La ordenacin de los Pases segn niveles de sostenibilidad se realiza con un
HJ-Biplot (Galindo, 1986 [2]). Los resultados obtenidos indican que todos los indicadores
relacionados con los temas sociales caracterizan a los pases ms desarrollados que
pertenecen a Europa y Amrica; por otro lado los indicadores medioambientales toman
valores ms altos en los pases menos desarrollados como son los que pertenecen a frica.
Los resultados obtenidos estn en la lnea de los obtenidos por otros autores como Hosseini
y Kaneko (2011) [3].

Palabras claves: HJ -Biplot, Sustainable Society Index.

Introduccin
En los ltimos aos se ha producido en todo el mundo un gran inters por los temas
relacionado con el desarrollo sostenible o sostenibilidad, tanto a nivel micro (sostenibilidad
en el mbito empresarial) como macroeconmico (sostenibilidad de los diferentes pases)
tema menos desarrollado que a nivel empresarial pero que sin duda es muy importante. En
la presente investigacin nos centramos en la sostenibilidad de los pases que ha cobrado
gran relevancia a partir de la Conferencia de las Naciones Unidas sobre Medio Ambiente y
Desarrollo Sostenible celebrada en Rio de Janeiro en 1992, que incorpora el Desarrollo
Sostenible en la agenda poltica mundial y reafirma el concepto introducido en 1987 en el
Informe Brundtland. En dicho informe se recoge la primera formulacin oficial, del concepto
de Desarrollo Sostenible, definindose como el desarrollo que satisface las necesidades
presentes sin comprometer la capacidad de que las generaciones futuras satisfagan sus
propias necesidades (World Comission on Environment and Development, WCED, 1987
[4]). De este modo, se definen los principios generales que deben orientar a nivel
internacional las relaciones entre la economa y el medio ambiente, destacndose la
necesidad de buscar estrategias que permitan compatibilizar los procesos de crecimiento
con la sostenibilidad (Erias-Rey, 2003 [5]).
El logro del Desarrollo Sostenible supone avanzar en tres pilares fundamentales: el
desarrollo econmico, la cohesin social y la proteccin del medio ambiente. Es decir, el
Desarrollo Sostenible presupone la integracin de tres dimensiones:
Medioambiental (ecolgica). Se define como la necesidad de mantener la
continuidad de los recursos medioambientales a lo largo del tiempo. Se puede lograr
a travs de la limitacin del consumo de los recursos y productos fcilmente
agotables, la reduccin de los residuos y la contaminacin en todas sus vertientes, la


conservacin de la energa y el reciclaje.
Social. Implica la necesidad de garantizar la equidad intergeneracional, es decir,
satisfacer las necesidades bsicas actuales de todas las personas garantizando, al
mismo tiempo, el que, llegado el momento, las generaciones futuras puedan
igualmente satisfacer las suyas.
Econmico. Supone la bsqueda del equilibrio econmico mediante una combinacin
ptima entre el desarrollo econmico y la conservacin de los recursos naturales.

Desarrollo
Descripcin de la muestra
Utilizamos el ndice de Sociedad Sostenible (SSI), elaborado por Van de Kerk y Manuel
(2012) [1] evaluado en 151 pases internacionales de distintas reas geogrficas y que
recoge informacin de los tres ejes fundamentales del Desarrollo Sostenible: econmico,
social y medioambiental.
Est formado por 3 dimensiones, 8 categoras y 21 indicadores entre los que se encuentran:
suficiente comida, suficiente bebida, educacin, buen gobierno, calidad del aire,
biodiversidad, emisin de gases, energa renovable, empleo, producto interior bruto, deuda
pblica, entre otros.
Tcnica de anlisis
La tcnica elegida para realizar el anlisis es el HJ- Biplot (Galindo, 1986 [2]), el cual permite
representar grficamente la matriz de datos X (151x21) resultante de observar los 151
pases y los 21 indicadores que representan los aspectos econmicos, sociales y
medioambientales, en un subespacio de baja dimensin en el cual es posible interpretar la
proximidad entre los puntos que representan a los pases en terminos de similitud y los
ngulos entre los marcadores que representan los indicadores, en terminos de covariacin
entre ellos. El software para aplicar el HJ-Biplot ha sido desarrollado por Vicente-Villardn
(2010) [6].

Los tres primeros valores propios absorben el 62.33% de la inercia. Existe un eje dominante
que absorbe prcticamente el 43,73%.
La Tabla 1 recoge los valores de las correlaciones de los ejes latentes con los ndices de
sostenibilidad observados. (Contribuciones del factor al elemento). La mayor parte de los
indicadores de sostenibilidad presentan altas correlaciones con eje 1. En la Figura 1 se
representan las ndices de sostenibilidad y los pases, con marcas diferentes para las
diferentes zonas geogrficas.
Tabla 1: Contribucin relativa del factor al elemento
Sufficient Food
62
1
32 0 Gender Equality
33
0
19
9
33
Renewable
Energy
57
8
19
5
17
Sufficient to
Drink
70
3
19 22 Income Distribution
15
2
12
32
0
Greenhouse
Gases
73
5
38 2
Safe Sanitation
73
9
83 5 Good Governance
68
4
11
1
4 Organic Farming
38
1
16
2
69
Healthy Life
84
0
2 3 Air Quality 98
33
4
85 Genuine Savings 76
11
7
51
Clean Air
69
4
5 8 Biodiversity 3
33
9
38 GDP
88
5
0 0
Clean Water
28
5
21
5
4
Renewable Water
Resources
16
65
0
34 Employment 70 1 186
Education
75
7
1 6 Consumption
44
9
97 0 Public Debt 85 10 396


Todos los indicadores relacionados con los temas sociales, Educacin, Igualdad de Gnero,
Buen Gobierno, etc., caracterizan a los pases ms desarrollados que pertenecen a Europa
y Amrica; por otro lado los indicadores medioambientales como Emisin de Gases, Energa
Renovable, etc., son ms altos en los pases menos desarrollados como son los que
pertenecen a frica.

Figura 1. Representacin HJ-BIPLOT. reas geogrficas e Indicadores de sostenibilidad

La variable Fuentes de agua renovables es la ms importante para discriminar los pases
asaticos del resto de los pases. Los resultados obtenidos estn en la lnea de los obtenidos
por otros autores como Hosseini y Kaneko (2011) [3] que mediante la utilizacin de la
tcnica de componentes principales concluyen que los indicadores de sostenibilidad mejores
del mundo corresponden a Europa en parte debido a las condiciones econmicas medidas
mediante el indicador GDP, que tambin aparece en nuestro modelo como indicador
relevante en los pases europeos. As mismo coinciden al indicar que frica no muestra
inters por los temas institucionales, econmicos ni sociales pero s por los
medioambientales.

Bibliografa
[1 Van de Kerk, G. y Manuel, A. (2012). Sustainable Society Index. Sustainable Society
Foundation.
[2] Galindo, M. P. (1896). Una alternativa de representacin simultnea: HJ-Biplot.
Questio, 10(1): 1323.
[3] Hosseini, H. y Kaneko, S. (2011). Dynamic sustainability assessment of countries at the
macro level: A principal component analysis. Ecological Indicators, 11(3): 811823.
[4] World Commission on Environment and Development (1987). Our common future.
Oxford; New York: Oxford University Press.
[5] Erias-Rey, A. (2003). Desarrollo sostenible: un nuevo escenario en el mbito local.
Economa, Medio Ambiente y Desarrollo Sostenible. Diputacin de A Corua. Universidad de
A Corua, 329342.
[6] Vicente-Villardn, J. L. (2010). Multbiplot. A package for Multivariante Analysis using
Biplots. Departamento de Estadstica. University of Salamanca. Salamanca. Spain.
http://biplot.usal.es/ClassicalBiplot/index.html


ANLISIS ESTADSTICO DE REPETITIVIDAD DEL NDICE DE
SORCIN DE FSFORO (ISP)

POSE, N. N.
1
; CENDOYA, M. G
1
.; ZAMUNER, E. C.
1

1
Facultad de Ciencias Agrarias, Universidad Nacional de Mar del Plata

nelidapose@gmail.com

RESUMEN
En la literatura existe escasa informacin sobre estudios de precisin (repetitividad) en la
estimacin de capacidad de sorcin de fsforo (P), utilizando el ndice de Sorcin de P (ISP).
Para realizar el anlisis se emplearon muestras compuestas de 5 cm superficiales de 4
suelos molisol con agricultura y distintas caractersticas edficas. Se emple isoterma de
adsorcin de P de un punto para calcular ISP. Se calcul ISP como el cociente entre P
sorbido y logaritmo de concentracin de P en solucin. El objetivo de esta experiencia fue
determinar la repetitividad del mtodo empleado y establecer la mejor distribucin de
nmero de muestras y submuestras que no produzca mayores cambios en la repetitividad
lograda. A travs del anlisis de varianza, se estim la varianza de error y la diferencia
mnima significativa (DMS) para comparar medias entre dos tratamientos. Luego se
realizaron 500 remuestreos aleatorios de 4, 3, 2 y 1 submuestra por muestra, considerando
4 o 2 muestras por tratamiento, se reajust el modelo, y se obtuvo la repetitividad y DMS. La
estimacin de repetitividad o varianza de error en el mtodo result de 402,15 (mg P kg
-
1
suelo)
2
, con una capacidad para detectar una diferencia mnima significativa entre
tratamientos de 36.00 (mg P kg
-1
suelo). Se puede concluir que la tcnica del ISP tiene
buena repetitividad en las condiciones analizadas, mostrando efecto de las caractersticas
del suelo. Sin embargo, no es prctico como anlisis de rutina el uso de 4 muestras y 5
submuestras por tratamiento. De la comparacin de los resultados con 5 a 1 lecturas
colorimtricas (submuestras) por muestra surge que no hay diferencias importantes ni en
repetitividad ni DMS, cuando se realizan 2 lecturas en 4 muestras, simplificando el anlisis
de laboratorio y pudiendo considerarse una alternativa aceptable en trminos de relacin
costo-beneficio.

Palabras clave: Capacidad de retencin de fsforo, submuestreo, tamao de muestra.

Introduccin
Los diferentes laboratorios utilizan distintas tcnicas en la determinacin del ndice de
Sorcin de fsforo (ISP), con escasa informacin respecto a estudios de precisin de dichas
tcnicas. Bache y Williams (1971) reportaron que los procedimientos utilizados presentaban
coeficientes de variacin inferiores al 6%. En este trabajo se seleccion para la tcnica
utilizada por Rubio et al. (2008) para determinar el ISP, en Argiudoles de la pampa ondulada
(Argentina). La repetitividad de un mtodo es la precisin de las determinaciones, cuando es
desarrollado por un mismo analista en un mismo equipo a lo largo de un periodo de tiempo
corto (Calpena et al., 1991). El objetivo de esta experiencia fue determinar la repetitividad
del mtodo empleado y establecer la menor cantidad de recursos y su mejor distribucin
entre nmero de muestras y submuestras que no implique mayores cambios en la
repetitividad lograda.

Desarrollo
Para realizar este trabajo de consideraron 4 lotes con diferentes caractersticas edficas
(Tabla 1), en el establecimiento Cinco Cerros, Balcarce (Buenos Aires) sobre un suelo
Argiudol tpico (USDA Soil Classification). En octubre del 2010, se tomaron para cada lote
una muestra compuesta de 20 porciones de 5 cm superficiales suelo, se secaron al aire y se
tamizaron por 2 mm. Para determinar el ISP se emple la tcnica de isoterma de adsorcin


de P de un punto (Bache & Williams, 1971). Para cada lote, la muestra compuesta se dividi
en 4 muestras, dos de ellas se analizaron en una primera sesin de trabajo y otras dos en
una segunda sesin. De cada muestra se agit horizontalmente 1 g de suelo con 20 mL de
solucin de 75 mg P L
-1
en CaCl
2
0.01M, durante 20 h a 25C; luego se centrifug a 5000
rpm (10 min a 10C). Del sobrenadante se tomaron 5 submuestras y se determin
concentracin de P por colorimetra (Murphy y Riley, 1962). La cantidad de P sorbido se
calcul como diferencia entre concentracin de P agregada en solucin inicial y la
determinada en cada submuestra del sobrenadante. Finalmente se calcul ISP mediante la
siguiente ecuacin (Bache y Williams, 1971):
, Donde: X = P sorbido en fase slida (mg P kg
-1
suelo);
P
f
= concentracin de P en
solucin del suelo, luego de 20 h de equilibrio (mg P L
-1
).

Tabla 1: Valores de pH, P extractable Bray1, y carbono orgnico total (COT) en los suelos
estudiados.

Para el anlisis de repetitividad se consider que los valores de ISP correspondan a 4
Tratamientos (Lotes A, B, C y D), en dos bloques (sesin 1 y 2 de trabajo), con dos
repeticiones en cada sesin y 5 submuestras. Se realiz el anlisis de varianza para
determinar la precisin del mtodo (repetitividad), estimando la varianza de error y la
diferencia mnima significativa (DMS) para la comparacin de medias entre dos
tratamientos con =0.05.
El mtodo utilizado requiere determinar el ISP en un total 20 submuestras, esto es muy
costoso en trminos de tiempo y trabajo como para utilizarse en un anlisis de rutina.
Reducir el nmero total de submuestras por tratamiento se puede lograr disminuyendo el
nmero de muestras o el de submuestras por muestra. Para determinar la combinacin
ptima de cantidad de muestras y submuestras, se realizaron 500 remuestreos aleatorios de
4, 3, 2 y 1 submuestra por muestra, utilizando las 4 muestras por tratamiento o slo 2 de
ellas. En cada caso se reajust el modelo se obtuvo repetitividad y DMS. Los anlisis se
realizaron con el programa R (R Core Team, 2012).

La estimacin de la repetitividad o varianza de error en el mtodo result de 402,15 (mg P
kg
-1
suelo)
2
, con una capacidad para detectar una diferencia mnima significativa entre
tratamientos de 36,00 (mg P kg
-1
suelo).
En Tabla 2 se presenta el anlisis de varianza para ISP cuando se trabaj con las 4
muestras y 5 submuestras. Los datos resultaron desbalanceados pues el lote C no se
analiz en la 1 sesin de trabajo. Se detect diferencia significativa en ISP entre los sitios
analizados (p<0, 0001).
Las estimaciones de repetitividad obtenidas con 4 muestras y menor nmero de
submuestras resultaron en promedio muy similares a la obtenida con todos los datos, para
submuestras de tamao 2 a 4, pero este valor crece cuando slo se trabaja con una muestra
(Figura 1). Esto es razonable pues al no tener submuestras el error de submuestreo queda
confundido con el error experimental. Por este motivo se recomienda al menos realizar dos
submuestras por muestra al utilizar este mtodo. Tambin observamos en la Figura 1, que la
variabilidad de esta estimacin crece al disminuir el tamao de las submuestras, hecho que
tambin es conocido, pero deseamos estudiar que tan grave es la prdida en confiabilidad
en trminos de la relacin costo-beneficio. Al reducir el nmero de muestras de 4 a 2, vemos
pH PBray1 COT
A 6,12 20,6 47,82
B 7,18 35,08 42,87
C 6,2 41,18 38,31
D 5,95 53,26 31,19
Lote mg P kg
-1
g C kg
-1
f
P
X
ISP
log


que la estimacin del error experimental aumenta en forma consistente para todo tamao de
submuestra, y la variabilidad en la estimacin es mucho mayor. En este sentido con una
misma asignacin de recursos, de 8 submuestras totales por tratamiento, es ms
recomendable trabajar con 4 muestras y dos submuestras que con 2 muestras y 4
submuestras, pues se obtiene una menor estimacin de la varianza experimental con similar
variabilidad en la estimacin.
Con respecto a la capacidad para detectar diferencias significativas entre tratamientos,
vemos que al reducir el nmero de submuestras de 5 hasta 2, en promedio no hay grandes
cambios, si bien la variabilidad de la DMS aumenta (Figura 2). Sin embargo, estas prdidas
son mucho mas evidentes al disminuir el nmero de muestras. Para la misma asignacin de
recursos de 8 submuestras totales por tratamiento, es mejor asignarlas en 4 muestras con
dos submuestras que en 2 muestras con 4 submuestras, tanto en el valor medio de DMS
como en su variabilidad.
Para la estimacin de la capacidad de retencin de P utilizando el ISP, se puede concluir
que la tcnica tiene buena repetitividad en las condiciones analizadas, permitiendo mostrar
el efecto de las caractersticas del suelo en dicho ndice. De la comparacin de los
resultados obtenidos surge que se podra simplificar el anlisis de laboratorio con slo 2
lecturas en cuatro muestras sin prdidas importantes ni en repetitividad ni en DMS, pudiendo
considerarse una alternativa aceptable en trminos de relacin costo-beneficio.

Tabla 2: Anlisis de la varianza para el ISP con cinco submuestras por unidad experimental (U.E.).
Fuentes de variacin
Grados de
libertad
Suma de
cuadrados
Cuadrado
medio de error
F cal Probabilidad
Da 1 4570 4570 1,80 0,21
Suelo 3 229927 76642 30,26 4,95e-05 ***
Error entre U.E. 9 22797 2533 4,85 8,36e-05 ***
Error dentro de U.E. 56 29246 522
Cdigos de significacin: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

Figura 1: Estimacin de la varianza de error en
funcin del nmero de submuestras, crculo negro
con 2 muestras por tratamiento, tringulo gris con 4
muestras por tratamiento, lneas continuas unen los
valores promedios, lneas punteadas unen los
cuantiles del 2,5% y 97,5%.
Figura 2: Diferencia mnima significativa al 5% en
funcin del nmero de submuestras, crculo negro
con 2 muestras por tratamiento, tringulo gris con
4 muestras por tratamiento, lneas continuas unen
los valores promedios, lneas punteadas unen los
cuantiles del 2,5% y 97,5%.

Bibliografa
Bache, B. W. y Williams, E. G. (1971). A phosphate sorption index for soils. Soil Sci. J.
vol(22): 289-301.
Calpena A. C., Escribano E, Fernndez C. (1991) Validacin de los mtodos analticos.
Farm. Clin.; Vol(7(9)):749-58.


Murphy, J. y Riley, J. P. (1962). A modified single solution method for the determination of
phosphate in natural waters. Anal. Chim. Acta(27): 31-36.
Rubio, G.; Cabello, M. J.; Gutirrez Boem, F. H. (2008). Estimating Available Soil
Phosphorus Increases after Phosphorus Additions in Mollisols. Soil Sci. Soc. Am. J.
Vol(72):1721-1727.
Usda Soil Clasiffication (2006). Claves para la Taxonoma de Suelos. Soil Survey Staff
Departamento de Agricultura de los Estados Unidos. Servicio de Conservacin de Recursos
Naturales. 10 Edicin, 331 p.
R Core Team (2013). R: A language and environment for statistical computing. R Foundation
for Statistical Computing, Vienna, Austria. Versin 3.0.0 obtenida 03/04/2013 URL
http://www.R-project.org/


UNA PRUEBA DE BONDAD DE AJUSTE DEL TIPO DE
CORRELACION-REGRESION Y SU APLICACIN A DATOS CON
CENSURA DEL MEDIO AMBIENTE

CLAUDIA CASTRO-KURISS
1

1
Departamento de Matemtica, Instituto Tecnolgico de Buenos Aires (ITBA), Buenos Aires,
Argentina

ccastro@itba.edu.ar ccastrok@gmail.com

RESUMEN
En este trabajo se propone una nueva prueba de bondad de ajuste a una distribucin normal
con parmetros desconocidos bajo la hiptesis nula (Ho). Esta prueba puede emplearse en
el caso de muestras completas y tambin en el caso de muestras con censura de Tipo II a
derecha o a izquierda. Dicha prueba est basada en un estadstico de correlacin obtenido a
partir de un grfico de probabilidad empleando las medianas de los estadsticos de orden
normales. En este trabajo se calculan los cuantiles de la distribucin del estadstico bajo la
hiptesis nula mediante simulaciones de Monte Carlo. Tambin mediante simulaciones, y
para diferentes porcentajes de censura, se calcula la potencia de la prueba basada en el
estadstico propuesto usando una distribucin normal en la Ho y diversas distribuciones
conocidas en la alternativa. Mediante un extenso estudio de simulacin, se compara la
potencia del test con las de otros estadsticos de tipo cuadrtico y del tipo de Kolmogorv-
Smirnov (KS) empleados tambin para probar normalidad con datos completos y
censurados. La prueba propuesta resulta ms potente en la mayora de los casos
considerados. Finalmente, el empleo del test propuesto se ilustra a travs de un ejemplo
con datos reales del medio ambiente. Se propone adems para el tipo de problema
planteado una forma alternativa de estimacin de la media y el desvo de la muestra
censurada en el caso que provenga de una distribucin normal o de una log-normal.

Palabras clave: medianas de estadsticos de orden, coeficiente de correlacin.

Introduccin
Tests basados en regresin y correlacin han sido empleados con xito en el caso de
muestras completas, tanto para testear normalidad como para testear otras distribuciones de
locacin y escala. En particular el test propuesto por Shapiro y Wilk (1965, 1968) basado en
el estadstico W es el cociente, al cuadrado, entre el mejor estimador lineal del parmetro
de escala de la distribucin normal y el desvo estndar muestral. Este test fue
posteriormente modificado por Shapiro y Francia (1972) para muestras grandes, quienes
propusieron pesar las observaciones ordenadas por el valor esperado de los estadsticos de
orden normales, obteniendo as el estadstico W. Tanto W como su modificacin W son
estadsticos del tipo de correlacin-regresin pues W es igual al cuadrado de la correlacin
entre los estadsticos de orden de la muestra y los valores esperados de los estadsticos de
orden normales (ver DAgostino y Stephens (1986)). El test de Shapiro-Wilk result ser el
ms potente para el caso de normalidad (ver Tiku (1974)).
Varios autores han propuesto estadsticos basados en grficos de probabilidad, como el de
probabilidad-probabilidad (PP-plot) para establecer la bondad de ajuste. Filiben (1975)
emple tcnicas grficas y bas su propuesta en el coeficiente de correlacin que surge del
grfico de probabilidad normal y lo emple para testear normalidad en muestras completas.
El test que proponemos en el presente artculo es una extensin y modificacin de dicha
propuesta.
Las muestras con censura aparecen en la prctica cuando no es posible relevar toda la
informacin de las unidades muestreadas y son aquellas donde las observaciones
incompletas estn identificadas y se conoce su nmero. Aparecen con gran frecuencia en


aplicaciones prcticas en distintos areas de la ciencia. Por ejemplo, en ciencias
relacionadas con el medio ambiente donde los valores reportados resultan mayores que una
cota conocida y especificada mientras que los datos censurados resultan inferiores a dicha
cota. Estas cotas se conocen como lmite de cuantificacin (LDC) y lmite de deteccin
(LDD) del aparato empleado en la medicin. Ver Keith L. (1991). Sobre modos y tipos de
censura, consultar Lawless (2003).
Para estas muestras surgen de manera natural dos problemas: establecer la distribucin
subyacente de los datos a estudiar y brindar estimaciones de media y desvo.
El caso ms frecuente de aplicacin consiste en considerar que la distribucin especificada
en Ho pertenece a una familia de locacin y escala. Por lo que es necesario estimar los
parmetros de la distribucin especificada en la hiptesis nula, que en nuestro trabajo
consideramos normal. Estudiar la bondad del ajuste resulta complejo ya que la distribucin
de los estadsticos puede depender de los estimadores de los parmetros, del mtodo de
estimacin, del tamao muestral como tambin de la distribucin considerada en la hiptesis
nula. Si los parmetros son estimados con mtodos adecuados entonces la distribucin de
los estadsticos de los tests no dependen de los valores verdaderos de los parmetros (ver
DAgostino y Stephens (1986)). Uno de los test de bondad de ajuste ms conocido es el de
Kolmogorov-Smirnov (KS) que compara la funcin de distribucin emprica (FDE) con la
funcin de distribucin acumulada (FDA) terica establecida en la hiptesis nula. El
estadstico de este test ha sido notado como D y se basa en la distancia del supremo entre
la FDE y la FDA. Tambin son muy conocidos los estadsticos denominados de tipo
cuadrtico, que se basan en otras distancias entre la FDE y la FDA. Los estadsticos de
estos tests se denotan W
2
(Cramer-von Mises), A
2
(Anderson-Darling) y U
2
(Watson). Ver
DAgostino y Stephens (1986).
Tests de bondad de ajuste para muestras normales censuradas y con parmetros
desconocidos estimados por mxima verosimilitud basados en el estadstico D y en el de
Michael (1983) DSP, fueron propuestos por Castro- Kuriss et al. (2010).
El objetivo del presente trabajo es proponer un nuevo test de bondad de ajuste para
muestras con censura por derecha o por izquierda provenientes de una poblacin normal,
fcil de implementar computacionalmente y potente frente a diversas alternativas y que
tenga a su vez la posibilidad de asociarse con un grfico de probabilidad. Al mismo tiempo
brindar otra estimacin para los parmetros de la muestra censurada suponiendo
normalidad para el tema de aplicacin mencionado donde habitualmente se emplean otros
mtodos tales como el de reemplazo de los valores censurados, el de estimacin de los
parmetros para muestras con censura suponiendo previamente una distribucin en los
datos (Clifford Cohen (1991)) y mtodos tipo fill-in que incluyen propuestas paramtricas
robustas. Ver Manly B. (2001).

Desarrollo
El estadstico del test est basado en el coeficiente de correlacin entre las medianas de los
estadsticos de orden normales y los estadsticos de orden muestrales censurados, por lo
que el test propuesto puede asociarse a un grfico del tipo cuantil-cuantil normal con
censura.
Bajo Ho, la distribucin se consider perteneciente a la familia normal y los parmetros
fueron estimados mediante mxima verosimilitud, y tambin en aquellos casos donde
mediante transformaciones es posible obtener una muestra proveniente de la distribucin
normal.Por ejemplo, se puede testear si la distribucin subyacente es log-normal. Se emple
el mtodo de Monte Carlo para calcular los cuantiles de la distribucin del estadstico
propuesto bajo Ho para distintos radios de censura y tamaos muestrales y se estudi la
potencia comparativa del test considerando 17 distribuciones en la hiptesis alternativa, que
abarcaron distribuciones asimtricas, simtricas con colas cortas, simtricas con colas
pesadas y normales contaminadas con distintas elecciones de contaminacin. La
comparacin de la potencia se realiz con la de los tests basados en D, DSP, W
2
, A
2
y U
2
ya
mencionados.



Mediante el empleo de un programa desarrollado en lenguaje R, el test se puede aplicar a
cualquier tamao muestral y radio de observaciones censuradas. El test est asociado a un
grfico de probabilidad a partir del cual se proponen estimaciones para la media y el desvo
de la muestra censurada.
La potencia comparada con los estadsticos de tipo cuadrtico y de tipo KS muestra que el
test resulta ms potente para la mayora de las alternativas consideradas o es competitivo
con el ms potente. Como ejemplo de aplicacin se emplea un conjunto de 75 mediciones
en partes por miles de millones 1,2,3,4-tetraclorobenceno, donde 19 fueron censurados por
izquierda en 0.25. Estos datos fueron estudiados por Gilbert y Simpson (1992).
Posteriormente Manly (2001) estima la media y el desvo mediante varios mtodos
suponiendo log-normalidad pero al graficarlos pone en duda su afirmacin. Mediante el test
propuesto se rechaza la hiptesis de log-normalidad, con un valor-P <0.01, por lo que se ha
encontrado la respuesta al problema planteado por dicho autor.

Bibliografa
[1] Castro-Kuriss, C., Kelmansky, D., Leiva, V., Martinez, E. (2010). On a goodness-of-fit test
for normality with unknown parameters and type-II censored data. Journal of Applied
Statistics, 37, 1193-1211.
[2] Clifford Cohen A. (1991) Truncated and Censored SamplesTheory and Applications,
Marcel Dekker, Inc., New York.
[3] D'Agostino, R. B., Stephens, M. A. (1986). Goodness of Fit Techniques. Marcel Dekker,
New York.
[4] Filiben, J. J. (1975). The probability plot correlation coeficient test for normality.
Technometrics, 17, 111-117.
[5] Gilbert, R.O. and Simpson, J.C. (1992). Statistical Methods for Evaluating the Attainment
of Cleanup Standards. Volume 3: Reference-Based Standards for Soils and Solid Media.
United States Environmental Protection Agency Report PNL-7409, Springfield, Virginia.
[6] Keith, L.H. (1991). Environmental Sampling and Analysis: A Practical Guide .Lewis
Publishers, Chelsea, Michigan.
[7] Lawless, J.F. ( 2003). Statistical Models and Methods for Lifetime Data. Second Edition.
Wiley, New York.
[8] Manly Bryan F.J. (2001). Statistics for Environmental Science and Management.
Chapman & Hall/CRC. London.
[9] Michael, J. R. (1983). The stabilized probability plot. Biometrika, 70, 11-17.
[10] R Development Core Team R: A language and environment for statistical computing. R
Foundation for Statistical Computing, Vienna,Austria. (2008). http://www.r-project.org./
[11] Shapiro, S., Francia R. (1972). An approximation analysis of variance test for normality.
Journal of the American Statistical Association, 67, 215216
[12] Shapiro, S. S., Wilk M. B. (1965). An analysis of variance test for normality (complete
samples). Biometrika, 52, 591-611.
[13] Shapiro, S. , Wilk M. B. (1968) . Approximation for the null distribution of the W statistic,
Technometrics, 10, 861-866.
[14] Tiku, M. L. (1974). Testing normality and exponentiality in multi-sample situations.
Communications Statistics, 3(8), 777-794.



ANLISIS MULTIVA PARA LA CARACTERIZACIN DE
VARIACIONES ESPACIALES MAGNTICAS DE SEDIMENTOS
CONTAMINADOS DE LA BASE MARAMBIO (ANTRTIDA)

Natal, Marcela
1
, Chaparro Mauro A. E.
2
Chaparro Marcos A.E
3

1
Departamento de Matemtica Facultad de Ciencias Exactas y Naturales, UNMDP
2
Departamento de Matemtica Facultad de Ciencias Exactas y Naturales, UNMDP-
CONICET, Dean Funes 3350 - B7602AYL, Mar del Plata, Argentina
3
Instituto de Fsica Arroyo Seco (IFAS, UNCPBA)-CONICET, Pinto 399, 7000 Tandil,
Argentina

mnatal@mdp.edu.ar

RESUMEN
El modelo Tucker3 o de componentes principales de tres vas es aplicado frecuentemente
para identificar variaciones temporales y espaciales en datos con estructura
multidimensional. El estudio a travs de parmetros magnticos de la contaminacin
ambiental es un tema de gran inters, en particular en ambientes sensibles como la
Antrtida. Debido a la estructura multidimensional que presentan el conjunto de datos es
necesario para su anlisis la aplicacin de mtodos estadsticos multivariados. El modelo
Tucker3(P,Q,R) permite una interpretacin completa de la informacin registrada,
permitiendo resumir mediante unos pocos componentes cada una de las vas del arreglo
original e interpretando las interacciones entre las tres vas. En este trabajo se analizan
muestras de sedimentos lacustres en la base antrtica Marambio con una estructura de tres
modos: Lugar (6), Variables magnticas (7) y Profundidad (16) con el objetivo de obtener
una caracterizacin de las variables magnticas de acuerdo a la ubicacin y a la profundidad
a partir de un modelo Tucker3. El modelo Tucker3 (3,2,3) es el de dimensiones ptimas y
explica el 67 % de la varianza total. Se determin que las ms altas y ms bajas
concentraciones de material magntico estn a los 11, 12, 13 y 14 cm de profundidad en el
lugar L279 y LM116 respectivamente. Por otra parte se observ que en la superficie en
estos sitios los tamaos de granos magnticos son ms finos y con mayor coercitividad que
en los lugares L252 y L253.

Palabras clave: modelo Tucker3, anlisis multiva, magnetismo ambiental

Introduccin
La contaminacin en ambientes y su estudio a travs de parmetros magnticos es un tema
de gran inters, y en particular, en ambientes sensibles como la Antrtida (Chaparro et al.
2007). La utilizacin de mtodos magnticos para estudiar zonas afectadas por
contaminantes es econmica y relativamente rpida de llevar a cabo en contraposicin con
otros mtodos. No obstante, dichos estudios ambientales pueden involucrar un gran nmero
de datos que representan mltiples mediciones en muestras obtenidas en diferentes lugares
y a diferentes profundidades. En estos casos es necesario utilizar mtodos estadsticos
multivariados que permitan reducir el nmero de variables para simplificar la estructura de
los datos, y as, describir las formas de variacin en el espacio y en las profundidades. Entre
los mtodos usados para explorar los arreglos de tres vas, el modelo Tucker3(P,Q,R)
(T3
P,Q,R
) es aplicado frecuentemente (Singh 2006; Kroonenberg, 2008; Dong, 2010).

Materiales y mtodos
1 Conjunto de datos
En este trabajo se analiza un conjunto de datos de muestras de sedimentos de la Base
Marambio la cual est ubicada al noreste de la Isla Marambio a 210 m.s.n.m. Desde el ao


1969 existe un asentamiento permanente en la isla y en consecuencia, las actividades han
modificado el ambiente. Tales modificaciones, en su mayora, han tenido un efecto adverso
sobre la zona de influencia de la base (Chaparro et al., 2007). La base de datos tiene una
estructura multidimensional: Lugar (6), Variables magnticas (7) y Profundidad (16). Las
muestras utilizadas para este estudio provienen de tres lagunas artificiales, dos de las
cuales se utilizan en la actualidad para consumo de la base. De las tres lagunas se
extrajeron seis cores cortos (LM116, L252, L253, L277, L278, L279). LM116 y L277/78/79
pertenecen a las lagunas que actualmente se usan para consumo. En el laboratorio, los
cores fueron muestreados cada 1 cm; obtenindose as un total de 96 muestras. A cada una
de ellas se le realizaron mediciones magnticas (susceptibilidad magntica y magnetizacin
remanente: Las variables X, ARM y SIRM miden concentracin magntica, KARM/K y
SIRM/K miden el tamao de grano magntico y, ARM/SIRM, y H
cr
miden la coercitividad
magntica.
2 Modelo Tucker3
El modelo T3
P,Q,R
es una generalizacin del Anlisis de Componentes Principales y la
Descomposicin en valores singulares. El modelo ajustado a una matriz de datos de tres
vas X=(x
ijk
), de dimensiones IxJxK es dado por la siguiente expresin:
ijk pqr kr jq
P
p
Q
q
R
r
ip ijk
e g c b a x
1 1 1

Dnde a
ip
,b
jq
y c
kr
son los elementos de las matrices de componentes de los modos A(IxP),
B(JxQ) y C(KxR); g
pqr
es el elemento de la matriz ncleo G(PxQxR) y e
ijk
representa el
residual. La interaccin entre la componente p del primer modo, la componente q del
segundo modo y la componente r del tercer modo es dada por g
pqr
. Para seleccionar el
nmero de componentes ptimas en el modelo T3
P,Q,R
se considera el criterio de
Timmerman y Kiers citado por Kroonenberg (2008) basado en un multiway scree-plot en el
cual se representa la deviance de cada modelo T3
P,Q,R
posible versus la suma del nmero
total de componente S=P+Q+R. Se consideran las medidas de ajuste del modelo definidas a
partir de las matrices de componentes (A, B y C) y de la matriz G. Las medidas calculadas
corresponden a la proporcin de variabilidad explicada, la contribucin de los componentes
de cada modo y de cada triada de componentes al ajuste del modelo. Para el anlisis de los
datos se utiliza el paquete PTAK desarrollado por Leibovici (2010) del software R.

Debido a la naturaleza de los datos se realiz un pre-procesamiento para eliminar
diferencias de nivel y escala. Considerando Singh (2006) los datos fueron centrados a travs
del modo Lugar y escalados sobre la matriz centrada desplegada por el modo Variables. A
partir del multiway scree-plot y del porcentaje de varianza explicada se considera el modelo
de dimensin ptima (3,2,3) que explica el 67 % de la varianza total. En la Figura 1 se
representan las componentes de cada uno de los modos. Considerando las estimaciones de
la matriz de componentes para Variables, la primera componente tiene cargas negativas
altas en SIRM, ARM y X y carga positiva en ARM/SIRM. La segunda componente tiene
todas las cargas negativas en las restantes variables. De acuerdo a la matriz para Lugar la
primera componente tiene carga positiva para L279 y una carga negativa para LM116; la
segunda componente tiene cargas negativas en L252 y positivas en L279 y LM116; y la
tercera componente tiene carga negativa para el L278 y carga positiva para L279.
Considerando la matriz para Profundidad la primera componente tiene cargas negativas
para las profundidades 11, 12, 13 y 14; la segunda componente tiene carga positivas en las
profundidades 0, 1, 2 y 3; mientras que la componente 3 tiene cargas negativas para las
profundidades 7 y 8. La contribucin de los tres componentes del modo Lugar al ajuste total
del modelo es de 34.5%, 24.5% y 8.5%, del modo Variables 42.3% y 25.2%; y los del modo
Profundidad en 41.4%, 19% y 7.12%. Analizando los elementos de la matriz G estimada y
sus porcentajes de variacin explicada (Tabla 1) el 67 % de la variabilidad total explicada se
descompone principalmente en: 31.8 % es lo explicado por el elemento (1,1,1), 13.15% por
(2,2,2); 7.55% por (3,2,1) y el 5% por (2,1,3). A partir de la triada (1, 1, 1), se puede


caracterizar que en las profundidades 11, 12, 13 y 14 existen diferencias entre los valores de
concentracin de X, ARM, SIRM y SIRM/K entre los lugares LM116, L279 y L278. En dichas
profundidades en el lugar LM116 se observan las mayores concentraciones de minerales
magnticos (en los cuales coinciden los signos de las componentes); mientras que en los
sitios L278 y L279 las concentraciones son las ms bajas (signos de las componentes
opuestos). Considerando el siguiente aporte ms grande de la interaccin entre los tres
modos, es decir el (2,2,2) se puede describir que en la superficie (profundidades 0, 1, 2 y 3)
los lugares L279 y LM116 tienen los tamaos de granos (variables KARM/K y SIRM/K) ms

Figura 1. Representacin de las tres componentes del modo Lugar (a), de las dos componentes del modo Variables (b) y de la
componentes 1 y 2 (c1) y de las componentes 2 y 3 (c2) del modo Profundidades..

V1 V2 V1 V2
P1 L1 -14.61(31.8) 2.56(0.98) P2 L3 -1.72(0.44) 0.26(0.01)
P1 L2 1.05 (0.16) 1.87(0.52) P3 L1 0.07(0.00) -0.88(0.11)
P1 L3 1.72(0.44) 7.12(7.55) P3 L2 -5.80(5.01) 3.52(1.85)
P2 L1 1.96 (0.57) 2.66(1.05) P3 L3 0.98 (0.14) 0.16(0.00)
P2 L2 5.05(3.79) 9.39(13.14)
Tabla 1. Matriz ncleo G del modelo Tucker (3,2,3). El valor entre parntesis es el porcentaje de variacin explicada de cada
elemento de la matriz. P, L y V corresponden a los modos profundidad, lugar y variables respectivamente.
finos que en los lugares L252 y L253; mientras que las caractersticas magnticas son ms
blandas (variable H
cr
) en los lugares L252 y L253 que en los lugares L279 y LM116. Dada la
triada (3,2,1) en las profundidades 11, 12, 13 y 14 el lugar L278 tiene tamao de grano
magntico mayor y minerales con mas alta coercitividad que en el lugar L279. Dada la triada
(2,1,3) en las profundidades 7 y 8 los valores de concentracin de minerales magnticos son
mayores en los lugares L252 y L253 que en los lugares L279 y LM116. El sitio LM116, core
perteneciente a la laguna actualmente en uso, presenta altas concentraciones de material
magntico fino de alta coercitividad siendo esto sealado en Chaparro et al (2012) como un
indicio de que el sitio est contaminado por metales pesados. Por otra parte el modelo
presentan a los cores pertenecientes a la laguna no activas (L252 y L253), como sitios que
tienen valores bajos de concentracin, con granos gruesos y de baja coercitividad,
presentando indicios de un sitio sin contaminacin como fue sealado en Chaparro et al
2012.

Bibliografa
Chaparro MAE, Nuez H, Lirio JM, Gogorza CGS, Sinito AM (2007). Magnetic screening and
heavy metal pollution studies in soils from Marambio station, Antarctica. Antarctic Science
19(3): 379393.
Chaparro Mauro, Chaparro Marcos, Sinito AM (2012). An interval fuzzy model dor magnetic
monitoring: estimation of a pollution index. Environmental Earth Sciences 66:1477-1485.
(a)
(b)
(c2)
(c1)


Singh, K., Malik, A., Sinhg, V.,Sinha, S. (2006).Muti-way data analysis of soils irrigated with
wastewater A case study. Chemometrics and intelligent laboratory systems, 83: 1-12.
Kroonenberg, Pieter (2008). Applied Multiway Data Analysis. JohnWiley&Sons Series in
probablility and Statistics, USA.
Dong, J.; Zhang, Y.; Zhang, S. (2010). Identification of temporal and spatial variations of
water quality in Sanya Bay, China by three-way principal component analysis. Environment
Earth Sei 60: 1673-1682.
Leibovici, D. (2010). Spatio-Temporal multiway decompositions using principal tensor
analysis on k-modes: The R package PTAK. Journal of Statistical Software, 34 Issue 10.


NUEVO ESTIMADOR PARA LA RAZN DE ODDS

JUAN CARLOS CORREA MORALES
1
, CAROLINA GONZLEZ CAAS
2
, JHON
EDER ARREDONDO MEJA
3

1
Profesor asociado, Universidad Nacional de Colombia, Medelln, Colombia
2
Estudiante de estadstica, Universidad Nacional de Colombia, Medelln, Colombia
3
Estudiante de estadstica, Universidad Nacional de Colombia, Medelln, Colombia

1
jccorrea@unal.edu.co

RESUMEN
La razn de odds es la medida por excelencia para medir asociacin en tablas de
contingencia que juega un papel fundamental en trabajos aplicados en epidemiologa,
sociologa, etc. Es sabido, que se presentan problemas para estimar dicha razn en
presencia de ceros en las celdas pues puede convertirse en una forma indeterminada.

Proponemos un nuevo estimador para la razn de Odds, modificando el propuesto por
Haldane en 1955; mostramos que este estimador posee un error cuadrtico medio menor
que el de Haldane; adems se presenta una comparacin de este estimador con otros
estimadores existentes para la razn de odds (Jewell, Mxima Verosimilitud, el estimador
tradicional y por supuesto el de Haldane)[1]. Una ventaja del estimador propuesto es que
resuelve el problema de los ceros en la tabla.

El estimador propuesto compite igualmente bien con los dems y se presentan los casos
generales en los cules ste brinda una mejor estimacin (o una de las mejores) o en cules
casos la diferencia entre las estimaciones es irrelevante, es decir, no importa cul de ellos
es usado para la estimacin.

La comparacin entre los diferentes estimadores se hizo va simulacin, se plantearon
distintos escenarios y se observ el comportamiento de cada estimador en ellos. De esta
manera se muestra la eficiencia del estimador propuesto basado en el error cuadrtico
medio.

Palabras clave: razn de odds, estimador de Haldane, error cuadrtico medio,
estimador de mxima verosimilitud.

Introduccin
La razn de odds es una de las medidas ms importantes en el anlisis de tablas de
conteos. Consideremos la siguiente tabla,

Enfermos

SI NO
Expuestos
SI

NO

La razn de odds se define como:

Asumimos un esquema de muestreo producto binomial.



En la literatura hay varios estimadores para calcular la razn de odds. No todos ellos tienen
en cuenta el problema que se presenta cuando existen celdas con presencia de ceros. Para
el estimador propuesto consideramos la siguiente estructura:

A

B

donde a, b, c y d representan los conteos en las celdas de la tabla observada. Para el
estimador de Haldane se suma a cada uno de los valores de la celda (es decir hacer los
); no obstante, mostramos que esta correccin en las celdas no es la mejor.
Proponemos un conjunto de valores , que permiten una mejor estimacin de la
razn de odds cuando se tienen dos poblaciones bajo estudio.

Desarrollo
Se realiz una simulacin en R mediante algoritmos genticos. Se consider un esquema de
muestreo para la tabla producto-binomial. Se tuvieron en cuenta 5 tamaos de muestra
diferentes para cada una de las poblaciones, y tambin se pusieron a variar las proporciones
de xito para cada una de las poblaciones. Se hall para cada combinacin de valores los
OR reales y los OR simulados, se determin el ECM (Error cuadrtico medio) y se determin
cul combinacin de lo minimizaba.

La frmula para el clculo del OR real est dada de la siguiente manera:

,

donde y son las proporciones (probabilidad de xito) de las poblaciones 1 y 2
respectivamente, estos valores son los controlados en la simulacin.
Posteriormente, se generan tablas a partir de Binomiales( , ) con i=1, 2. Se estiman
como:

El clculo del ECM est definido por:

Es decir, la media de la diferencia de los errores al cuadrado, donde N es un nmero de
iteraciones previamente asignado, para este caso N=1000.

Despus de realizar los procedimientos mencionados anteriormente se obtuvieron los
siguientes valores ptimos para los

=0.1
=0.9
=0.9


=0.2

Los valores anteriores proporcionan un menor ECM al momento de calcular la razn de
odds, y esto hace que el estimador propuesto sea ms certero y no presente problemas ante
la presencia de celdas con cero observaciones, finalmente, el estimador propuesto queda
conformado de la siguiente manera:

Despus de obtener estos nuevos valores para los , este estimador es puesto en
comparacin con el estimador de Haldane en diferentes escenarios, adems de otros
estimadores como el estimador propuesto por Jewell, el estimador de Mxima Verosimilitud
y el estimador tradicional, con el fin de observar su comportamiento y poder dar sugerencias
sobre en qu tipo de situaciones es ms conveniente utilizar una estimacin que otras y
cuando no tiene relevancia el utilizar una que otra.

Bibliografa
Kraemer, H. C. (2004) Reconstructing the Odds Ratio as a Measure of 2 2 Association in
a population. Statistics in Medicine, Vol. 23, pp. 257-270
[1]Winkler, R. L. Smith, J. E. y Fryback, D. G. (2002) The Role of Informative Priors in Zero-
Numerator Problems: Being Conservative Versus Being Candid. The American
Statistician, Vol. 56, No. 1, pp. 1-4
Jovanovic, B. D. y Levy, P. S. (1997) A Look of the Rule of Three. The American
Statistician, Vol. 51, No. 2, pp. 137-139
Agresti, A. y Caffo, B. (2000) Simple and Effective Condence Intervals for Proportions and
Dierences of Proportions Result From Adding Two Successes and Two Failures. The
American Statistician, Vol. 54, No. 4, pp. 280-288
Woodward, M. (1999).Epidemiology study design and data analysis 5
th
Edicin, United
Kingdom.
Zar, J.H. (2010) Bioestatistical analysis. 5
th
Edicin, United States of America.



VALIDACION DEL AUTOREPORTE DE ANSIEDAD EN NIOS Y
ADOLESCENTES CHILENOS NO CONSULTANTES. UNA
APLICACIN DE ECUACIONES ESTRUCTURALES

IRENE SCHIATTINO
1
, CLAUDIO SILVA
1
, GLORIA TOLEDO
2
,

SOLEDAD VON
MHLENBROCK M.
3
CONSUELO ALDUNATE
4
, MARCELA LARRAGUIBEL
5

1
Acadmico. Escuela de Salud Pblica. Facultad de Medicina. Universidad de Chile.
2
Psiquiatra Infanto Juvenil.
3
Mdico Cirujano. Residente de Psiquiatra Infanto Juvenil.
Clnica Psiquitrica. Universidad de Chile.
4
Mdico Cirujano. Alumna programa Doctorado en
Ciencias Mdicas y Especialidad en Psiquiatra Infanto Juvenil. Universidad de Chile.
5
Psiquiatra Infanto Juvenil. Profesor Adjunto Clnica Psiquitrica. Universidad de Chile

ischiattino@med.uchile.cl

RESUMEN
Los trastornos ansiosos en la poblacin chilena infantojuvenil son de alta prevalencia y
frecuentemente subdiagnosticados. Han existido mltiples intentos para crear instrumentos
que ayuden a su tamizaje. Dentro de estos, la escala de ansiedad para nios y adolescentes
(SCARED versin en ingls), es uno de los ms utilizados. Para la poblacin
hispanoamericana se adapt este autoreporte de nios y adolescente (AANA) con cinco
dimensiones asociadas a este trastorno. El objetivo del presente trabajo fue estudiar la
estructura factorial del AANA validado en Mxico y verificar si el modelo con cinco
dimensiones (Pnico/somtico, ansiedad de separacin, ansiedad generalizada, fobia social
y fobia escolar) se ajusta a una poblacin infanto juvenil chilena no consultante. Se aplic un
anlisis factorial confirmatorio (AFC), en el marco de los modelos de ecuaciones
estructurales (SEM) a una muestra aleatoria estratificada de 560 nios y adolescentes, que
cursaban entre segundo bsico y cuarto medio de cuatro establecimientos educacionales
particulares subvencionados de la comuna de Independencia en Santiago de Chile. La
consistencia interna en cada una de las cinco dimensiones del instrumento fue 0.73 ( de
Cronbach). Dada la distribucin de las variables, en el modelo de ecuaciones estructurales
aplicado (cinco variables medibles y un factor latente) se us el mtodo de estimacin ADF
(Asymptotic Distribution Free) y el ajuste se evalu mediante el ndice RMSEA (Root Mean
Squared Error Aproximation) y TLI (Tucker-Lewis Non- Normed Fit Index).
Los resultados permiten concluir que el instrumento, en esta poblacin, es capaz de
determinar un nico constructo ansiedad (factor latente) y que los distintos tems del
instrumento permiten determinar las cinco dimensiones encontradas en el estudio original.

Palabras Clave: Ansiedad, Validacin, Anlisis factorial, Ecuaciones estructurales.

Introduccin
En Chile, estudios recientes han detectado un 8,3% de nios y adolescente con trastornos
ansiosos asociado a limitacin funcional, lo que es coherente con lo encontrado en la
literatura internacional.
A pesar de la alta prevalencia descrita, estos trastornos son frecuentemente
subdiagnosticados en la poblacin infantojuvenil dada la dificultad en diferenciar la ansiedad
propia de una etapa del desarrollo de la ansiedad patolgica.
Esto hace necesario la creacin y validacin de instrumentos de screning de rpidos y fcil
aplicacin, que permitan sospechar la presencia de estos trastornos, para lograr una
oportuna derivacin a especialista, tratamiento y prevencin de otras psicopatologas.(12)
Entre estos instrumentos la escala para ansiedad en nios y adolescentes SCARED (Screen
for Child Anxiety Related Emotional Disorders), diseada a partir de criterios del DSM-IV, ha


sido la ms difundida. En la poblacin infantil hispanoamericana existen estudios de
validacin de sta escala en la poblacin general y consultante.
En poblacin latinoamericana , existe un estudio realizado en Mxico donde se realiz la
validacin de la escala de ansiedad SCARED, en una poblacin adolescente general,
crendose la escala de ansiedad para adolescente (AANA). La versin final consta de 41
tems que conforman cinco dimensiones que determinan psicopatologas ansiosas descritas
en el DSM IV. Estas dimensiones son: Pnico/somtico, ansiedad generalizada, ansiedad
de separacin, fobia social y fobia escolar. Posteriormente el autoreporte fue aplicado a
poblacin clnica espaola, con similares respuestas a la escala original.
El objetivo del presente trabajo fue estudiar la estructura factorial del AANA y verificar si el
modelo con cinco dimensiones de este instrumento validado en Mxico se ajusta a una
poblacin infanto juvenil chilena no consultante. Para lograr el objetivo propuesto se aplic
un anlisis factorial confirmatorio (AFC), en el marco de los modelos de ecuaciones
estructurales (SEM).

Metodologa
El instrumento de 41 tems que miden la frecuencia de cada sntoma en escala 0 (casi
nunca), 1 (a veces) y 2 (frecuentemente), se aplic a una muestra de 560 nios y
adolescentes, determinada por muestreo aleatorio estratificado de una poblacin de nios y
adolescentes que cursaban entre segundo bsico y cuarto medio de establecimientos
educacionales particulares subvencionados de la comuna de Independencia en Santiago de
Chile.
Los criterios de inclusin fueron: lectoescritura adquirida y el consentimiento informado
firmado por los apoderados. Se excluyeron de la muestra los que presentaban el
diagnstico de psicopatologa ansiosa en tratamiento actual, retardo mental, psicosis, que
declararan el deseo de no participar o no estaban presentes en el momento de la toma de
muestra.
El anlisis de la informacin fue realizado usando el STATA 12. Se aplic un anlisis
factorial confirmatorio (AFC), en base a cinco variables determinadas por la suma de los
puntajes de los tems considerados en cada dimensin, en el marco de los modelos de
ecuaciones estructurales (SEM). Dada la distribucin de las mediciones se us el mtodo de
estimacin ADF (Asymptotic Distribution Free) que permite la no normalidad multivariante y
que es una forma del mtodo WLS (Weigthes Least Squares). El ajuste de este modelo se
evalu mediante el ndice RMSEA (Root Mean Squared Error Aproximation) y TLI..
Preliminarmente se estudi la consistencia interna de los datos y la pertinencia de aplicar
un AFC, basado en las matrices policricas.

Resultados
Los participantes fueron 278 nios y 281 nias, de edades entre 7 y 18 aos con una
mediana de edad de 12 aos (R.I.= 6 aos).
El coeficiente alpha de Cronbachs global para las cinco variables resultantes de la suma de
los puntajes de los tems considerados en cada dimensin es 0.80 y en cada dimensin
0.73. El anlisis factorial exploratorio (AFE) basado en la matriz policrica, indic que las
cinco variables consideradas conformaran un nico factor latente, Ansiedad (KMO=0.80).
Por otra parte, las intercorrelaciones encontradas entre las variables, sera indicativo de la
no independencia de las variables.
Se aplic el anlisis factorial confirmatorio (AFC) con las cinco variables medibles y un factor
latente en base al diagrama de trayectoria (Ver Figura 1), usando el mtodo Asymptotic
Distribution Free (ADF) que permite la no normalidad multivariante de las variables.

Figura 1. Diagrama de trayectoria (AFC para un factor) de la escala de Ansiedad para nios
y adolescentes (AANA) y las dimensiones PS=Pnico somtico AG=Ansiedad generalizada
AS=Ansiedad de separacin FS=Fobia social FE=Fobia escolar.



AANA
PS
1
1
AG
2
1
AS
3
1
FS
4
1
FE
5
1

Los valores de los test de bondad de ajuste para el modelo propuesto fueron RMSEA
(0.047) y TLI (0.913), valores que confirmaran la hiptesis que el constructo Ansiedad
podra estar compuesto por las cinco dimensiones, a saber, pnico-somtico, ansiedad
generalizada, ansiedad de separacin, fobia social, fobia escolar.

Conclusin
Los resultados obtenidos tras el anlisis factorial exploratorio y confirmatorio del autoreporte
de ansiedad para nios y adolescentes corroboran que el instrumento logra discriminar un
nico constructo (ansiedad) dentro de una poblacin infantojuvenil no consultante. Y que los
41 tems evaluados, conformaran las 5 dimensiones (pnico somtico, ansiedad de
separacin, ansiedad generalizada, fobia social y fobia escolar) descritas en la literatura
internacional.

Bibliografa
[1] Snchez S. (2001). Validez y confiabilidad de la escala de ansiedad (SCARED) para
nios y adolescentes. Tesis para subespecialidad de psiquiatra infantil y de la
adolescencia. Universidad Nacional Autnoma de Mxico.
[2] Von Muhlenbrock M., Toledo G., Aldunate C., Schiattino I., Correa C., Peralta E.,
Larraguibel M. (2011). Descripcin del comportamiento de la Escala de Ansiedad para
Nios y Adolescentes (AANA) en Poblacin Chilena. Psiquiatra y Salud Mental 2011;
XXVIII (1): 13-23.
[3] Stata structural equation modelling. Reference manual. Release 12 (2011). A Stata
Press Publication Stata Corp LP College Station, Texas.
[4] Brown, T. A. (2006). Confirmatory factor analysis for applied research. The Guilford
Press. New York.
.77 .75 .72 .66 .53


TREE-BASED METHODS IN THE ANALYSIS OF SURVIVAL DATA.
APPLICATION TO THE STUDY OF DISPARITIES IN SURVIVAL OF
PEDIATRIC CANCER PATIENTS

GILDA GARIBOTTI
1
, FLORENCIA MORENO
2
, VERNICA DUSSEL
3
, LILIANA ORELLANA
4

1
Centro Regional Universitario Bariloche, Universidad Nacional del Comahue
2
Instituto Nacional del Cncer, Ministerio de Salud de la Nacin
3
Instituto de Efectividad Clnica y Sanitaria
4
Instituto de Clculo, Universidad de Buenos Aires

garibottig@comahue-conicet.gob.ar

RESUMEN
Tree-based methods are ideally suited to identify and quantify the effects of patient
characteristics that relate to the course of disease in clinical investigations. Breiman et al. (1)
set the theoretical and practical basis of classification and regression trees. Early adaptations
of this strategy to health science data are from Gordon and Olshen (2) and Ciampi et al. (3).
In the study of survival data, tree-based methods define a partition of the covariates space
creating groups of observations that can be assumed to be approximately homogeneous in
terms of survival. This permits the use of the Kaplan-Meier estimator to characterize the
survival of the group and compare prognosis between the groups defined by the partition.
This study evaluates the adequacy of tree-based methods for the study of discrepancies in
pediatric cancer survival within Argentina. We studied 12-month survival (12-ms) of children
diagnosed with lymphoid leukemia (LL) aged 0 to 14 years. Factors considered were age at
diagnosis, gender, socioeconomic index of the province of residence and medical migration.
Estimated overall 12-ms in LL patients was 83.7%. Among 1 to 10 year old children from
provinces with low socioeconomic index, we identified a gap in 12-month survival between
those who did and did not migrate, 78.2% and 87% respectively.
Tree-based methods provide a superior means for identifying the most vulnerable groups of
pediatric cancer patients and of the main regional features influencing survival. This
information is necessary in making informed decisions to ensure improved and equitable
cancer care.

Palabras clave: regression tres, survival analysis, healthcare disparities.

Introduccin
Los mtodos basados en rboles son una herramienta muy apropiada en estudios clnicos
donde se busca identificar y cuantificar el efecto de factores que se relacionan con la
evolucin de la enfermedad. Frecuentemente la variable respuesta es tiempo hasta la
ocurrencia de un evento y a partir de las variables clnicas observadas, esta estrategia
genera grupos de pacientes que tienen una supervivencia homognea y que puede ser
caracterizada mediante el estimador de Kaplan Meier. La representacin por medio de un
rbol binario del resultado del anlisis, permite a los investigadores del rea de salud contar
con una caracterizacin simple del pronstico de la enfermedad de los pacientes y descubrir
interacciones significativas entre los factores asociados a la evolucin de la enfermedad.
Breiman y colaboradores (1) establecieron la base terica y prctica de los rboles de
clasificacin y regresin. Numerosos autores propusieron mtodos basados en rboles para
el anlisis de datos censurados. (3,4,5,6,7)
En este proyecto utilizamos mtodos basados en rboles para estudiar supervivencia a los
12 meses de nios diagnosticados con leucemia linfoblstica e identificar las caractersticas
ms relevantes asociadas con la evolucin de la enfermedad.



Desarrollo
Los datos que consideramos tienen la forma (t,c,z), donde t es el tiempo de supervivencia,
posiblemente censurado, c es el indicador de censura, c=1 falla, c=0 censura a derecha y
z=(z
1
,,z
p
) es un vector de covariables. En el primer paso de la construccin del rbol la
muestra total (nodo raz) se divide en dos grupos definidos por una de las covariables. Las
particiones admisibles resultan de considerar preguntas asociadas a una covariable z
i
: si z
i

es ordenada, se consideran preguntas de la forma es z
i
a?, para un dado a; si z
i
no es
ordenada, se considera z
i
pertenece a A?, donde A es cualquier subconjunto de las
categoras de z
i
. Los dos grupos quedan formados por los individuos que contestan sio
no respectivamente. La particin elegida es la que maximiza una cierta medida de
separacin en la distribucin de la respuesta, el estadstico del test de cociente de
verosimilitud entre los dos grupos en nuestro caso. Este mismo procedimiento se repite
recursivamente en los grupos resultantes hasta que se obtienen numerosas regiones
disjuntas cada una con unas pocas observaciones. Cada uno de estos grupos finales se
denomina nodo terminal. Luego de la construccin de este gran rbol se procede a la
seleccin de un rbol de tamao adecuado que provea un ajuste apropiado. A esta parte del
proceso se la llama poda. En el caso de datos de supervivencia, el rbol final puede tener
nodos terminales con curvas de supervivencia similares. Las mismas pueden ser
combinadas o amalgamadas para definir los grupos finales. Este paso se realiz creando
una variable categrica con categoras correspondientes a los nodos del rbol y
construyendo un nuevo rbol slo en base a esta variable de manera de determinar nodos
terminales con supervivencia diferente.
El estudio fue realizado en base a datos provistos por el Registro Oncopeditrico
Hospitalario Argentino, ROHA. (8) La muestra consisti de 3337 pacientes con leucemia
linfoblstica (LL) diagnosticados entre 2000 y 2008 y menores de 15 aos al diagnstico. El
punto final del estudio fue muerte por cualquier causa. La supervivencia a los 12 meses del
diagnstico fue evaluada en relacin a edad al diagnstico, sexo, ndice socioeconmico de
la provincia de origen y migracin de su provincia de origen para obtener tratamiento
mdico. Como indicador socioeconmico se utiliz el ndice de Desarrollo Humano (IDH) de
2006 de cada provincia argentina. (9) El IDH toma valores entre 0 y 1, menor valor
corresponde a nivel socioeconmico ms bajo.

El estimador de Kaplan Meier de la supervivencia (%) a los 12 meses (KM-12) y el intervalo
de 95% de confianza (IC) para nios diagnosticados con LL son 83.7 (IC: 82.4, 85.0).
Se utiliz el modelo de Cox de riesgos proporcionales para evaluar separadamente cada
uno de los 4 factores pronsticos estudiados. Para pacientes con LL los nicos factores
significativamente asociados con la supervivencia fueron edad e IDH.
La Figura 1 resume el anlisis basado en rboles. El modelo identific 4 grupos de pacientes
con supervivencia diferente. El peor pronstico corresponde a menores de 1 ao (G8), KM-
12 46.8 (IC: 38.5-57.0). El otro grupo con supervivencia inferior a la media est compuesto
por nios de 1 ao provenientes de provincias con IDH 0.65 (G4), nios de 1 a 10 aos de
provincias pobres (IDH<0.65) que no migraron (G6) y pacientes de 11 a 14 aos (G7), KM-
12 76.6 (IC: 74.1, 79.2).
Este estudio demuestra la importancia del uso de mtodos alternativos al modelo de Cox en
el estudio de discrepancias en salud. Al ajustar el modelo de Cox, la migracin mdica
result no significativa. Sin embargo, en el anlisis basado en rboles, encontramos que la
migracin afecta la supervivencia de nios de 1 a 10 aos que viven en provincias pobres
(IDH<0.654). Los mtodos basados en rboles estn diseados para maximizar, en cada
paso, la diferencia en experiencia de supervivencia entre los subgrupos definidos. En
consecuencia, las variables seleccionadas representan influencias locales en subconjuntos
de individuos.
Esta metodologa nos permiti identificar los grupos ms vulnerables de pacientes
peditricos con leucemia, estos resultados pueden contribuir a disear polticas que
busquen reducir las inequidades en sobrevida por cncer en el pas.


Figura 1. Izquierda: rbol de clasificacin. En cada nodo terminal se da la siguiente
informacin: identificacin del grupo (G1-G8), f/n: fallecidos/ tamao muestra, s: estimador
de Kaplan-Meier de supervivencia a los 12 meses e intervalo de confianza del 95%. Edad en
aos, IDH: ndice de Desarrollo Humano, mm: migracin mdica.
Derecha: Curvas de supervivencia de Kaplan-Meier de los grupos definidos luego del
amalgamado. General: supervivencia general, G1-G8 como en el grfico de la izquierda.

Bibliografa
[1] Breiman L, Friedman J, Olsehn R, Stone C. (1984). Classification and regression trees.
Wadsworth International Group.
[2] Gordon I, Olshen R. (1985). Tree-structured survival analysis. Cancer Treat Rep, 69:
1065-1069.
[3] Ciampi A, Chang C, Hogg S, McKinney S. (1987). Recursive partitioning: a versatile
method for exploratory data analysis in biostatistics. Biostatistics: 23-50.
[4] Segal M. (1988). Regression trees for censored data. Biostatistics, 44: 35-47.
[5] Davis R, Anderson J. (1989). Exponential survival tree. Stat Med, 8: 947-961.
[6] Ahn H, Loh W. (1994) Tree-structured proportional hazards regression modeling.
Biometrics, 50: 471-485.
[7] LeBlanc M, Crowley J. (1992). Relative risk trees for censored survival data. Biometrics,
48: 411-425
[8] Moreno F, Dussel V, Abriatta G, Loria D, Orellana L. (2012). Registro oncopeditrico
argentino: incidencia 2000-2009. Supervivencia 2000-2009. Tendencia de mortalidad 1997-
2010. Buenos Aires.
[9] Mercado R, Catterberg G. (2010). Human development in Argentina: current trends and
new challenges. National Report on Human Development.


SELECCIN DE ATRIBUTOS EN CLASIFICACIN SUPERVISADA.
USO DE LA ENTROPA CONDICIONAL

MARA DEL CARMEN ROMERO
1
, JULIO A. DI RIENZO
2
Y ALEJANDRO CLAUSSE
3

1
Fac. Cs. Econmicas, Universidad Nacional del Centro de la Provincia de Buenos Aires
2
Estadstica y Biometra, Fac. Ciencias Agrarias, Universidad Nacional de Crdoba
3
PLADEMA, Fac. Cs. Exactas, Universidad Nacional del Centro de la Provincia de Buenos
Aires

mariadelc.romero@gmail.com

RESUMEN
Las bases de datos de alta dimensionalidad pueden encontrarse en diferentes reas de
conocimiento. Los datos provenientes de microarreglos de ADN son buenos representantes
de estos contextos y tienen, adems, la particularidad de poseer mayor cantidad de atributos
que de observaciones. Si bien, la clasificacin supervisada suele ser una de las tcnicas
ms usadas en estos casos, el ruido debido a las particularidades expuestas provocan que
los clasificadores convencionales tengan resultados inestables. En este trabajo se propone
el uso de la entropa condicional como medida para realizar la seleccin del subconjunto de
atributos que distingan entre tratamientos en contextos de microarreglos de ADN. La
entropa mide la cantidad media de informacin que es necesaria proveer para no tener
incertidumbre sobre una variable determinada y tiene la ventaja de poder aplicarse a
contextos con variables pertenecientes a cualquier escala de medicin. Se desarroll un
algoritmo en R y se simularon diferentes escenarios de microarreglos de ADN. Las
conclusiones se obtuvieron considerando el tamao promedio del subconjunto seleccionado
y el porcentaje de atributos seleccionados que efectivamente son diferenciales. Entre los
resultados preliminares puede mencionarse que: en la mayora de los casos, la entropa
condicional con el subconjunto de atributos seleccionados es 0; a mayor cantidad de
rplicas, mayor es el tamao del subconjunto y mayor el porcentaje de atributos
efectivamente diferenciales; y que, a mayor porcentaje de atributos diferenciales, menor es
el tamao del subconjunto de atributos seleccionados y mayor es el porcentaje de atributos
efectivamente diferenciales.

Palabras clave: alta dimensionalidad, microarreglos de ADN, incertidumbre, simulacin

Introduccin
Los avances tecnolgicos de las ltimas dcadas facilitaron la creacin de grandes bases de
datos de alta dimensionalidad (gran cantidad de atributos), lo cual involucra no slo grandes
exigencias en la adquisicin de los datos sino tambin en el almacenamiento, el
mantenimiento, y sobre todo, el procesamiento de los mismos. En 1996, Fayyad y otros,
introdujeron la estrategia de anlisis conocida como descubrimiento de conocimiento en
bases de datos, la cual involucra mtodos y tcnicas para extraer conocimiento de alto nivel
a partir de grandes conjuntos de datos de bajo nivel. Comprende el proceso completo de
descubrir conocimiento a partir de los datos, incluyendo los pasos que van desde la
obtencin de los mismos hasta la aplicacin del conocimiento adquirido. Lo esencial de este
proceso es la minera de datos, se define como los mtodos para el descubrimiento y la
extraccin de patrones de relacin entre atributos a partir de los datos. Otros autores, como
Kantardzic (2011) no la definen como componentes del proceso de extraccin de
conocimiento sino como el proceso en s mismo.
La clasificacin supervisada suele ser una de las tcnicas ms usadas en contextos de alta
dimensionalidad. Sin embargo, los clasificadores convencionales producen resultados
inestables en aplicaciones (cada vez ms frecuentes) en las cuales la cantidad de atributos


es superior a la cantidad de observaciones. En estos casos, el ruido suele ser un
denominador comn, provocando la sobreparametrizacin y la propensin al sobreajuste de
los clasificadores convencionales.
El rea genmica es un contexto con las particularidades descriptas, en el cual la
clasificacin supervisada suele ser un objetivo. Ante este requerimiento, se expone un
mtodo que usa la entropa condicional y algunos resultados preliminares. El desarrollo se
realiza en el contexto de anlisis de expresin gnica.

Desarrollo

Datos
Datos continuos, provenientes de experimentos con matrices de expresin gnica. Se
caracterizan por tener gran cantidad de atributos (genes), baja cantidad de observaciones
(cantidad de tratamientos * cantidad de rplicas) y una fraccin pequea de genes
diferenciales. El objetivo es identificar genes con respuesta diferencial entre tratamientos.

Clase 1 Clase 2
R11 R12 R13 R21 R22 R23
Gen
1 Y111 Y121 Y131 Y211 Y221 Y231
2 Y112 Y122 Y132 Y212 Y222 Y232

N Y11N Y12N Y13N Y21N Y22N Y23N

Medida de evaluacin: Entropa condicional
La optimalidad de un subconjunto siempre es relativa a una medida de evaluacin. La
entropa puede definirse como la cantidad media de informacin que es necesaria proveer
para no tener incertidumbre sobre una fuente determinada: , X
representa la variable aleatoria, p(x
i
) la probabilidad de ocurrencia de cada uno de sus
valores y el logaritmo en base 2 considera que la informacin se representar mediante
cdigo binario (bits). La entropa condicional referencia la entropa que tiene una
determinada variable Y (en el caso de la aplicacin, el tratamiento) conociendo la
informacin que aporta otra variable X (genes).

En el contexto de la aplicacin, si la entropa (incertidumbre) del tratamiento disminuye por
el conocimiento de algn gen, dicho gen es relevante para la distincin entre tratamientos.

Algoritmo
El objetivo es generar un subconjunto de atributos que permita la clasificacin supervisada
(basado en la entropa condicional). Se implement un algoritmo que consiste en agregar
incrementalmente al subconjunto de atributos seleccionados aqullos que minimicen la
entropa condicional de la clase. Esta evaluacin se realiza considerando los atributos ya
ingresados en dicho subconjunto y el ciclo termina cuando se obtiene una entropa igual a 0
o cuando no logra mejorarse la entropa del ciclo anterior.
La generacin de datos se realiz a travs de un algoritmo desarrollado por Di Rienzo
(2006), que permite especificar la cantidad de genes, tratamientos, rplicas, y el porcentaje
de genes diferenciales y evaluar, en una instancia posterior, el rendimiento de los mtodos.
Se generaron 1000 repeticiones para 6 escenarios dados por los siguientes parmetros:
1000 genes, 2 tratamientos, 5 y 10 rplicas biolgicas y 5, 10 y 30% de genes diferenciales.
Debido a la continuidad de los datos y a que es necesaria la discretizacin de los mismos
para la aplicacin de la entropa condicional se consideraron distintas alternativas de
discretizacin: en 2, 5, 10 y 20 intervalos de igual amplitud.
Se desarroll un programa en R y se utiliz el package entropy de R (Hausser y Strimmer,
2013). Se trabaj con la funcin entropy la cual estima la entropa Shannon de una variable
aleatoria a partir de frecuencias observadas.
Por cada simulacin (se realizaron 1000 en total)
Las clases hacen referencia a los tratamientos.
Las rplicas a la cantidad de individuos (perfiles
genticos) que hay dentro de cada grupo. Rij donde i
indexa la clase y j la repeticin dentro de la clase.
Las expresiones gnicas estn denotadas por Yijk, i
indexa la clase, j la rplica y k indexa al gen.



1) Generar la matriz de expresin gnica MEG (Di Rienzo, 2006)
Atributos (genes) = x
1
, x
2
, , x
n
, n = cantidad de atributos. Clases: C={1,2}
2) Seleccin del subconjunto de atributos diferenciales
Paso 1: Inicializar el conjunto de atributos seleccionados S como vaco:S={}
Paso 2: Ciclo que se repite mientras se tenga una entropa condicional
H(clase/(x
i
S)) mayor a 0 o mientras no logre mejorarse (disminuirse) la
entropa del ciclo anterior)
a. Para cada uno de los atributos no incluidos en S, calcular las
entropas condicionales de la clase considerando la inclusin de
ellos en el subconjunto resultante S: H(clase/(x
i
S))
b. Seleccionar el atributo x
i
cuya H(clase/(x
i
S)) sea la mnima
(conociendo al atributo x
i
, se tiene menor incertidumbre sobre la
clase C) y agregarlo al subconjunto S = S x
i

El comportamiento de la entropa condicional se expone, para todos los escenarios
propuestos, considerando el tamao promedio del subconjunto seleccionado y el porcentaje
de atributos seleccionados que efectivamente son diferenciales (Tabla 1). Entre las
principales conclusiones:
En la mayora de los casos, la entropa condicional con los atributos seleccionados es 0.
Cuanto mayor es la cantidad de intervalos en los cuales se discretiza, menor es el
tamao del subconjunto seleccionado y mayor es el porcentaje de atributos diferenciales
(al discretizar en mayor cantidad de intervalos, mayor precisin en los datos).
A mayor cantidad de rplicas, mayor es el tamao del subconjunto y mayor el porcentaje
de atributos efectivamente diferenciales (al tener ms rplicas, se tiene ms informacin)
Mayor porcentaje de atributos diferenciales, menor es el tamao del subconjunto de
atributos seleccionados y mayor es el porcentaje de atributos diferenciales.

Tabla 1: Tamao promedio del subconjunto seleccionado (tamao) y Porcentaje de atributos seleccionados que
efectivamente son diferenciales (%dif)
Discretizacin en 2 intervalos Discretizacin en 5 intervalos

5 rplicas 10 rplicas 5 rplicas 10 rplicas

Tamao % dif Tamao % dif Tamao % dif Tamao % dif
5% dif 3.37 24.07 4.85 26.20 2.71 44.45 4.49 51.28
10% dif 3.34 30.52 5.30 38.14 2.66 54.37 4.56 67.51
30% dif 2.93 52.45 5.01 57.68 2.32 74.07 3.90 85.21
Discretizacin en 10 intervalos Discretizacin en 20 intervalos
5 rplicas 10 rplicas 5 rplicas 10 rplicas
Tamao % dif Tamao % dif Tamao % dif Tamao % dif
% dif 2.44 64.30 3.71 72.88 1.89 73.00 2.67 77.75
10% dif 2.08 65.75 3.49 82.80 1.62 76.67 2.22 84.08
30% dif 1.88 82.5 2.77 92.58 1.31 93.50 1.99 85.33

Este trabajo muestra resultados preliminares sobre el uso de la entropa condicional para la
seleccin de atributos diferenciales. Se prev la generacin de contextos con mayor
cantidad de atributos de diferentes escalas de medicin para evaluar el rendimiento de la
medida propuesta.

Bibliografa
[1] Di Rienzo, J. y Romero, M. (2006). Simulacin de matrices de expresin gnica de
experimentos con micromatrices de ADN. Jornadas Internacionales de Estadstica. Rosario,
Argentina.
[2] Fayyad, U.; Piatetsky-Shapiro, G. y Smyth, P. (1996). From Data Mining to Knowledge
Discovery in Databases. Artificial Intelligence Magazine, 17(3): 37-54.
[3] Hauser, J. y Strimmer, K. (2013). Package Entropy: Estimation of Entropy, Mutual
Information and Related Quantities. R package, versin 1.2.0. Versin obtenida en abril de
2013. http://strimmerlab.org/software/entropy
[4] Kantardzic, M. (2011). Data Mining: Concepts, Models, Methods, and Algorithms. IEEE
Press & John Wiley. Segunda Edicin. Agosto, 2011.


ESTUDIO DE LA EVOLUCIN DEL NDICE DE LIBERTAD
ECONMICA EN ARGENTINA USANDO BIPLOT DINMICO

JAIME EGIDO
1
, PURIFICACIN GALINDO
2

1
Departamento de Estadstica, Universidad de Salamanca
2
Departamento de Estadstica, Universidad de Salamanca

jegido@usal.es

RESUMEN
El bienestar de una sociedad se consigue alcanzando un desarrollo econmico sostenido,
siendo los modelos basados en la libre competencia los que han obtenido mejores
resultados. Recurriremos al ndice de Libertad Econmica publicado por la Fundacin
Heritage para realizar un estudio sobre la evolucin que ha habido en materia de libertades
econmicas en el continente americano durante el periodo de tiempo transcurrido entre los
aos 2005 al 2013. Utilizamos una nueva tcnica desarrollada, Biplot Dinmico, para
analizar las trayectorias de los ndices y de los pases del continente, con especial atencin
en Argentina.

Palabras clave: biplot dinmico, libertad econmica, tres vas.

Introduccin
El bienestar de una sociedad est basado en la capacidad que dicha sociedad tiene para
promover su desarrollo econmico. Diversos estudios indican que la mejor forma de
conseguir un crecimiento econmico y obtener mayor bienestar social es implantando
polticas que den a la economa fluidez [1], [2]. Los modelos que han existido hasta la fecha,
y que han obtenido mejores resultados en la consecucin de este fin, han sido los modelos
basados en la libre competencia.
La libertad econmica es la condicin en la cual los individuos pueden actuar con autonoma
en la bsqueda de su sustento econmico y de una mayor prosperidad. El objetivo de la
libertad econmica no es simplemente la ausencia de limitaciones o restricciones por parte
del gobierno sino la creacin y mantenimiento de un sentido mutuo de libertad para todos
[3].
La Fundacin Heritage [4] en colaboracin con The Wall Street Journal [5] elabora
anualmente, desde 1995 y siguiendo la teora de Adam Smith [6], el ndice de Libertad
Econmica. Este ndice crea 10 puntos de referencia para medir el xito econmico de 185
pases, permitiendo comprobar que las teoras de prosperidad y libertad econmica del siglo
XVIII estn vigentes en el siglo XXI.
El ndice de Libertad Econmica [7] evala el grado de libertad de la actividad econmica
calculando y agregando diez indicadores que miden aspectos tales como las relaciones del
pas con el resto del mundo, las polticas internas existentes, la libertad de los individuos
para trabajar y para invertir, sin restricciones e interferencias del gobierno. Estos indicadores
interactan entre s y se complementan, constituyendo un medio multidimensional para
conseguir el progreso econmico.

Desarrollo
Los datos que hemos utilizado para realizar este estudio han sido obtenidos de la pgina de
Internet de la Fundacin Heritage [4]. Se trata de una matriz de datos donde se recoge el
ndice de Libertad Econmica de todos los pases del continente americano, as como los
diez ndices especficos que miden cada uno de los componentes del ndice. El resultado es
una matriz, que se puede convertir en un cubo de datos, con 29 pases (filas) y 11 variables


(columnas) medidas en 9 periodos, los correspondientes a los aos comprendidos entre
2005 y 2013 ambos incluidos.
Para el anlisis se ha utilizado una nueva tcnica: el Biplot Dinmico. Esta tcnica tiene
como fundamento la proyeccin sobre la representacin biplot de un momento prefijado, la
situacin de referencia, del resto de momentos medidos, calculando sus trayectorias.
El Biplot Dinmico se desarrolla en dos etapas: la primera consiste en el anlisis de la
situacin de referencia, anlisis esttico, realizando un anlisis biplot clsico [8], aunque se
aconseja utilizar un anlisis HJ-Biplot [9] debido a las propiedades de representacin
simultnea de filas y columnas que ste hace, permitindonos conocer las relaciones
multivariantes de la situacin de referencia; en el estudio hemos tomado como situacin de
referencia la correspondiente al ao 2013. La segunda etapa, anlisis dinmico, consiste en
proyectar sobre el grfico biplot obtenido en la etapa anterior el resto de situaciones que
queremos analizar. El resultado es el conjunto de trayectorias de los individuos y de las
variables sobre el biplot de la situacin de referencia.
El anlisis Biplot Dinmico mantiene las propiedades del biplot utilizado en la etapa primera,
a las que se aaden las propiedades correspondientes de los marcadores fila y de los
marcadores columna de los elementos respecto a su situacin de referencia.
Para dar soporte a esta teora se ha desarrollado un paquete en R [10] con interfaz grfica
de usuario que hemos llamado dynBiplotGUI, y que cubre todo lo necesario para su
utilizacin: la adquisicin de datos para el anlisis, el formateo de los datos, la seleccin de
individuos y variables que van a formar parte del estudio, y la eleccin de opciones que van
a ser utilizadas para la representacin.

Un anlisis descriptivo de las variables en el ao 2013 nos indica que el Derecho a la
propiedad y la Libertad frente a la corrupcin son claramente los aspectos menos
desarrollados en los pases del continente americano, existiendo gran amplitud
intercuartlica. Los aspectos de Libertad fiscal, Libertad monetaria y Libertad comercial son
los ms desarrollados.
El resultado de realizar la primera etapa del Biplot Dinmico, tomando como situacin de
referencia el ao 2013, realizando un anlisis HJ-Biplot con datos centrados, obtenemos una
inercia acumulada en el plano 1-2 de un 78%, estando todas las variables suficientemente
bien representadas.
Los pases mejor posicionados frente al ndice son Canad, Chile y Estados Unidos,
destacando a su vez por una alta puntuacin, junto a Barbados, en los ndices de Derechos
de propiedad, Libertad frente a la corrupcin, Libertad laboral y Libertad empresarial.
Los pases con menor puntuacin en el ndice de Libertad Econmica son Cuba, Venezuela,
Argentina, Ecuador, Bolivia y Hait, todos ellos con una puntuacin menor de 50 sobre 100.
Argentina, con una puntuacin global de 467 en el ao 2013, obtiene una mala calificacin
en Derechos de Propiedad (15), Libertad frente a la Corrupcin (30), Libertad laboral (474),
Libertad de inversin (40) y Libertad financiera (30). La mejores puntuaciones las obtiene en
Libertad fiscal (643), Libertad empresarial (601), Libertad monetaria (604) y Libertad
comercial (675).
Con la segunda etapa del Biplot Dinmico podemos observar la dinmica del modelo.
Durante el periodo analizado se produce una disminucin en todos los ndices de libertad
econmica, salvo en Libertad fiscal y Libertad comercial que se incrementan ligeramente. Es
significativo observar que el ndice global se separa del ndice de Libertad frente a la
corrupcin a lo largo del periodo. En la ilustracin 1 se muestra un Biplot Dinmico con los
datos centrados; se ha ocultado informacin para dar claridad al grfico.
Respecto a la evolucin de los pases del continente, es significativa la prdida de libertad
en los Estados Unidos, pasando de un valor de 799 al principio del periodo a un valor de 76
al final del mismo. De los pases peor situados frente al ndice, Cuba, Venezuela, Argentina,
Ecuador, Bolivia y Hait, tan slo este ltimo ha tenido periodos de mejora logrando
mantenerse, mientras que el resto ha cedido una parte importante de su puntuacin, como


en el caso de Venezuela que ha pasado de una puntuacin de 452 en la ao 2005 a 361 en
el ao 2013.

Ilustracin 1: Resultado del Biplot Dinmico
Argentina ha sufrido una prdida importante de libertad econmica al pasar en el periodo
estudiado de 517 a 467. Se observa en su trayectoria que despus de tres periodos de
mejora comienza un descenso que se acenta en los dos ltimos aos donde pierde 5
puntos. Las principales reas de descenso son las de Libertad fiscal y Gasto pblico,
seguidas de Libertad comercial, Libertad monetaria, Libertad de inversin y Libertad
financiera.

Bibliografa
[1] Sen, A. (2000). Desarrollo y Libertad, 1. ed. Planeta, Barcelona.
[2] Holcombe, R. y Gwartney, J. (2010). Unions, economic freedom, and growth. Cato J
Cato J. vol(30): pg.122.
[3] Miller, T.; Kim, A. B. (2013). Chapter 7: Defining Economic Freedom. 2013 Index Econ.
Free. Heritage Foundation; Wall Street Journal, Washington, D.C.; New York, N.Y.
[4] heritage.org (2012). The Heritage Foundation. http://www.heritage.org/
[5] WSJ (2012). The Wall Street Journal. http://www.wsj.com
[6] Smith, A. (1776). Wealth of Nations
[7] Miller, T.; Holmes, K.; Feulner, E. J. (2013). 2013 Index of Economic Freedom. Heritage
Foundation; Wall Street Journal, Washington, D.C.; New York, N.Y.
[8] Gabriel, K. R. (1971). The biplot graphic display of matrices with application to principal
component analysis. Biometrika, vol(58): pg. 45367.
[9] Galindo, P. (1986). Una alternativa de representacin simultnea: HJ-Biplot. Qestii,
vol(10).
[10] R Core Team (2012). R: A Language and Environment for Statistical Computing. R
Foundation for Statistical Computing. Vienna, Austria. http://www.R-project.org/



THE ANALYSIS OF A THREE-WAY MULTIVARIATE DATA BY
PARTIAL TRIADIC ANALYSIS AND TUCKER3 MODEL: AN
EXAMPLE ENRICHED WITH ZOOPLANKTON DATA

M PURIFICACIN GALINNDO-VILLARDN
1
, SUSANA MENDES
2,3
, SNIA MARQUES
3
,
ULISSES AZEITEIRO
3,4
, PAULO MARANHO
2,3
, SRGIO LEANDRO
2
, M JOS
FERNNDEZ-GMEZ
1

1
Department of Statistics, University of Salamanca, Salamanca, Spain
2
Marine Resources Research Group, School of Tourism and Maritime Technology,
Polytechnic Institute of Leiria, Peniche, Portugal
3
CEF - Centre for Functional Ecology, Department of Life Sciences, University of Coimbra,
Coimbra, Portugal
4
Department of Sciences and Technology, University Aberta, Porto, Portugal

pgalindo@usal.es

ABSTRACT

This research focuses on the comparative study of two methods of three-way data analysis.
At the same time, emphasis is given to the several aspects in which comparisons between
the methods are based, as well as its applicability to analyze data from ecological studies in
time and space.

Keywords: exploratory analysis; three-way data; PTA; Tucker3.

Introduction
The most common methods for the study of three-way data analysis are the Triadic Analysis
[1,2] and Tucker models [3]. The first seeks a consensus configuration over time or space
and therefore aims to evaluate the stable part in the dynamics of relationships. In the second,
the models are adjusted to achieve the goal of explaining the interaction. This work aims to
produce a general comparison, including the two different techniques for studying multi-way
matrices. Thus, the two techniques are applied to data obtained from a study of zooplankton
distribution [4] in the Berlengas Natural Reserve (Portugal). Zooplankton distribution was
studied over a period of one year and monthly sampling was performed at 6 stations. The
data collected can therefore be arranged into three-way array as sites x species x time. The
Tucker3 method was chosen due its flexibility at fitting data with different modes (ways),
each of which can have a different number of latent factors.

The Partial Triadic Analysis
Partial triadic analysis is an exploratory tool for three-way data analysis and derived from
triadic analysis [3]. It is therefore different from Kroonenbergs three-mode PCA [5], and from
Tuckers triadic analysis. Its main idea is to compare different data tables (matrices) obtained
under various experimental conditions, but containing the same rows and same columns
[1,6]. By analogy to N-way methods, the three-way data set is denoted by with dimensions
, and , corresponding to the number of rows, columns and tables, respectively. Thus, an
element of is , where , and . Each direction is called a
mode and the number of levels in the mode is called dimension. A table is a slice of of
dimension obtained by fixing the index in the third mode. It can also be named a frontal
slab or layer. The tables and are called horizontal and vertical slabs, and can be
obtained by fixing the first or the second mode index. The main steps of PTA algorithm
(namely the interstructure, the compromise and the intrastructure analyses) are described in
[1], however it is important first consider that different tables are, for example, sites x


species which results in a two-way matrix of dimension or sites x (species x
time).

The Tucker3 model
The aim of Tucker3 analysis is to summarize the three sets of entities constituting the three-
way data set in such a way that the main information in the data can be summarized by
means of a limited number of components for each set of entities. It is therefore a
generalization of two-way PCA. In Tucker3 analysis, a (usually preprocessed) three-way data
array , of order I x J x K, is described by the model ,
, and ; where and and denote the elements of the
components matrices , describing the sampling sites (objects), , describing
the species variables and , describing the sampling times (conditions), respectively,
and denotes the elements of core array , which weights the products
between component of the sampling sites (1
st
mode), component of the species variables
(2
nd
mode), and component of the sampling times (3
rd
mode) and explains the interaction
among the factors of each of the modes. The term denotes an error term (or
residual) associated with the description of (in this case, the value of the measurement
referring to the th sampling site, th species variable and th sampling month). The values ,
and are the number of components selected to describe the first, the second and the third
mode, respectively, of the data array. This number is not necessarily the same for each
mode. The core efficiently describes the main relations in the data, and the component
matrices , and describe how the particular sites, species variables and sampling times
relate to their associated components.

Survey Design and Data
From February 2006 to February 2007, zooplankton samples were collected monthly
(excluding the month of August 2006, by adverse weather conditions) from 6 stations,
located along a transect perpendicular to the coastline (between the Peniche coast and
Berlenga islands, Portugal). The samples were obtained from inshore, shelf and offshore
regions. Only the most abundant 50 taxa out of the 90 identified, having a minimal mean
occurrence of 0.1% of the total density observed in the study area was considered. A
detailed description of the study is given in [4]. The data do have perfect trilinear structure,
since for each mode (sites, species and months) the dimensions of the data are the same for
all data tables. In order to investigate the temporal and spatial variability in the zooplankton
community structure, the species densities were arranged in a tridimensional matrix
comprising a 6 x 50 x 12 data block of sites by species densities by months. These data
offered the possibility to study the spatial variability of the zooplankton community and its
dynamics in time.

Results
First, PTA is performed on the data set with perfect trilinear structure. Each data table
contains different sampling sites , characterized by species densities
measured in a certain month . The tables are arranged as frontal slabs in . Then, the
Tucker3 analysis was applied to the same data and when the results have to be interpreted
further, the core array , the elements of which reflect the interactions between the modes, is
taken into account. The results were not fully interpreted for the two methods. Only the
comparison of the performance of both methods is presented and the advantages of each
procedure are highlighted. It was found that PTA and Tucker3 not lead to the same results.
However, those differences can be expected due to the different objectives of the methods.
Tucker3 model is a decomposition model, which fit the original data as well as possible,


whereas PTA reveals object distributions on the compromise plot. The solution with three
components for first mode and two components for second and third ( ) modes,
accounted for 41.1% of the variability in the Tucker3 model. This result was obviously far
from the PTA solution (with 82%). Although these contrast, some careful is needed when
compare them. The total variance explained by the Tucker3 model is different from that is
obtainable by the PTA method. Note that, the variability accounted for in the present analysis
is based on the simultaneous reduction in all three modes. Moreover, the Tucker3 model
used here includes weights for the combination of components from three different modes.
These weights are given by means of core matrix elements, and the most important
elements (four for the present study) represent an extremely compact description of the all
data set. The main idea of PTA method is to study proximities among tables (or matrices) by
defining consensus configuration. All steps of the PTA follow this direction, since begins
finding a measure of agreement between the different tables (interstructure), and, next, it
allows for studying the consensus configuration (compromise) and the partial configurations
(trajectories). However, PTA cannot be generalized to more than three-way data and it is
only exploratory tool since it cannot be used in a modeling context as can be done with multi-
way models. These, as Tucker3 model, allows easier visualization of the data structure
highlighting each source of variability, in particular capturing species assemblages'
distribution which is common in ecological studies. It provides a better insight into data
structure, since it take into account the three-dimensional structure of the data. Moreover
Tucker3 model reduce the noise, and shows which of the original variables are correlated
and which of them are the most significant for a certain (environmental) problem description.
In conclusion, and summarizing, the pattern observed for the three modes, sites, species and
months PTA suggested that February, March, October, December, January 2007 and
February 2007 had more particular structures and Tucker3 model represented January 2007,
March and December as the of the months with the large influence in the overall solution. So,
one appealing feature of Tucker3 model is the fact that highlights structures that PTA had
suggested as particulars. Hence, besides the environmental considerations strictly
connected to the present case in study, in general terms, the suitability of the proposed
Tucker3 procedure can be remarked to detect periodic patterns of multivariate time series
within a pool of sampling points that can be hindered by anomalous events and specific
features of sites which constitute a relevant advantage of the procedure. Nevertheless, in this
study both methods provided interpretable results and presented a global description of the
main patterns for the zooplankton community data of the Berlengas Natural Reserve.

Bibliography
[1] Jaffrenou, P. A. (1978). Sur l'analyse des familles finies de variables vectorielles. Bases
algbriques et application la description statistique. Thse de 3 cycle, Sciences et
Technique du Languedoc, Montpellier-II, Montpellier.
[2] THIOULOUSE, J. & CHESSEL, D. 1987. Les analyses multitableaux en cologie
factorielle. I. De la typologie dtat la typologie de fonctionnement par lanalyse triadique.
Acta Oecologica, Oecologia Generalis, 8, 463-480
[3] Tucker, L. R. (1966). Some mathematical notes on three-mode factor analysis.
Psychometrika, 31, 279311.
[4] Mendes, S., Marques, S. C., Azeiteiro, U. M., Fernndez-Gomz, M. J., Galindo-Villardn,
M. P., Maranho, P., Morgado, F., Leandro, S. M. (2011). Zooplankton distribution in a
Marine Protected Area: the Berlengas Natural Reserve (Western coast of Portugal).
Fresenius Environmental Bulletin, 20, 496-505.
[5] Kroonenberg, P. M. (1983). Three-mode principal component analysis. DSWO Press,
Leiden, Germany.
[6] Lavit, C., Escoufier, Y., Sabatier, R., Traissac, P. (1994). The ACT (Statis method).
Computational Statistics and Data Analysis, 18, 97-119.


UTILIZACIN DE DISEOS DE TESTIGOS APAREADOS EN
MEJORAMIENTO GENTICO VEGETAL

BOLOGNA SUSANA
1
, ROJAS ELIZABETH
1
, BONGIOVANNI MARCELO
1
, MARTNEZ
ALVAREZ DIEGO
1
, ESCUDERO SANDRA
1
, RUBIRA FRANCO
1

1
Universidad Nacional de San Luis, Facultad de Ingeniera y Ciencias Agropecuarias

sbologna@fices.unsl.edu.ar

RESUMEN
La utilizacin del diseo de Testigos Apareados (DTA) en la mejora vegetal hace posible la
evaluacin de un gran nmero de materiales experimentales y en consecuencia la
conduccin de numerosas parcelas. Existe metodologa con sustento estadstico, en el
marco de los modelos lineales generales y mixtos, que constituyen herramientas slidas
para la interpretacin de los resultados que arrojan los testigos apareados. Con el objetivo
de investigar distintas metodologas para la evaluacin del DTA, se analiz un ensayo de
genotipos de soja y se aplicaron los siguientes mtodos: Rendimiento corregido por testigos,
ANOVA a una va de clasificacin, Correlaciones espaciales y Anlisis de Covarianzas. El
mtodo que result ms eficiente y que mejor ajust al conjunto de datos fue el de
correlacin espacial exponencial.

Palabras clave: testigos apareados, modelos mixtos, correlacin espacial.

Introduccin
En un programa de mejoramiento gentico se tienen que evaluar gran cantidad de lneas
experimentales para poder identificar y seleccionar los genotipos superiores. sta tarea se
ve dificultada por la cantidad de parcelas que hay que conducir (repeticiones, localidades,
aos), y por lo tanto la aplicacin de los diseos experimentales tradicionales con
repeticiones complica su evaluacin. Una alternativa es la utilizacin del DTA donde la
seleccin se realiza por comparacin directa de los nuevos genotipos, que se ensayan en
una sola unidad experimental, con variedades testigos que se intercalan sistemticamente
entre ellas (Boca, 2011). El testigo comn que se intercala permite modelar los efectos
sistemticos de la calidad del terreno donde se ubican las parcelas (Di Rienzo et al., 2010).
Para la evaluacin de estos diseos comnmente se utiliza el mtodo del rendimiento
corregido por testigos, que si bien aporta un ranking de los tratamientos, ste debe
considerarse solo a ttulo informativo ya que no tiene sustento estadstico. Existe otra
metodologa que otorga una interpretacin estadstica valida, basada en modelos lineales
generales y mixtos, que permiten modelar la variacin espacial y as utilizar como covariable
la posicin de cada genotipo respecto al testigo (Boca, 2011). Adems el marco terico de
stos modelos brinda la posibilidad de analizar datos con estructura de dependencia, datos
correlacionados, con falta de normalidad y desbalance (Balzarini et al., 2005). El objetivo del
trabajo fue analizar la utilidad del DTA en un programa de mejoramiento y aplicar distintas
metodologas para su evaluacin.

Desarrollo
Se evaluaron los datos registrados en un ensayo de genotipos de soja, realizado en la
campaa 2011/12 en la localidad de Los Molles (San Luis). Se utiliz un DTA con 17
tratamientos sin repeticiones y un testigo comn repetido luego de cada genotipo. Se evalu
la variable rendimiento (Rto) de granos por parcela en kg/ha ajustado al 13,5% de humedad.
Para el anlisis del DTA se aplicaron las siguientes metodologas: 1. Mtodo del
Rendimiento corregido por testigos y 2. Modelos lineales generales y mixtos: Anlisis de la
varianza a una va de clasificacin, Correlaciones espaciales y Anlisis de covarianza.


1. Mtodo del Rto corregido por testigos. Haciendo uso de los testigos asociados a cada
cultivar se puede hacer una comparacin entre tratamientos, aplicando las ecuaciones:
RCT = Rto corregido por testigos para el genotipo A = Rto genotipo A x Rto promedio de
todos los testigos / Rto promedio de los testigos apareados al genotipo A
RRCT = Rto relativo corregido por testigos = RCT / Rto promedio del ensayo
2. Modelos lineales generales y mixtos. 2.1. Anlisis de la varianza a una va de
clasificacin: Se realiz un ANOVA a una va de clasificacin, donde el nico factor de
tratamiento fue Genotipo. Los tratamientos se compararon usando una estimacin del
trmino del error a partir de la varianza entre los testigos, que fueron los nicos niveles del
factor tratamiento que estuvieron repetidos. Para aplicar ste modelo se consider a
Rendimiento como variable dependiente y a Genotipo como variable de clasificacin. Se
estableci a la variable Genotipo como efecto fijo. Luego para realizar las comparaciones
entre los tratamientos se realiz la prueba LSD de Fisher. 2.2. Correlaciones espaciales: Se
realiz un ANOVA usando correlaciones espaciales para corregir las medias de cada
genotipo por el efecto de sitio en donde los tratamientos fueron ubicados al azar. As se
defini a la ubicacin de cada parcela como una nueva variable denominada Posicin. Para
aplicar dicho modelo se consider a Rendimiento como variable dependiente, a Genotipo
como criterio de clasificacin y a Posicin como covariable. Tambin se consider a la
variable Genotipo como efecto fijo. Se aplicaron los siguientes modelos de correlacin:
Espacial exponencial, Espacial Gaussiana, Espacial lineal, Espacial cuadrtica y Espacial
esfrica. Luego para cada modelo se realiz la prueba LSD de Fisher. 2.3. Anlisis de
covarianzas: Se realiz un ANOVA basado en un anlisis de covarianzas para ajustar las
medias de los genotipos en las distintas posiciones. Para ello se construy una nueva
variable con los rendimientos correspondientes a los testigos llamada Tes, luego con los
valores del rendimiento del genotipo ms cercano a cada testigo se defini la variable Gen, y
se calcul la diferencia del rendimiento del testigo frente al genotipo generando la variable
Dif. Se realiz un anlisis de Regresin Lineal considerando a Dif como variable
dependiente y a Posicin como variable regresora, y se guardaron las diferencias predichas
(Pred_Dif) del modelo con el fin de utilizarlas como una covariable en el anlisis de los
genotipos. Luego se establecieron las variables de la siguiente manera: Rendimiento como
variable dependiente, Genotipo como criterio de clasificacin y Pred_Dif como covariable,
estas dos ltimas se consideraron como efectos fijos. Por ltimo se realiz la prueba LSD de
Fisher (Di Rienzo et al., 2010). Para decidir qu modelo ajust mejor al conjunto de datos,
se analizaron dos medidas de ajuste: AIC (Criterio de Akaike) y BIC (Criterio Bayesiano de
Informacin). Los anlisis estadsticos se realizaron con el software InfoStat.

Mtodo del Rto Corregido por Testigos: El Rto promedio fue de 1523 kg/ha y el promedio de
las parcelas donde se ubic el testigo fue de 1587 kg/ha. En la Tabla 1 se observan los
valores de Rto, RCT y RRCT para cada genotipo.


Tabla 1. Mtodo Rendimiento corregido por testigos. Rendimientos en kg/ha.
Genotipo Rendimiento RCT RRCT Ranking
0108 1495 2023 133% 1
0305 2090 1703 112% 2
0411 1544 1670 110% 3
0116 1543 1621 106% 4
0206 1701 1592 105% 5
Testigo 1587 1587 104% 6
0107 1645 1583 104% 7
0208 1896 1579 104% 8
0217 1614 1554 102% 9
0414 1273 1554 102% 10
0113 1760 1539 101% 11
0309 1440 1463 96% 12
0104 1728 1459 96% 13
0404 1449 1394 91% 14
0208 1217 1356 89% 15
0102 1323 1342 88% 16
0117 1157 1252 82% 17
0403 977 1148 75% 18

La fortaleza del mtodo de RCT radica en la posibilidad que ofrece de considerar la posicin
en el plano que el azar le asign a cada genotipo, y as disminuir el error debido al ambiente.
En la Tabla 1 se observa que el genotipo 0108 rindi 1495 Kg/ha, un Rto inferior a la media
del ensayo y por debajo del testigo. Sin embargo, cuando se corrige la posicin, el genotipo
0108 ocupa el primer lugar rindiendo 33% ms que la media y 4% ms que los testigos. Esto
se explica analizando el plano del ensayo donde 0108 se ubic en la misma zona que otros
genotipos de bajo rendimiento como 0414 y 0117, lo que hace suponer que el azar los ubic
en una zona de baja calidad. La debilidad que se atribuye a ste mtodo, es que no define la
diferencia mnima en Kg/ha que debera existir para considerar que un genotipo es superior
al otro, y en consecuencia en el ranking que elabora se interpreta que el genotipo del primer
puesto supera al del segundo y as sucesivamente.
2. Modelos lineales generales y mixtos. 2.1. ANOVA a una va de clasificacin: La Prueba F
para Genotipo no result significativa para Rendimiento (p<0,3392), por lo que no se
interpretan las diferencias de medias de la prueba LSD de Fisher. Segn Boca (2011), ste
modelo no es el ms adecuado para evaluar los DTA, ya que no permite modelar los efectos
sistemticos de la calidad del terreno donde se ubican las parcelas experimentales.
2.2. Correlaciones espaciales: De las cinco correlaciones realizadas, se analiza la
Correlacin espacial exponencial debido a que fue la que mostr menor AIC y BIC (263,72 y
280,38) y la Prueba F detect diferencias significativas entre los genotipos (p=0,0033).
Segn la comparacin de medias realizada por la Prueba LSD de Fisher (Alfa=0,05), los
genotipos 0108, 0305 y 0411 fueron estadsticamente iguales y 0108 fue el nico que
super al testigo y al resto de los materiales.
Si se comparan los resultados del mtodo de RCT con el de Correlacin espacial
exponencial, se puede observar que en los rankings que presentan ambos mtodos,
coinciden los tres primeros puestos ocupados por 0108, 0305 y 0411, y el testigo se ubica
en el sexto lugar. La diferencia que se debe destacar, es que por RCT se interpreta que el
genotipo del primer lugar supera al del segundo y as sucesivamente, y que los cinco
primeros superan al testigo. En cambio en el modelo de correlacin espacial exponencial, se
interpreta que los tres primeros genotipos del ranking son estadsticamente iguales, por lo
que no se puede afirmar que 0108 supera a 0305 y ste a 0411, y que el nico genotipo que
supera al testigo es 0108.
2.3. Anlisis de covarianzas: La Prueba F para Genotipo no result significativa para la
variable Rendimiento (p<0,2213), por lo que no se interpretan las diferencias de medias
presentadas en la prueba LSD de Fisher.
De todos los modelos aplicados, los que mejor ajustaron al conjunto de datos, fueron los de
Correlacin espacial exponencial, Correlacin espacial cuadrtica y Correlacin espacial


Gaussiana, ya que presentaron los menores valores de AIC y BIC y a su vez fueron los
nicos en donde la Prueba LSD Fisher (Alfa=0,05) result significativa para Rendimiento.
La utilizacin del DTA permiti realizar una seleccin basada en una interpretacin
estadsticamente vlida.
La aplicacin de modelos estadsticos mixtos permiti modelar los efectos sistemticos de la
calidad del terreno donde se ubicaron las parcelas experimentales.
El modelo estadstico que demostr mayor eficiencia para evaluar el DTA fue el de
Correlacin Espacial Exponencial.
El mtodo de RCT result ineficiente para la evaluacin del DTA, ya que la seleccin basada
en sus resultados es subjetiva dado que no se basa en diferencias estadsticas.

Bibliografa
Balzarini, M.; Macchiavelli, R.; Casanoves, F. (2005). Aplicaciones de Modelos Mixtos en
Agricultura y Forestera. http://academic.uprm.edu/rmacchia/agro6998/AplicModMixtosAgricForest.pdf
Boca, T. (2011). Capacitacin en estadstica aplicada a datos agronmicos. Modulo III:
Diseos experimentales con testigos apareados. Inst. Clima y Agua INTA Castellar FAUBA.
http://geoestadistica.inta.gov.ar/sites/geoestadistica.inta.gov.ar/files/pdf/Curso%20Chacras%20III.pdf
Di Rienzo, J. A.; Macchiavelli, R. y Casanoves F. (2010). Modelos Mixtos en InfoStat.
www.infostat.com.ar/descargas/demo/MMixtosInfoStat.pdf


PERFORMANCE MEDIA Y ESTABILIDAD DE LINEAS DE SOJA VIA
AMMI Y GGE BIPLOTS

ROJAS ELIZABETH
1
, BOLOGNA SUSANA
1
, SOLDINI DIEGO
2
, DI RENZO MIGUEL
3
,
SALINES LUIS
2

1
Univ.Nacional de San Luis.
2
INTA Marcos Jurez.
3
Univ. Nacional de Ro Cuarto

elirojass@hotmail.com

RESUMEN
Los ensayos multiambientales son indispensables en las ltimas etapas del mejoramiento
gentico vegetal y cuando existen respuestas diferenciales de los genotipos en los distintos
ambientes por la presencia de interaccin genotipo ambiente (GE), se dificulta la
interpretacin de los resultados de estos ensayos. Dado que en presencia de GE,
combinaciones de ciertos genotipos (G) en determinados ambientes pueden resultar en
respuestas fenotpicas superiores a lo esperado respecto de los efectos de genotipo +
ambiente, se hace necesario investigar la interaccin a fin de poder capitalizarla y se
dedican muchos esfuerzos en su estudio e interpretacin (Vargas et al., 2001). El objetivo de
este trabajo fue analizar la performance media y la estabilidad de lneas avanzadas de soja
mediante dos modelos lineales bilineales: SREG y AMMI. Se utilizaron datos de rendimiento
de 8 lneas avanzadas de soja desarrolladas por el Programa Nacional de Mejoramiento de
Soja del INTA y 3 variedades testigo, todas correspondientes al grupo de madurez VI,
evaluadas en las localidades de La Carlota, Manfredi, Marcos Jurez, Paran y Rafaela. Se
utilizaron el modelo de regresin por sitio SREG y el modelo de efectos aditivos e
interaccin multiplicativa o modelo AMMI. Ambos modelos identificaron a los genotipos
J036074, J035352 y J035914 como los de mejores rendimientos. En el anlisis de la
estabilidad el biplot del AMMI1 mostr a las lneas L9649001 y J035914 como la ms
estable y la menos estable respectivamente, dentro aquellas de rendimientos superiores, y
en el biplot GGE del modelo SREG, J035914 se mostr como la lnea ms estable en tanto
que L9649001 fue la de menor estabilidad. Ambos anlisis coinciden en la identificacin de
los genotipos de mejor performance sin embargo muestran resultados opuestos en cuanto a
sus niveles de estabilidad.

Palabras clave: interaccin genotipo ambiente, estabilidad, AMMI, GGE.

Introduccin
En las etapas finales de los programas de mejoramiento gentico vegetal se prueban los G
en ensayos multiambientales. La informacin que aportan estos ensayos permite evaluar la
adaptabilidad de los G pero tambin permite identificar el tipo y la magnitud de la GE. Dado
que en presencia de GE, combinaciones de ciertos G en determinados ambientes pueden
resultar en respuestas fenotpicas superiores a lo esperado respecto de los efectos de
genotipo + ambiente, se hace necesario investigar la interaccin a fin de poder capitalizarla
(Vencovsky y Barriga,1992). Debido a que la presencia de GE complica la interpretacin de
los resultados de los ensayos, en las investigaciones agrcolas se dedican muchos
esfuerzos al estudio e interpretacin de la interaccin (Vargas et al., 2001). El objetivo de
este trabajo fue analizar la performance media y la estabilidad de lneas avanzadas de soja
mediante dos modelos lineales bilineales: SREG y AMMI.

Materiales y Mtodos
Se utilizaron datos de rendimiento de 8 lneas avanzadas de soja del Programa Nacional de
Mejoramiento de Soja del INTA y 3 variedades testigo, todas correspondientes al grupo de
madurez VI, evaluadas en las localidades de La Carlota, Manfredi, Marcos Jurez, Paran y


Rafaela, en 2007-08. Para el anlisis estadstico se utilizaron dos modelos lineales
bilineales: el modelo de regresin por sitio SREG (Cornelius et al., 1996), que remueve el
efecto de sitio y slo expresa la respuesta en funcin de G+GE, y el modelo llamado por
Zobel et al. (1988) y Gauch (1988) de efectos aditivos e interaccin multiplicativa o modelo
AMMI, que remueve el efecto de sitio y de genotipo, expresando la respuesta solamente en
funcin de la GE. Todos los anlisis fueron realizados con el software GGE (Yan, 2000).

1. Identificacin de los mejores genotipos en diferentes ambientes va GGE biplot (Modelo
SREG). La propuesta de Yan y Hunt (2002) de interpretacin de los GGE biplot especifica
que para identificar los mejores genotipos en cada ambiente, se debe graficar el polgono
envolvente de identificadores de genotipos. En la Figura 1, los extremos que definen el
polgono estn dados por los genotipos J035532, J036074, L9757004, L9960301, L9756701
y L9649001, los de mejor o peor rendimiento en algunos ambientes. Luego, para cada uno
de los lados del polgono se trazan lneas rectas que pasan por el origen y son
perpendiculares a cada uno de los lados o a sus proyecciones. Estas lneas representaran
hipotticos ambientes en los cuales los genotipos que determinan ese lado tendran igual
performance. De esta forma, el biplot queda dividido en cuadrantes, generalmente cada uno
con un genotipo en el vrtice, siendo stos los que ms rinden en los ambientes que quedan
en el cuadrante y los que se encuentran en cuadrantes que no incluyen a ninguna localidad
son los de rendimientos ms pobres en todos los sitios evaluados. Como muestra el biplot
de la Figura 1, Paran, La Carlota, Manfredi y Marcos Jurez, quedan en el mismo
cuadrante, en ellas la mejor performance la tuvo J036074. En tanto que J035352 fue la que
manifest mejor comportamiento en Rafaela. Asimismo se observa que los genotipos
denominados L son los de rendimientos ms pobres en todos los sitios evaluados.

Fig. 1. Identificacin de los mejores genotipos en cada ambiente. GGE.
2. Anlisis de performance media y estabilidad de los genotipos a travs de GGE (Modelo
SREG). A partir del biplot GGE, trazando el EAPa (Eje Ambiental Promedio abscisa) y su
perpendicular que pasa por el origen EAPo (Eje Ambiental Promedio ordenada), las
proyecciones perpendiculares de los marcadores de los genotipos sobre el EAPa
representan la contribucin del genotipo a la interaccin y revelan el ranking de performance
media. Del mismo modo, las proyecciones al EAPo daran una aproximacin a la
contribucin de la GE, una medida de la estabilidad o inestabilidad de los genotipos a travs
de los ambientes. En la Figura 2, coincidentemente con lo que se evidencia en el anlisis
anterior, las lneas de mejor performance fueron J036074 y J035352, siendo J035914 la ms
estable dentro de las de mayor rendimiento.


Fig. 2. Ranking de genotipos basado en performance media y estabilidad. GGE.
3. Anlisis de Performance media y estabilidad mediante AMMI 1. El biplot del AMMI1
coincide con el biplot GGE del ranking de genotipos, mostrando a J036074 y J035914 como
las de rendimientos superiores. Sin embargo el de mayor estabilidad segn AMMI1 fue
L9649001 seguido de A6126RG y J036074, en tanto que J035914 aparece como uno de los
ms inestables, esto contrasta con los resultados que mostraba el biplot del GGE, donde
sta lnea se presentava como la ms estable y L9649001 como la de menor estabilidad
dentro de las de rendimiento superior al promedio (Fig. 2 y 3).

Fig. 3 .Performance media y estabilidad AMMI1.
Los modelos aplicados muestran diferencias importantes en lo que respecta a la estabilidad
de las lneas, sin embargo coinciden en aquellas de mayor rendimiento.

Bibliografa
Cornelius, P., Crossa, J.; Seyedsadr, M., (1996).Statistical tests and estimatorsof
multiplicative models for genotype-by-environment interaction. In. Kang,M.; Gauch, H. (Eds)
Genotype-by-environment Interaction. CRC Press, FL.pp. 199-234.
Gauch, H. Jr. (1988). Model selection and validation for yield trials with interaction.
Biometrics 44: 705-715.
Vargas, M., Crossa, J., Van Eeuwijs, F., Sayre, K., y Reynolds, M. (2001). Interpreting
Treatment x Environment Interaction in Agronomy Trials.Agronomy Journal.93:949-960.
Vencovsky, R., y P. Barriga. (1992). Gentica Biomtrica no Fitomelhorarnento de Plantas.
Sociedade Brasileira de Gentica. pp. 486.
Yan W. y Hunt L. (2002). Biplot Analysis of Diallel Data.Crop Sci. 42:2130.


Zobel, R., Wright, M. y Gauch, H. (1988). Statistical analysis of a yield trial.Agron.J., 80:
388-393.


UNA APLICACIN DEL MUESTREO SISTEMTICO Y DEL GRFICO
DE BURBUJAS PARA EVALUAR LA DISTRIBUCIN ESPACIAL DE
LARVAS DE MOSCA BLANCA Bemicia tabaci (Gennadius) EN
CULTIVO DE PIMIENTO EN INVERNADERO EN LULES, TUCUMN,
ARGENTINA

OSVALDO E. A. ARCE
1
, LELIA INES GHIGGIA
2
, ANA JOSEFINA MACIAN
2
, JUAN
ANTONIO FERNNDEZ
2
, MYRIAM ROSANA PAZ
2
, ADRIANA PATRICIA JAIME
2

1
Ct. Biometra y Tcnica Experimental, Facultad de Agronoma y Zootecnia, Universidad
Nacional de Tucumn

2
Ct. Zoologa Agrcola, Facultad de Agronoma y Zootecnia, Universidad Nacional de
Tucumn

ova.arce@gmail.com

RESUMEN
El anlisis de la distribucin espacial de plagas insectiles es importante para desarrollar
estrategias de control sustentables. Conocer la distribucin espacial y los puntos de mayor
concentracin de las moscas blancas en el cultivo, permite tomar decisiones acertadas
sobre el control de las mismas. En un plan de manejo sustentable es preferible realizar
aplicaciones dirigidas en vez de pulverizaciones totales. Esto redunda en una reduccin de
costos y en un plan de control que afecta en menor grado el ambiente.
En este trabajo se propone realizar un muestreo sistemtico repetido en el tiempo, con
estructura de grilla, y el grfico de burbujas como herramienta grfica para observar
rpidamente no solo los sectores de mayor concentracin de la plaga sino tambin las
abundancias relativas entre los distintos puntos de muestreo. Este tipo de anlisis
corresponde a lo que los eclogos llaman Anlisis Exploratorio Descriptivo. En este trabajo
se realizaron las evaluaciones en un invernadero de pimiento ubicado en Lules, provincia de
Tucumn, Argentina. Semanalmente se cont el nmero de larvas de mosca blanca Bemisia
tabaci (Gennadius) en cada punto de muestreo entre los meses de mayo y noviembre de
2009. El anlisis se hizo con el software libre R. La aplicacin de esta metodologa result
apropiada para los fines anteriormente expuestos.

Palabras clave: anlisis exploratorio, mtodos grficos, control sustentable, grficos
en R.

Introduccin
Uno de los principales problemas sanitarios que afectan la produccin de pimiento bajo
carpa plstica es Bemisia tabaci (Gennadius), insecto que provoca daos directos mediante
la succin de savia e indirectos a travs de la excrecin de sustancias azucaradas, donde se
desarrollan hongos que producen fumagina, causante de la disminucin de la capacidad
fotosinttica de la planta afectada, adems de ser un importante vector de enfermedades
virales.
Conocer la distribucin espacial y los puntos de mayor concentracin de las moscas blancas
en el cultivo, permite tomar decisiones acertadas sobre el control de las mismas. En un plan
de manejo sustentable es preferible realizar aplicaciones dirigidas a los focos en vez de
pulverizaciones totales. Esto redunda en una reduccin de costos y en un plan de control
que afecta en menor grado el ambiente.



Desarrollo
Datos
Los datos corresponden a mediciones realizadas sobre larvas de B. tabaci en un
invernadero de pimiento. El inters estuvo en evaluar la distribucin espacial tanto
transversalmente como longitudinalmente.
Muestreo
Para el muestreo se tom un rea de 24 m de largo por 60 m de ancho. Se realiz una grilla
de muestreo (muestreo sistemtico), dentro de esta superficie, consistente en seis filas
equiespaciadas. En cada fila se delimitaron tres sectores: norte, centro y sur. Las muestras
se tomaron seleccionando una planta al azar en cada una de ellas. En cada punto de
muestreo se tomaron 4 hojas al azar de la parte central de la planta, es decir, un total de 12
hojas por fila. Las muestras fueron acondicionadas en bolsas plsticas y etiquetadas y
trasladadas al laboratorio de la Ctedra de Zoologa Agrcola de la Facultad de Agronoma y
Zootecnia de la UNT para su posterior anlisis y estudio bajo microscopio estereoscpico.
Se registr la presencia de larvas vivas de moscas blanca en planillas confeccionadas a tal
efecto.
Anlisis de los datos
El grfico de burbujas se propone como una herramienta descriptiva til en problemas de
ecologa (Borcard et al. 2011) para analizar distribucin espacial y cantidades relativas.
Este grfico se realiza con el comando bubble.plot de R (R Core Team, 2013; Crawley,
2007) o bien con el comando plot (Borcard et al. 2011) utilizando la opcin cex para generar
las burbujas. El argumento cex se usa para definir el tamao de un tem en un grfico. En
este trabajo correspondi al vector de abundancias de las larvas de de mosca blanca. El
resultado es una serie de burbujas cuyo dimetro es proporcional a la abundancia.


1 2 3 4 5 6
0
1
2
3
4
Fila
M
u
e
s
t
r
a

1 2 3 4 5 6
0
1
2
3
4
Fila
M
u
e
s
t
r
a

Figura 1. Izquierda: evaluacin en la primera semana. Derecha: evaluacin a las 10
semanas.


1 2 3 4 5 6
0
1
2
3
4
Fila
M
u
e
s
t
r
a

Figura 2. Evaluacin a las 15 semanas.

Como se puede ver en las figuras el monitoreo semanal realizado segn la manera descripta
permite ir siguiendo la evolucin de las larvas de mosca blanca y detectar el momento y el
sector en que debe aplicarse algn producto de control. En el caso de la figura 1 se ve que
la distribucin espacial es uniforme pero con abundancia baja. A las 10 semanas se
observa que la abundancia continua baja pero la distribucin es ms concentrada. La figura
2 permite observar una distribucin muy concentrada en la izquierda del invernculo con una
explosin en la abundancia que requiere medidas de control en ese sector a fines de evitar
daos al cultivo.
La metodologa utilizada en este trabajo result muy til para los fines mencionados en la
introduccin. Puede ser utilizada tambin en extensiones de cultivos ms grandes
aumentando la cantidad de puntos de muestreo. En este caso se utilizaron pocos puntos por
tratarse de una superficie reducida.

Bibliografa
Borcard, D.; Gillet, F. y Legendre, P. (2011). Numerical ecology with R. USA.
Crawley, M. (2007). The R book. England.
R Core Team (2013). R: A language and environment for statistical computing. R
Foundation for Statistical Computing, Vienna, Austria. Versin obtenida el 03/06/13. URL
http://www.R-project.org/.


ANLISIS DE LOS FACTORES QUE AFECTAN EL USO DE SITIOS
POTENCIALES DE REPRODUCCIN DEL SAPITO DE LAS SIERRAS
(MELANOPHRYNISCUS AFF MONTEVIDENSIS) EN LOS RELICTOS
DEL PASTIZAL SERRANO

ROSANA CEPEDA
1
,

CLAUDIA MARINELLI
1
, VERNICA SIMOY
1
,AGUSTINA CORTELEZZI
1
,
BERKUNSKY, IGOR
1
Y FEDERICO P. KACOLIRIS
1,2

1
Instituto Multidisciplinario sobre Ecosistemas y Desarrollo Sustentable, Universidad
Nacional del Centro de la Provincia de Buenos Aires, Campus Universitario, Paraje Arroyo
Seco s/n, Tandil 7000, Argentina.
2
Museo de La Plata, Universidad Nacional de La Plata, Paseo del Bosque s/n, La Plata
1900, Argentina

rocepeda@gmail.com

RESUMEN
Las especies con distribuciones muy restringidas son vulnerables a la extincin, y la
modificacin de los hbitats naturales es la principal amenaza a su persistencia. El sapito de
las sierras (Melanophryniscus aff montevidensis) es una especie endmica que se
reproduce en charcas temporales de los relictos de pastizal serrano del sistema de Tandilia.
El objetivo de este trabajo es detectar que caractersticas de los sitios de reproduccin
favorecen a la presencia del sapito de las sierras. Identificamos 115 sitios posibles de
reproduccin en los remanentes de pastizales del rea protegida "La Poligonal", obteniendo
una densidad de 75 sitios /km
2
. Los sitios con poca profundidad y a ms de 500m de los
caminos tienen mayor porcentaje de uso, siendo en su mayora pequeos y circulares. El
estado del fondo afecta significativamente a la presencia del sapito. La proteccin, la mejora
y restauracin de los relictos de pastizal serrano son claves para su conservacin y la
preservacin de las especies que all habitan.

Palabras Claves: Relicto de Pastizal; Conservacin; Sitios de reproduccin;
Melanophryniscus.

Introduccin
La fragmentacin, la degradacin y alteracin del hbitat son las principales causas de la
gran cantidad de especies de anfibios que se encuentran hoy en peligro de extincin (Stuart
et al. 2004; Lips et al. 2008). Debido a los cambios ambientales es necesario analizar las
relaciones entre las caractersticas de los hbitats de reproduccin (charcas temporales) y
su utilizacin.
Los mejores sitios de reproduccin sern los que mantienen el agua suficiente para
completar la metamorfosis, y proporcionar recursos para renacuajos (es decir, alimento y
refugio de los depredadores). Una ventaja de las charcas temporales pequeas y poco
profundas es que limitan el establecimiento de potenciales depredadores de gran tamao,
tales como peces u otras especies de anuros (Skelly et al 1999;. Blaustein 2001). Adems,
la presencia de vegetacin proporciona alimento y sitios para fijar los huevos (Crump 1991).
Como otras especies de anfibios, el sapito de las Sierras, Melanophryniscus aff.
montevidensis, se enfrenta a las consecuencias del aislamiento por la fragmentacin de
hbitat debido principalmente al avance de la agricultura, la silvicultura y el desarrollo
urbano. El hbitat de esta especie se redujo drsticamente y en la actualidad menos del 5%
de estos pastizales permanecen aislados en unos pocos relictos (Bilenca y Miarro 2004).
El sapito de las sierras muestra eventos explosivos de cra, asociados a fuertes lluvias, en
charcas naturales y artificiales de valles y arroyos temporales (Berkunsky obs pers.)


El objetivo de este trabajo es evaluar las principales caractersticas de los sitios de
reproduccin de las poblaciones del sapito de las sierras, y analizar cmo estas
caractersticas influyen en la presencia de los sapitos. Una primera estimacin del tamao
mnimo de la poblacin en la zona de estudio, se realiz a partir de los registros de
muestreos a campo. Adems, se ensay una estimacin del tamao mnimo de la poblacin
en la zona de estudio a partir de los registros colectados en campo.
Conocer los requerimientos de hbitat y el tamao de la poblacin del sapito de las sierras
es imprescindible para desarrollar estrategias de conservacin.

Materiales y Mtodos
Los pastizales del Sistema de Tandilia cuya vegetacin dominante es Paspalum
quadrifarium y varias especies de Stipa y Piptochaetium han sido clasificados como reas
Valiosas de Pastizal (Fig. 2, Bilenca y Miarro 2004). Trabajamos en 5 de los 7 relictos de
pastizal existentes en el rea protegida "La Poligonal " (Tandil, Buenos Aires, Argentina, 37
21 'S, 59 06' W) cubriendo una superficie de 18,5 Km
2
: Las Animas (15.3 Km
2
);El
Calvario" (1.9 Km
2
); "La Movediza" (0.8 Km
2
); "Parque Independencia" (0.1 Km
2
) y "Las
Tunitas "(0.4 Km
2
). La expansin de la ciudad acenta la degradacin, fragmentacin y
aislamiento de los relictos de pastizal, encontrndose algunos parches de pastizal inmersos
en el paisaje urbano.
Las charcas temporales que se encuentran en el pastizal serrano son utilizadas como sitios
de reproduccin de varias especies de anuros como el sapito de las sierras. La forma y
persistencia de estos sitios estn condicionadas por el relieve, siendo ms abundantes y
persistentes en los valles o laderas suaves, y los mrgenes de los arroyos (Berkunsky obs
pers.).
Realizamos muestreos durante el mes de Octubre de 2012 entre las 10 y las 17 h, en base
al pico de actividad que ha sido registrado para la especie (Cairo and Zalba, 2007). En cada
muestreo exploramos los remanentes de pastizal buscando posibles sitios de reproduccin.
Registramos la localizacin geogrfica de estos sitios y la distancia de los mismos al camino
ms cercano. Para la mayora de los sitios registramos las dimensiones (largo, ancho y
profundidad), forma (lineal o circular), origen (natural o circular) y sustrato dominante en el
fondo (vegetacin, roca o barro). En algunos sitios, adems de registrar las detecciones de
sapitos, contamos la cantidad de individuos detectados.
Realizamos un anlisis de la estructura de variacin de las variables asociadas al sitio de
reproduccin. Usamos un modelo lineal generalizado con respuesta binomial para evaluar el
efecto de las variables involucradas. Finalmente, estimamos el tamao mnimo de la
poblacin en la zona.

Resultados y Discusin
En los cinco relictos de pastizal muestreados registramos 115 posibles sitios de
reproduccin. El relicto Las Animas" concentr el 70% de los sitios de reproduccin. El
resto se distribuyeron en los otros cuatro relictos: "El Calvario", 12%, "La Movediza" (7%),
"Parque Independencia" (7%) y "Las Tunitas" (4%). La densidad de los posibles sitios de
reproduccin en los diferentes relictos de pastizal estudiados fue similar en todos los
relictos. En consecuencia, podemos considerar que el tamao del relicto no afecta la
disponibilidad de hbitat. Incluso los relictos ms pequeos mantienen sitios potenciales.
La mayora de los sitios posibles de reproduccin fueron circulares (63%) y de origen natural
(55%). Los sustratos dominantes en el fondo fue vegetacin (41%) y barro (41%). Los
posibles sitios de reproduccin estuvieron asociados significativamente con fondos
vegetados y/o con barro. Encontramos una alta proporcin de sitios artificiales que son
consecuencia de la actividad minera en el pasado reciente y la expansin de la ciudad y de
las actividades tursticas en los relictos. No observamos asociacin significativa con las
dimensiones de las charcas.
Detectamos la presencia del Sapito de las Sierras en el 50% de los posibles sitios de
reproduccin, en un promedio de 5 individuos por cada sitio. Estimamos un tamao mnimo
de poblacin de 116 individuos en los cinco relictos de pastizal estudiados en el rea


protegida. La profundidad de la charca no alcanzo a ser significativa pero indica asociarse
negativamente con la presencia de sapos, ocupando en general, sitios de reproduccin
inferiores a 50 cm de profundidad. Las observaciones acuerdan con la idea generalizada de
que los sapos seleccionaran charcas temporales poco profundas para evitar potenciales
depredadores. Encontramos una relacin positiva entre la presencia de sapos y la distancia
de sitios de reproduccin al camino ms cercano. El porcentaje de utilizacin fue bajo en
aquellos situados a menos de 500 m de caminos. Por otra parte el tipo de fondo, afecta en
todos los casos en sentido negativo a la presencia de sapito.
La prdida de potenciales sitios de reproduccin puede tener graves consecuencias, no slo
en la reduccin del hbitat, sino tambin en la disminucin de la conectividad entre las
poblaciones.

Bibliografa
[1] Bilenca, D. and F. Miarro. 2004. Identificacin de reas valiosas de pastizal (AVPs) en
las Pampas y Campos de Argentina, Uruguay y Sur de Brasil. Fundacin Vida Silvestre
Argentina, Buenos Aires.
[2]Blaustein, A.R., E.L. Wildy, L.K. Belden and A. Hatch. 2001. The influence of abiotic and
biotic factors on amphibians in ephemeral ponds with special reference to long-toed
salamanders (Ambystoma macrodactylum). Israel Journal of Zoology 47:333345
[3]Cairo, S.L. and S.M. Zalba. 2007. Effects of a paved road on mortality and mobility of
Red-belly Toads (Melanophryniscus sp.) in Argentinean grasslands. Amphibia-Reptilia
28:377385.
[4]Crump, M.L. 1991. Choice of oviposition site and egg load assessment by a tree frog.
Herpetologica 47:308315.
[5]Hazell, D., J.M. Hero, D. Lindenmayer and R. Cunningham. 2003. A comparison of
constructed and natural habitat for frog conservation in an Australian agricultural landscape.
Biological Conservation 119:6171.
[6]Lips, K.R., J. Diffendorfer, J.R. Mendelson III and M.W. Sears. 2008. Riding the wave:
Reconciling the roles of disease and climate change in amphibian declines. PLOS Biology
6:441454.
[7]Stuart, S.N., J.S. Chanson, N.A. Cox, B.E. Young, A.S.L. Rodrigues, D.L. Fischman and
R.W. Waller. 2004. Status and trends of amphibian declines and extinctions worldwide.
Science 306:17831786.
[8]Skelly, D.K., E.E. Werner and S.A. Cortwright. 1999. Long-term distributional dynamics of
a Michigan amphibian assemblage. Ecology 80:23262337.


EL ANLISIS FACTORIAL MLTIPLE PARA TABLAS DE
CONTINGENCIA EN INDAGACIONES DE CONCEPCIONES SOBRE
EL INFINITO MATEMTICO

NORA BACCAL
1
, VIRGINIA MONTORO
2
, MARA TERESA JUAN
3

1
Centro Regional Universitario Bariloche- Universidad Nacional del Comahue. INIBIOMA
2,3
Centro Regional Universitario Bariloche- Universidad Nacional del Comahue

norabaccala@gmail.com

RESUMEN
Se indagan las ideas de estudiantes secundarios y universitarios, respecto de aspectos
bsicos sobre el infinito, utilizando las respuestas escritas a un cuestionario con preguntas
de respuesta mltiple.
Para el anlisis se utiliz el Anlisis Factorial Mltiple para tablas de contingencia (AFMIT),
que permiti observar que los estudiantes secundarios de los primeros aos de los colegios
se caracterizan por la inseguridad en sus respuestas, los de aos intermedios por
concepciones alternativas, como la de infinito como un nmero muy grande y finalmente los
ltimos aos de los secundarios y los universitarios de Biologa y Matemtica Avanzada que
responden correctamente a la mayora de las preguntas.
El AFMIT permiti reconocer y describir patrones en las respuestas de los estudiantes a lo
largo de los aspectos indagados, encontrando que la formacin matemtica, se presenta
como relevante para una adecuada construccin del concepto de infinito.

Palabras clave: anlisis intratabla- infinito- grupos de variables.

Introduccin
La comprensin de los estudiantes acerca de la nocin de infinito es frecuentemente lbil y
contradictoria, an en los ltimos aos de la educacin secundaria e incluso en la
universidad, los estudiantes encuentran serias dificultades de conceptualizacin cuando se
enfrentan con situaciones que implican el infinito (Montoro, 2005 y 2012, Montoro y Scheur,
2004, entre otros). El concepto de infinito matemtico es clave en la construccin
matemtica de la comprensin del nmero real, de modo que la apropiacin del infinito por
parte de los estudiantes es esencial en la apropiacin del concepto de nmero real (Juan, et
al., 2012,
Dentro de la lnea de investigacin en pensamiento y educacin matemtica
1
, se realiz un
estudio para indagar las ideas de estudiantes, sobre aspectos bsicos del infinito, ms
especficamente se quiere indagar cmo a lo largo del nivel educativo secundario y
universitario, los estudiantes dan cuenta de: a) la posibilidad de obtener una coleccin
infinita a partir de la combinacin de un nmero finito (pocos o muchos) de elementos; b) la
distincin entre infinito y muy grande, c) la distincin entre infinito y todo. Mediante el anlisis
de las respuestas a un cuestionario escrito (Montoro, 2003), con varias preguntas de opcin
mltiple entre las cuales podemos distinguir tres grupos en cuanto al enfoque del tema y
cuyas respuestas dan cuenta de las ideas de los estudiantes. Esta informacin lleva a
construir varias tablas de contingencia para cada uno de estos grupos de preguntas. El
Anlisis Factorial Mltiple Intratabla (AFMIT), desarrollado por Bcue y Pags (2000, 2003),
facilita la comparacin conjunta de varias tablas de contingencia, ya que permite ver no slo

1
Proyecto 04/B159. Secretaria de Investigacin UNComahue. Directora Virginia Montoro Co-Directora Martha
Ferrero.


la variabilidad de la informacin dentro de una misma tabla, sino la variabilidad inter-tabla
(Albornoz y Baccal, 2012).
Por lo tanto el objetivo del presente trabajo es mostrar la utilidad del AFMIT en el estudio de
las ideas que alumnos secundarios y universitarios tienen sobre aspectos bsicos de la
nocin de infinito y analizar la influencia del nivel educativo, la carrera que cursan y el nivel
de avance en la misma.

Desarrollo
Se utiliz un cuestionario que consta de 10 preguntas cerradas, para ser contestadas en
forma individual y por escrito en clase. Se encuest en total 315 estudiantes:- 195
estudiantes de secundaria que asisten a tres colegios de Bariloche (C46; C2 y CT). El CT
es tecnolgico, con jornada doble y su plan de estudios es de 6 aos. En cada colegio,
participaron los alumnos de un curso de primer ao, uno de tercer ao y uno del ltimo ao.
- 120 estudiantes universitarios ingresantes y avanzados de las carreras de Matemtica
(MI, MA) , Educacin Fsica (EFI,EFA)y Biologa (BI, BA). Las carreras fueron elegidas de
modo que la matemtica es de importancia central, intermedia y baja en cada una de ellas
respectivamente.
Se consideran los siguientes grupos (las modalidades de las variables que lo constituyen se
refieren a un mismo modo de enfocar el tema): G1=Infinito potencial: si con pocos elementos
de partida se puede obtener, potencialmente una coleccin infinita (las variables son las
modalidades de respuesta: Si, No, No sabe de las preguntas 1, 2 y 5). G2 = Distincin entre
infinito y todo (las modalidades: Si, No, No sabe de las preguntas 3, 4 y 6). G3= si a partir de
un nmero finito de elementos puedo obtener una coleccin (actualmente) infinita,
diferencindola de una con un nmero muy grande de elementos (Preguntas 7, 8, 9 y 10,
con las modalidades: P7: Poco, Mucho, No contesta; P8 y P9: Poco, Mucho, Incompleto, No
contesta, P10: Poco, Incompleto, No contesta).
Se aplic el AFMIT sobre la tabla yuxtapuesta que tiene por filas las clases de estudiantes:
C41, C43, C45, C21, C23, C25, CT1, CT3, CT6, MI, MA, EFI, EFA, BI, BA y por columnas
las modalidades (tipos de respuestas) de las variables (preguntas) que constituyen cada
grupo.
Figura 1. Tabla de contingencia mltiple y mrgenes: notacin

ijt
f
: Frecuencia relativa asociada a la fila i columna j de la tabla t. un ndice sustituido por un
punto indica la suma sobre ese ndice.
El AFMIT es equivalente a realizar un ACP no normado de las tres tablas de contingencia
yuxtapuestas de trmino general dado en (1):
jt . .. i
jt .
t ..
t . i
ijt
ijt
f f
f
f
f
f
x
|
|
.
|
\
|
=
dando a la fila i el peso fi.. y
a la columna (j,t) es decir la j-sima columna de la tabla t, el peso
t
1
jt .
f
, siendo
t
1
= el
primer valor propio obtenido del seudo anlisis de correspondencia de la tabla t. Se
(1)

T
., .......... ..........
t
.. .......... ..........
1
.... ...... ,......... 1
......., ,......... 1 ........, ,......... 1
1
, .......... ,......... 1
Grupo
c
p
Grupo Grupo
T
p
t
p p
1
n
i f
i..
f
ijt
f
i.t
f
.jt
f
..t
f
ijt
f
.jt

T
., .......... ..........
t
.. .......... ..........
1
.... ...... ,......... 1
......., ,......... 1 ........, ,......... 1
1
, .......... ,......... 1
Grupo
c
p
Grupo Grupo
T
p
t
p p
1
n
i f
i..
f
ijt
f
i.t
f
.jt
f
..t
f
ijt
f
.jt


denomina seudo ya que los pesos para las filas y las columnas son las indicadas y no los
respectivos marginales filas y columnas de la tabla t.
Con los principales factores consenso resultantes del AFMIT se realiz un Anlisis de
Clasificacin (AC), utilizando como procedimiento de agrupacin el mtodo de Ward.

Los grupos G1 y G3 son los ms correlacionados (RV=0.601) y sin embargo son los grupos
1 y 2 los que comparten las principales direcciones de inercia (Lg=0.905). Se seleccionaron
los tres primeros ejes del AFMIT, que explican el 66,31 % de la variabilidad de los datos.
Con los cuatro primeros factores del AFMIT (que explican el 87.36% de la variabilidad total)
se realiz un AC que permiti corroborar y completar los resultados del AFMIT.
Los alumnos de primer ao de las escuelas C46 y C2 se caracterizan por contestar que no
saben las preguntas del G3 y no responder a las preguntas que conforman los grupos
contestar G1 y G2. El tercero del C46 y el primer ao de la escuela CT presentan un
comportamiento similar ya que no contestan cuando se les pregunta respecto del Infinito
distinto de todo (G2), pero contestan en forma incorrecta cuando se los indaga respecto a
los otros aspectos. Los ingresantes a la universidad de las tres carreras presentan
respuestas similares a estos ltimos alumnos de secundaria, pero se diferencian de ellos, ya
que respecto a G2 dan respuestas variables, considerando que si una coleccione es infintia
en ella deben estar todos los elementos. El quinto ao del C46 contesta correctamente
principalmente respecto al G2, mientras que tercero y sexto ao del CT sus respuestas
correctas estn referidas fundamentalmente al Infinito Actual (G3) y al Infinito Potencial (G1),
respectivamente. Los alumnos de MA responden correctamente sobre los tres aspectos
indagados. EFA es el grupo ms disperso respecto a su respuesta media.
El AFMIT permiti reconocer y describir patrones en las respuestas de los estudiantes a lo
largo de los tres aspectos indagados, encontrando que la formacin matemtica especfica,
es fundamental para una adecuada construccin del concepto de infinito ya que los
encuestados que brindaron respuestas correctas fueron los estudiantes universitarios de
Matemtica y los secundarios pertenecen a instituciones educativas con un proyecto
educativo ms slido en la materia matemtica.

Bibliografa
Albornoz, M.; Baccal, N. (2012). La Estadstica Textual y el Anlisis Factorial Mltiple Intra
Tabla en indagaciones sobre conceptos matemticos. Ann. X Congreso Latinoamericano de
Sociedades de Estadstica. Crdoba, Argentina.
Bcue, M.; Pags, J. (2000), Analyse Factorielle Mltiple intra-tableux. Application l
analyse simultane de plusieurs questions ouvertes. In JADT 2000, 5me Journes
Internationales d Analyse statistique de Donne Textuelles, Rajman M. et Chappelier
J.C.(Eds.)EPFL, Lausanne, pp. 425-432.
Bcue, M.; Pags, J. (2003), Anlisis factorial mltiple para tablas de contingencia: Estudio
de mortalidad en las comunidades autnomas de Espaa. 27 Congreso Nacional de
Estadstica e Investigacin Operativa, Lleida.
Juan, M. T., Montoro, V. y Scheuer, N.. (2012). Colecciones infinitas. Ideas de estudiantes
de escuelas secundarias. Educacin Matemtica, vol. 24, N. 2. Mxico. 61-90
Montoro, V. (2003). Estudio sobre concepciones de estudiantes universitarios respecto de la
nocin de infinito matemtico. Universidad Nacional del Comahue. Fac. de Ingeniera. Tesis
de Maestra.
Montoro, V. (2005). Al infinito y ms ac: concepciones de estudiantes universitarios.
Infancia y Aprendizaje,28, 4, 409-427.
Montoro, V. (2012.) Ideas de Estudiantes Universitarios Sobre Colecciones Infinitas. Un
estudio de concepciones en pensamiento matemtico avanzado. Editorial Academica
Espaola. ISBN: 978-3-659 02949-3.
Montoro, V. y Scheuer, N. (2004). Cmo piensan el infinito matemtico los estudiantes
universitarios de distintas carreras?. Epsilon, 60, 20 (3), 435-447.


ANLISIS DE LOS ESPACIOS DE REPRESENTACIN DEL ANLISIS
ACTORIAL MLTIPLE, STATIS Y ANLISIS DE PROCRUSTES GENERALIZADO
A PARTIR DE UNA APLICACIN EN EL CAMPO DE LA AGRONOMA

ZULIANI ROXANNA
1
, FUENTEALBA JENNY
1,2
,

LAVALLE ANDREA
1
, BRAMARDI
SERGIO
1,3

1
Departamento de Estadstica, Universidad Nacional del Comahue.
2
Universidad Nacional de Ro Negro
3
Universidad Nacional de La Plata

matiroc@live.com.ar

RESUMEN
En los diseos de investigacin actuales es frecuente encontrar tablas de datos de tres vas.
Dichos datos estn originados por individuos a los que se les han medido un conjunto de
variables (tablas clsicas de dos vas) en diferentes condiciones (situaciones
experimentales). Dentro de los mtodos multivariados empleados en el tratamiento de los
datos de tres vas, existen al menos dos enfoques: el de la escuela francesa con los
mtodos STATIS [6] [5] y el Anlisis Factorial Mltiple (AFM) [2] dentro de los ms usados; y
los pertenecientes a la escuela anglosajona tal como el Anlisis de Procrustes Generalizado
(APG) [3] entre otros. Estos mtodos difieren en la forma en que se obtiene una estructura
comn (configuracin consenso) para las diferentes condiciones. En el STATIS se define la
configuracin consenso como una tabla promedio ponderada, en el AFM este subespacio se
consigue diagonalizando la matriz yuxtapuesta, previa ponderacin por el inverso del primer
valor propio de cada una de las tablas que la conforman. En cambio, el APG es una tcnica
enteramente geomtrica que se basa en la bsqueda de una configuracin consenso
ptima, en el sentido de aproximar lo mximo posible las distintas configuraciones asociadas
a cada tabla. En el presente trabajo, a partir de una muestra de datos pertenecientes al
Banco de Germoplasma de la EEA INTA Pergamino sobre caracterizacin de poblaciones
nativas de maz, se comparan los espacios factoriales derivados de estos mtodos. Para
realizar la comparacin se correlacionaron las configuraciones de individuos resultantes en
cada uno de ellos. Los resultados evidencian un alta concordancia entre las configuraciones
encontradas por los tres mtodos, que se traducen en altas correlaciones. Todos los
resultados son obtenidos en el entorno de programacin y anlisis de datos del software R
[7]

Palabras clave: configuracin consenso datos de tres vas poblaciones nativas -
maz

Introduccin
Los mtodos clsicos del anlisis multivariado trabajan con tablas de Individuos por
Variables, es decir, con datos conocidos comnmente como datos de dos modos. Sin
embargo, cuando las interrelaciones entre Individuos y Variables estn medidas en distintos
lugares, en distintos momentos en el tiempo, o en distintas situaciones experimentales, se
tendr en cada lugar, en cada momento o en cada situacin, una tabla de dos modos y por
lo tanto, la informacin puede presentarse en varias tablas de Individuos por Variables, es
decir, cada observacin es originada por tres modos: Individuos, Variables y Condiciones.
Los datos de tres modos pueden clasificarse en datos de Tres Vas (Three Way Data) y
Datos de Conjuntos Mltiples (Multiway Set of Data) [4].


En los datos de Tres Vas existe un solo conjunto de individuos, un solo conjunto de
variables y un solo conjunto de condiciones. Son observaciones para todos los individuos,
sobre las mismas variables en todas las ocasiones experimentales o condiciones.
En los Datos de Conjuntos Mltiples, uno de los modos est compuesto por varios conjuntos
pudiendo presentarse: Varios conjuntos de individuos, un solo conjunto de variables y un
solo conjunto de condiciones; o bien, varios conjuntos de variables y un mismo nmero de
individuos y condiciones.

Materiales y Mtodos
En este trabajo, los individuos son poblaciones nativas de maz de la raza Cristalino
Colorado (primer va) procedentes de la provincia de Buenos Aires, conservadas en el BAP
2
,
sobre las que se han observado 10 variables morfolgicas (segunda va), en dos ambientes
de la zona norte de la Provincia de Buenos Aires (tercer va).

STATIS:
El mtodo Statis (Structuration de Tableaux A Trois Indices de la Statisque) [6] [5] es un
mtodo exploratorio del Anlisis de Datos, cuyo principal objetivo es la bsqueda de una
estructura comn entre las tablas, que pueden estar formadas por los mismos individuos a
los que se les han hecho mediciones en distintas condiciones o por individuos diferentes a
los que se les miden las mismas variables. La comparacin global de las nubes de
individuos que constituyen cada tabla, se lleva a cabo en la etapa denominada
interestructura. En la etapa conocida como intraestructura se representan los individuos
medios o individuos-compromiso del conjunto de tablas. El mtodo es una generalizacin
del Anlisis de Componentes Principales (ACP) y brinda la posibilidad de realizar anlisis
grficos.

ANLISIS FACTORIAL MLTIPLE:
El AFM desarrollado por Escofier B. y Pags J. [2], en el seno de la Escuela Francesa
permite el anlisis de datos de tres modos equilibrando la influencia de cada tabla. Los
grupos de variables pueden ser diferentes, incluso en la naturaleza y nmero de variables
que los componen. La nica condicin es que las variables que integran cada tabla sean de
la misma naturaleza, cuantitativa o cualitativa. El objetivo del AFM es poner de manifiesto
los principales factores de variabilidad de los individuos, estando estos ltimos descritos, de
manera equilibrada, por los diversos grupos de variables. Cuando las variables son
cuantitativas la metodologa se basa fundamentalmente en el Anlisis de Componentes
Principales (ACP). En una primera etapa se analiza cada tabla por separado, mediante un
ACP. En la segunda etapa se analiza la tabla yuxtapuesta, donde cada tabla ha sido
ponderada por el inverso del primer valor propio del ACP.
ANLISIS DE PROCRUSTES GENERALIZADO:
El APG [3], armoniza las configuraciones individuales, o las representaciones geomtricas
en el plano, a travs de pasos algebraicos iterativos que transforman cada configuracin
individual. Estos pasos incluyen traslacin, rotacin, refrexin y escalado de las
coordenadas de los puntos bajo dos premisas: mantener la distancia relativa entre
elementos de cada configuracin individual y minimizar la suma de cuadrados entre puntos
homlogos, es decir, puntos que corresponden al mismo elemento bajo diferentes
configuraciones. La configuracin consenso es obtenida como el promedio de estas
configuraciones individuales transformadas [1].

2
Banco Activo de Germoplasma de la EEA INTA Pergamino (BAP) cuenta con aproximadamente 2360
poblaciones locales de maz (Zea mays I.), agrupadas en diferentes razas.


Resultados y Conclusiones:
Para poder comparar los mtodos se obtuvo la matriz de distancias entre los individuos
medios en las tres configuraciones consenso (en el plano principal) y a partir de ellas, se
calcul el coeficiente de correlacin lineal de Pearson, como se muestra en la siguiente
tabla:
AFM STATIS APG
AFM 1 0.998 0.973
STATIS 1 0.974
APG 1

Se observa una alta concordancia entre las caracterizaciones obtenidas con los tres
mtodos (estadsticamente altamente significativas) lo que indicara que presentan
configuraciones consenso prcticamente equivalentes. El hecho ms significativo es la alta
uniformidad de los resultados entre AFM y STATIS, que se traduce en una alta correlacin
(prxima a 1) entre ellos. Es importante sealar que estos dos mtodos a diferencia del APG
representaron la configuracin de las variables en el anlisis global y realizaron un anlisis
de las tablas (comparacin global) En cuanto al APG proporcion el aporte de cada individuo
a la suma de cuadrados en un ANOVA.
Para generalizar las conclusiones, en base al comportamiento de esta muestra de datos, se
preve simular datos utilizando R .

Bibliografa
[1] Bramardi, S.J.; Bernet, G.; Asns M.J. and Carbonell E., (2005). Simultaneous Agronomic
and Molecular Characterization of Genotypes via the Generalised Procrustes Analysis: An
Application to Cucumber. Crop Sci. 45: 1603-1609.
[2] Escofier B. and Pags J., (1990). Anlisis Factoriales Simples y Mltiples: Objetivos,
Mtodos e Interpretacin. Universidad del Pas Vasco. Bilbao, pp 285.
[3] Gower, J. C., (1975). Generalized Procrustes Analysis. Psychometrika, 40: 33-51.
[4] Kiers, H.A.L. (1988).Comparison of \Anglo-Saxon" and Three-Mode Methods.Statistique
et Analyse des Donn_ees, 13,3: 14-32.
[5] Lavit, Ch. (1988). Analyse Conjointe de Tableaux Quantitatifs. Masson, Paris.
[6] L_Hermier Des Plantes, H. (1976). Structuration Des Tableaux A Trois Indices De La
Statistique: Theorie et Application d_une M_ethode d_Analyse Conjointe. PhD. Thesis,
Universite Des Sciences et Techniques Du Languedoc.
[7] R Development Core Team. (2008). R: A language and environment for statistical
computing. R Foundation for Statistical Computing. Vienna, Austria. ISBN 3-900051-07-0,
URL http://www.R-project.org.


EFICIENCIA DEL TIPO DE DISEO SOBRE LA HEREDABILIDAD DE
LA RESISTENCIA A SCLEROTINIA DEL CAPTULO DE GIRASOL

SANTIAGO GERMAN DELGADO
1,2
, MARIA GABRIELA CENDOYA
2
, FERNANDO
CASTAO
2
, TERESA SALABERRY
2
, FACUNDO QUIROZ
3

1
Becario de Perfeccionamiento, UNMdP
2
Facultad de Ciencias Agrarias, UNMdP
3
INTA EEA-Balcarce

delgadosantiago@hotmail.com

RESUMEN
El objetivo del trabajo fue evaluar tres diseos experimentales, en su eficiencia para separar
los efectos de genotipo y genotipo-ambiente, del error experimental en la resistencia a la
penetracin y crecimiento de Sclerotinia sclerotiorum. Para evaluar la resistencia de
genotipos a travs de su fenotipo, es necesario evaluarlos en diferentes ambientes. Es
frecuente utilizar diseos en bloques completos aleatorizados as como evaluar muchos
genotipos, pero el control local logrado por grandes bloques queda en duda. Los diseos
evaluados fueron en bloques completos aleatorizados (bca), en bloques incompletos
parcialmente balanceados (bipb) y alfa lattice (alfa). Hubo 37 hbridos de girasol mas 3
controles por bloque, se sembraron en dos ensayos a campo durante las campaas
agrcolas 2010-11 y 2011-12. Se cuantific el perodo de incubacin de la PBC en cada
genotipo y luego se lo relativiz a los testigos (pir). El diseo alfa fue el que mayor GDG
mostr (0,7103) pero no manifiest una gran diferencia, respecto a los diseos bca y bipb.
Las correlaciones entre el orden de las predicciones de los hbridos, mostr valores mayores
a 0,97, sto indica que el ranking de los cultivares no fue muy afectado, sin embargo la
seleccin de los mejores podra cambiar. El modelo alfa permiti explicar mejor el
comportamiento de la variable, dejando en los residuos del modelo un ruido aleatorio no
asociado la posicin en el campo experimental, por lo que se recomienda ultilizar este
diseo al medir la resistencia.

Palabras clave: grado de determinacin gentica, diseo experimental, Heliantus
annus

Introduccin
La podredumbre blanca del captulo (PBC) de girasol, causada por Sclerotinia sclerotiorum,
es determinante del rendimiento de dicha oleaginosa en el sudeste de Buenos Aires. La
resistencia a la PBC es fuertemente afectada por el ambiente (Castao et al., 2001). Por
esta razn, para obtener estimaciones precisas del nivel de resistencia de los genotipos, a
travs de su fenotipo, se hace necesario realizar los ensayos de campo en diferentes
localidades y/o aos.
Es frecuente el uso del diseo en bloques completos y aleatorizados, pero con muchos
genotipos en evaluacin, se duda del control local del experimento. El objetivo del trabajo
fue evaluar tres diseos experimentales, en bloques completos aleatorizados (bca), en
bloques incompletos parcialmente balanceados (bipb) y alfa lattice (alfa), por su eficiencia
para separar los efectos de genotipo y genotipo-ambiente del error experimental.

Desarrollo
En Balcarce, 37 cultivares ms otros 2 hbridos de girasol, utilizados como testigos, se
sembraron en dos ensayos a campo durante las campaas 2010-11 y 2011-12. El diseo
del experimento fue alfa lattice con tres repeticiones completas, en sub-bloques
parcialmente balanceados. A floracin, se inocularon 12 de las plantas de la parcela,


elegidas al azar, con una solucin acuosa conteniendo alrededor de 25 mil ascosporas de S.
sclerotiorum. En cada captulo enfermo se midi el nmero de das desde la inoculacin
hasta la aparicin del primer sntoma a campo (pi). Luego el pi se relativiz a los testigos y
se registr el promedio para cada parcela (pir).
Pir usualmente no tiene distribucin normal, por esta razn se utiliz el mtodo de Box y Cox
(1964) para encontrar la transformacin adecuada (pirt).
Se ajustaron, por mxima verosimilitud restringida, tres modelos a efectos aleatorios
respondiendo a los tres diseos de inters:

Modelo bca:
pirt
ijk
=+
j
+
k
(
j
)+
i
+
ij
+
ijk
(1)
Modelo bipb:
pirt
ijsk
=+
j
+
k
(
j
)+
s
(
k
(
j
))+
i
+
ij
+
ijk
(2)
Modelo alfa:
pirt
ijskfc
=+
j
+
k
(
j
)+
s
(
k
(
j
))+
f
(
j
)+
c
(
j
)+
i
+
ij
+
ijk
(3)
Donde:
es la media general de pirt;
j
efecto aleatoriodel j-simo ao;
k
(
j
)
efecto
aleatorio del k-simo bloque anidado al j-simo ao;
s
(
k
(
j
))
efecto aleatorio del s-simo
sub-bloque del k-simo bloque anidado en el j-simo ao;
f
(
j
)
efecto aleatorio de la f-
sima fila dentro del j-simo ao;
c
(
j
)
efecto aleatorio de la c-sima columna dentro del
j-simo ao;
i
efecto aleatorio del i-simo genotipo;
ij
efecto de la interaccin entre el i-
simo genotipo y el j-simo ao;
ijk
error aleatorio de la ijk-observacin.
Se estudi el patrn espacial de los residuos estandarizados de cada modelo a travs de
grficos para detectar si el control local del diseo era adecuado.
Con las varianzas estimadas en los tres modelos se estim el grado de determinacin
gentica (GDG=heredabilidad en sentido amplio) por el mtodo descripto por Holland et al.
(2003) para datos desbalanceados:
GDG=

g
2
g
2
+

ga
2
a
+

2
ac
Donde
g
2
es la varianza debida a los genotipos;

ga
2
varianza debida
a la interaccin genotipo-ao;
2
varianza del error; a es el promedio armnico entre
genotipos del nmero de aos evaluados y ac es la media armnica entre genotipos del
nmero de bloques evaluados.
Se estim la correlacin de Spearman entre los valores predichos para los cultivares por los
tres modelos ajustados, para estudiar la coincidencia en su ordenamiento. Los anlisis
fueron hechos con R 2-15.1 (R Core Team, 2011). El ajuste de los modelos mixtos se realiz
a travz de la funcin lmer del paquete lm4 (Bates & Maechler, 2011). Para los grficos se
utiliz el paquete Lattice (Sarkar, 2008).

A partir del anlisis de los residuales para el modelo 3 se detect una fuerte asimetra y no
respondan al supuesto de distribucin normal. Por el mtodo de Box y Cox se detect que
la mejor transformacin de pir era con un =-0,5 (pirt).
La varianza en pirt de la interaccin genotipo ambiente result significativa (o=0,01) para los
tres modelos ajustados. Esto indica que el comportamiento de los genotipos depende del
ambiente en que se desarrolla el experimento.
Al graficar los residuales se observa un claro patrn de distribucin espacial en el modelo
1. En ambos aos, los residuales positivos se separaron espacialmente de los negativos.
Con el agregado de los sub-bloques, en el modelo 2, los residuales ya no muestran un
patrn de distribucin espacial tan marcado, aunque persiste una falta de control local en las
filas particularmente en el ciclo 2010-11. En el modelo 3, no se detecta un patrn de
distribucin en los residuos (Fig.1). De este anlisis surge que, al evaluar pirt, es necesario
realizar un diseo que incorpore mayor control local para poder distinguir la varianza


fenotpica de la gentica. Si no se consideraran los efectos de filas, columnas y sub-bloques,
se estaran confundiendo los efectos genticos con los de las parcelas, provocando una
pobre estimacin de la variabilidad gentica. Este resultado era esperable. No se pretenda
homogeneidad de condiciones en bloques grandes e involucrando muchos genotipos. La
variable pirt debera estimarse a partir de datos generados desde un diseo alfa lattice, ya
que ste ofrece un control local ms estricto. Los valores de GDG estimados por todos los
modelos fueron elevados. Este resultado interesa al mejoramiento ya que se podran lograr
altos progresos genticos debido a la seleccin de genotipos de acuerdo a pirt. El diseo
alfa permiti calcular el GDG ms alto (0,7103), aunque dicho valor fue similar al generado
por los diseos bca y bipb (GDG= 0,6926 y 0,6924 respectivamente).
Los coeficientes de correlacin del ranking de los hbridos, entre los modelos considerados,
fueron significativos (p < 0.0001, en todos los casos): r= 0,988 (modelos 1 y 2), r= 0,977
(1 y 3) y r= 0,987 (2 y 3) Esto sugiere que, si bien el orden de las predicciones de los
hbridos fue semejante en los tres modelos, la seleccin de los mejores hbridos podra
cambiar. Dado que el modelo alfa permiti explicar mejor el comportamiento de pirt,
dejando en los residuos del modelo un ruido aleatorio no asociado la posicin en el campo
experimental, se recomienda utilizar este tipo de diseo para cuantificar la PBC en girasol.

Modelo Ensayo: 2010/2011 Ensayo: 2011/2012
bca (1)

bipb (2)

alfa (3)

Figura 1. Mapa de nivel de la distribucin espacial de los residuales estandarizados de cada modelo en cada
ensayo.

Bibliografa
Bates, D. & Maechler, M. 2011. lme4: Linear mixed-effects models using S4 classes. R
package versin 0.999375-36. http://CRAN.R-project.org/package=lme4
Box, G.E.P. & Cox, D.R. 1964. An analysis of transformations. Journal of the Royal Statistical
Society. Series B. 26:211252.
columna
f
i
l
a
1
2
3
4
5 10 15 20 25
-2.1
-1.4
-0.7
0
0.7
1.4
2.1
columna
f
i
l
a
1
2
3
4
5 10 15 20 25
-2.1
-1.4
-0.7
0
0.7
1.4
2.1
columna
f
i
l
a
1
2
3
4
5 10 15 20 25
-2.7
-1.8
-0.9
0
0.9
1.8
2.7
columna
f
i
l
a
1
2
3
4
5 10 15 20 25
-3.33
-2.22
-1.11
0
1.11
2.22
3.33
columna
f
i
l
a
1
2
3
4
5 10 15 20 25
-2.1
-1.4
-0.7
0
0.7
1.4
2.1
columna
f
i
l
a
1
2
3
4
5 10 15 20 25
-3.33
-2.22
-1.11
0
1.11
2.22
3.33


Castao, F.; Vear, F. & Tourvieille de Labrouhe, D. 2001. Horizontal resistances in sunflower:
a review of a workshop at the 15th International Sunflower Conference. Olagineux, Corps
Gras, Lipides 8:211-215.
Holland, J.B.; Nyquist, W.E. & Cervantes-Martnez, C.T. 2003. Estimating and interpreting
heritability for plant breeding: an update. Plant Breeding Reviews. 22: 9-112.
R Core Team. 2011. R: a language and environment for statistical computing. R Foundation
for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL http://www.R-
project.org/
Sarkar, D. 2008. Lattice: Multivariate Data Visualization with R. Springer, New York. ISBN
978-0-387-75968-5.


CREACIN DE UNA LIBRERA EN EL AMBIENTE COMPUTACIONAL
R PARA EL ANLISIS DE EXPERIMENTOS CON DIFERENTES
ARREGLOS FACTORIALES

DINON, MARA ANABELLA
1
; SAN MARTINO, SILVINA
1
; MONTERUBBIANESI, MARA
GLORIA
1

1
Facultad de Ciencias Agrarias - Universidad Nacional de Mar del Plata (UNMdP)

anabella005@yahoo.com.ar

RESUMEN
El ambiente computacional R es un software libre que permite diversos anlisis estadsticos
de datos y grficos. Si bien incluye muchas funciones y paquetes para el procesamiento de
informacin, no siempre resulta sencillo para usuarios no estadsticos, sobre todo cuando se
realizan experimentos que involucran ms de un factor de tratamiento. Debido a que dicho
programa brinda la posibilidad de generar y almacenar subrutinas, se crearon una serie de
funciones con el objetivo de facilitar el trabajo de investigadores, estudiantes y/o
profesionales que frecuentemente se enfrentan con dificultades a la hora de analizar los
datos provenientes de los ensayos que han realizado. Las mismas se integraron en una
librera llamada twofactors. Las funciones permiten un anlisis exhaustivo de experimentos
conducidos bajo diseos completamente aleatorizados o en bloques completos
aleatorizados con arreglo factorial o en parcelas divididas y diseos en bloques divididos.
Adems, la librera incluye una funcin que posibilita la presentacin grfica de los
resultados obtenidos, favoreciendo la interpretacin de los mismos.
Palabras clave: Experimentos factoriales ambiente R librera R
Introduccin
Muchas veces, tanto estudiantes como profesionales precisan realizar ensayos como parte
de alguna investigacin. Como resultado de los mismos, se obtienen datos que es necesario
analizar estadsticamente para poder arribar a conclusiones adecuadas. Si bien existen
programas computacionales como R, que permiten llevar a cabo esos anlisis, no siempre
resultan fciles de utilizar por usuarios no estadsticos, sobre todo cuando se realizan
experimentos que involucran ms de un factor.
El anlisis de experimentos que involucran dos factores de tratamiento que no interactan
tiene, en general, una amplia cobertura tanto en los textos estadsticos como en los
paquetes estadsticos. En particular, en el caso de R, la prueba de contrastes de inters
cuando los factores no interactan es relativamente simple (Faraway, 2002; Crawley, 2007;
Bretz et al., 2011). Pero para aquellas situaciones en las cuales se presenta interaccin, las
comparaciones de inters resultan ms complejas para un usuario no estadstico. En cuanto
a su implementacin computacional, las mismas tambin son ms complejas y el usuario
debe tener, en general, un dominio mayor de aspectos metodolgicos y de programacin.
Tal es el caso, por ejemplo, del paquete phia (De Rosario-Martnez, 2013), recientemente
desarrollado, el cual permite la apertura de la interaccin, pero tanto el uso de sus funciones
como la interpretacin de los anlisis realizados resultan dificultosos para la poblacin
objetivo del presente trabajo. Por otro lado, algunos modelos que involucran varios trminos
de error requieren, en general, de programacin adicional para obtener el anlisis y
presentacin deseados.
Este trabajo fue realizado en el marco de una beca de Estudiante Avanzado de la UNMdP,
mientras el primer autor era estudiante de grado de la carrera de Ingeniera Agronmica. El
mismo tuvo como objetivo principal generar instrumentos que faciliten el uso de diversas
metodologas estadsticas para usuarios que no son especialistas en esta disciplina. Por otro


lado, tambin se busca facilitar el aprendizaje y la aplicacin de la Estadstica a problemas
concretos, tanto para alumnos de grado como de posgrado. Es esencial que, tanto los
alumnos como los investigadores, puedan ir convirtindose en usuarios capacitados e
independientes de la Estadstica con un manejo adecuado de la misma y de algn software
que les permita analizar los datos de sus propias investigaciones y presentar algunos de los
resultados en una atractiva forma grfica, enriqueciendo los informes de sus trabajos.
Desarrollo
Se investigaron los aspectos metodolgicos asociados al anlisis de experimentos
diseados que involucran dos factores de tratamiento, de uso frecuente en las Ciencias
Agrarias, Biolgicas, Veterinarias y de Alimentos, y los aspectos de implementacin
computacional. Se consideraron casos balanceados y que cumplen los supuestos de
homogeneidad de varianzas, normalidad e independencia, provenientes de experimentos
que involucran dos factores, conducidos bajo los siguientes diseos: completamente
aleatorizado con arreglo factorial, en bloques completos aleatorizados con arreglo factorial,
completamente aleatorizado con arreglo en parcelas divididas, en bloques completos
aleatorizados con arreglo en parcelas divididas y en bloques divididos o en franjas.
Para todos ellos, se consideraron los casos con y sin efecto significativo de la interaccin de
los factores en cuestin. Se implementaron anlisis de comparaciones mltiples de medias,
para los cuales se consideraron las pruebas de Tukey (Honestly Significance Difference,
HSD), en los casos de diseos completamente aleatorizados con arreglo factorial y diseos
en bloques completos aleatorizados con arreglo factorial y Mnima Diferencia Significativa
(Least Significant Difference, LSD), en todos los diseos. En particular, para la comparacin
de las medias de los niveles del factor ubicado en las parcelas principales dentro de cada
nivel del factor ubicado en las subparcelas se propuso tanto la correccin de Satterthwaite
(descripta en Kuehl, 2001), como el mtodo sugerido por Cochran y Cox, 1965 y otros
(Gomez y Gmez, 1984; Steel y Torrie, 1988). Ambas correcciones tambin fueron
implementadas en las correspondientes comparaciones de medias para el diseo en
bloques divididos con interaccin significativa.
Tambin se realiz una revisin bibliogrfica sobre los aspectos computacionales
necesarios para poder llevar a cabo el desarrollo de las funciones y se evaluaron funciones
y paquetes existentes, como el agricolae (De Mendiburu, 2010) y otros de la base de R (R
Development Core Team, 2012a). La versatilidad de R permite el aporte continuo de los
contribuyentes, generando diferentes paquetes con funciones que brindan distintas opciones
de anlisis, as como de presentacin de los resultados.
Mediante los mtodos propios del programa, se crearon las nuevas funciones, dando una
alternativa ms al anlisis de la interaccin, aqu con un enfoque frecuentemente utilizado
en reas agronmicas, incorporando tambin una presentacin de resultados sinttica y de
fcil interpretacin.
A continuacin, se integraron las mismas mediante la creacin de una librera en R para
Windows, segn lo descripto en la bibliografa (R Development Core Team, 2012b; Mosher,
2012). sta se document a fin de facilitar su uso, segn los protocolos detallados por el
CRAN (R Development Core Team, 2012b).
Resultados y conclusiones
Se logr la librera llamada twofactors que comprende funciones para realizar anlisis de
datos conducidos bajo los diseos y arreglos factoriales anteriormente descriptos. Entre
ellas, se pueden destacar tres funciones: fact, utilizada para hacer el anlisis de datos en
arreglo factorial; split_plot, para casos en parcelas divididas y strip_plot para bloques
divididos. Las mismas realizan el anlisis de la varianza y las comparaciones de medias.
Adems, se gener una funcin que permite representar grficamente los resultados,
favoreciendo la interpretacin de los mismos. Esta ltima se denomin tf_plot y puede ser
utilizada a continuacin del anlisis realizado por cualquiera de las tres funciones
anteriormente nombradas.


Como habamos mencionado, el anlisis de experimentos multifactoriales genera siempre
dificultad en alumnos y profesionales que no tienen una amplia formacin en estadstica. De
esta manera, contar con una herramienta que facilite estos anlisis y la presentacin de los
resultados correspondientes, consideramos que contribuye al uso ms masivo de R,
favoreciendo el procesamiento de los datos obtenidos en los diferentes ensayos y
fomentando un anlisis adecuado de los mismos.
Por todo ello esperamos que la creacin y documentacin de las funciones y de la librera,
realice un importante aporte a dichos usuarios para que analicen e interpreten resultados
propios, contribuyendo, adems, a presentar los mismos en una forma grfica adecuada y
novedosa.
Se considerar la ampliacin de la librera a fin de cubrir aspectos que actualmente no estn
contemplados en ella.
Bibliografa
BRETZ, F.; HOTHORN, T. y WESTFALL, P. (2011). Multiple comparisons using R,
Chapman & Hall/CRC. EUA.
COCHRAN, W.G. y COX, G.M. (1965). Diseos experimentales. Editorial Trillas. Mxico.
CRAWLEY, M.J. (2007). The R Book. John Wiley & Sons. Inglaterra.
DE MENDIBURU, F. (2010). agricolae: Statistical Procedures for Agricultural Research. R
package version 1.0-9. Versin obtenida el 24/04/12. http://CRAN.R-
project.org/package=agricolae
DE ROSARIO-MARTNEZ, H. (2013). phia: Post-Hoc Interaction Analysis. R package
version 0.1-2. Versin obtenida el 03/07/13. http://CRAN.R-project.org/package=phia
FARAWAY, J.J. (2002). Practical Regression and Anova using R. Versin obtenida el
24/10/12. http://www.cran.r-project.org
GMEZ, K.A.; GMEZ, A.A. (1984). Statistical procedures for agricultural research. Second
edition. John Wiley & Sons. EUA.
KUEHL, R. O. (2001). Diseo de experimentos. Segunda edicin. International Thomson
Editores. Mxico.
MOSHER, S. (2012). Ten steps to Building an R Package under Windows. Versin
obtenida el 25/01/13. http://www.stevemosher.wordpress.com
R DEVELOPMENT CORE TEAM. (2012a). Introduccin a R. R Foundation for Statistical
Computing. Austria. Versin obtenida el 20/04/12. http://www.r-project.org
R DEVELOPMENT CORE TEAM (2012b). Writing R Extensions. R Foundation for
Statistical Computing. Austria. Versin obtenida el 5/12/12. http://www.r-project.org
STEEL, R.G.D. y TORRIE, J.H. (1988). Bioestadstica: Principios y procedimientos. Segunda
Edicin. Mc. Graw Hill. Mxico.



CULTIVO DE PECES EN JAULAS Y ANLISIS DE MODELOS
MIXTOS COMO HERRAMIENTAS PARA MEJORAR LA PRECISIN
DE LAS ESTIMACIONES Y DISMINUIR EL NMERO DE ANIMALES
UTILIZADOS EN ENSAYOS DE PISCICULTURA

SNCHEZ SEBASTIN
1,2
, ORTIZ, JULIO C.
1,2
, SANTINN, JUAN J.
1
, SIMN,
JORGELINA
2
, HERNNDEZ, DAVID R.
1

1
Instituto de Ictiologa del Nordeste, Fac. Cs. Veterinarias, UNNE. Sgto. Cabral 2139, Ctes.
2
Ctedra de Bioestadstica, Fac. Cs. Veterinarias, UNNE. Sgto. Cabral 2139, Ctes.

sebasanchez58@hotmail.com

RESUMEN
Se analiza el efecto de la densidad de siembra sobre parmetros de crecimiento de juveniles
de R. quelen tras veintin das de cultivo en jaulas alojadas en estanques. 630 ejemplares
se asignaron aleatoriamente a 9 jaulas a tres densidades de siembra, las que se
distribuyeron en tres estanques de mampostera de 4 m
3
(bloques), segn un diseo en
bloques completamente aleatorizado. La experiencia dur 21 das, incluyendo biometras a
los 7, 14 y 21 das, cuantificndose en cada tiempo el peso medio (P), porcentaje de
sobrevivencia (%S), coeficiente de crecimiento especfico (CCE) y biomasa total (B). Los
resultados se analizaron mediante el empleo de modelos mixtos para medidas repetidas en
el tiempo, considerando como efectos fijos la densidad y el tiempo de cultivo, y su
interaccin. Como efectos aleatorios, se incluy al estanque y la jaula, esta ltima
considerada como unidad experimental. Considerando los criterios AIC y BIC se seleccion
un modelo sin estructura para las correlaciones entre errores provenientes de la misma
unidad experimental y varianzas residuales diferentes en el tiempo. El efecto de la densidad
se evalu mediante el uso de contrastes ortogonales, y las comparaciones de medias a
posteriori se realizaron aplicando el test LSD de Fisher controlando el error de tipo I
(=0,016). En ningn caso se encontr interaccin significativa entre tiempo y densidad.
Tampoco se encontraron diferencias significativas entre densidades para %S, al tiempo que
en las dems variables se estim un efecto lineal significativo (P<0,05) que permiti
determinar que B se relaciona linealmente de manera positiva con la densidad de siembra al
tiempo que P y CCE lo hacen inversamente. El modelo experimental y el diseo estadstico
utilizados permitieron caracterizar el efecto de la densidad de siembra sobre variables
productivas optimizando el uso de los recursos disponibles.

Palabras clave: modelos mixtos, Rhamdia quelen, Piscicultura.

Introduccin
El estudio de especies autctonas con potencial para la produccin acucola es impulsado
por un amplio y sostenido aumento de esta actividad a nivel mundial y regional (FAO, 2012).
En Sudamrica, una de las especies en estudio es el bagre Rhamdia quelen, un pez con
excelentes propiedades para la piscicultura, debido principalmente a la ausencia de espinas
intramusculares y las excelentes propiedades organolpticas de su carne (Baldisserotto y
Radnz Neto, 2004).
Dentro de las diferentes etapas del cultivo, la recra o pre-engorde aparece como una de las
ms complejas, ya que se caracteriza por presentar altas tasas de mortalidad (Barcellos y
col., 2004), motivo por el cual resulta necesario realizar estudios que traten de solucionar
esta problemtica a partir de la propuesta y evaluacin de nuevas tecnologas de cultivo.
La mayora de los estudios realizados en R. quelen en esta etapa de cultivo inicial se llev a
cabo en estanques a cielo abierto bajo sistema semi-intensivo (densidades de 25 a 300 ind.
m
-2
). Tales experiencias, que presentaron resultados muy variables en lo que se refiere a la
sobrevida obtenida as como al peso de los peces cultivados, cuentan con el inconveniente


de requerir grandes cantidades de peces, ya que los estanques utilizados miden entre 100
m
2
y 300 m
2
, al tiempo que demandan una gran cantidad de los mismos, ya que cada
estanque es considerado una unidad experimental (Rossi & Luchini, 2005). A esto debe
aadirse la dificultad a la hora de realizar biometras durante el desarrollo de los ensayos,
debido a que los peces deben ser capturados con redes, lo que genera estrs adems de
afectar la calidad del agua por remocin de las partculas del fondo.
Tambin existen experiencias realizadas en jaulas (Barcellos y col., 2004), las que se
desarrollaron generalmente siguiendo un diseo completamente aleatorizado, donde la jaula
es considerada la unidad experimental. Si bien en estos estudios el nmero de peces
utilizados disminuye, los anlisis estadsticos realizados suelen acotarse casi con
exclusividad a los valores obtenidos al final de la experiencia, sin considerar la informacin
obtenida en tiempos intermedios, determinando la prdida de buena parte de los datos
generados, o en el mejor de los casos, se realizaron ANOVAs parciales en cada tiempo, sin
considerar la interaccin entre el tiempo de cultivo y los tratamientos, disminuyendo de buen
modo el tamao muestral y consecuentemente la potencia de las pruebas realizadas.
En este trabajo se propone analizar el efecto de la densidad de siembra sobre parmetros
de crecimiento de juveniles de R. quelen luego de veintin das de cultivo en jaulas, segn
un diseo experimental en bloques completamente aleatorizado mediante el empleo de
modelos mixtos para medidas repetidas en el tiempo. Finalmente, los valores obtenidos en
el da 21 se analizaron con un modelo ms sencillo en el que solo se consider el efecto de
tratamientos y bloques a los efectos de observar si los resultados obtenidos con el anlisis
de modelos mixtos difieren al emplear un modelo estadstico ms simple similar a los
habitualmente utilizados en estudios similares al presente.

Desarrollo
La experiencia se llev a cabo en las instalaciones de piscicultura experimental del Instituto
de Ictiologa del Nordeste (INICNE) de la Facultad de Ciencias Veterinarias-UNNE,
Corrientes, Argentina. Se utilizaron 630 ejemplares de 30 das de vida y 85 mg de peso
medio seleccionados mediante el uso de tamices de 2 y 4 mm, los que permitieron trabajar
con un lote homogneo adecuado al tamao de la malla con que se construyeron las jaulas
(2,5 mm). Los peces se distribuyeron aleatoriamente en grupos de 30, 60 y 120 ejemplares
por triplicado y luego se sembraron en jaulas a 0,2 m
3
(densidades de siembra de 150, 300,
y 600 ind. m
-3
, tratamientos experimentales T1, T2 y T3, respectivamente). Las jaulas se
repartieron en tres estanques de mampostera de 4 m
2
con una rplica de cada tratamiento
por estanque (bloques), donde permanecieron por 21 das. Durante la experiencia los peces
se alimentaron 2 veces al da con racin balanceada fabricada en el INICNE de acuerdo a
los requerimientos de la especie.
Las variables de crecimiento y supervivencia se obtuvieron mediante el recuento y pesaje de
todos los peces a los 7, 14 y 21 das de cultivo.
A continuacin se describe el sistema de variables consideradas en el estudio:
Criterios de clasificacin:
Densidad de cultivo: 150, 300, y 600 ind. m
-3
.
Das de cultivo: 7, 14 y 21 das.
Bloques: 3 estanques de mampostera en que se colocaron las jaulas.
Unidad experimental: Cada una de las 9 jaulas fue tenida en cuenta a la hora de estimar la
correlacin entre medidas en el tiempo.
Variables (corresponden al promedio de cada jaula en un tiempo determinado):
Peso (P) = P
t
N
t
-1
,
donde P
t
es el peso total en gramos de los ejemplares de cada unidad y N es el nmero de
individuos en un tiempo determinado.
Coeficiente de Crecimiento Especfico (CCE) = [100 (3 (P
t

0,33
P
0

0,33
) (t t
0
)
-1
)],
donde P
t
y P
0
corresponden al peso final e inicial en g en un perodo determinado;
Biomasa (B) = P
t

Porcentaje de Supervivencia (%S) = 100 (N
t
N
0
-1
), donde N
t
y N
0
= representan el nmero
final e inicial de peces en un perodo determinado, respectivamente.


Los resultados obtenidos se analizaron mediante el empleo de modelos mixtos para
medidas repetidas en el tiempo, considerando como efectos fijos la densidad y el tiempo de
cultivo y su interaccin. Como efectos aleatorios, se incluy al estanque y la jaula, esta
ltima considerada como unidad experimental. Con este esquema general se consideraron
diferentes estructuras para la variancia residual as como para la heteroscedasticidad,
seleccionndose el mejor modelo de acuerdo a los criterios AIC y BIC. El efecto de la
densidad de siembra se evalu mediante el uso de contrastes ortogonales evaluando los
efectos lineal y cuadrtico, mientras que las comparaciones de medias a posteriori se
realizaron aplicando el test LSD de Fisher controlando el error de tipo I (=0,016). De
manera adicional, los resultados obtenidos el da 21 se analizaron de considerando
solamente el efecto de la densidad y los bloques de manera similar a los realizados en
estudios similares al presente. El n considerado fue de 27 para el anlisis de medidas
repetidas en el tiempo (3 densidades x 3 tiempos x 3 bloques) mientras que cuando se
consider solo el da 21 fue de 9 (3 densidades x 3 bloques). Todas las pruebas estadsticas
se realizaron con el programa InfoStat versin 2012 (Di Rienzo y col., 2012).

Anlisis de medidas repetidas en el tiempo: El modelo seleccionado incluy efectos
aleatorios de bloque, sin estructura para las correlaciones entre errores provenientes de la
misma unidad experimental y varianzas residuales diferentes en el tiempo. En ninguna de
las variables analizadas se encontr interaccin significativa entre tiempo y densidad
(P>0,05). El %S no present diferencias significativas entre densidades ni en el tiempo
(P>0,05), mientras que para las dems variables el efecto de ambos factores fue
significativo (P<0,05). Los contrastes ortogonales permitieron determinar que B se relaciona
linealmente de manera directa con la densidad de siembra, mientras que P y CCE lo hacen
inversamente (P<0,05). La comparacin de medias de tratamientos a posteriori evidenci la
ocurrencia de diferencias significativas solo entre la mayor y la menor densidad de cultivo
(P<0,05). En ningn caso se estim efecto cuadrtico de la densidad (P>0,05).
Anlisis particular de los datos del da 21: El anlisis realizado a partir de los resultados
finales de la experiencia arroj resultados diferentes al anterior, ya que si bien se estim un
efecto significativo de la densidad asociado de manera lineal con P y B (P<0,05) y la
ausencia de significancia para %S (P>0,05), la densidad de cultivo no result significativa
para CCE (P>0,05). As, el empleo de un modelo ms completo, permiti detectar
diferencias entre tratamientos que pudieron detectarse al analizar solamente el resultado
final de la experiencia.
Puede concluirse que el modelo de cultivo experimental (jaulas en estanques) y el diseo
estadstico (modelos mixtos) utilizados permitieron caracterizar el efecto de la densidad de
siembra sobre variables productivas optimizando el uso de los recursos disponibles.

Bibliografa
Baldisserotto, B. y Radnz Neto, J. (2004). Criaao de Jundi. UFSM. Brasil.
Barcellos, L.J.G., Kreutz, L.C., Quevedo, R.M., Fioreze, I., Cericato, L., Soso, A.B.,
Fagundes, M., Conrad, J., Baldissera, R.K. y Bruschi, A. (2004). Nursery rearing of jundi,
Rhamdia quelen (Quoy & Gaimard) in cages: cage type, stocking density and stress
response to confinement. Aquaculture 232: 383-394.
Di Rienzo J.A., Casanoves F., Balzarini M.G., Gonzalez L., Tablada M., Robledo C.W.
InfoStat versin 2012. Grupo InfoStat, FCA, Universidad Nacional de Crdoba, Argentina.
URL http://www.infostat.com.ar.
FAO. (2012). El Estado Mundial de la Pesca y la Acuicultura (SOFIA). FAO. Italia.
Pinheiro, J.C. y Bates, D. (2000). Mixed-Effects Models in S and S-Plus. Springer Verlag.
New York Inc. USA.
Rossi, F. y Luchini, L. (2005). Tecnologas para cultivo del Randia (Rhamdia quelen) para
fomento de su produccin comercial, en clima templado a templado-calido. Direccin de
Acuicultura Argentina.


ANLISIS DE SENSIBILIDAD DE ESTIMADORES Y TESTS EN UN
MODELO DE CALIBRACIN COMPARATIVA HETEROSCEDSTICO

PATRICIA GIMNEZ

Departamento de Matemtica, FCEyN, Universidad Nacional de Mar del Plata

pcgimene@mdp.edu.ar

RESUMEN
El objetivo de este trabajo es realizar un anlisis de sensibilidad de estimadores y tests
basados en mxima verosimilitud, en un modelo de calibracin comparativa funcional
heteroscedstico, con varianzas conocidas. Estos modelos son usados con frecuencia, por
ejemplo, en qumica analtica, para comparar dos o ms mtodos analticos en varios
niveles de concentracin. Se definen medidas de influencia local de los estadsticos de
inters, mostrando que los recprocos de las varianzas, como medidas de precisin de los
mtodos de medicin, juegan un rol importante para la correcta identificacin de
observaciones influyentes. La metodologa se basa en el clculo de la densidad del modelo
perturbado y la matriz de informacin de Fisher esperada con respecto al vector de
perturbacin. Las medidas propuestas son comparadas con las ms difundidas, basadas en
la curvatura normal de Cook. El desempeo del mtodo se ilustra con una aplicacin a un
conjunto de datos reales proveniente de la Qumica, mostrndose la importancia de la
identificacin de observaciones influyentes que pueden alterar las conclusiones de un test
para deteccin de sesgo analtico.

Palabras clave: influencia local, mxima verosimilitud, calibracin comparativa,
heteroscedasticidad.

Introduccin
En este trabajo consideramos un modelo de calibracin comparativa funcional
heteroscedstico, con varianzas conocidas, tpicamente usado en Qumica para comparar
dos o ms mtodos analticos en varios niveles de concentracin.
Sea n el tamao muestral, x
i
e y
i
los valores de concentracin observados usando el
instrumento de referencia y el instrumento alternativo, respectivamente y z
i
el verdadero
valor de concentracin no observado en la muestra i, i=1...n. Consideramos el modelo
x
i
=z
i
+ u
i
y
i
=+x
i
+e
i
,

donde (u
i
,e
i
) tienen una distribucin normal con vector de medias (0,0) y varianzas
conocidas
i
y
i
, con (u
i
,e
i
), independientes, i=1n. Este modelo puede ser visto como un
caso particular de un modelo funcional con errores en las variables (MEV) [1], pues las
verdaderas concentraciones son consideradas constantes fijas desconocidas, llamadas
parmetros incidentales, que deben ser estimados y cuyo nmero aumenta con el tamao
muestral.
Interesa realizar un anlisis de sensibilidad para evaluar la estabilidad de los estimadores de
mxima verosimilitud (EMV) de y y tests de Wald ante perturbaciones en los datos. Este
anlisis es esencial a fin de identificar observaciones influyentes que puedan distorsionar los
resultados, conduciendo en algunos casos a inferencias errneas. Utilizamos un enfoque de
influencia local que nos permite evaluar el efecto de perturbaciones en los datos ms
fcilmente que las tcnicas de eliminacin de casos y est libre del efecto de
enmascaramiento.
Estimacin de mxima verosimilitud en este modelo fue estudiada por [2]. Un anlisis de
influencia local sobre los EMV fue realizado por [3], usando el enfoque de Cook [4]. En este
trabajo, consideramos influencia local sobre EMV y tests utilizando el enfoque reciente de


[5], que extiende el enfoque de Cook en varios aspectos. Primero, nos provee un mtodo
para seleccionar perturbaciones apropiadas que hace uso de la matriz de informacin de
Fisher esperada con respecto al vector de perturbacin. Segundo, nos permite definir
nuevas medidas de influencia que son invariantes por escala para funciones objetivo con
derivada primera no nula en el punto crtico.

Desarrollo
Para obtener los EMV de los parmetros de inters y , primero se obtienen los EMV de
los parmetros incidentales z
i
como funcin de y y luego se considera la funcin de log-
verosimilitud perfilada.
La ausencia de sesgo en el nuevo mtodo de medicin es expresada por la hiptesis =0 y
=1. Para testear esta hiptesis utilizamos el estadstico de Wald W.
Consideramos tres esquemas de perturbacin inherentes al modelo de calibracin
comparativa: perturbacin de casos, del mtodo de referencia y del mtodo alternativo, que
representamos por un vector de perturbacin de dimensin n. La no perturbacin del
modelo es representada por
0
.
La metodologa propuesta para obtener medidas de influencia para y y W, se basa en la
obtencin de una densidad para el modelo perturbado, como funcin del vector . Luego, el
clculo de la matriz de informacin de Fisher esperada con respecto a la densidad del
modelo perturbado, G(), nos permite analizar cando una perturbacin es apropiada. Una
perturbacin apropiada se define como aquella que satisface G=G(
0
)=cI
n
, c>0. Esta
condicin evita componentes redundantes de , determina la ortogonalidad entre las
diferentes componentes y asegura que la cantidad de perturbacin introducida por las
componentes de es uniforme.
Llamando f a nuestra funcin objetivo (f= , W), una medida de influencia para f, en la
direccin h, es definida por
FI
h
=h
T
G
-1/2
f
T
f
G
-1/2
h,
donde
f
=f(
0
)/
T
.
La direccin unitaria que maximiza el valor absoluto de FI
h
, h
max
FI, muestra cmo perturbar
los datos para obtener el mximo cambio local en f. El grfico ndice representado por h
max
FI
es usado como diagnstico. Tambin se calcularon para comparacin, las medidas ms
difundidas basadas en el enfoque de Cook. El desempeo del mtodo se analiz mediante
una aplicacin a un conjunto de datos reales sobre determinacin de un componente
qumico en aguas de ros, mediante dos mtodos. Cada determinacin es la media de tres
rplicas, lo que permite obtener las varianzas de los errores.

Este trabajo extiende el enfoque reciente de influencia local de [5] formulado para modelos
de regresin tradicionales al contexto de un MEV, en presencia de parmetros incidentales.
Se propusieron tres esquemas apropiados de perturbacin (casos, mtodo de referencia y
mtodo alternativo) de la densidad del modelo y se determinaron los estadsticos de inters
perturbados (EMV y test de Wald). Los esquemas de perturbacin del mtodo de referencia
y del mtodo alternativo requieren que se tenga en cuenta la presencia de
heteroscedasticidad. Se obtuvieron las medidas de influencia FI a partir del clculo de las
derivadas primeras de los estadsticos perturbados y de la matriz de informacin de Fisher
con respecto al modelo perturbado. Se compararon estas medidas con las basadas en el
enfoque de Cook. El desempeo del mtodo en un conjunto de datos reales muestra que la
nueva metodologa propuesta, detecta outliers con altos valores de varianzas, los cuales no
son detectados utilizando el enfoque ms difundido de Cook, lo que altera por ejemplo las
conclusiones de un test. Los recprocos de las varianzas, como medidas de precisin de los
mtodos de medicin, juegan un rol importante para la correcta identificacin de
observaciones influyentes. Esto muestra la importancia de tener en cuenta la seleccin de
perturbaciones apropiadas cuando se realiza un anlisis de influencia local en un modelo
heteroscedstico. Las tcnicas propuestas proveen al investigador de una herramienta


valiosa que le permite la correcta identificacin de observaciones influyentes y muestra su
efecto en las conclusiones de un test para deteccin de sesgo analtico.

Bibliografa
[1] Fuller, W. (1987). Measurement Error Models. Wiley, New York.
[2] Galea-Rojas, M., Castillo, M.V., Bolfarine, H. y de Castro, M. (2003). Detection of
analytical bias. The Analyst, 128: 1073-1081.
[3] de Castro, M., Galea-Rojas, M., Bolfarine, H. y Castillo, M.V. (2006). Local influence in
regresin models for the detection of analytical bias. Chemometrics and Intelligent
Laboratory Systems, 83: 139-147.
[4] Cook, R.D. (1986). Assessment of local influence (with discussion). Journal of the Royal
Statistical Society. Series B 48: 133-169.
[5] Zhu, H.T., Ibrahim, J.G., Lee, S. y Zhang, H. (2007). Perturbation selection and influence
measures in local influence analysis. The Annals of Statistics, 35: 2565-2588.



IMPUTAO DE OBSERVAES EM EXPERIMENTOS
GENTIPO
AMBIENTE UTILIZANDO A DECOMPOSIO POR

VALORES SINGULARES

MARISOL GARCA-PEA
(1)
CARLOS TADEU DOS SANTOS DIAS
(1)

(1)
Departamento de Cincias Exatas, Universidade de So Paulo/ESALQ, Brasil.

luzmara@gmail.com

RESUMO
Um problema comum em experimentos multiambientes so as combinaes ausentes
gentipo-ambiente. O objetivo desse trabalho aplicar o algoritmo de imputao
determinstica recentemente proposto por Arciniegas et al. (2010) O mtodo utiliza a
decomposio por valores singulares (DVS) de uma matriz e foram testadas trs alternativas
com diferentes escolhas das componentes da DVS sobre um conjunto completo de dados
reais, fazendo retiradas aleatrias. Para avaliar a qualidade das imputaes foram utilizadas
as correlaes e o quadrado mdio do desvio entre as estimativas e os dados experimentais
verdadeiros. A metodologia aplicada no precisa de pressuposies distribucionais,
estruturais e no depende do mecanismo de ausncia nos dados.

Palavras chave: DVS, imputao, interao gentipoambiente.

Introduo
No melhoramento gentico de plantas, os ensaios multiambientais so importantes para
testar a adaptao geral e especfica das cultivares. Uma cultivar desenvolvendo-se em
diferentes ambientes mostrar uma flutuao significativa do desempenho na produo
relativa a outras cultivares. Essas mudanas so influenciadas por diferentes condies
ambientais e so referidas como interao gentipo por ambiente ou GE.

Muitas vezes os experimentos GE so desbalanceados e vrios gentipos no so
testados em alguns ambientes. Uma maneira muito comum de analisar dados provenientes
desse tipo de estudos imputar as observaes ausentes e posteriormente, aplicar
procedimentos clssicos, como por exemplo, o modelo de efeitos aditivos com interao
multiplicativa (AMMI) ou a regresso fatorial (Arciniegas-Alarcn et al. 2011) sobre a matriz
de dados completada (observados + imputados). Uma aproximao alternativa trabalhar
com dados incompletos sob a estrutura do modelo misto com estimativas baseadas em
mxima verossimilhana (Kang et al., 2004).

Recentemente, um mtodo de imputao determinstica sem pressuposies estruturais
nem distribucionais para os experimentos multiambientais foi proposto por Arciniegas-
Alarcn et al. (2010). O mtodo utiliza uma mistura de regresso com a aproximao de
posto inferior de uma matriz e o objetivo desse trabalho aplicar o algoritmo sobre um
conjunto de dados real com retiradas aleatrias de dados.

Material e mtodos
1 Imputao de dados usando a DVS
Suponha uma matriz de dimenso (np) com elementos (i=1,...,n; j=1,...,p), em que
alguns deles so ausentes.
Passo 1: Os valores ausentes so imputados inicialmente pela mdia da respectiva coluna
obtendo uma matriz completada e posteriormente so padronizadas as colunas,
subtraindo de cada elemento e dividindo o resultado por (em que e representam a
mdia e desvio padro da j-sima coluna).


Passo 2: Sobre a matriz padronizada recalculada a imputao de cada valor ausente
usando-se , em que os vetores , e as matrizes e , so
obtidos da partio , com , ,
, e . Para cada observao faltante
os componentes da partio considerada sero diferentes.
Passo 3: O processo de imputao depende da escolha do valor para e os critrios sero
os seguintes: GabrielMax com , GabrielCrit1 com tal que,
e GabrielEigen com tal que,

Passo 4: Finalmente, a matriz deve ser retornada sua escala original assim,
. Ento, o processo iterado (voltando ao Passo 1) at alcanar
estabilidade nas imputaes. Todo o processo deve ser feito sobre a matriz , tal que np,
caso contrario, a matriz deve ser transposta.

2 Exemplo de aplicao
Para avaliar o mtodo de imputao proposto com as diferentes escolhas para , foi
escolhido um conjunto de dados reais provenientes de um experimento com interao
gentipo por ambiente. Os dados correspondem a experimentos conduzidos em sete
ambientes, nas regies sul e sudeste do Brasil, para 20 prognies de Eucalyptus grandis
provenientes de Austrlia. O delineamento utilizado foi aleatorizado em blocos, com 6
plantas por parcela e 10 repeties, no espaamento 3.0m por 2.0m.
A matriz de dados tem uma dimenso de (20 7) e foi considerada somente uma retirada
aleatria do 30%, isto , 42 dados. Os resultados obtidos aplicando GabrielMax, GabrielCrit1
e GabrielEigen so apresentados na tabela 1. O menor quadrado mdio do desvio (MSD)
entre as imputaes e os valores originais foi obtido atravs do GabrielEigen, com um valor
de 0.6826, seguido em ordem pelo mtodo GabrielMax e GabrielCrit1 com 1.3123 e 1.4736
respectivamente. Tambm foi obtido o coeficiente de correlao, encontrando 0.96 para as
estimativas com GabrielEigen, 0.91 para GabrielCrit1 e 0.92 para GabrielMax. Os resultados
obtidos nesse exemplo sugerem que GabrielEigen pode ser o mtodo mais recomendado,
enquanto o algoritmo GabrielCrit1apresentou o maior MSD.
Dado que os valores ausentes so preditos tambm para completar tabelas de informao
com o objetivo final de estimar parmetros de um modelo, foram ajustados os parmetros
genotpicos e ambientais atravs de uma anlise de varincia ANOVA depois de fazer a
imputao de dados. Os parmetros genotpicos e ambientais no se apresentam por
questo de espao.
O quadrado mdio do desvio (MSD) entre os parmetros genotpicos dos dados originais e
os dados completados foi: 0.0722 imputando com GabrielMax, 0.0957 utilizando GabrielCrit1
e 0.0256 com as imputaes atravs de GabrielEigen. Novamente GabrielEigen apresenta
os melhores resultados.
Entretanto, os quadrados mdios dos desvios entre os parmetros ambientais dos dados
originais e os dados completados foram: 0.0343, 0.0390 e 0.0150 imputando as
observaes ausentes atravs de GabrielMax, GabrielCrit1 e GabrielEigen respectivamente.



Tabela 1. Valores ausentes imputados pelos diferentes mtodos (Exemplo)
Mtodo de imputao Mtodo de imputao
Posicin
ausente
Valor
original
Gabriel
Max
Gabriel
Crit1
Gabriel
Eigen
Posicin
ausente
Valor
original
Gabriel
Max
Gabriel
Crit1
Gabriel
Eigen
(3,1) 16.52 17.39 17.03 16.63 (15,4) 17.91 19.18 18.18 18.11
(9,1) 16.87 15.12 15.67 16.62 (17,4) 18.91 18.20 16.60 19.24
(13,1) 17.62 16.12 16.30 16.14 (19,4) 15.68 16.85 16.67 15.47
(15,1) 15.94 16.47 17.31 16.70 (20,4) 16.46 16.10 14.50 16.13
(18,1) 16.90 15.33 15.60 16.70 (6,5) 11.91 13.32 13.04 12.73
(2,2) 24.00 24.32 23.72 23.65 (8,5) 13.66 14.10 14.05 13.69
(5,2) 21.56 21.96 21.43 21.62 (12,5) 12.62 13.04 12.97 13.09
(11,2) 22.98 22.43 22.46 22.83 (16,5) 12.80 13.55 12.82 13.11
(19,2) 20.12 23.01 22.68 21.19 (2,6) 17.77 19.31 19.49 19.49
(3,3) 15.94 16.84 17.16 17.00 (5,6) 18.06 17.22 17.22 17.39
(6,3) 16.61 17.58 17.47 16.85 (15,6) 19.71 17.88 18.45 18.63
(7,3) 17.02 15.60 15.21 15.29 (16,6) 19.44 18.88 18.88 18.86
(17,3) 16.17 17.52 16.94 17.86 (17,6) 20.24 18.74 18.90 19.36
(19,3) 14.66 15.59 16.36 15.41 (19,6) 16.10 16.45 16.92 16.80
(1,4) 20.61 20.63 20.74 20.09 (4,7) 13.03 13.31 12.56 13.08
(3,4) 18.91 17.86 17.68 17.97 (6,7) 13.17 14.28 14.37 13.39
(6,4) 19.08 18.44 19.26 17.74 (7,7) 11.14 12.55 13.11 12.34
(9,4) 18.96 16.73 17.39 17.92 (8,7) 14.37 14.71 13.67 14.25
(10,4) 18.94 17.65 18.69 18.94 (11,7) 13.13 14.37 13.88 13.56
(12,4) 18.19 17.81 16.74 18.43 (12,7) 13.52 13.41 12.78 13.71
(13,4) 18.78 17.36 16.43 16.89 (13,7) 13.24 13.33 12.69 13.02

Concluses
Segundo o exemplo baseado em um conjuntos de dados reais, o mtodo que oferece as
melhores caractersticas o algoritmo de imputao GabrielEigen. Com esse mtodo se
minimizou o quadrado mdio do desvio (MSD) entre as imputaes e os dados verdadeiros
do experimento, bem como o MSD entre os parmetros genotpicos e ambientais ajustados
nos dados originais e nos dados completados. Tambm o mtodo GabrielEigen apresentou
a correlao mais alta. Assim, o mtodo proposto livre de pressuposies distribucionais
ou estruturais e no depende do mecanismo de ausncia dos dados em experimentos com
interao gentipo por ambiente (G E).

Referncias
[1] Arciniegas-Alarcn, S., Garca-Pea, M., Dias, C.T.S., Krzanowski, W.J. (2010) An
alternative methodology for imputing missing data in trials with genotype-by-environment
interaction. Biometrical Letters, v.47, n.1, p.1-14.
[2] Arciniegas-Alarcn S, Garca-Pea M, Dias CTS (2011) Data imputation in trials with
genotypeenvironment interaction. Interciencia 36: 444-449.
[3] Kang, M.S., Balzarini, M.G., Guerra, J.L.L. (2004) Genotype-by-environment interaction.
In: Saxton, A.M. (Ed.). Genetic analysis of complex traits using SAS. SAS Institute Inc., Cary,
NC, USA, p. 6996.



ENSAYO DE UNIFORMIDAD EN POLLOS PARRILLEROS EN
CONDICIONES DE PRODUCCIN

PALACIOS LUCIANO
1
, MARTINEZ CARLA
1
, FILIPPINI OLGA SUSANA
1

1
Universidad Nacional de Lujn

lucianofepalacios@hotmail.com carla.r.martinez@gmail.com

RESUMEN
Fue programado un ensayo de uniformidad durante el mes de enero para lograr unidades
experimentales homogneas (Escobar J.A et al 1982). Se consideraron las caractersticas
genticas de las aves, capacidad fisiolgica, caractersticas nutricionales y manejo de las
enfermedades (plan sanitario). Durante este perodo todos los animales fueron tratados en
igualdad de condiciones de alimentacin, sanidad y manejo. Se controlaron parmetros
productivos, enfermedades, manejo, etc. Se tomaron animales de igual edad, sexo y peso
inicial. El objetivo fue hallar diferencias en los parmetros productivos estudiados (Murillo
Nez et al 2012) atribuibles a una heterogeneidad en el ambiente del lugar donde se
realiz el ensayo. Se analiz la heterogeneidad sistemtica y la aleatoria. Se dividi el
galpn experimental en 4 sitios, con 12 corrales cada uno. Cada sitio fue estratificado en
tres zonas estratos de 4 corrales, elegidas aleatoriamente. En cada sitio se realizo un
ANOVA segn un esquema Completamente al azar, considerando tres localizaciones o
estratos. Con esto se estudio la variabilidad sistemtica del ambiente dentro de cada sitio.
La variabilidad aleatoria se estudi a partir de la comparacin de los CMerror de cada sitio.
A partir del anlisis estadstico utilizado para cada uno de los cuatro sitios se hall variacin
aleatoria pero no variacin sistemtica. No se hallaron diferencias significativas en los
parmetros zootcnicos medidos segn zona.

Palabras claves: ensayo de uniformidad en aves, heterogeneidad sistemtica y
aleatoria.

Introduccin
En el proceso de estudiar los efectos causados por los factores ambientales y de manejo,
sobre las condiciones en el interior de las instalaciones de cra de pollos parrilleros, es
necesario conocer y describir detalladamente los principales factores que contribuyen a la
existencia de variacin en las respuestas de las unidades experimentales o corrales con
animales.
En la prctica de la investigacin con pollos parrilleros en galpones experimentales
similares a las instalaciones estndar de produccin, es prcticamente imposible obtener un
ambiente totalmente uniforme u homogneo. Dentro de las variables a citar, podemos
mencionar la orientacin del galpn con respecto al sol, la disponibilidad de agua dentro del
mismo. Otros mecanismos que aumentan la no uniformidad, son el caso de las lneas de
aspersores y ventiladores, el origen de los pollitos BB utilizados, ya sea desde las
caractersticas sanitarias y de manejo que se les aplic a los planteles de reproductores a
los que pertenecen, como as tambin el manejo sanitario y operativo dentro de la planta de
incubacin.

Desarrollo
El ensayo se realiz en la Granja Experimental de CLADAN, ubicada en San Andrs de
Giles, desde el 01/02/2013 al 15/02/2013, bajo condiciones de crianza similares a las


comerciales. El galpn estaba dividido en 48 corrales, de 5 m
2
cada uno, Cada corral
alberg una cantidad de 60 pollos. Se utilizaron 2880 pollos Coob machos provenientes de
Avcola Suyai SRL.
Considerando las dos variaciones que pueden existir como heterogeneidad sistemtica y
heterogeneidad al azar, se realiz un ensayo de uniformidad para determinar si existan
variaciones con respecto al ambiente, dado que las caractersticas genticas de las aves,
capacidad fisiolgica, caractersticas nutricionales y manejo de las enfermedades, eran
homogneas. Se supuso que la heterogeneidad sistemtica actuaria sobre amplias zonas
del galpn y podra depender en este caso de la orientacin del galpn, diferencias de
temperatura dentro del mismo, diferencias en la disponibilidad de agua en las lneas o
diferencias debidas al manejo de las aves, siendo analizadas a partir del afecto de la
estratificacin del sitio en distintas localizaciones dentro del mismo. La heterogeneidad
aleatoria no sigue un patrn definido dentro del galpn, y puede afectar a la totalidad de los
corrales dentro de los sitios, o a parte de ellos. Las variaciones aleatorias dan origen al
denominado error experimental, que es la cuantificacin estadstica de la heterogeneidad
atribuible a causas desconocidas y cuyo valor indica el grado de imprecisin en el
experimento (Escobar ,1982). Esta variacin es controlada, en nuestro caso, a partir
CMerror generado en los anlisis de varianza en los cuatro sitios en que se dividi el
galpn. En cada sitio se realizo un ANOVA segn un esquema Completamente al azar,
considerando tres localizaciones, zonas o estratos que incluan cuatro corrales cada una,
denominadas con A, B y C. (Ver Mapa). Con esto se estudio la variabilidad sistemtica del
ambiente dentro de cada sitio. La variabilidad aleatoria se estudi a partir de la comparacin
de los CMerror de cada sitio. Todos los animales recibieron la misma dieta de nutricin
durante el perodo que dur el ensayo. Asimismo, se realiz un anlisis de los coeficientes
de variacin de cada sitio para los parmetros productivos, que presentaron en todos los
casos valores menores al 15%.
Mtodo Estadstico: Se llev a cabo el mismo experimento en cada uno de los 4 sitios con la
idea de combinar los datos y realizar un solo anlisis global. Se analizaron los Cuadrados
Medios del Error de cada sitio para detectar heterogeneidad aleatoria. Para realizar el
anlisis combinado es necesario que los CMerror sean homogneos. Las pruebas de
homogeneidad, se realizaron con la prueba de Levene para zonas y con la prueba F
mxima para Cuadrado Medio del Error.

CORRAL CORRAL

1 48 ZONA B
2 47

SITIO 1 3 46
ZONA A 4 45 ZONA C
5 44
6 43

7 42
ZONA C 8 41 ZONA B
SITIO 2 9 40
10 39

11 38
ZONA A 12 37

13 36
ZONA A 14 35

SITIO 3 15 34
16 33
ZONA C 17 32 ZONA B
18 31

19 30
ZONA B 20 29

SITIO 4 21 28
22 27 ZONA A
ZONA C 23 26
24 25

Resultados
Las variables peso corporal, ganancia diaria de peso, consumo de alimento y conversin
durante los catorce das que dur el ensayo, fueron analizadas para cada sitio, en dos
oportunidades. Las comparaciones mltiples se realizaron a travs del test de Tukey y
prueba de Tamhane en los casos en donde los parmetros de produccin no presentaron
homogeneidad de varianzas. El estadstico de Levene tom un valor lo suficientemente


pequeo para no rechazar la hiptesis de homocedasticidad a los niveles de significacin
habitual para los estratos dentro de los sitio, pero si fue rechazada en el anlisis
combinado segn sitios y estratos zona. En el sitio 2 se observa mayor error aleatorio que
en los restantes sitios, indicando heterogeneidad al azar. En el anova realizado para todas
las variables considerando los sitios y su combinacin en el espacio, la evidencia disponible
no fue suficiente para detectar diferencias estadsticamente significativas (Tabla 1 y 2).

Tabla 1: Pesos promedios y ganancias segn ubicacin.
Tabla 1 Peso7 Peso14 GDP7 GDP14
Media Media Media Media
Zona A
157,23a 428,30a 22,46a 38,72a
Zona B
156,90a 423,28a 22,41a 38,05a
Zona C
158,91a 430,95a 22,70a 38,86a

Tabla 2: Consumos y conversiones segn ubicacin.

Cons7 Cons14 Cons0a14 Conv7 Conv14
Media Media Media Media Media
zonas

Zona A
133,43a 385,14a 518,57a ,8498a 1,2122a
Zona B
134,26a 382,97a 517,23a ,8561a 1,2281a
Zona C
141,22a 367,25a 508,47a ,8893a 1,1803a

Conclusin
A partir del anlisis estadstico utilizado para cada uno de los cuatro sitios se hall variacin
aleatoria pero no variacin sistemtica. No se hallaron diferencias significativas en los
parmetros zootcnicos medidos segn zona. El ambiente afect en forma similar a todos
los sectores de la granja experimental.

Bibliografa
Escobar J.A (1982). La heterogeneidad del suelo y los ensayos de uniformidad. Primera
edicin. Colombia.
Garca Roberto M (2004). Inferencia Estadstica y Diseo de Experimentos. Primera Edicin.
Eudeba. Argentina.
Kuehl, Robert O. (2001) Diseo de experimentos. 2da edicin. Editorial Thomson Learning.
Militza G. Murillo Nez, Alfonso G. Vsquez Arroyo. (2012) Evaluacin de parmetros
productivos en las lneas genticas Cobb no sexable vs. Arbor Acres Plus
Ross.Honduras.



ANLISIS TMPORO-ESPACIAL DE REPORTES DE ENTEQUE
SECO EN LA PROVINCIA DE BUENOS AIRES

PASSUCCI, J.A.
1
; MORENO, F.C.
2
; FRADE, V.
2
; SPTH, E.J.A.
2
; RODRGUEZ, E.M.
1

1
reas Epidemiologa Bsica y Bioestadstica. Centro de Investigacin Veterinaria de Tandil
(CIVETAN), CONICET, Facultad de Ciencias Veterinarias, UNCPBA. Campus Universitario,
7000 Tandil, Argentina
2
INTA EEA Balcarce, Buenos Aires, Argentina.

emrodri@vet.unicen.edu.ar

RESUMEN
Un Programa de registro de datos de enfermedades de bovinos ejecutado por el INTA en la
provincia de Buenos Aires, se bas en reportes de casos clnicos que veterinarios privados
realizaron en forma voluntaria entre los aos 2001 y 2007, generndose as una gran base
de datos de enfermedades. El objetivo de este trabajo fue, a partir de esa fuente de datos,
analizar la distribucin tmporo-espacial de reportes de Enteque seco y detectar y
cuantificar potenciales factores asociados.
La unidad de estudio fue el partido, reportando 135 veterinarios 299 casos de Enteque seco
en 219 establecimientos de 31 partidos. La distribucin tmporo-espacial de los reportes fue
analizada mediante el test de permutacin espacio-temporal (SatScan V9.1). Un modelo de
regresin de Poisson (SAS V9.2.) fue utilizado para cuantificar asociaciones entre factores y
el nmero de reportes, incluyndose el efecto espacial como aleatorio. Se identificaron
cuatro cluster tmporo-espacial significativos, siendo los ms probables el Cluster 1
(p<,0001) integrado por 4 partidos y que dur 3,5 meses (O/E:3,45) y el Cluster 2 (p<,00001)
que comprendi tres partidos y duro 2,5 meses (O/E:4,13) . Se observ asociacin
significativa entre la cantidad de reportes de Enteque seco y la superficie del partido
(p=0,0168), nmero de establecimientos (p<,0001) y el total de animales (p=0,0361). El
anlisis utilizado permiti visualizar espacio temporalmente la distribucin de los
diagnsticos realizados en una importante regin ganadera del pas y aplicar un mtodo de
anlisis que permite cuantificar factores asociados con la enfermedad, conociendo
solamente el reporte de casos.

Palabras clave: Enteque Seco, Anlisis espacial, regresin de Poisson

Introduccin
El enteque seco (ES) o calcinosis enzotica de los bovinos es una enfermedad de origen
toxico producida por la ingestin repetida de hojas de duraznillo blanco (Solanum
glaucophyllum) que al caer sobre el piso son ingeridas junto con el pasto por los animales.
El Solanum glaucophyllum crece en lugares anegadizos, donde forma colonias conocidas
cono duraznillares y se encuentra ampliamente distribuido en el centro y este de la Pcia. de
Bs. As (Cuenca del Ro Salado), estando tambin presente en las provincias del Litoral,
Santa Fe, Chaco y Formosa, Paraguay, Uruguay y sur de Brasil. Esta intoxicacin vegetal
crnica que afecta a animales de ms de 2 aos de edad en pastoreo, presenta una
marcada estacionalidad en verano, cuando escasea el forraje y en otoos secos y, causa
deposicin de sales de calcio en los tejidos blandos que se acompaa de un severo
deterioro fsico con depreciacin de las reses. Si bien no hay estimacin exacta en cuanto a
las prdidas econmicas que ocasiona, hay clculos que indican que existen millones de
cabezas de ganado bajo los efectos del duraznillo y con la consiguiente posibilidad de
intoxicacin, provocando baja ganancia de peso, prdida de vientres y desaprovechamiento
de pasturas en una poca de gran proliferacin de las mismas. Muchas enfermedades


producidas por plantas txicas, tienden a tener distribucin espacial asociada en parte con el
ambiente fsico y factores biolgicos que influyen en el riesgo de aparicin de la misma.
La Vigilancia Epidemiolgica es un proceso continuo y sistemtico de recoleccin, anlisis e
interpretacin de datos zoosanitarios con el objetivo de difundir rpidamente la informacin a
aquellos que la requieran para llevar a cabo medidas sanitarias. Uno de los insumos de la
Vigilancia Epidemiolgica es el registro de enfermedades diagnosticadas por veterinarios
privados. A partir de esto el Instituto Nacional de Tecnologa Agropecuaria (INTA), gener el
Programa de Interaccin Profesional basado en reportes de casos clnicos que 290
veterinarios privados realizaron en forma voluntaria entre los aos 2001 y 2007 en la
Provincia de Buenos Aires.
El objetivo de este trabajo fue analizar a partir de esa fuente de datos (11990 registros) la
distribucin tmporo-espacial de reportes de Enteque seco y detectar y cuantificar
potenciales factores asociados.

Desarrollo
La unidad de estudio fue el partido, donde 135 veterinarios, reportaron 299 casos de
enteque seco en 219 establecimientos, en un total de 31 partidos de la provincia de Buenos
Aires. La distribucin tmporo-espacial de los reportes fue analizada mediante el test de
permutacin espacio-temporal (SatScan V9.1).
Cuando las enfermedades no son contagiosas y poco frecuentes, es usualmente razonable
asumir que la variable nmero de casos sigue una distribucin de Poisson. Por lo tanto la
variable respuesta cantidad de reportes de enteque fue analizada utilizado un modelo
mixto de regresin basado en la propuesta de Besag, 1991, asumiendo que la variable sigue
una distribucin de Poisson. El modelo aplicado fue:
i i
k
j
j j i i
U X E Y c | | + + + + =

=1
0
) log(

donde, Y
i
es el nmero de reportes de Enteque Seco (ES) en el partido i, E
i
es la covariable
cantidad total de reportes del partido, |
j
(j=1,..k) representan los coeficientes de regresin
asociados a los k hipotticos factores de riesgo, U
i
es un factor aleatorio que representa la
estructura espacio-temporal. La relacin temporal y espacial, est representada por los
agrupamientos (clusters) obtenidos a partir de la aplicacin por el SatScan.
Los potenciales factores de riesgo considerados fueron: cantidad de establecimientos con
ES (estab_ente), cantidad de veterinarios que reportan ES (vet_ente), superficie del partido
en Ha (superficie), cantidad de establecimiento (establec), nmero de vacas (vacas),
nmero total de animales (total), relacin novillo-novillito sobre la cantidad de vacas
(novi_novito_vac), cantidad de animales expuestos (expuestos), cantidad de animales
enfermos (enfermos) y cantidad de animales muertos (muertos). Para el anlisis fue utilizado
el procedimiento PROC GLIMMIX del SAS V9.3. (SAS Institute, Cary. 2012)

En la Figura 1a se muestran los partidos donde se registraron reportes de enfermedades en
general y en la Figura 1b se muestran los partidos que reportaron ES con la localizacin de
los cuatro clusters significativos (p<.0001, p<0.0001, p=0.0039 y p=0.028 respectivamente).
El cluster 1, el ms probable, es conformado por: G. Madariaga, Maip, Mar Chiquita y G.
Lavalle, con registros desde el 29/03/2005 al 11/07/05. El Cluster 2, por G. Lamadrid,
Laprida y Olavarra, desde 14/03/2006 al 29/05/2006. El Cluster 3, por G. Belgrano, Monte,
Las Flores, G. Paz, Pila, Chascoms y Rauch, desde 9/10/2001 hasta 28/03/2005. Y el
Cluster 4, Azul y Tapalqu, del 20/06/2006 al 5/02/2007.
En cuanto a los factores asociados a los reportes de ES, solo fue detectada asociacin
significativa con la superficie del partido (p=0,0168), la cantidad de establecimientos
(p<0,0001) y el total de animales en el partido (p=0,0361). Cuanto ms superficie tiene el
partido menos reportes se esperan, con una OR=0,954 (0,922-0,988). Dicho de otro modo,
por cada 10000 Ha que disminuye el partido habra 1,05 (1/0,954) ms chances de obtener
registros de ES. En el mismo sentido se asocia la cantidad de establecimientos del partido


(OR=0,997; 0,996-0,998). En partidos con menos cantidad de establecimientos hay mas
chance de recibir reportes de ES. La cantidad total de animales tiene una asociacin positiva
(OR=1,141; 1,019-1,278), por cada 10000 animales que incrementan el total del ganado,
hay 1,14 veces mas chances de recibir reportes de ES (Tabla 1)

Figura 1a. Partidos que hicieron reportes
de enfermedades en el perodo en
estudio
Figura 1b. Partidos que hicieron reportes
de Enteque seco en el perodo de estudio
y los cluster detectados

Tabla 1. Enteque seco (ES) Riesgo esimado para cada factor
Effect Estimate S. Error Pr>F OR Lower Upper
Superficie del partido (c/10000 Ha) -0,0469 0,01756 0,0168 0,954 0,922 0,988
Establecimientos en el partido -0,0027 0,000511 <,0001 0,997 0,996 0,998
Total de animales (c/10000) 0,1321 0,05773 0,0361 1,141 1,019 1,278

El anlisis utilizado permiti visualizar tmporo-espacialmente la distribucin de los
diagnsticos realizados en una de las principales regiones ganaderas de la Argentina
(Cuenca del Salado) y aplicar un mtodo de anlisis que permite cuantificar factores
asociados con la enfermedad, conociendo solamente el reporte de casos.

Bibilografa
Besag, J.; York, J.; Molli, A. (1991) Bayesian image restoration with two applications in
spatial statistics. Ann. Inst. Statist. Math. 43, 1: 1-59.
Chhetri, B.K.; Prez, A.M.; Thurmond, M.C. (2010) Factors associated with spatial clustering
of foot-mouth disease in Nepal. Trop. Anim. Health Prod. 42: 1441-1449.
Gimeno, E. (2002). Enteque seco o calcinosis enzotica en rumiantes. produccion-
animal.com.ar, Argentina. Versin obtenida el: 07/08/2013. http://www.produccion-
animal.com.ar/sanidad_intoxicaciones_metabolicos/intoxicaciones/45-enteque_seco.pdf
Spth, E.J.A.; Entrocasso, C.; Plorutti, F.; Manazza, J.A.; Brusca, G.; Faverin, C. (2012)
Enfermedades de los bovinos diagnosticadas por veterinarios en el centro-sur de Buenos
Aires. Aos 2001 al 2007. Boletn tcnico N 161. Ediciones INTA. Argentina.


IMPUTAO DETERMINSTICA EM EXPERIMENTOS
MULTIAMBIENTAIS

SERGIO ARCINIEGAS-ALARCN
(1)
CARLOS TADEU DOS SANTOS DIAS
(1)

(1)
Departamento de Cincias Exatas, Universidade de So Paulo/ESALQ, Brasil.

sergio.arciniegas@gmail.com

RESUMO
O objetivo deste artigo propor um novo mtodo de imputao para resolver o problema de
desbalanceamento em experimentos com interao gentipo ambiente (GE). O mtodo
obtido atravs de uma extenso do mtodo de validao cruzada por autovetor. Para test-
lo foi realizado um estudo de simulao a partir de uma matriz completa de dados reais
proveniente de um ensaio GE de ervilha. A simulao de desbalanceamento foi feita com
retiradas aleatrias de 10%, 20% e 40% na matriz. A qualidade das imputaes foi avaliada
utilizando a diferena preditiva media (RMSPD) entre os parmetros genotpicos e
ambientais dos dados originais e dos dados completados por imputao. A metodologia
proposta livre de pressuposies distribucionais ou estruturais e no tem restries em
relao ao mecanismo ou padro dos dados faltantes.

Palavras chave: autovetor, imputao, interao gentipoambiente, validao
cruzada.

Introduo
Usualmente os ensaios multiambientais contm informao incompleta. Possveis
alternativas para analisar tais experimentos so (i) extrair um subconjunto balanceado
eliminando os gentipos ou ambientes que tenham dados faltantes, (ii) preencher as caselas
vazias com mdias ambientais ou (iii) preencher os dados faltantes com estimativas obtidas
por mtodos que envolvem a utilizao de, por exemplo, modelos multiplicativos ou modelos
lineares mistos. Segundo Yan (2013), as estratgias anteriores podem resolver o problema
de desbalanceamento, mas nenhuma delas simples e efetiva. A primeira estratgia no
utiliza toda a informao disponvel, a segunda estratgia pode ter problemas se existe uma
grande quantidade de observaes ausentes e a terceira estratgia precisa de mltiplos
passos e procedimentos complicados.

O objetivo deste trabalho propor um algoritmo de imputao determinstica livre de
pressuposies distribucionais e estruturais a partir de uma extenso do mtodo de
validao cruzada do autovetor apresentado por Bro (2008).

Material e mtodos
2.1 Imputao de dados utilizando o mtodo de validao cruzada do autovetor
Suponha uma matriz Xde dimenso (np) com elementos (i=1,...,n; j=1,...,p), em que
alguns deles so ausentes notados por .
Passo 1: Os valores ausentes so imputados inicialmente pela mdia da respectiva
coluna obtendo uma matriz X completada e posteriormente so padronizadas as colunas,
subtraindo de cada elemento e dividindo o resultado por (em que e representam a
mdia e desvio padro da j-sima coluna).
Passo 2: Eliminar a i-sima linha da matriz X e sobre a matriz resultante
( ) i
X calcular a
correspondente decomposio por valores singulares. Isto , para todo i, i=1,...,n calcular


( )
( ) ( )
=
= =
m
k
T
k k k
T i
d
1
v u UDV X em que | |
m 1
u u U , ... , = , | |
m 1
v v V , ... , = ,
| |
m 1
D d d diag , ... , = , UD T = e V P = , .
Passo 3: Escolher o , tal que
{ }
75 . 0
1 , 1 min
1
2
1
2
~
|
|
|
|
.
|
\
|

=
=
p n
k
k
m
k
k
d
d
.
Passo 4: Atualizar a imputao para cada utilizando
( )
=
m
ij
x
( ) T
j
T j
p t

, em que
j
p a j-sima linha de P,
( ) ( ) ( ) ( ) ( )
( )
1

=
j T j j T j
i
T j
P P P x t em que
( )T j
P a matriz de
pesos encontradas no passo 2 com a j-sima linha excluda,
( )T j
i
x o vector linha que

contm a i-sima linha de Xsem o j-simo elemento.
Passo 5: Finalmente, depois de atualizar as imputaes para todos os dados faltantes, a
matriz X deve ser retornada sua escala original assim, . Ento, o
processo iterado (voltando ao Passo 1) at alcanar estabilidade nas imputaes. Todo o
processo deve ser feito sobre a matriz X, tal que np, caso contrario, a matriz deve ser
transposta. Observao: Alm de considerar a convergncia, foi aplicado o mesmo mtodo
mas fixando o nmero de iteraes entre 0 e 3. Assim, os mtodos avaliados sero
nomeados Eigenvector0, Eigenvector1, Eigenvector2, Eigenvector3 e Eigenvector.

2 Estudo de simulao
Para avaliar o mtodo de imputao, foi escolhido um conjunto de dados reais proveniente
de um experimento com interao gentipo por ambiente. O conjunto de dados se obteve a
partir do delineamento experimental aleatorizados em blocos com repeties e est
composto por uma matriz de dimenso 18x9, com 18 variedades de ervilha avaliadas em 9
locais diferentes da Polnia. O experimento foi conduzido pelo Research Centre for Cultivar
Testing, Supia Wielka, em que a varivel de interesse foi produo mdia medida em dt/ha.
A matriz de dados original foi submetida a retiradas aleatrias de diferentes porcentagens.
Foram consideradas as porcentagens de 10%, 20%, e 40%. O processo foi repetido 1000
vezes, obtendo 3000 matrizes diferentes com valores omissos e em cada uma os dados
foram imputados com os 5 algoritmos Eigenvector j descritos.

Para comparar os mtodos de imputao foram encontrados atravs da ANOVA os efeitos
genotpicos e ambientais tanto na matriz original quanto em cada uma das matrizes
simuladas e completadas posteriormente por imputao. A diferena preditiva mdia
(RMSPD) entre os parmetros de cada matriz completada e a matriz original foi padronizada
e utilizada como critrio de comparao (Arciniegas-Alarcn e Dias, 2009). Assim, as
estatsticas utilizadas foram RMSPD(gen) e RMSPD(env) para efeitos genotpicos e
ambientais respectivamente.

Resultados e Concluses
Na figura 1.a. se apresenta a distribuio da RMSPD(gen) na escala padronizada. Observa-
se que a distribuio para Eigenvector assimtrica esquerda e dita assimetria aumenta
conforme aumenta a porcentagem de dados omissos. Em geral, a distribuio do
Eigenvector est por em cima do zero e com o aumento de dados faltantes tende a se
concentrar em cima de 1, quer dizer que este mtodo teve as maiores diferenas entre os
parmetros genotpicos aditivos dos dados reais e os parmetros genotpicos aditivos dos
dados completados por imputao.



Figura 1.a. Box plot da distribuio da RMSPD(gen)

Entretanto, o melhor mtodo segundo a RMSPD(gen) o Eigenvector1, quer dizer o
eigenvector com apenas uma iterao. Este mtodo apresenta a menor mediana nas
porcentagens de 10% e 20%. Na porcentagem de 40% as medianas do Eigenvector0 e
Eigenvector1 pelo grfico so praticamente iguais, mas o Eigenvector1 continua sendo o
mais recomendvel por causa de ter a menor disperso. Assim, com Eigenvector1 se
obtiveram as menores diferenas entre os parmetros genotpicos aditivos dos dados reais
e os dados completados. A distribuio da RMSPD(env) na escala padronizada apresenta
um comportamento muito parecido com a distribuio da RMSPD(gen), mas no
apresentada por questo de espao. Novamente o mtodo Eigenvector apresenta as
maiores diferenas entre os parmetros ambientais aditivos dos dados reais e os
parmetros ambientais dos dados completados por imputao porque o algoritmo que
maximiza a RMSPD(env). Neste caso a RMSPD(env) minimizada com Eigenvector0 e
Eigenvector1 e nas trs porcentagens de retirada consideradas apresentam medianas
aproximadamente iguais, mas Eigenvector1 tem uma menor disperso e isso o torna o
mtodo mais recomendvel.

Referncias
[1] Arciniegas-Alarcn S, Dias CTS (2009) Data imputation in trials with genotype by
environment interaction: an application on cotton data. Biom. Braz. J. 27: 125-138
[2] Bro R, Kjeldahl K, Smilde AK, Kiers HAL (2008) Cross-validation of component models: a
critical look at current methods. Anal. Bioanal. Chem. 390: 1241-1251
[3]Yan W (2013) Biplot analysis of incomplete two-way data. Crop Sci. 53: 48-57


ESTIMACIN DE ESCALAS CON CORRECCIN POR SESGO

ECHEVERRA, LUCA
1
; PACE GUERRERO, IGNACIO
2
; BERGES, MIRIAM
3

1,2,3
Facultad de Ciencias Econmicas y Sociales, Universidad Nacional de Mar del Plata

echeverrialucia@hotmail.com

RESUMEN
Se propone la estimacin de un sistema completo de demanda (QES), el que contiene en su
especificacin un parmetro para el gasto de subsistencia que permite la incorporacin de
escalas de equivalencia en el consumo de los hogares (de la regin metropolitana de
Argentina) con diferente composicin. La estimacin requiere efectuar una correccin por
sesgo debido a la censura presente en la variable dependiente, por lo que se aplica el
procedimiento de Shonkwiller y Yen (1999).

Palabras clave: sistema completo de demanda, estimacin de escalas, correccin del
sesgo de seleccin

Introduccin
Los modelos empricos de demanda se estiman usando datos agregados a nivel de los
hogares y se basan en diferentes formas funcionales que han evolucionado a partir del
enfoque del sistema de demanda casi ideal (AIDS) de Deaton y Muellbauer (1980). Dado
que las demandas de los distintos bienes y servicios de las familias estn relacionadas, a
travs de los errores de las ecuaciones, se recomienda su estimacin como sistema
Seemingly Unrelated Regression (SUR). Los sistemas de demanda permiten evaluar
cambios estructurales y los efectos sobre el bienestar.
El objetivo de este trabajo es estimar un sistema completo de demanda para todos los
bienes que consumen las familias de la Ciudad Autnoma de Buenos Aires incorporando
efectos demogrficos, los que son modelados en la forma de trminos adicionales que
trasladan las funciones originales en magnitudes diferentes de acuerdo a los tipos de
hogares definidos. De esta forma, para cada bien y para cada tipo de hogar se construyen
escalas, que modifican las cantidades demandadas, respecto del hogar de referencia (un
adulto en edad activa) y, por ende, permiten conocer el nivel de gasto adicional requerido
por hogares de mayor tamao para alcanzar el mismo nivel de bienestar que el hogar de
referencia.

Desarrollo
Una de las formas posibles para obtener escalas de equivalencia entre hogares con
diferente composicin consiste en introducir efectos demogrficos en un sistema completo
de demanda, donde los factores de escala en el consumo son especficos para cada bien e
incorporan las necesidades de los miembros adicionales en el hogar.
Siguiendo a Kohn y Missong (2001), se emplea el sistema de demanda cuadrtico
denominado Quadratic Expenditure System (QES) para la estimacin de las escalas de
equivalencia. Este modelo supone que las cantidades observadas para el hogar tipo z
pueden ser convertidas en el consumo equivalente de un hogar de referencia tipo r
empleando un vector de factores de escala para cada bien. El hogar de referencia es el
compuesto por un miembro adulto. De este modo el factor de escala para el hogar z para el


bien i ( ) se determina en relacin al hogar de referencia, para el cual est normalizado
a uno.
La eleccin de la forma paramtrica del sistema de demanda est condicionada por la
modelizacin de las curvas de Engel (la relacin entre cantidades demandadas e ingreso).
La evidencia emprica sugiere que la forma cuadrtica ha demostrado ser lo suficientemente
flexible como para describir el consumo de distintos bienes especficos (Banks et al., 1997).
Los modelos lineales como el Sistema Ideal de Demanda (AIDS) y el Lineal de Gastos (LES)
no han presentado buenos ajustes (a excepcin de alimentos) y los modelos con trminos
polinmicos de grado superior a dos no indicaron mejoras significativas en las estimaciones.
Uno de los modelos cuadrticos ms utilizados es el sistema de demanda QES propuesto
por Pollak y Wales (1978) y por Howe et al. (1979) cuya expresin es:
(1)
dondek=1,,n indica los rubros de gasto considerados, p es el precio, q la cantidad, y es el
gasto total, b es la cantidad de subsistencia, a y c son los parmetros que corresponden al
trmino lineal y cuadrtico del gasto, indica el gasto de subsistencia necesario en
todos los rubros de bienes para alcanzar el mnimo nivel de bienestar. Las restricciones
tericas de la demanda imponen que .
Los efectos demogrficos se incorporan como variables dicotmicas dummies, que
desplazan la demanda (afectando slo la ordenada al origen) por tipo de hogar. De esta
forma, cada parmetro depende de las variables z, tal que en (1) cada b
i
se reemplaza por
).
El uso de microdatos requiere efectuar una correccin por sesgo de seleccin debido a la
censura presente en la variable dependiente. La presencia de gasto de consumo cero se
debe a la infrecuencia de compra, soluciones de esquina, datos faltantes (missing), entre
otros. Para ello se emplea el procedimiento bietpico propuesto por Shonkwiller y Yen
(1999), que consiste en la extensin del modelo de Heckman (1979) al caso multiecuacional.
Este procedimiento modela, en la primera etapa, la probabilidad que los hogares consuman
o no cada uno de los bienes con un modelo probit univariado, a partir del cual se obtienen
las funciones de densidad, , y acumulada, , para la distribucin Normal
estndar. En la segunda etapa, se ponderan las funciones de demanda del sistema QES por
la funcin de distribucin acumulada estimada y se agrega la funcin de densidad estimada
como una variable adicional, de forma tal que el modelo a estimar es (2):
(2)
De acuerdo con los autores el empleo de un modelo probit univariado en la primera etapa de
estimacin es suficiente para asegurar la consistencia de las estimacin, aunque la
eficiencia se obtiene del uso de un modelo probit multivariado (Yen, 2004).
Por otro lado, la estimacin del QES requiere informacin de precios para cada rubro de
gasto - -. Para ello se emplean los ndices de precios para cada una de las categoras de
gastos de la ENGH
1
(que corresponden con la apertura del ndice a un dgito) publicados por
el INDEC
2
.
Finalmente, para la construccin de una escala nica (correspondiente al mnimo nivel de
bienestar) para cada tipo de hogar (z) (que resume el comportamiento de gasto en las nueve

1
Se emplean las 9 categoras de gasto: alimentos y bebidas; indumentaria; vivienda y combustibles;
mantenimiento del hogar; salud; transporte y comunicaciones; esparcimiento; enseanza; otros gastos.
2
Instituto Nacional de Estadstica y Censos.


categoras de bienes consideradas) se comparan los gastos estimados a nivel de
subsistencia (para el total de categoras de gasto empleadas) de cada tipo de hogar con
respecto al del hogar de referencia (r), es decir que las escalas se calculan a partir de la
relacin entre la sumatoria de los gastos estimados de los nueve rubros considerados (4):
(4)

Los hogares de la ENGH se clasifican de acuerdo a criterios de tamao y composicin, con
lo que se obtienen 7 tipos de hogares. La tipologa de hogares empleados, la proporcin que
representan en el total de la muestra (2.724 hogares) y las escalas estimadas se presentan
en el cuadro 1.

Cuadro 1. Tipologa de hogares y escalas estimadas.
Tipos
de
Hogar
Descripcin de la composicin
de cada categora de hogar
Porcentaje de
cada tipo de
hogar

Escalas
Estimadas
2004/05
H
0
Un adulto en edad activa (hogar de referencia) 15,7% 1
H
1
Un mayor de 65 aos 9,7% 1,481
H
2
Dos adultos en edad activa 16% 1,682
H
3
Otro tipo de hogar de 2 personas 14,3% 2,714
H
4
Nuclear -con 1 o 2 menores de 14 aos- 15,6% 2,676
H
5
Ms de 2 integrantes y con menores de 14 aos 11,1% 3,644
H
6
Ms de 2 integrantes y sin menores de 14 aos 17,7% 3,187

Los resultados obtenidos muestran consistencia en las escalas de mnimo bienestar
obtenidas, ya que el incremento en el nmero de integrantes del hogar refleja un aumento
en el gasto de subsistencia requerido. En el caso de los adultos mayores se observa un
incremento en el costo de vida del 48%, lo que se corresponde con un mayor gasto en
categoras tales como salud, transporte y alimentos (considerando que se trata de ciudad de
Buenos Aires). La presencia de menores de 14 aos en el hogar, para los tipos 5 y 6 cuya
composicin resulta comparable, representa un incremento del 45,7% de los gastos.
Adems, se observan importantes economas de escala por tamao de los hogares. A
medida que aumentan el nmero de miembros que viven en el hogar, los gastos se
incrementan menos que proporcionalmente. Por ejemplo la incorporacin de un segundo
adulto en edad activa en el hogar incrementa los gastos slo un 68,2% respecto del 100%
que representa un nico miembro adulto en el hogar y la presencia de uno o dos menores
aumenta los gastos de una pareja en un 60%.

Bibliografa
Banks, J.; Blundell, R.; Lewbel, A. (1997). Quadratic Engel Curves and Consumer Demand.
The Review of Economics and Statistics. Vol. 79, pp. 527-539.
Deaton, A.; Muellbauer, J. (1980). An Almost Ideal Demand System. American Economic
Review. Vol. 70 N 3, pp. 312-26.
Heckman, J. (1979). Sample Selection Bias as a Specification Error. Econometrica. Vol. 47,
pp.153-162.
Howe, H.; Pollak, R.; Wales, T. (1979). Theory and Time Series Estimation of the Quadratic
Expenditure System. Econometrica, Vol. 47, N 5, pp. 1231-1247.
Kohn, K.; Missong, M. (2001). Estimation of Quadratic Expenditure Systems Using German
Households Budget Data. Institute of Statistics and Econometrics, Christian-Albrechts-
University of Kiel. Working Paper 148/01.


Pollak, R.; Wales, T. (1978). Estimation of Complete Demand Systems from Households
Budget Data: The Linear and Quadratic Expenditure Systems. American Economic Review.
Vol. 68, N 3, pp. 348-359.
Shonkwiler, J.; Yen, S. (1999). Two-Steps Estimation of Censored System Equations.
American Journal of Agricultural Economics. Vol. 81 N 4, pp. 972-982.
Yen, S. (2004). A Multivariate Sample-Selection Model: Estimating Cigarette and Alcohol
Demands with Zero Observation. American Journal of Agricultural Economics. Vol. 87 N 2,
pp. 453-466.



DIFERENCIACIN SEGN COLOR EN MATERIALES GENTICOS
DE GRANOS DE MOSTAZA BLANCA

VIGNERA M. LAURA
1
, FILIPPINI, OLGA S.
1
, CURIONI ANA
2

1
Divisin Estadstica, Departamento de Ciencias Bsicas, UNLU.
2
Divisin Tecnologa Agropecuaria, Departamento de Tecnologa, UNLU.

lauravig@argentina.com

RESUMEN
La Argentina posee condiciones ptimas para el desarrollo del cultivo de mostaza blanca o
tambin denominada amarilla (Sinapis alba L.), sin embargo los rendimientos obtenidos no
son an competitivos. Las causas de la baja produccin se relacionan con varios aspectos
agrotecnolgicos, entre ellos la casi nula inscripcin de material gentico en el INASE,
Instituto Nacional de Semillas. Pues en la mayora de los casos las simientes que utilizan los
productores no estn identificadas, constituyndose esto en una limitante importante, puesto
que no se tiene conocimiento sobre el comportamiento futuro del material gentico en uso.
Al observar visualmente semillas de esta especie, se detectan diferencias en cuanto al color
en distintos materiales de mostaza blanca. El objetivo de este trabajo fue caracterizar el
color de granos de mostaza blanca por medio de colormetros y detectar diferencias entre
materiales de distinta procedencia, lo que permitira obtener un mtodo objetivo de
diferenciacin varietal. El color de muestras de granos de Sinapis alba L. provenientes de 3
materiales, San Pedro (SP), Platario (Pl) y Canad (Ca), fue determinado mediante un
espectrofotmetro. Se obtuvieron y registraron los valores de L*, a* y b*, tres componentes
cromticas, donde L* es la luminosidad, que representa la luminosidad u oscuridad del color,
asociada a la coordenada blanco-negro, a* representa las mediciones en la direccin rojo-
verde y b* representa la respuesta en el eje amarillo-azul, puesto que la ubicacin en el
espacio de un color se define por un sistema cartesiano tridimensional. Se realizaron 25
exposiciones de 3 determinaciones en cada muestra. El anlisis estadstico de los datos se
realiz a travs de un Modelo Lineal General Multivariante, cuya aplicacin permiti detectar
diferencias significativas entre los distintos materiales (SP, Pl y Ca), basndose en sus
coordenadas cromticas. Las coloraciones amarillo-ocrceo de los granos de mostaza
blanca presentan diferencias visuales sutiles entre distintos materiales genticos.

Palabras clave: mostaza, color, componentes cromticas, materiales genticos,
multivariado

Introduccin
Los granos de Sinapis alba L., son empleados principalmente en la industria alimenticia, en
menor medida en la farmacutica y por sus contenidos en aceites tambin como
biocombustible (Berglund, 2007; Dyggan, 2006; Oplinger et al., 1991; Duke, 1983).
Indudablemente, el color es parte de las bases de comercializacin de los granos de esta
especie lo cual ratifica la importancia de lograr un mtodo rpido, confiable y objetivo en la
determinacin de este parmetro de calidad. El sistema Cie-Lab (establecido por la
Comisin Internationale de LEclairage) define cada color a partir de sus coordenadas L*
(luminosidad), a* y b*, las que determinan un espacio tridimensional (C.I.E., 1986), y es un
mtodo de amplio uso en alimentos. La luminosidad L* vara entre el 0 y 100 para el negro y
blanco respectivamente; para el factor cromtico a* valores negativos indican verde mientras
valores positivos indican rojo, y para b* valores negativos indican azul y valores positivos
indican amarillo. Figura 1.



Figura 1. CIE Lab espacio de color. L es siempre positivo y representa la luminosidad; a>0 representa un
componente rojo, a<0 componente verde; b>0 representa un componente amarillo y b<0 componente azul.

Carvalho et all. (2005), valid el empleo del colormetro, como instrumento de estimacin
indirecta y segura, de los contenidos de licopene en tomate, dado la alta correlacin entre el
color y los contenidos de licopene.
El objetivo de este trabajo fue detectar posibles diferencias entre distintos materiales
genticos de mostaza blanca producidos en la regin pampeana norte, a travs de los
factores cromticos L*, a*, b*, coordenadas del espacio de color, mediante determinaciones
calorimtricas con espectrofotmetros.

Desarrollo
La determinacin del color de muestras de granos de Sinapis alba L. se realiz sobre 3
materiales genticos, uno cosechado en San Pedro (SP) y dos en Lujn (Ca y Pl); para los
materiales SP y Pl se dispuso de 8 muestras para cada uno y en el material Ca, 4 muestras.
La medicin del color se realiz mediante un espectrofotmetro (CM508d), marca Minolta.
Las 20 muestras se colocaron en cajas de Petri de 83mm de dimetro y 15mm de altura.
Previo a la toma de cualquier medida se realiz la calibracin de blanco (white calibration)
con el mximo de absorbancia, es decir cero de transmitancia y despus el "zero calibration"
que sera el mximo de transmitancia y cero de absorbancia. Se obtuvieron y registraron los
valores de L*, a* y b* para cada muestra, mediante 25 exposiciones de 3 determinaciones
por punto de cada muestra.
La metodologa de anlisis estadstico utilizada fue el Modelo Lineal General Multivariante
(MANOVA), mtodo de anlisis multivariado cuyo propsito es establecer si existen
diferencias significativas entre las distintas variedades de granos de mostaza procedentes
de los diferentes materiales SP, Pl y Ca, basndose en sus coordenadas cromticas.
En este modelo, las variables dependientes son las coordenadas cromticas y las variables
predictoras son los materiales genticos que se busca diferenciar. Comparaciones mltiples
posteriores permitieron establecer cul/es eran los materiales genticos que se
diferenciaban.
En un paso posterior, y habindose hallado que efectivamente existe diferencia entre los
materiales genticos, a travs de un Anlisis Discriminante efectuado por pasos, se analiz
cul era la componente cromtica que tena mayor importancia al momento de diferenciar
las tres variedades.


En la Tabla 1 se muestran los promedios de las coordenadas cromticas para cada material
gentico estudiado.

Tabla 1. Promedios de coordenadas cromticas segn material gentico.

L* a* b*
Media Media Media
Variedad
SP 48,73a
1
8,54a 45,81c
Pl 50,79b 9,31b 41,15b
Ca 50,26b 8,87a 32,91a
1
Letras diferentes indican diferencias significativas para =0,05

Las pruebas para contrastes multivariados, como Lambda de Wilks y Traza de Hotelling,
resultaron significativas en el anlisis multivariado de la varianza, indicando que el efecto de
las variedades contribuyen al modelo, valor-p <0,05.
El anlisis multivariado de la varianza demuestra que existen diferencias significativas entre
las variedades, valor-p<0,05. Pruebas posteriores de comparaciones mltiples indican que el
material gentico San Pedro presenta valores ms bajos para la componente cromtica L*,
indicando que en el espacio triestmulo de color CIE, es la variedad ms luminosa,
diferencindose significativamente de las otras variedades, ms oscuras (valores de L* ms
elevados). Respecto a la componente a*, si bien en todos los casos los valores ledos por el
espectrofotmetro son todos positivos, se observa una coloracin ms rojiza en la variedad
Platario (valores ms elevados), diferencindose de San Pedro y Canad. Y por ltimo en
referencia a la variable b*, cuyos valores positivos oscilan dentro de la gama del amarillo, se
observ que existen diferencias significativas entre las tres variedades. Esta componente
resulta ms amarilla para la variedad Platario (valores ms altos de b*).
Un Anlisis Discriminante, indic que la componente cromtica b*, result ser la ms
discriminatoria, observndose para ella valores ms elevados de F (F=73,7). Asimismo,
utilizando el mtodo de inclusin por pasos, fue la primera variable que ingres en el anlisis
y la que presenta correlacin ms elevada con la primera funcin hallada, funcin que
explica el 95,7% de la varianza total.
Las coloraciones amarillo-ocrceo de los granos de mostaza blanca presentan diferencias
visuales sutiles entre distintos materiales genticos, que mediante determinaciones
colorimtricas con espectrofotmetros se diferencian a travs de los factores cromticos L*,
a*, b*, coordenadas del espacio de color. Esta primera aproximacin calorimtrica de los
granos de mostaza, y las diferencias de color detectadas segn los materiales genticos
analizados, nos permitira tener en cuenta el empleo de colormetros para la diferenciacin
de cultivares segn la coloracin de los granos.

Bibliografa
Arizio O., Alfonso W. y Curioni A. (2005). Mostaza Blanca (Sinapis alba L. Syn. Brassica
hirsa): Agrotecnologa, calidad y mercados. VI Jornadas de Actualizacin en Cultivos no
Tradicionales, Aromticos y Medicinales. UNLu. Lujn, Abril 2005. 33 Pag. CD.
Berglund, D. (2007). Tame Mustard Production.NDSU. A-935. www.ag.ndsu.edu
Carvalho, W.; Fonseca, M.E.N.; Silva, H.R.; Boiteux, L.S.; Giordano, L.B. (2005). Estimativa
indireta de teores de licopeno em frutos de gentipos de tomateiro via anlise colorimtrica.
Horticultura Brasileira, Braslia, v.232 n.3, p.819-825.
Cuadras, C.M. 2012. Nuevos Mtodos de Anlisis Multivariante. Barcelona: CMC Editions.
Documento en lnea www.ub.edu
CIE-Lab. (1986). Colorimetrie, 2nd ed. Publication C.I.E. N 15, 2. Viena: Central Bureau of
the Cimision Internationale de LEclairage.
ISO 1237. 1981. Mustard seed Specification. UDC 633.844-004.1. 11pag.


Johnson, Dallas E. (2000). Mtodos Multivariados Aplicados al Anlisis de Datos. Edicin
Espaol. International Thomson Editors.Mxico.
McKenzie, R. 2010. Mustard Production for Alberta Agriculture Research Division. Alberta
Agriculture and Rural Development. January 2010. Agdex 143/20-1. 14 pag.
Oplinger, E.; Oelke, E.; Putnam,D.; Kelling, K.; Kaminsid, K.; Teynor, T.; Doll, J. and
Durgan, B. 1991. Mustard. Alternative Field Crops Manual. 9 pag.


CLASIFICACIN DIFUSA DE MORFOS LAGO Y RO DEL CAMARN
Samastacus spinifrons

MIGUEL YAEZ A.
1
, ERICH RUDOLPH L.
2
, NELSON COLIHUEQUE V.
2

1
Departamento de Estadstica, Universidad del Bo-Bo, Concepcin, Chile
2
Departamento de Ciencias Biolgicas y Biodiversidad, Universidad de Los Lagos, Osorno,
Chile

myanez@ubiobio.cl

RESUMEN
En el anlisis de informacin ecolgica surge frecuentemente el problema de tratar con
datos con alto grado de incertidumbre, producto de la presencia de variables aleatorias,
datos incompletos o poco precisos, aproximaciones en lugar de mediciones o datos no
comparables. Los mtodos de agrupamiento clsicos, al ignorar la naturaleza continua de
las variables ecolgicas y la incertidumbre de los datos, pueden llevar a una clasificacin
errnea o a una interpretacin equivocada. Las tcnicas de clasificacin difusa permiten
reflejar mejor las caractersticas de datos ecolgicos. En este trabajo se presentan los
resultados obtenidos por el algoritmo de clasificacin difusa c-medias (FCM) a caracteres
morfolgicos del camarn Samastacus spinifrons presente en ambientes fluviales y lacustres
del sur de Chile.

Palabras clave: caracteres morfolgicos, clasificacin difusa, status taxonmico.

Introduccin
El camarn Samastacus spinifrons fue descrito por Philippi (1882) en base probablemente a
dos especmenes de ro. Ringuelet (1949) comprob ciertas diferencias morfolgicas entre
los especmenes de ro y de lago. Posteriormente, Jara (1994) realiza una descripcin de
estas diferencias, siendo ratificadas por Rudolph (2002). Actualmente, en S. spinifrons se
distinguen dos morfologas corporales, segn la procedencia de los especmenes. As, los
representantes de poblaciones fluviales (morfo ro) tienen una complexin robusta, gruesa y
pesada, rostro corto, ojos pequeos, y su coloracin es, generalmente, caf o gris verde
oscuro. En cambio, los provenientes de poblaciones lacustres (morfo lago) son de
complexin liviana, rostros alongados, ojos grandes, y la coloracin tiende a ser caf
amarillento o castao claro. Pese al tiempo transcurrido desde que se conocen ambos
morfos, an no se ha efectuado ningn estudio morfomtrico y/o gentico que permita
comprender el status taxonmico de estos. Para lograr este propsito, se recolectaron
camarones S. spinifrons de lago y ro los cuales fueron sometidos a evaluacin morfolgica
externa. En este trabajo se reportan los resultados de utilizar el procedimiento de
clasificacin difusa c-medias (FCM) propuesto por Bezdek (1974 a, 1974b) a datos
morfolgicos y compararlos con los anlisis genticos de la especie. La principal ventaja de
las tcnicas de clasificacin difusa con respecto a los mtodos de agrupamiento clsicos, es
que permite obtener el valor de pertenencia del dato clasificado, permitiendo discernir el
grado de agrupamiento dentro del conjunto en estudio.

Desarrollo
El conjunto de datos utilizado en este estudio, abarca muestreos de especmenes adultos de
S. spinifrons morfo ro (n=73) capturados en los ros Hueyusca (4110 S; 7342W) y
Contaco (4035 S; 7331W) de forma manual y mediante el calado de trampas cebadas.
Los especimenes morfo lago (n=64) fueron recolectados desde el fondo (70 m. aprox.) de
los lagos Rupanco (4050 S; 7230W) y Lleu-Lleu (3815 S; 7330W) por medio del calado
de trampas cebadas. En laboratorio se midieron 23 variables morfomtricas. Se desea


determinar el status taxonmico de las especies, para lo cual se realiza un anlisis de
clasificacin difusa c-medias (Bezdek , 1974 a, 1974b). El algoritmo difuso c-medias (FCM)
se basa en la minimizacin de la funcin objetivo:
( ) ( )
2
1 1
, ;
c n
m
ik k i
i k
J u
= =
=
A
U V X x v
donde
( ) ( )
2 T
k i k i k i
=
A
x v x v A x v , siendo A la norma Euclidiana,
ik
u es el grado
de pertenencia del i-simo dato en el j-simo conglomerado o clase, bajo las siguientes
condiciones:
( )
1
0 1,2, ,
n
ik
k
u n i c
=
< < =
,
( )
1
1 1,2,
c
ik
i
u k n
=
= =
y
1 1
c n
ik
i k
u n
= =
=
. Los
prototipos de los conglomerados (centroides) se obtienen como:
( )
( )
( )
1
1
1,2, ,
n
m
ik k
k
i n
m
ik
k
u
i c
u
=
=
= =
x
v .
La particin difusa c-medias se obtiene a travs de un proceso iterativo (Bezdek et al.,
1984). En este trabajo, el nmero ptimo de clases o conglomerados se determina
utilizando cuatro medidas de validacin. Se utiliza el coeficiente de particin normalizado
(PCn) y el ndice de entropa normalizada (CEn) propuestos por Bezdek et al. (1984), el
ndice Xie-Beni (XB) desarrollado por Xie y Beni (1991), y el ndice de separacin (S)
formulado por Bensaid et. al. (1996). Adems, se usa el ndice de confusin (CI) propuesto
por Burrough et. al. (1997) para determinar el grado de solapamiento de las clases. El
algoritmo AFM fue programa en Matlab, considerando como cota de convergencia
0.0001 c = y exponente difuso m=2.

Para lograr el nmero ptimo de clases o conglomerados, el algoritmo difuso c-medias
(FCM) fue aplicado a la muestra de 137 especies de S. spinifrons produciendo soluciones
desde dos a once clases. El comportamiento de las medidas de validacin se muestra en la
figura siguiente:
2 3 4 5 6 7 8 9 10 11
0
0.2
0.4
0.6
0.8
1
Nmero de clases (c)
P
C
n
2 3 4 5 6 7 8 9 10 11
0
0.2
0.4
0.6
0.8
1
Nmero de clases (c)
C
E
n
2 3 4 5 6 7 8 9 10 11
0
0.5
1
1.5
x 10
-3
Nmero de clases (c)
S
2 3 4 5 6 7 8 9 10 11
0
0.01
0.02
0.03
0.04
0.05
Nmero de clases (c)
X
B

Figura.- ndices PCn, CEn, S y XB para determinar el nmero ptimo de clases difusas.

El valor mximo de PCn y los valores mnimos de CEn, S y XB, sugieren que dos clases son
apropiadas para la clasificacin de las especies. Siguiendo a Burrough et. al. (1997) se


compara el ndice de confusin CI para cada elemento en la muestra, tal que un CI>0.50
indica que existe una gran incertidumbre en la pertenencia a una clase determinada. La
siguiente tabla muestra el resumen de la solucin para dos clases.

Tabla.- Grado de pertenencia a las Clases (promedios)

Lugar Clase 1 Clase 2
Lago Rupanco 0,8421 0,1579
( n=15 )
( n=6 )
( n=13 )
Lago Lleu-Lleu 0,8384 0,1616
( n=9 )
( n=1 )
( n=20 )
Ro Hueyusca 0,8831 0,1169
( n=5 )
( n=6 )
( n=19 )
Ro Contaco 0,9262 0,0738
( n=42 )
Ro Contaco 0,5818 0,4182
( n=1 )

La distribucin de los valores de pertenencia para los morfos ro y lago, muestra que la
Clase 1 est formada principalmente por especies S. spinofrons del lago Rupanco (44%) y
ro Contaco (98%), en menor medida por especies del lago Lleu-Lleu (39%) y ro Hueyusca
(17%). En cambio, la Clase 2 est constituida en su mayora por las especies del lago Lleu-
Lleu (87%), lago Rupanco (38%) y ro Hueyusca (63%). Algunas especies (10%) de los
morfos lago y ro no tienen un grado de pertenencia dominante en una de las clases. Ambas
clases o conglomerados evidencian caractersticas morfolgicas homogneas entre las
especies de ro y lago. El agrupamiento resultante en la clase 2 concuerda con el resultado
citogentico, en ste no se observaron diferencias significativas en el nmero de
cromocentros entre las especies del ro Hueyusca y lago Lleu-Lleu.

Bibliografa
[1] Bensaid, A.; Hall, L.; Bezdek, J.; Clarke, L.; Silbiger, M.; Arrington J. and Murtagh, R.
(1996). Validity-guided (re)clustering with applications to image segmentation. IEEE
Transactions on Fuzzy Systems, 4, 112-123.
[2] Bezdek, J. (1974a). Cluster validity wtih fuzzy sets. Journal of Cybernetics, 3, 58-73.
[3] Bezdek, J. (1974b). Numerical taxonomy with fuzzy sets. Journal of Mathematical
Biology, 1, 57-71.
[4] Bezdek, J.; Erhlich, R. and Full, W. (1984). FCM: The fuzzy c-means clustering algorithm.
Computers & Geosciences, 10, 191-203.
[5] Burrough, P.; Van Gaans, P. and Hootsmans, R. (1997). Continuous classification in soil
survey: spatial correlation, confusion and boundaries. Geoderma, 77, 115-135.
[6] Jara, C. (1994). Camarones dulceacucolas en Chile. Informe tcnico-cientfico. Instituto
de Zoologa, Universidad Austral de Chile, 15 pp.
[7] Philippi, R. (1882). Zoologa chilena. Sobre los Astacus. Anales de la Universidad de
Chile, 61, 624-628.
[8] Ringuelet, R. (1949). La morfologa y el mecanismo de sujecin de las cras de
Parastacus agassizi Faxon. Notas Museo La Plata, 117, 55-59.
[9] Rudolph, E. (2002). Sobre la biologa del camarn de ro Samastacus spinifrons (Philippi,
1882) (Decapada, Parastacidae). Gayana, 66(2), 147-159.


[10] Xie, X. and Beni, G. (1991). A validity measure for fuzzy clustering. IEEE Transactions
Pattern Analysis Machine Intelligence, 13, 841-847.


FACTORES ASOCIADOS AL RENDIMIENTO ACADMICO EN LA
CARRERA DE INGENIERA AGRONMICA DE LA UNNE

GIMNEZ, L.I.
1
; ALMIRN, M.C.
2
; BBEDA, G.R.R.
1
; DALURZO, H.
3

1
Clculo Estadstico y Biometra. FCA. Universidad Nacional del Nordeste
2
Gabinete Pedaggico. FCA. Universidad Nacional del Nordeste.
3
Secretara Acadmica. FCA. Universidad Nacional del Nordeste

lauraitatigimenez@gmail.com

RESUMEN
Este trabajo forma parte de un proyecto de investigacin desarrollado por docentes de
diferentes ctedras de la facultad de Ciencias Agrarias de la UNNE. Est orientado a la
definicin de estrategias de contencin y retencin de estudiantes de la carrera de
Ingeniera Agronmica. El objetivo de este trabajo fue determinar la relacin entre factores
institucionales, pedaggicos y socioeducativos con el rendimiento acadmico de los
estudiantes de la carrera. Se realiz un muestreo estratificado para seleccionar 64
estudiantes de las cohortes 2005 y 2006 a los cuales se los entrevist con un cuestionario
semi-estructurado. Las entrevistas se realizaron durante segundo semestre del ao 2011. El
rendimiento acadmico fue medido con el nmero de materias obligatorias aprobadas a
diciembre del 2011; esta informacin fue obtenida de los archivos de la facultad. Se
analizaron, entre otras variables, la asistencia a clases tericas, el nivel educativo del padre
y el tipo de ocupacin, la convivencia (con quien vive) y las causas de no aprobacin de
exmenes finales. Para evaluar las relaciones entre las variables se realizaron tablas de
contingencia, pruebas de X
2
y un Anlisis de Correspondencias Mltiple. El rendimiento
acadmico estuvo relacionado a la situacin de convivencia. Se observ que alumnos que
tienen ms de 28 materias aprobadas viven con un amigo o hermano a diferencia de los que
viven con la familia los cuales tuvieron menos de 7 materias aprobadas. El anlisis de
correspondencias mltiples arroj que estudiantes que conviven con un amigo o hermano,
que tienen el padre profesional tienen mejores niveles de rendimiento acadmico.
Palabras clave: multivariado, anlisis de correspondencias mltiple, variables
categricas.

Introduccin
La facultad de Ciencias Agrarias de la UNNE se encuentra desarrollando un proyecto de
investigacin que se propuso iniciar la identificacin de factores asociados a las condiciones
institucionales y curriculares que se relacionan al desgranamiento y posible desercin de los
estudiantes de Ingeniera Agronmica, e identificar y describir las caractersticas socio
educativas de los estudiantes y la relacin con el desempeo acadmico en la carrera. En
una primera etapa se describi el perfil socio-educativo de los estudiantes en funcin del
nivel de escolaridad, ocupacin y nivel de ingreso de padres o familiares directos.
Se conceptualiza el rendimiento acadmico como los resultados acadmicos parciales
alcanzados por los estudiantes en el cursado de la carrera (regularizacin, aprobacin de las
asignaturas) en el tiempo previsto por el Plan de Estudios (Luque y Sequi, 2002). En este
estudio se ha tomado el rendimiento en sentido amplio (xito, retraso o abandono), no se ha
considerado el sentido estricto -notas o calificaciones-(Fita et. al, 2004). Se considera que,
conocer los factores asociados al rendimiento acadmico, da una idea del sentido y la
magnitud de algunas dimensiones referidas al estudiante.
En ese marco, el objetivo del trabajo que se presenta fue determinar la relacin entre
factores institucionales, pedaggicos y socioeducativos con el rendimiento acadmico de
los estudiantes de la carrera.


Desarrollo
A travs de un muestreo estratificado, se seleccionaron 64 estudiantes a los cuales se los
entrevist con un cuestionario semi-estructurado. La muestra corresponde a estudiantes de
las cohortes 2005 y 2006 que se encontraban cursando algn ao de la carrera en el 2011
(ao en el que se realizaron las entrevistas). Se analiz la dimensin convivencia (con quin
vive mientras estudia): solo, con amigo, con hermano, con familia, no contesta; nivel de
estudio del padre: primario, secundario, terciario, universitario incompleto, universitario
completo, fallecido, no contesta; ocupacin del padre: profesional o no, relacionada o no con
la carrera Ingeniera Agronmica, docente, otro; motivos de desaprobacin segn la opinin
del estudiante: no comprensin de los temas, no comprensin de las preguntas, falta de
articulacin entre tericos y prcticos, no poder responder a preguntas sobre temas
puntuales (finos/detalles), falta de estudio, problemas personales, nervios, otros. Teniendo
en cuenta que el plan de estudios vigente est compuesto por 40 materias obligatorias las
cuales enmarcan la trayectoria de los estudiantes por sus correlatividades, se consider
indicadora del rendimiento acadmico a la cantidad de materias aprobadas. Luego se la
categoriz de la siguiente manera: 0 a 7, 8 a 16, 17 a 27, 28 a 33 y ms de 33.
Para evaluar las relaciones entre las variables se realizaron tablas de contingencia y
pruebas de X
2
.Luego con las variables cuya relacin result significativa se realiz un
Anlisis de Correspondencias Mltiple. Se utiliz el software InfoStat versin 2013.

En la muestra analizada el promedio de materias obligatorias aprobada fue 18, con un rango
de 34. El 59% de los alumnos tiene entre 8 y 27 materias obligatorias aprobadas, slo un
5% tiene ms de 33 materias. Segn el trayecto terico del plan de estudios, los estudiantes
analizados deberan estar recibidos (a diciembre del 2011) o cursando quinto ao. Teniendo
en cuenta esta situacin el presente estudio muestra que en promedio tienen aprobadas
materias de primer, segundo y tercer ao, por lo tanto existe una importante distancia entre
el trayecto terico y la trayectoria real.
Se analiz luego la relacin entre los posibles factores que inciden en el rendimiento, en la
tabla 1 se presenta los resultados.
Tabla 1.Variables relacionadas con el nmero de materias aprobadas, prueba de Chi
Cuadrado y P-valor
Variables relacionadas con el nmero de
materias aprobadas
X
2
gl P-valor
Nivel de estudio del padre 21.59 24 0.6034
Ocupacin del padre 28.65 20 0.0948
Convivencia 34.14 16 0.0052
Motivos de desaprobacin de finales 30.08 24 0.1822

El rendimiento acadmico estuvo relacionado a su situacin de convivencia. Se observ que
alumnos que viven con un amigo o hermano tienen ms de 28 materias aprobadas a
diferencia de los que viven con la familia los cuales tuvieron menos de 7 materias
aprobadas.
Otro factor indicador del rendimiento fue la ocupacin del padre (P-valor = 0.0948) aunque la
relacin no fue significativa al 5%. Con esta variable ms la convivencia se realiz un biplot
a partir de un anlisis de correspondencias mltiples (Figura 1).


-1,14 -0,15 0,84 1,83 2,81
Eje 1
-2,59
-1,39
-0,20
0,99
2,19
E
j
e

2
8 a 16
Ms de 33
17 a 27
0 a 7
28 a 33
Amigo
Familia
Hermano
NC
Solo
Otros
No relacionado
Prof esional No Relacionado
Relacionado
Docencia
Prof esional Relacionado
8 a 16
Ms de 33
17 a 27
0 a 7
28 a 33
Amigo
Familia
Hermano
NC
Solo
Otros
No relacionado
Prof esional No Relacionado
Relacionado
Docencia
Prof esional Relacionado

Figura 1. Proyeccin de los factores (convivencia y ocupacin del padre) con nmero de
materias aprobadas en los ejes 1 y 2.
Se puede observar que estudiantes que conviven con un amigo o hermano y que tienen el
padre profesional tienen mejores niveles de rendimiento acadmico.

Bibliografia
Breininger, E; Rodrguez, P. (2004) Desempeo Acadmico de Estudiantes de segundo ao
de la Facultad de Ciencias Veterinarias: una aproximacin a sus causas. rea de Qumica
Biolgica, Facultad de Ciencias Veterinarias. UBA. InVet. 6(1): 159. Argentina: 1668-3498.
Vsquez, E. y Winkelried, D. (2003). Buscando el Bienestar de los pobres: Cun lejos
estamos?, 1era edicin. Centro de investigacin de la Universidad del Pacfico. Lima. 176-
207.
(2013) InfoStat versin 2013. Grupo InfoStat, FCA, Universidad Nacional de Crdoba,
Argentina. URL http://www.infostat.com.ar
Fita, E., Rodrguez, S. y Torrado, M. (2004). El rendimiento acadmico en la transicin
secundaria-universidad. Revista de Educacin. (334), 391-414.
Luque, E. y Sequi, J. (2002). Modelo Terico para la Determinacin del Rendimiento
Acadmico General del Alumno, en la Enseanza Superior. Documento presentado en el
Congreso Regional de Ciencia y Tecnologa NOA. 2002. Argentina.
(www.editorial.unca.edu.ar/NOA2002/Modelo%20Rendimiento%20Academico.pdf)
Pea, D. (2002). Anlisis de datos Multivariantes. Mc.Graw Hill. Espaa.



COMPARACIN DE LA MEDICIN DE PORCENTAJE GRASO
CORPORAL EN HUMANOS POR DOS MTODOS

ALBEZA RAMON
1
, SNCHEZ DIANA C.
2
, FONSECA MIRIAM
3

1
Servicio de Cardiologa. Hospital San Bernardo. Salta.
2
Ctedra de Bioestadstica. Facultad de Ciencias de la Salud de la Universidad Nacional de
Salta.
3
Ctedra de Enfermera Psiquitrica. Facultad de Ciencias de la Salud. Universidad
Nacional de Salta.

csanchez@unsa.edu.ar

RESUMEN
El sndrome metablico constituye la principal causa de morbimortalidad en los pases
desarrollados y en vas de desarrollo constituyndose en un verdadero desafo para el
equipo de salud, el diagnstico precoz es una meta fundamental en Salud Pblica. El
porcentaje graso corporal es uno de los criterios tiles para establecer factores de riesgo
cardiovascular. Este indicador puede obtenerse como consecuencia del ndice de Masa
Corporal as como por plicometra. Se aplicaron mediciones en mujeres dentro del personal
de enfermera del Hospital San Bernardo y se obtuvo el porcentaje graso por los dos
mtodos. No se encontraron diferencias estadsticamente significativas entre los mtodos
(t=1,74; p=0,0921). El 33% de las enfermeras presentaron % grasos superiores al 30% lo
que constituye la presencia de este factor de riesgo cardiovascular.

Introduccin
La aptitud morfolgica es evaluada con instrumentos como balanza, tallmetro,
antropmetros y cinta mtrica con los cuales se obtienen las medidas como el peso, la talla,
permetros y dimetros, posteriormente a partir de ellas se determinan la composicin
corporal y el somatotipo fundamentalmente desde el punto de vista de la salud
(Braguinsky,1999).
En el marco de un trabajo mas amplio donde se est construyendo una batera evaluativa
compuesta por criterios antropomtricos de riesgo metablico y cardiovascular, se determin
el % graso segn dos mtodos: el basado en el Indice de Masa Corporal (IMC) y el basado
en plicometra (Bowers, 1995).
Estos criterios responden al concepto de obesidad relacionado al aumento del porcentaje
graso acompaado no de un aumento del peso corporal total; de manera tal que pueden
haber obesos con peso normal (OPN).
El objetivo del presente trabajo fue evaluar si se presentan diferencias entre los mtodos de
medicin del porcentaje graso en enfermeras que trabajan en el Hospital San Bernardo de la
Ciudad de Salta a fin establecer la equivalencia o no de los mtodos.

Desarrollo
Materiales y mtodos: Se realiz un muestreo por conveniencia de las 32 enfermeras de
turno maana que de todas las invitadas a participar del estudio concurrieron
voluntariamente al rea de Medicina del Deporte del Servicio de Cardiologa del Hospital
San Bernardo, en el periodo del 15 al 30 de Abril de 2013. Entre numerosas variables
morfomtricas relevadas, se obtuvieron el peso y talla para la construccin del ndice de
Masa Corporal y el correspondiente clculo de % graso, adems de los Pliegues tricipital,
suprailaco y del muslo. Para esto se us calibre tipo Lange con rango entre 0 mm y 60 mm.
Se aplic una prueba t para el caso de muestras pareadas para establecer la significancia
de la medicin por los dos mtodos (=0,05).



La edad de las enfermeras involucradas en el estudio fue de 48,2 9,7 aos, con un mnimo
de 29 y un mximo de 61 aos cumplidos. Los indicadores estadsticos correspondientes al
grupo de enfermeras que intervinieron en el estudio, se presentan en la Tabla 1.

Tabla 1. Medidas de resumen para variables relevadas en 32 enfermeras.
El 33% de las enfermeras presentaron porcentajes grasos superiores al 30% segn los dos
mtodos.
Para el anlisis, de verific el supuesto de normalidad aplicando el Test de Shapiro Wilks
modificado, de modo que las variables porcentaje graso a partir de ndice de Masa Corporal
(p=0,0793) y porcentaje graso por plicometra (p= 0,0912). De las mediciones pareadas no
se obtuvieron diferencias estadsticamente significativas en el porcentaje graso obtenido a
travs del ndice Masa Corporal y el obtenido por las mediciones plicomtricas (t=1,74;
p=0,0921). Las variables se representaron en el Grfico 1.

%graso IMC
%graso plicometria
0,00
13,53
27,06
40,58
54,11
%

g
r
a
s
o
%graso IMC
%graso plicometria

Grfico 1. Diagrama de caja para porcentaje graso determinado por dos mtodos.

De estos resultados surge que la aplicacin de los dos mtodos de medida produce
resultados que no difieren significativamente, por lo que resultaran equivalente a la hora de
determinar este factor de riesgo metablico y cardiovascular, en mujeres de similares
caractersticas etarias y profesionales a las estudiadas.

Bibliografa
[1] Bowers/Fox. (1995) Fisiologa del Deporte. Edicin: 3 edicin, Editorial: Panamericana.
[2] Braguinsky Jorge. (1999) Obesidad, patogenia, clnica y tratamiento. Editorial: el ateneo.
[3] Wilmore/Costill. (2004) Fisiologa del esfuerzo y del deporte. Edicin: 5 edicin. Editorial:
Paidotribo.
VARIABLE n MEDIA DE CV MIN MAX MEDIANA Q1 Q3
IND.CINT/CAD 32 0,87 0,10 11,44 0,51 1,09 0,87 0,82 0,93
PER.CINT 32 91,79 12,16 13,25 65,50 109,00 91,50 84,40 100,00
DIAM.SAG. 32 21,26 3,59 16,88 14,00 27,00 20,50 19,00 24,00
IMC 32 29,70 5,72 19,24 18,39 39,20 29,36 46,04 34,41
%GRSO/SEG.IMC 32 40,40 8,22 20,35 24,48 52,64 42,01 33,42 45,40
%GRSO/SEG.PLIC. 32 39,06 6,79 17,39 23,41 50,98 40,07 36,61 43,32


MODELACIN DE LA ABUNDANCIA DE ECTOPRASITOS EN
ROEDORES MEDIANTE EL USO DE MODELOS LINEALES
GENERALIZADOS INFLACIONADOS DE CEROS

AVILA-PROSER VLADIMIR
1
, SILVA DE-LA-FUENTE MA. CAROLINA
2
, MORENO
LUCILA
2,
GONZLEZ-ACUA DANIEL
2

1
Ingenieria estadstica, Facultad de ciencia fsicas matemtica, Universidad de Concepcin
2
Fac. de Cs. Naturales y Oceanogrficas, Departamento de Zoologa, Universidad de
Concepcin

vavila@udec.cl

RESUMEN
Es comn encontrar experimentos que tengan la variable de respuesta de tipo conteo, sin
embargo, el GLM Poisson para la respuesta en algunos casos, el no incorporar variables o
la mala medicin de estas, puede ocasionar sobre dispersin por lo que se utilizan de
preferencia los modelos Quasi-Poisson y Binomial Negativo (BN). Pero en otros casos, la
variable de respuesta presenta una gran cantidad de ceros, estos se deben tanto a la
naturaleza del problema como a su realizacin. En tales casos, un problema con excesos de
ceros si se trabaja de forma usual puede dar estimaciones sesgadas o incluso influir en la
sobredispersin. En este trabajo se aplican diferentes modelos para tratar el problema de
cero aumentados, mediante los modelos GLM Poisson y BN, como tambin, modelos ZIP y
ZINB. Estos modelos se aplicaron con el fin de evaluar las comunidades de caros
asociados a Phyllotis darwini, un roedor con una amplia distribucin en Chile, determinando
las especies de caros asociadas a este roedor y estudiar cmo los factores biticos y
abiticos afectan la abundancia de estos. Se realizaron estacionalmente cuatro campaas
en el norte chico de Chile, visitando dos eco-regiones, Mediterrnea rida y Mediterrnea
Per-rida. Los roedores fueron medidos y se les extrajeron sus ectoparsitos. Mediante los
modelos ya mencionados se determin la influencia de los factores biticos (largo total,
ndice de condicin corporal y sexo) y abiticos (temperatura, humedad y pluviosidad), en la
abundancia de los caros.

Palabras clave: caros, roedores, ZIP, ZIBN, GLM, factores biticos y abiticos

Introduccin
En este estudio se pretenden evaluar las comunidades de caros asociados a Phyllotis
darwini, un roedor con una amplia distribucin en Chile, determinando las especies de
caros asociadas a este roedor y como los factores biticos y abiticos afectan la
abundancia de estos. Se realizaron estacionalmente cuatro campaas en el norte chico de
Chile, visitando cuatro localidades (Las Chinchillas, Fray Jorge, Llanos de Challe y Pan de
Azcar), pertenecientes a dos eco-regiones, Mediterranea-ariday Mediterranea Per-arida.
Los roedores fueron capturados, sedados y se le extrajeron los ectoparsitos.

Desarrollo
Por un periodo de un ao se realiz un total de cuatro campaas de muestreo (otoo
invierno primavera - verano) en el norte chico de Chile, tomando en cuenta dos eco-
regiones, mediterrnea rida y mediterrnea per-rida. Cada una de las localidades fueron
visitadas estacionalmente durante un ao por un periodo de cuatro das. Los datos de
temperatura, humedad y pluviosidad fueron obtenidos desde Worldclim, trabajando con las
mnimas y mximas. Una vez sedado el roedor, se tomaron las medidas corporales (mm):
Largo total (LT), largo de oreja (LORE), largo de cabeza (Lca), largo de cola (LC), largo del
tarso (LTAR). Como se ha mencionado, la metodologa estadstica a utilizar consiste en la


aplicacin GLM con distribucin en la respuesta Poisson y Binomial Negativo y modelos
GLM inflacionados de ceros con distribucin Poisson y BN (de ahora en adelante ZIP y
ZINB). Para la variable de respuesta de la especie de ectoprasitos Fahrenholzi se ajust un
modelos ZINB despus de haber estudiado la sobredispersin en el modelo ZIP mediante el
test de razn de verosimilitud (p.valor= 0.00) y un AIC de 377.81 y 409.36 para el primer y
segundo modelo respectivamente. Se presenta a continuacin una tabla con las variables
ajustadas junto a los respectivos valores de significacin:

Estimacin y significacin para la parte de modelacin de conteo del modelo ZINB
Variable Estimacin Error estndar Pr(>|z|)
Intercepto 57.488 17.580 0.001
Ec. regiones Med.
Per-arida
-4.978 1.496 0.000
Temperatura -0.718 0.211 0.000
Humedad -0.708 0.196 0.000
LC 0.057 0.016 0.000
log(teta) -1.880 0.247 0.000

Estimacin y significacin para la parte de modelacin de ceros del modelo ZINB
Intercepto 158.904 294.247 0.589
Ec. regiones Med.
Per-arida
-162.528 202.372 0.422
Temperatura 29.618 36.262 0.414
Humedad -11.281 13.927 0.417
LC 1.549 1.908 0.417

Para la especie de ectoprasitos Bacoti, se procedi de la misma forma, pero a diferencia de
Fahrenholzi, no se encontr sobredispersin al aplicar el test de razn de verosimilitud
(p.valor = 0.5715). De igual manera que el modelo anterior, a continuacin se presentan las
variables ayudan a explicar la variable de respuesta junto a sus valores de significancia.

Estimacin y significacin para la parte de modelacin de conteo del modelo ZIP
Intercepto -0.144 1.593 0.927
Sexo (Macho) 0.569 0.302 0.059
CC 50.698 28.151 0.071
LC -0.032 0.012 0.011
LT 0.018 0.008 0.036



Estimacin y significacin para la parte de modelacin de ceros del modelo ZIP
Intercepto 2.548 1.921 0.18
Sexo (Macho) 0.685 0.403 0.08
CC 3.722 28.520 0.12
LC -0.030 0.009 0.34
LT 0.008 0.009 0.34

Podemos ver que para las dos variables se obtuvieron mejores resultados en los modelos
inflacionados de cero, los cuales para la especie Fahrenholzi se puede explicar mediante
alguno de los factores biticos y abiticos. A diferencia de la especie Bacoti, podemos ver
que tuvo mayor importancia los factores biticos. De esta forma, podemos explicar la
distribucin de los ectoparsitos y estudiar su comportamiento.

Bibliografa
[1] ALAIN F, ZUUR. 2009. Mixed Effects Models and Extensions in Ecology with R
[2] ALLRED, D. 1954. Mites as intermediate host of tapeworms. Proceedings of the Utah
Academy of Sciences Arts and Letters 31:44-51.
[3] BAZN-LEN, E. 2010. Ecologa parasitaria de dos especies de pequeos mamferos de
Chile, Abrothrix olivaceus (Rodentia: Cricetidae) y Thylamys elegans (Didelphimorphia:
Didelphidae). Tesis de Magster. Universidad de Chile. Santiago, Chile.
[4] CATTADORI, M.I., HAUKISALMI, V., HENTTONEN, H. & HUDSON, P.J. 2006.
Transmission ecology and the structure of parasite communities in small mammals. En:
Micromammals and macroparasites from evolutionary ecology to management. (Eds.
Morand S., Krasnov B.R., Poulin, R.), pp. 349 369. Springer-Verlag, Tokyo, Japan.
[5] COFR, H. & MARQUET, P.A. 1999. Conservation status, rarity, and geographic
priorities for conservation of Chilean mammals: an assessment. Biological Conservation
88(1):53-68.



ESTUDIO COMPARATIVO DE LA DINMICA DEL CRECIMIENTO DE
UNA POBLACIN PLAGA A TRAVS DE MTODOS DE CONTROL
BIOLGICO, UTILIZANDO MODELOS LINEALES GENERALIZADOS
Y ANLISIS DE SOBREVIVENCIA

FILIPPINI, OLGA SUSANA
1,2
; DELFINO, HUGO
1
; GIORGINI, DIANA
1,2

1
Departamento de Ciencias Bsicas, Divisin de Estadstica, Universidad Nacional de Lujn.
Bs As. Argentina
2
Departamento de Mtodos Cuantitativos, Facultad de Agronoma, Universidad Nacional de
Buenos Aires. Argentina

sfilippini@unlu.edu.ar

RESUMEN
Las plagas insectiles ocasionan una serie de daos directos e indirectos sobre los productos
almacenados generando prdidas cuantitativas y cualitativas. El control que se lleva a cabo
sobre estas plagas es a base de productos qumicos, pero la contaminacin ambiental, la
presencia de residuos txicos en los alimentos y la generacin de plagas resistentes a
productos sintticos debido al uso inadecuado de estos ltimos, hacen de este sistema de
manejo un problema y motivan la bsqueda de sistemas alternativos de control que sean
sustentables con el medio ambiente y no comprometan la salud humana. Los efectos de
metabolitos secundarios presentes en los vegetales pueden ser una opcin para establecer
un manejo integrado. Este trabajo tiene por objetivo evaluar el poder insecticida de
metabolitos presentes en Chenopodium album sobre Oryzaephilus surinamensis L.
sustituyendo una parte de la dieta base con polvo de hojas e inflorescencia y la mezcla de
ambas en distintas concentraciones. Se detectan diferencias significativas entre los
tratamientos en el nmero de pupas deformes. Las curvas de sobrevivencia tambin difieren
a lo largo del tiempo.

Palabras clave: control biolgico, modelo lineal generalizado, sobrevivencia.

Introduccin
Los granos cosechados y llevados a depsito pasan a formar un nuevo ecosistema donde
interactan factores biticos (insectos, caros, roedores, etc.) y abiticos (temperatura,
humedad). Se produce un deterioro del producto debido a causas fsicas (temperatura y
humedad), tcnicas (estado del grano, condiciones de almacenamiento, duracin, etc.) y
biolgicas (hongos, bacterias, insectos, roedores) que ocasiona prdidas anuales de
millones de dlares. (CREA, 1996).
Se conocen 250 especies de insectos plagas de granos almacenados, de las cuales 25 son
de importancia primaria y secundaria. (FAO, 2001) Estos se caracterizan por su enorme
capacidad de reproduccin, pudiendo en condiciones ideales invadir una bodega o lugar de
almacenamiento afectando los productos que all se encuentran. Los insectos adultos
devoran en una semana su peso en granos y las larvas varias veces su peso en las tres a
cuatro semanas que dura el estado segn el insecto. (FAO, 2001).
El uso inadecuado de los distintos mtodos convencionales de control de plagas han
generado varios inconvenientes, entre ellos resistencia de plagas a productos sintticos
(Collins et al, 1993; Prickett et al, 1990), trastornos en la salud y el medio ambiente y efectos
adversos sobre especies benficas (Tembo et al, 1995).
Una alternativa de manejo de plagas de granos almacenados es el uso potencial de
productos naturales extrados de plantas aromticas y malezas. En los tejidos vegetales hay
ciertas sustancias que actan como seales o mensajeros de disuacin, produciendo


efectos repulsivos, antialimentarios, txicos, alteraciones de la fisiologa y/o comportamiento
sexual o poblacional de insectos. El potencial de productos naturales que pueden usarse por
sus propiedades biolgicas particulares como herbicidas, plaguicidas, inhibidores del
crecimiento, etc. es prcticamente inagotable (Panizzi et al, 1991). Se aplican diferentes
tcnicas en los ensayos experimentales (Quinn, G. & Keough, M ,2002). Estas sustancias de
origen vegetal si bien son muy txicas para algunos insectos, generalmente no dejan
residuos de larga duracin para el hombre y otros animales (Daridson, 1992) permitiendo
un manejo sustentable del agroecosistema.
Chenopodium album es una planta anual, herbcea, erguida, maleza de cultivos como la
papa, trigo, girasol, arroz, lino; tambin aparece en montes frutales, huertas y viveros. Se
encuentra distribuda por todo el mundo, en Argentina est ampliamente difundida desde La
Rioja hasta Santa Cruz.
El objetivo de este trabajo que es parte de un estudio ms general dnde se evalan todos
los estados del insecto plaga, es evaluar el poder insecticida de metabolitos presentes en
Chenopodium album sobre Oryzaephilus surinamensis L., comparando distintos mtodos
de preparacin segn un modelo lineal generalizado, considerando el nmero de pupas que
nacen deformes del insecto plaga, luego de la aplicacin de los distintos tratamientos.
Peridicamente se estudian las larvas y pupas hasta que alcanzan el estado adulto para
determinar la dinmica del crecimiento de esta poblacin plaga a travs del estudio de su
funcin de sobrevivencia.

Desarrollo
Se utilizan insectos adultos de O. surinamensis L. provenientes de cepas criadas bajo
condiciones de temperatura y humedad controladas y con una dieta base compuesta por
fcula de maz, harina de trigo y levadura en polvo. Se aplican 10 tratamientos en un diseo
completamente aleatorizado con tres repeticiones: Tratamiento 1: Testigo. Tratamiento 2:
Hoja 10%. Tratamiento 3: Hoja 20%. Tratamiento 4: Hoja 30%. Tratamiento 5:
Inflorescencia 10%. Tratamiento 6: Inflorescencia 20%. Tratamiento 7: Inflorescencia 30%.
Tratamiento 8: Mezcla 10%. Tratamiento 9: Mezcla 20%. Tratamiento 10: Mezcla 30%.
En la primera etapa del estudio, se contabiliza peridicamente el nmero de individuos
adultos muertos y la presencia de larvas. Estas larvas son separadas de los adultos en
cada observacin, colocndolas en frascos de vidrio de 3 cm. de dimetro y 3 cm. de altura.
Se continan observando, las pupas en que se convirtieron las larvas, durante 35 das,
contabilizando cada 7 das , cuantas pupas presentan deformaciones, para determinar la
dinmica del crecimiento de esta poblacin plaga a travs del estudio de sus funciones de
sobrevivencia, luego de la aplicacin de los tratamientos. En este trabajo, se comparan los
distintos tratamientos a partir de la etapa en que las larvas aisladas de los adultos llegan al
estado de pupas, siendo el evento de inters el nmero de pupas deformes, presentando
alteraciones de su comportamiento que disminuirn los efectos perjudiciales de esta plaga.
En el anlisis del modelo que siguen los datos se consider como variable respuesta el
nmero de pupas deformes, como factor los tratamientos, usando como covariable el
tiempo. Considerando que el uso de modelos lineales (es decir, asumiendo varianza
constante y errores normales) puede no ser adecuado ante datos de conteo, se decide
usar, un Modelo Lineal Generalizado con una distribucin de errores de tipo Poisson.
La funcin de vnculo de tipo logartmico asegura que todos los valores predichos sean
positivos, mientras que la distribucin de errores de tipo Poisson tiene en cuenta el hecho de
que los datos son enteros y que la varianza aumenta proporcionalmente a la media.
Para el estudio de la dinmica de las poblaciones de las larvas que llegan al estado de
pupa, se utiliza tablas de Vida. El tiempo de observacin fue dividido en intervalos de 7 das,
siendo las larvas que se convirtieron en pupas y que posteriormente pasaron al estado de
pupas deformes, las etapas de estos insectos considerados para este trabajo.
Para analizar las funciones de sobrevivencia del insecto plaga segn los distintos
tratamientos se utiliz el test de Gehan.



Ambos factores considerados en el modelo Lineal Generalizado resultaron significativos( p<
0.01) (Tabla 1).
Tabla 1: Contrastes de los efectos del modelo

Origen Tipo III

Chi-
cuadrado
de Wald gl Sig.
(Interseccin) 175,963 1 ,000
Trat 126,439 9 ,000
Tiempo 366,739 1 ,000
Variable dependiente: Pupas Deformes
Modelo: (Interseccin), Trat, Tiempo

A los 35 das de observacin considerando las pupas provenientes de larvas aisladas de
adultos de la especie O. surinamensis L, los tratamientos que mayor cantidad de pupas
deformes produjeron fueron los tratamientos a una concentracin del 30 % con hoja y
Mezcla de hojas e inflorescencia (Tratamientos 4 y 10), no presentando diferencias entre
ellos- Estas diferencias no son significativas a los 21 das de observacin. Asimismo los
tratamientos menos eficientes resultaron ser los preparados a un 10 % de concentracin, en
hoja, inflorescencia mezcla de ambas.( tratamientos 5, 2 y 8).
En cuanto al estudio de sobrevivencia, de acuerdo a las Tablas de Vida, los tratamientos
con menor porcentaje de sobrevivencia del insecto plaga, fueronT4y T10, las funciones de
sobrevivencia en inflorescencia mezcla a una concentracin del 20% no se diferencian de
estas dos- El mayor porcentaje de sobrevivencia se presenta en los insectos con tratamiento
testigo(Figura 1)

Bibliografa
[1] Daridson (1992). Plagas de Insectos Agrcolas y del Jardn. Editorial Limusa-Noriega.
Pg.: 89-90, 120-121.
[2] FAO (2001). Breves normas de control de calidad en granos almacenados. Captulo 8.
faoinpho.org/biblioteca/paquete_poscosecha/normas.htm.
[3]M.Kry (2010). Introduction to Winbugs for Ecologists: Bayesian Approach to Regression,


Anova, Mixed Models and Related Analyses. Academic Press. Captulo 6: 57-89 pp.
[4] Quinn, G. & Keough, M (2002). Experimental Design and Data Analysis for Biologists.
Cambridge University Press. Captulos 10 y 11: 262-338 pp.


DISEOS PTIMOS PARA MODELOS CON RESPUESTA BETA EN
MODELAMIENTO CONJUNTO DE MEDIA Y PRECISIN

MARIA FERNANDA ZRATE
1
, LUIS ALBERTO LPEZ
2

1
Estudiante de Maestra, Departamento de Estadstica, Universidad Nacional de Colombia
2
Profesor Titular, Departamento de Estadstica, Universidad Nacional de Colombia

mfzaratej@unal.edu.co

RESUMEN
En este trabajo se propone un uso del teorema general de equivalencia para la construccin
de diseos D-ptimos continuos para datos que siguen una respuesta en proporcin
continua, teniendo en cuenta de forma simultnea estructuras de regresin para la media y
el parmetro de precisin. Lo anterior teniendo en cuenta la similitud entre la matriz de
informacin para modelos con observaciones multivariadas y aquella para el modelo de
regresin beta doblemente generalizado. Se hace uso de esta teora para encontrar los
niveles ptimos de exploracin, cuando se tiene un factor de clasificacin. Como en general
los diseos ptimos no lineales dependen de los valores de los parmetros a ser estimados,
se construirn diseos localmente ptimos. Se construye el diseo D-ptimo para un
conjunto de datos provenientes de un ensayo en el rea de fitomejoramiento.

Palabras clave: Distribucin beta, diseos ptimos, modelo doblemente generalizado,
teorema de equivalencia, funcin trigama.

Introduccin
El modelamiento de tasas y proporciones continuas bajo la distribucin beta ha despertado
inters dentro de la comunidad estadstica, por lo que actualmente se puedan encontrar
varios artculos referentes al tema e incluso rutinas dentro de paquetes estadsticos que
soportan el problema de estimacin, sin embargo la etapa del diseo an no ha sido
ampliamente explorada.
Con este trabajo se pretende brindar una iniciativa en este campo desde la perspectiva del
diseo experimental ptimo y los diseos generados computacionalmente, siendo esto
posible mediante la propuesta de una adaptacin del teorema general de equivalencia para
observaciones multivariadas propuesto por Kiefer en 1959 para modelos de regresin beta
con modelamiento conjunto de media y precisin.
Para ilustrar el funcionamiento de los disenos D-ptimos, se plantea la utilizacin de estos
para datos provenientes del rea de fitomejoramiento, este campo de la biologia trata de
crear vegetales con caractersticas mejoradas, en este caso, especficamente se quiere
investigar la resistencia a los fungicidas. La utilizacin de los diseos aqu propuestos
ayudara a esta rea en tanto que el plan experimental creado asegurara una mejor
inferencia.

Diseo D-ptimo Continuo para el Modelo de Regresin Beta
La teora del diseo experimental ptimo se ocupa de decidir cuntos y en qu puntos del
espacio de las variables explicativas se debe llevar a cabo el experimento, de forma tal que
se obtenga la mxima informacin acerca de este, procurando mejorar la inferencia del
modelo mediante la obtencin de estimaciones ms precisas de los parmetros.
Formalmente un diseo ptimo es una medida de probabilidad con soporte finito bajo un
espacio compacto , representada por



la primera lnea corresponde a los tratamientos que sern efectuados (puntos del diseo)
y la segunda lnea a la frecuencia o peso con que se realizar cada uno de ellos, luego
. El criterio de D-optimalidad busca hallar el diseo tal que maximice el
determinante de la matriz de informacin, lo que equivale a minimizar la varianza
generalizada de los estimadores mximos verosmiles de los parmetros. El diseo D-
ptimo no es nico por tanto para la comparacin entre diseos se hace uso de la medida D
eficiencia relativa la cual se define como

Donde es el nmero de parmetros del modelo para el cual se quiera crear el diseo. Por
ejemplo un valor de indica que el diseo necesitar el doble de corridas
experimentales para que resulte ser tan eficiente como en diseo .[1]

Para el modelo de regresin beta la matriz de informacin es de la forma donde es
la matriz diseo y es una matriz simtrica cuyos elementos dependen de los predictores
de la media y de la precisin. (Para una completa especificacin del modelo ver [2]). Dado
que los parmetros de la distribucin beta no son ortogonales, tal matriz no es diagonal en
bloques, por tanto el diseo para el modelo conjunto no podr ser obtenido a partir de los
diseos marginales de la media y la precisin.

La matriz de informacin para observaciones multivariadas puede ser expresada como la
suma de matrices de informacin, esta misma expresin en trminos de suma de matrices
puede tenerse para el modelo de regresin beta mediante una sencilla descomposicin.
Esto sugiere que el teorema general de equivalencia para observaciones multivariadas
puede ser aplicado para el modelo de regresin beta. Tal teorema establece la equivalencia
entre las siguientes tres condiciones:[3]

Sean y las matrices de informacin para el diseo y para un conjunto de
variables diseos , respectivamente, definidas sobre una regin diseo compacta .

1) El diseo maximiza (minimiza ) entre todos los posibles diseos .
2) El diseo minimiza el mximo de
3) En los puntos de soporte de , . Con igual al
nmero de parmetros del modelo.

La ltima condicin provee una herramienta para verificar cuando un diseo propuesto es
ptimo y de esta forma da la base para la creacin de algoritmos para la construccin de los
mismos. Ntese que la notacin para las matrices de informacin incluyen el vector de
parmetros , lo cual resalta el carcter de localidad en los diseos.
A continuacin, se ilustran las ideas anteriores realizando una aplicacin en el rea de
fitomejoramiento, el algoritmo utilizado es el algoritmo intercambiable de primer orden.[3]

Resultados
Se considera la aplicacin a un estudio en el rea de fitomejoramiento, que tiene por inters
evaluar la severidad del dao del cultivo de banano Musa sp producido por el hongo
'mychospharella muscicola' tras la aplicacin de cuatro diferentes concentraciones (lt ha)
del fungicida Kinquel Cobre (Quelato de Cobre) que van de 0 lt ha a 1 lt ha.



El diseo con el cual fueron tomados los datos es . Tras sucesivos
ajustes1 el que reporto un mejor fue:

Si se desean realizar posteriores ensayos con el mismo fungicida, el ajuste del anterior
modelo proporcionara una gua en cuanto al modelo a asumir para la creacin del plan
experimental. En este problema la exploracin se realiza sobre una nica regin diseo
ya que se estn considerando las mismas variables explicativas para la media y la
precisin. Asumiendo el anterior modelo el diseo resultante es
. La D eficiencia de este diseo frente al original ( ) es de
1.10 lo que indica que este diseo resulta ser aproximadamente 10% ms eficiente.
Para estudiar la robustez del diseo ante la mala especificacin de los efectos de los
trminos del modelo, se construyeron otros diseos bajo los siguientes tres escenarios:

Reduccin en el efecto de la concentracin sobre la dispersin:
Reduccin en el efecto de la concentracin sobre la media:
Reduccin del efecto de la concentracin sobre la media y dispersin

Las D eficiencias de los anteriores diseos con respecto al original son 1.14 y 1.12, para
, respectivamente. Segn lo anterior, para este contexto de datos, parecen ser ms
eficientes diseos que ponen ms peso en los extremos de la regin diseo y menos en los
puntos centrales, siendo los pesos de los extremos aproximadamente iguales en todos los
casos; si se asumen efectos grandes para todos los trminos, el diseo requiere ms
puntos de diseo. Para posteriores ensayos con el mismo fungicida se propondra el uso de
los diseos D-ptimos para la creacin del plan experimental, ya que estos son ms
eficientes.

Conclusiones
Los diseos aqu propuestos pueden ser una valiosa herramienta para la planeacin de
experimentos para datos restringidos a algn intervalo cerrado, en especial cuando los
recursos de este sean limitados.
Se debe ser cuidadoso al usar estos diseos, ya que al igual que los dems diseos
alfabticamente ptimos son ptimos frente a un nico criterio, en tanto que otros diseos
como los sugeridos por la metodologa de superficies de respuesta son ptimos para una
mayor cantidad de criterios, sin embargo al no haber aun en la literatura estudios de estos
diseos para el modelo beta, los diseos D-ptimos constituyen un buen acercamiento al
desarrollo en el rea.
Dado que los diseos que se generen dependen de la especificacin de las funciones de
enlace y de los parmetros a estimar, se debe realizar un estudio amplio para conocer el
comportamiento de los diseos ante malas especificaciones de los factores mencionados
as como la variacin de estos cuando se tienen diferentes regiones diseo.

Bibliografa
[1] Atkinson, A. y Donev, A. (2007). Optimum Experimental Designs, with SAS. First, United
States.
[2] Simas, A. (2010). Improved estimators for a general class of beta regression models.
Computational Statistics and Data Analysis, vol(54): 348-366.

1
. Estimaciones realizadas con el paquete betareg del software R.


[1] Fedorov, V. y Studden, W. (1972). Theory of Optimal Experiments. First, United States.
[3] Wu, Y. (2005). Optimal design for dose response using beta distribuited responses.
Journal of Biopharmaceutical Statistics, vol(15): 753-771.


CARACTERIZACIN ESPACIAL DE VARIABLES FISICOQUMICAS
EN CINAGA DE LAS QUINTAS UBICADA EN CARTAGENA,
COLOMBIA

DAIRA LUZ VELANDIA
1
, ILIANA MARA PATERNINA
2
, ALESSANDRA FARIAS
3

Y JUAN CARLOS VALDELAMAR
4

1
Docente. Facultad de Ciencias Bsicas. Universidad Tecnolgica de Bolvar. Cartagena-
Colombia . Estudiante de doctorado. Departamento de Estadstica. Universidad de
Valparaso. Valparaso-Chile
2
Docente Ctedra. Facultad de Ciencias Bsicas. Universidad Tecnolgica de Bolvar.
Cartagena-Colombia
3
Estudiante de doctorado. Departamento de Estadstica. Universidad de Valparaso.
Valparaso-Chile
4
Docente Investigador. Fundacin Universitaria Tecnolgico Comfenalco. Cartagena-
Colombia

dairavm@gmail.com
alessach@gmail.com

RESUMEN
Con el propsito de caracterizar el comportamiento espacial de algunas variables
fisicoqumicas en la cinaga de las Quintas de Cartagena, Caribe Colombiano, se
efectuaron jornadas de muestreo, en el que se obtuvieron observaciones que
posteriormente fueron analizadas mediante tcnicas geoestadsticas. Se evalu la estructura
de correlacin espacial de las variables mediante la construccin de semivariogramas
experimentales, se aplic la tcnica de kriging con el fin de predecir valores de las variables
en lugares no muestreados y se plante un modelo donde se evidenciara el efecto de las
variables fisicoqumicas medidas con la calidad del agua (oxgeno disuelto). Las variables
salinidad y conductividad presentaron un comportamiento homogneo a lo largo de la
cinaga, mientras que para el oxgeno disuelto y la transparencia el comportamiento fue
heterogneo, mostrndose un gradiente de distribucin en sentido creciente desde el
mercado de Bazurto hacia la Baha de Cartagena, lo cual pone en evidencia la influencia de
las actividades antrpicas que se desarrolla en este sector, sobre las condiciones
ambientales de este humedal.

Palabras claves: mapas de distribucin, kriging, correlacin espacial,
semivariogramas.

Introduccin
La heterogeneidad espacial que se presenta en los ecosistemas, es una caracterstica que
ha sido reconocida desde el comienzo del desarrollo de la misma ecologa, sin embargo la
cuantificacin del grado y escala espacial que se presentan en algunos hbitats o conjunto
de variables biolgicas, ecolgicas o fsicas no haba sido necesario hallarlas debido a que
a simple vista esta heterogeneidad era percibida, predicindose el comportamiento espacial
de las mismas de manera visual (Gallardo 2006). El tratamiento geoestadstico de datos
ambientales, es una labor que tiene sus fundamentos en la naturaleza de dependencia
espacial implcita que hay dentro de este tipo de datos permitiendo describir la continuidad
espacial de fenmenos naturales (Moral 2004). Hoy en da ya se poseen muchas de estas
herramientas, bien estructuradas y de fcil utilizacin impulsado tambin por el desarrollo de
los sistemas de informacin geogrfica (SIG), cuyo avance ha hecho posible la visualizacin


y manipulacin relativamente sencilla de datos georreferenciados (Gmez-Martnez et al
2000).
En Colombia se han adelantado varias investigaciones de estudios medioambientales que
evidencian el uso de las herramientas geoestadsticas con el fin de encontrar patrones que
relacionen la ubicacin geogrfica de las variables de inters y la presencia y/o ausencia de
las mismas (Giraldo et al 2000, Meja et al 2007).

Mtodos
El conjunto de datos utilizados en el presente anlisis fue tomado en la cinaga las Quintas,
ubicada al suroccidente de la ciudad de Cartagena de Indias, el 1 de mayo del ao 2012.
Los datos recolectados a nivel superficial de la cinaga, corresponden a las variables fsico-
qumicas oxgeno disuelto (mg/l), pH, temperatura (C), conductividad (mS/cm), slidos
totales disueltos (mg/l) y salinidad (ppm); estas variables se midieron con ayuda de un
multiparmetro Hanna HI 9828. Igualmente en cada uno de los 103 puntos muestreados, se
registr la profundidad (cm) y transparencia (cm) con ayuda de un disco Secchi, siguiendo la
metodologa propuesta por Rueda-Delgado (2002). Las coordenadas geogrficas de cada
punto se registraron mediante el GPS Garmin eTrex Vista. Posterior al registro de las
variables, los datos obtenidos se tabularon en hojas electrnicas del programa
computacional Excel de Microsoft, para luego procesarlos mediante el paquete estadstico
R; a travs del cual se generaron anlisis exploratorios de los datos, identificacin de
tendencias y caractersticas de las variables de inters que pudieran, de alguna manera,
evidenciar un comportamiento global en el sistema, seguidamente para la descripcin de la
estructura espacial, se realizaron los semivariogramas experimentales buscando el modelo
de mejor ajuste (Cressie 1991, Mancera-Pineda et al 2003). Finalmente, con las variables
que evidenciaron estructura de correlacin espacial, se aplic la tcnica de kriging adecuada
(Stein 1999), cuyos resultados se usaron como soporte para elaborar los mapas de
distribucin, que proporcionaron evidencias del comportamiento espacial de las variables
medidas.

Resultados
En el resumen estadstico realizado se observ que las variables pH, temperatura,
conductividad, slidos totales disueltos y salinidad presentan un coeficiente de variacin
relativamente bajo, evidenciando un comportamiento homogneo en el sistema, contrario a
ello las variables profundidad, transparencia y oxgeno disuelto reflejan una mayor variacin,
indicando heterogeneidad en el comportamiento de las mismas.
Las variables conductividad y salinidad respecto a las coordenadas geogrficas de latitud y
longitud muestran una menor tendencia a lo largo de las direcciones lo que da indicacin de
que sus valores promedio pueden mantenerse constantes en el sistema.
Los dispersogramas rezagados se construyeron para las variables que evidenciaron una
mayor heterogeneidad a lo largo del cuerpo de agua y relevantes para la caracterizacin del
mismo. Estos dispersogramas mostraron un mayor coeficiente de correlacin lineal , a
distancias de 0 a 10 m, siendo la transparencia y el oxgeno disuelto los de mayor magnitud.
Lo anterior permite prever los resultados del clculo de los semivariogramas experimentales
y as mismo proporcionar las variables de mayor relevancia en el momento de establecer el
comportamiento espacial en el sistema.
Se seleccionaron las variables, transparencia, oxgeno disuelto y slidos totales disueltos
por su importancia en la caracterizacin del sistema, y teniendo en cuenta los resultados
antes mencionados. Los semivariogramas experimentales sugieren una estructura de
dependencia espacial, debido a que la semivarianza no se mantiene constante a medida
que la distancia vara. Adems, los modelos ajustados son acotados garantizando que la
varianza de los incrementos es finita (Samper & Carrera 1990, Biau et al 1997 citado en
Giraldo et al 2000). Los rangos obtenidos indican una fuerte estructura de correlacin
espacial para distancias prximas a los 7m, considerando tan slo las variables


transparencia, oxgeno disuelto y slidos totales disueltos, y justo estas tres son las que
presentan el mayor porcentaje de varianza explicada por el espacio (Gallardo 2006), de
manera que estas variables son relevantes para caracterizar a nivel espacial el sistema.
Finalmente, la tcnica de kriging pudo ser usada debido a la presencia de estructuras de
correlacin espacial, y por ser los modelos ajustados acotados se puede afirmar que las
variables transparencia, oxgeno disuelto y slidos totales disueltos cumplen con el supuesto
de estacionariedad fuerte (Biau et al 1997 citado en Giraldo 2009), los resultados de la
interpolacin espacial, se muestran en los mapas de distribucin espacial de las variables
seleccionadas los cuales muestran una clara tendencia en el espacio.

Bibliografa
BIAU, G., E. ZORITA, H. STORCH & H. WACKERNAGEL. 1997. Estimation of Precipitation by
Kriging in EOF Space of the Sea Level Pressure Field. Journal of climate 12:1070-1085.
CRESSIE, N. 1991. Statistics for Spatial Data. John Wiley & Sons, Iowa. 990p.
GMEZ-MARTNEZ, M., J. MONTERO-LORENZO & N. GARCA-RUBIO. 2000. Kriging methodology
for regional economic analysis: Estimating the housing price in Albacete. International
advances in economic research 6: 438-450.
GIRALDO, R., W. TRONCOSO, J. MANCERA & N. MNDEZ. 2000. Geoestadstica: una
herramienta para la modelacin en estuarios. Revista de la Academia Colombiana de
Ciencias Exactas, Fsicas y Naturales XXIV: 59-72.
MEJA-RIVERA, O., T. BETANCUR-VARGAS & L. LONDOO-CIRO. 2007. Aplicacin de tcnicas
geoestadsticas en la hidrogeologa del bajo Cauca antioqueo. Revista Dyna 74: 137-149.
SAMPER, F. & J. CARRERA. 1990. Geoestadstica: Aplicaciones a la hidrologa subterrnea.
Universidad Politcnica de Catalunya, Barcelona. 484p.
STEIN, M. 1999. Interpolation of spatial data: some theory for kriging. Springer. New York.
257p.


MODELO PARA LA DISPERSIN DE LA CLOROFILA EN EL LAGO
DE VALENCIA DE VENEZUELA, USANDO UNA TCNICA DE
PARTCULA LAGRANGIANA

ALESSANDRA FARIAS
1
, DAIRA LUZ VELANDIA
2
JOS RAFAEL LEN R
3
.

1
Valparaso-Chile
2
Valparaso-Chile
3
Profesor Titular. Departamento de Matemticas. Universidad Central de Venezuela.
Caracas-Venezuela

1
alessach@gmail.com
2
dairavm@gmail.com
3
jleon@euler.ciens.ucv.ve

RESUMEN
Los lagos son depsitos de masas de agua sin dinamismo, por ende poseen ecosistemas
que pueden ser alterados fcilmente por la contaminacin ocasionndose as restricciones
en el uso del agua, alteraciones en la fauna y la flora, apariencia y olores desagradables. Un
ejemplo de esta problemtica en Venezuela es el Lago de Valencia, el cual est siendo
afectado por la polucin producida por la actividad humana de sus alrededores.
En este trabajo de investigacin se plantea un modelo bidimensional que simula la
dispersin de contaminantes sobre el lago, basado en el uso de ecuaciones en derivadas
parciales, las cuales describen los fenmenos fsicos de la adveccin y difusin;
considerndose en primer lugar el estudio del modelo de partcula Lagrangiana y su
validacin a travs de experimentos fundamentados en el procesamiento de imgenes
satelitales.

Palabras claves: Lagrangiano, Coeficientes de Difusin, Ecuacin de Fokker Planck,
Imgenes Satelitales.

Introduccin
En la actualidad, los modelos matemticos son una herramienta imprescindible para el
estudio de fenmenos ambientales, tal como la propagacin de contaminantes en el aire o
superficies lquidas; estos ayudan a predecir las trayectorias de los contaminantes, lo que
permite la creacin de planes de contingencia que reduzcan los daos en el medio
ambiente. Un lugar apropiado para el estudio del transporte de contaminantes es el Lago de
Valencia, ya que en sus cercanas existen zonas industriales, en donde se generan
desperdicios sintticos que terminan siendo depositados en el lago, estos desperdicios
suelen tener altos contenidos de fosfato y enzimas que aceleran la reproduccin de la
clorofila, como consecuencia grandes cantidades de oxgeno son consumidas, causndose
as la muerte de los peces (eutrofizacin).

En el presente trabajo se implementa un modelo de rastreo de partculas para simular el
transporte de contaminantes sobre el Lago de Valencia en Venezuela; debido a la
eutrofizacin del lago, se hace nfasis en el transporte de la clorofila. El modelo est
constituido por una combinacin de esquemas determinsticos y estocsticos; cada partcula
se traslada con el uso de una velocidad advectiva obtenida del campo de velocidad de su


entorno y la difusin de cada partcula se encuentra usando la tcnica de caminata
aleatoria.

Los modelos de rastreo de partculas, se basan en la idea de representar a un contaminante
como un conjunto de partculas discretas, sometidas a procesos de crecimiento o
decaimiento y que se transportan gracias a la adveccin y difusin. Segn, R. V. Pearson y
R. W. Barber [14], tales modelos son consistentes, a diferencia de otros que se basan en
resolver la ecuacin de difusin y adveccin mediante aproximaciones por diferencia finita,
argumentan que este procedimiento presenta inconvenientes cuando se aplica sobre
sistemas dominados por la adveccin, existen sumideros o los gradientes de concentracin
del contaminante son altos.

Mtodos
La implementacin del modelo, fue llevada a cabo siguiendo los pasos que se muestran en
las secciones de a continuacin:

1. Extraccin del borde o contorno del Lago con el uso de Photoshop.
2. Extraccin de M puntos del borde del Lago y de su isla ms importante, obteniendo
as dos matrices con las coordenadas de estos puntos.
3. Obtencin de una malla triangular uniforme.
4. Obtencin de una malla triangular no uniforme.
5. Generacin de una malla curvilnea.
6. Estimacin de coeficientes de difusin.
7. Obtencin de velocidades y georreferenciacin del lago.
8. Construccin de la batimetra del lago (Aplicacin de tcnicas de interpolacin-
Kriging).
9. Desarrollo del modelo.
10. Validacin del modelo mediante la comparacin de imgenes satelitales.

Resultados
Las velocidades de las aguas del lago y los coeficientes de difusin son factores
fundamentales; estos influyen directamente en el desplazamiento de las partculas. Otro
elemento importante, es la funcin de sealamiento del lago, pues impidi que las partculas
se escaparan del dominio que conforma el lago.

En la fase experimental, se posicionaron partculas de acuerdo a la densidad de la clorofila
observada en una imagen satelital de Julio 2002, se ejecut el modelo por un perodo de
tres meses y el resultado se compara con otra imagen satelital correspondiente a Julio 2002;
la distribucin de la clorofila arrojada por el modelo se asemeja a la observada en la imagen
del mes de Julio.

Conclusiones
Los modelos de rastreo de partculas, como el construido, son eficientes por mostrar
mediante animaciones el trayecto completo de un fluido. Se espera que este trabajo de
investigacin motive la elaboracin de otros similares y que sea una herramienta que
contribuya a minimizar los daos ocasionados por la contaminacin, mediante la elaboracin
de planes de contingencia.

Bibliografa
[1] Amoretti Vidal Jess Esteban, Solucin numrica de la ecuacin de Laplace y su
aplicacin a potenciales elctricos, Universidad Nacional de Ingeniera, Per, 2007, pp.1-5.
[2] An Introduction to Mesh Generation, Technical University of Denmark, 2009, pp. 6-44,
Pgina Web: http://www2.imm.dtu.dk/ apek/DGFEMCourse2009/Lecture06.pdf.
[3] Curso Introductorio a la Geomtica, Instituto de Ingeniera, Venezuela, 2009, pp. 1-67.


[4] E. B. Welch, T. Lindell, Ecological effects of wastewater: applied limnology and pollution
effects, Spon Press, London, 1980.
[5] G. S. Bhat y A. Krothapalli, Simulation of a Round Jet and a Plume in a Regional
Atmospheric Model, AMS Journals, Vol. 128, The Florida State University, 2000.
[6] G. T. Csanady, Turbulent diffusion in the environment, Springer, Luwer Academic
Publishers, Holland, 1973.
[7] I. A. Fernndez, Las Coordenadas Geogrficas y la Proyeccin UTM, Universidad de
Valladolid, Espaa, [s.a], pp. 4-15.
[8] J. A. Fay, Mecnica de Fluidos, Compaa Editorial Continental, Mxico, 1996.
[9] J. Len, Aplicacin del clculo estocstico en el modelaje del esparcimiento de
contaminantes en la superficie del agua, Tutores: (M. Colina y J. R. Len), Universidad
Central de Venezuela, 2008.
[10] M. S. Milgram, Does a point lie inside a polygon?, Journal of Computational Physics,
Vol. 84, 1989.
[11] Isabel Albarracn, Gabriela Po, Ruth Salomn y Marcela Cravero, Inhibicin del
Crecimiento de Chlamydomonas SP. por la Sal Isopropilamina de N-(Fosfonometil)Glicina,
Universidad Nacional de la Patagonia, Argentina, [s.a], pp. 3-4.
[12] Remacle Jean Francois, An introduction to Mesh Generation, Department of Civil
Engineering, Universit catholique de Louvain, Belgium, [s.a], pp. 1-40.
[13] Reynolds C. S, The ecology of freshwater phytoplankton, Cambridge Univ. Press, p.
384, 1984.
[14] R. V. Pearson, R. W. Barber, Modelling depth-integrated contaminant dispersion in the
Humber Estuary using a Lagrangian particle technique, University of Salford, United
Kingdom, 1995.
[15] T. Mikosch, Elementary Stochastic Calculus, University of Groningen, World Scientific,
Holanda, 1998.
[16] Y. Saad, Iterative Methods for Sparse Linear Systems, WPS, 1996.
[17] Yuan-Hui Li, Vertical Eddy Diffusion Coefficient in Lake Zurich, Birkhauser Verlag
Basel, Vol 35, EAWAG, ETH, 1973.
[18] Y. Obayashi, T. Isobe, A. Subramanian, S. Suzuki and S. Tanabe,Teasing out the Non-
Linearity in the POPs-Phytoplankton Bioconcentration Processes, Centre for Marine
Environmental Studies, Japn, 2009, pp. 11-18.



EFICACIA DEL USO DE LA VENTILACIN NO INVASIVA EN LA UTIP
DEL HOSPITAL CASTRO RENDN: ANLISIS BAYESIANO DE
PREVENIR EL USO DEL RESPIRADOR MECNICO ARTIFICIAL

MORELLI, CANDELARIA
1
, CARO, PATRICIA
1
, FIGUEROA, LAURA
2

1
UNCo, Facultad de Economa y Administracin, Departamento de Estadstica
2
Hospital Castro Rendn, Unidad de Terapia Intensiva Peditrica

candelariamorelli@gmail.com

RESUMEN
La insuficiencia respiratoria es uno de los principales motivos por el que los nios pueden
ser ingresados en una unidad de terapia intensiva peditrica (UTIP). Para disminuir las
complicaciones asociadas a la ventilacin mecnica se est empleando cada vez ms la
ventilacin no invasiva (VNI), la tcnica ms extendida es la VNI con presin positiva
(Continuos Positive Air Pressure, CPAP). Su principal ventaja es evitar la intubacin
intratraqueal y la traqueotoma. En el hospital Castro Rendn de Neuqun se realiz un
estudio descriptivo, longitudinal, retrospectivo durante 18 meses y sin considerar un grupo
control a pacientes de 1 a 24 meses de edad o peso menor de 13 Kg, con diagnstico de
infecciones respiratorias agudas bajas (IRAB) que fueron conectados en forma precoz al
CPAP. La falla del tratamiento fue haber requerido asistencia respiratoria mecnica. Los
resultados se analizaron con mtodos Bayesianos, utilizando informacin de un estudio
similar realizado en el hospital Garrahan de Buenos Aires para seleccionar una distribucin
previa. Se eligieron tres distribuciones a priori de la familia de distribuciones beta con los
parmetros a y b para la tasa de xito. Se construyeron intervalos de credibilidad y clculos
de probabilidad correspondiente. Todos los intervalos de mxima densidad que acumulan el
95% dieron por resultado valores superiores a 0,55. La probabilidad de superar a 0,5 dio 1
(suceso seguro) en todos los casos. Por lo tanto, el uso de VNI previene el uso del
respirador mecnico en ms del 50% de los casos y puede ser una alternativa a la
ventilacin mecnica convencional en determinados pacientes peditricos con IRAB.

Palabras clave: anlisis bayesiano, ventilacin no invasiva, pediatra, IRAB.

Introduccin
El fallo respiratorio implica un inadecuado intercambio de oxgeno y/o dixido de carbono
que puede ser debido a lesin pulmonar, fallo cardaco, enfermedades neurolgicas,
musculares o fallo multiorgnico, entre otras causas. Estos pacientes con frecuencia
requieren ventilacin mecnica para mejorar el intercambio gaseoso y disminuir el trabajo
respiratorio [1]. En Argentina, las IRAB ms frecuentes en la infancia son la bronquiolitis y la
neumona. Representan la 5 causa de muerte en nios entre 1 y 4 aos y el 4 lugar en los
menores de 1 ao [2].
Para disminuir las complicaciones asociadas a la ventilacin mecnica se est empleando
cada vez ms la ventilacin no invasiva (VNI). Su principal ventaja es evitar la intubacin
intratraqueal y la traqueotoma, y disminuir secundariamente el riesgo de neumona
asociada a ventilacin mecnica y las necesidades de sedacin y permitiendo en ocasiones
la alimentacin oral [1]. As pues, supone un nuevo paradigma que rompe el axioma por el
cual todo paciente con insuficiencia respiratoria moderada/grave precisa intubacin traqueal
y conexin a un respirador [3].
Actualmente, la tcnica ms extendida es la VNI con presin positiva (CPAP) y la aplicacin
de esta tcnica ventilatoria en adultos tiene casi 20 aos de evolucin, pero su introduccin
en el paciente peditrico se inicia a mediados de los aos 90 en Estados Unidos.
Recientemente, se ha publicado el primer ensayo clnico peditrico que demuestra la


eficacia de la tcnica en el paciente agudo en UTIP. Desde entonces esta nueva modalidad
de ventilacin asistida se est empleando cada vez ms en pacientes peditricos con
insuficiencia respiratoria de distinta etiologa [1] [3].
La ventilacin no invasiva no est exenta de inconvenientes. En el paciente peditrico
existen muchas variables (edad, variedad de patologa, etc.) que limitan su uso a un nmero
relativamente pequeo de pacientes con insuficiencia respiratoria dificultando la adquisicin
de experiencia para manejo de pacientes complejos [2].
A continuacin se presenta la experiencia de la aplicacin precoz del CPAP burbuja en la
UTIP del hospital Castro Rendn de la ciudad de Neuqun y se analizan los resultados de
este estudio usando informacin de una publicacin conducida en el hospital Garrahan de la
ciudad de Buenos Aires para seleccionar una distribucin a priori de la tasa de xito del uso
de VNI aplicando anlisis bayesiano.

Pacientes y mtodos
Se realiz un estudio descriptivo, longitudinal, retrospectivo y sin considerar un grupo control
a pacientes de 1 a 24 meses de edad o peso menor de 13 Kg, con diagnstico de IRAB
durante 18 meses. La base de datos se confeccion a partir de las historias clnicas de los
pacientes que se conectaron en forma precoz al CPAP como parte del tratamiento, es decir,
VNI electiva.
Los criterios para definir xito del tratamiento fue la presencia de dos o ms de las
siguientes condiciones a las 2 horas de haberse instaurado la VNI: disminucin del 15% de
la frecuencia respiratoria (FR), disminucin del 15% de la frecuencia cardaca (FC),
disminucin en 2 o ms puntos del score de Tal y saturacin mayor a 92 % con menor
FIO2. El criterio para definir la falla del tratamiento fue haber requerido asistencia
respiratoria mecnica.
En la UTIP del hospital Garrahan entre enero del 2006 y diciembre del 2009 se realiz una
experiencia clnica con aplicacin de VNI en el marco de su uso electivo, de rescate o
preventivo. Utilizamos los resultados de la primer parte del estudio para establecer una
distribucin a priori asociada al xito del procedimiento.
Se realizaron inferencias bayesianas de modo de sacar provecho de informacin previa.
Esta metodologa es apropiada cuando se trabaja con muestras pequeas. Se eligieron tres
distribuciones a priori de la familia de distribuciones beta con los parmetros a y b que
aproximadamente representan el nmero implcito de xitos y no xitos en la distribucin a
priori. Estos tres escenarios representan diferentes grados de incorporacin de evidencia
previa. En el primer caso (no use), se usa la distribucin priori no-informativa beta con
parmetros a = b = 0.5. En el segundo caso (partial use), se reduce la ponderacin del
estudio previo del Garrahan dividiendo a y b por 5. Finalmente, se repite el proceso usando
los valores a y b sin modificacin (full use) que equivale esencialmente a un agrupamiento
de los resultados en un meta-anlisis del ensayo. Como no se puede asumir que el contexto
del hospital Castro Rendn y el del Garrahan son los mismos, o que no tienen nada en
comn tampoco, es que se trabaj con dos situaciones extremas: sin uso de datos previos
(es decir, no hay similitud entre contextos) y el uso total de ellos (significando que ambos
contextos son equivalentes). Al hacer uso parcial de la informacin previa, se trabaj con el
escenario a mitad de camino de estos extremos. Una divisin por 5 de los parmetros
derivados de la distribucin beta fue elegida con el fin de aumentar la dispersin de la
distribucin atribuida a los datos anteriores, lo que permite un anlisis de sensibilidad
adecuado [4].
Para cada una de las opciones mencionadas, se obtuvieron las distribuciones beta
conjugada de la tasa de respuesta en cada rama del ensayo utilizando nuestros datos
binomiales. Se utiliz el Epidat 3.1 [5] para computar las distribuciones a posteriori y los
intervalos de densidad mxima (intervalo de probabilidad) al 95%.

Desde el 13 de junio de 2009 hasta el 13 de diciembre de 2010 se aplic VNI a 120
pacientes (58% femeninos) en la UTIP del hospital Castro Rendn. Para este estudio se


analiz cada episodio de VNI como un caso independiente Los pacientes presentaron una
mediana de edad de 3 meses (rango de 1 22) y peso medio de 6,49 2,24 kg. La
patologa ms frecuente fue neumona (54%), seguida de bronquiolitis (46%). Los
principales factores de prediccin de xito fueron disminucin de 15% en la FR y de Tal a
las 2 horas de iniciada la VNI.
En nuestra experiencia, la VNI puede inducir una mejora clnica y gasomtrica en el nio
con dificultad respiratoria, siendo eficaz hasta en el 72 % de los casos, aunque nuestros
resultados estn limitados por el pequeo nmero de muestra y el carcter retrospectivo del
estudio y esto limita su generalizacin al utilizar la metodologa clsica de anlisis
estadstico. El mtodo Bayesiano, es especialmente bien adaptado debido al tamao
pequeo de la muestra y permite integrar resultados previamente obtenidos en el estudio
actual de manera parcial o total. Las distribuciones beta a priori, como se mencionaron
anteriormente, se obtuvieron utilizando los datos del ensayo clnico del hospital Garrahan.
La tasa de xito en el hospital Garrahan con la aplicacin de VNI fue del 52% en el grupo
electivo (80/124). Siguiendo los pasos descritos en la seccin de mtodos, el anlisis se
realiz para los tres escenarios posibles. Los intervalos de credibilidad del 95% de prevenir
el uso del respirador mecnico fueron: [0,63-0,79] para no use, [0,6-0,75] para partial use
y [0,55-0,66] para full use.
El estudio Bayesiano permite exponer la utilidad preventiva del tratamiento pues se actualiz
la distribucin utilizando verosimilitud incorporando el estudio realizado en el hospital
Garrahan y concluyendo que todos los intervalos de mxima densidad que acumulan el 95%
tuvieron valores de lmite inferior superiores a 0,55. La probabilidad de superar a 0,5 dio 1
(suceso seguro) en todos los casos.
En conclusin, la VNI es una alternativa a la ventilacin mecnica convencional en
determinados pacientes peditricos con IRAB de distinta etiologa pues evita la intubacin
en ms del 50% de los casos.

Bibliografa
[1] Villanueva, A., Espues, S., Los Arcos Solas, M. y Rey Galn, C. (2005). Aplicacin de
ventilacin no invasiva en una unidad de cuidados intensivos peditricos. UCIP.
Departamento de Pediatra. Hospital Universitario Central de Asturias, Espaa. Versin
obtenida el 26/05/2013. http://www.elsevier.es/es/revistas/anales-pediatria-37/aplicacion-
ventilacion-no-invasiva-una-unidad-cuidados-13070175-originales-2005
[2] Ministerio de Salud de la Nacin Argentina. (2003). rea de salud integral del nio.
Enfermedades prevalentes de la infancia, programa de hospitalizacin abreviada del
sndrome bronquial obstructivo.
[3] dena, M y Bigat, T. (2009). Ventilacin no invasiva en pediatra. Centro Portugus
da Fundao Europeia para o Ensino da Anestesiologia (FEEA), Barcelona.
(http://www.feeaportugal.org). Versin obtenida el 26/05/2013.
http://www.feeaportugal.org/downrestri/curso4_2009/docs/Ventilacao em_Pediatria_II.pdf
[4] Perea-Milla, E., Silva Ayaguer L., Cerd J., Gonzlez Saiz, F., Rivas-Ruiz, F., Danet, A.,
Romero Vallecillo, M. y Oviedo-Joekes, E. (2009) Efficacy of prescribed injectable
diacetylmorphine in the Andalusian trial: Bayesian analysis of responders and non-
responders according to a multi domain outcome index. BioMed Central. Versin obtenida el
26/05/2013. http://www.trialsjournal.com/content/10/1/70
[5] EPIDAT 3.1: Software for analysis of tabulated data. Pan American Health Organization,
Xunta de Galicia: 2013. http://www.sergas.es



LA IMPORTANCIA DE LA INTERDISCIPLINARIEDAD ENTRE
ESPECIALISTAS DE LAS REAS DE SALUD Y ESTADSTICA:
EXPERIENCIA EN EL ANLISIS Y DISEO DE UNA BASE DE
DATOS DE ANOMALAS CONGNITAS

CALFINIER, GASTN
1
; CARVAJAL, NATALIA TRINIDAD
1
; SASO, MARIA VIRGINIA
1
;
ARANDA, GISELLA DAIANA
1
; SILVA, GISELLE BELEN
1
; TORRECILLA, MARINGEL
1

CARO, PATRICIA
1
; MORELLI, CANDELARIA
1
; AVILA, SILVIA
2
; PONCE ZALDUA,
EUGENIA
2

1
Facultad de Economa y Administracin, Estadstica, Universidad Nacional del Comahue
2
Servicio de gentica, Hospital Provincial de Neuqun Dr. Castro Rendn

gsnonline@gmail.com

RESUMEN
Este trabajo presenta una de las experiencias de trabajo en el marco del proyecto de
extensin Asesora en el Anlisis de Datos Biomdicos integrado por docentes y
estudiantes de las reas de matemtica y estadstica junto al personal mdico del rea de
gentica del Hospital Provincial Neuqun Dr. Castro Rendn (HCR). Debido a la
disminucin de la mortalidad infantil por causas prevenibles como las enfermedades
infectocontagiosas o los embarazos sin control, se hace evidente la importancia de las
anomalas congnitas (AC) como causa de mortalidad perinatal. Los objetivos de este
proyecto son determinar la tasa de incidencia de recin nacidos con defectos congnitos y la
eficiencia de las estrategias de diagnstico prenatal (DPN) como predictoras del nacimiento
de nios con AC. Se realiz un diseo epidemiolgico descriptivo transversal con datos
extrados de las historias clnicas de recin nacidos con AC, durante un ao (octubre 2011-
2012). La tasa de incidencias de AC fue 0.56, aproximndose a la de los pases
desarrollados (1.06). Se calcul la sensibilidad, como indicador estadstico que evala el
grado de eficacia a una prueba diagnstica (DPN) obtenindose un TPF (True Positive
Fraction) de 0.26 por lo que se requiere reforzar las estrategias para mejorar las tasas de
deteccin. Como consecuencia de esta vinculacin la ecografa consisti una herramienta
valiosa para diagnosticar AC del sistema urinario y las displasias esquelticas pero no para
la deteccin de cardiopatas congnitas y del sistema nervioso central. En base al anlisis
previo y a dificultades en el proceso de implementacin como limitaciones de anlisis
estadsticos, se dise un formulario de carga para confeccionar la primera base de datos
de AC en nuestra regin. En la instancia de elaboracin de la misma se volvi indispensable
un trabajo interdisciplinario entre el estadstico y el especialista en salud. Se utiliz el
soporte tecnolgico Epi Info.

Palabras clave: interdisciplinaridad, diseo de base de datos, anomalas congnitas.

Introduccin
El siguiente trabajo se realiza en el marco del proyecto de extensin Asesora en el
Anlisis de Datos Biomdicos integrado por docentes y estudiantes avanzados de las
carreras de Profesorado en Matemtica y Contador Pblico Nacional de la Facultad de
Economa de la Universidad Nacional del Comahue. Junto al personal del Servicio de
Gentica del Hospital Provincial Neuqun Dr. Castro Rendn (HCR) se dise un
formulario de carga informatizado para confeccionar la primera base de datos de Anomalas
Congnitas (AC) en nuestra regin. Las enfermedades transmisibles y la desnutricin han
sido padecimientos prevalentes que afectaron por dcadas a la poblacin infantil; en ese
contexto las AC fueron tradicionalmente consideradas un problema de salud poco relevante.
En las ltimas dcadas los pases desarrollados han experimentado un proceso de


transicin epidemiolgica, caracterizado por el creciente control de la desnutricin y las
enfermedades infectocontagiosas y el incremento relativo de las afecciones crnico-
degenerativas [1]. En la Provincia del Neuqun las condiciones de salud se asemejan a las
existentes en los mencionados pases lo que marca la necesidad de plantear nuevos
objetivos para la prevencin y el diagnstico oportuno de la problemtica que emerge. Los
sistemas de registro actualmente en uso (RENAC) no contemplan el anlisis detallado de las
anomalas congnitas; se plantea como esencial el desarrollo de bases de datos especficas
que permitan la puesta en valor de las anomalas congnitas como causa de mortalidad y
morbilidad de modo de permitir el desarrollo de nuevas estrategias para su abordaje. Ambos
equipos de trabajo han pautado acciones colaborativas para la el diseo de una base de
datos eficiente que permita el posterior anlisis estadstico. En la instancia de elaboracin
de la misma se vuelve indispensable un trabajo interdisciplinario entre el estadstico y el
especialista en salud para lograr un mejor desarrollo y anlisis de la investigacin al poder
relacionar las diferentes variables, optimizar y disminuir los posibles errores de carga de
datos, entre otros factores.

Desarrollo
Los profesionales de la salud necesitan de herramientas eficientes para la administracin de
la informacin permitiendo en esta instancia monitorear tendencias de defectos congnitos,
identificar factores de riesgo a lo largo del tiempo, desarrollar herramientas de prevencin de
AC, entre otros. Uno de los soportes tecnolgicos que se propone en esta etapa es el
software Epi Info [2] pues ofrece una funcionalidad sin la complejidad o el costo de las
aplicaciones de grandes empresas. Es fcil de utilizar en lugares con conectividad de red
limitada o recursos limitados para software comercial y profesional. Es un programa de
dominio pblico diseado principalmente por el Centro para el Control de Enfermedades de
Atlanta (CDC) de especial utilidad para la Salud Pblica en Estados Unidos. Tiene un
sistema amigable para construir bases de datos, analizarlos con las estadsticas de uso
bsico en epidemiologa y representarlos con grficos y mapas [3]. Para nuestra labor, Epi
Info nos permite, en diferentes pasos, disear un cuestionario en crear vistas, introducir
datos al cuestionario en grabar datos, procesar datos y desarrollar diferentes tipos de
anlisis estadstico en analizar datos [4].
En base a la necesidad de construir un sistema de registro integrado para el Servicio de
Gentica del Hospital Dr. Castro Rendn se dise un formulario de carga a partir de dos
planillas de Excel con los datos necesarios para la investigacin, que integre las variables de
nios nacidos con algn tipo de AC y su vinculacin con el DPN, realizado o no. Cabe
destacar que la confeccin de este formulario fue realizado por los alumnos que conforman
este proyecto, dirigido por los profesionales de ambas reas y para ello se especificaron las
variables que intervienen en el mismo desde el punto gentico y estadstico. A partir de
estos conceptos se definieron variables de tipo texto pero con valores legales, es decir, que
slo se puedan ingresar los datos de la misma de una nica manera para que no se
produzcan errores de carga, como por ejemplo, la variable nombre de hospital debe ser
Castro Rendn y no se permite ingresarlo como CR o castro; otra fue fecha de
nacimiento en la cual se prefij que la carga se realice por da-mes-ao, tambin se
consider determinar un rango para semanas de gestacin, se programaron variables de
chequeo que calculan, por ejemplo, la edad de la madre a la fecha del parto mediante los
datos de la fecha de nacimiento de la madre y la fecha de nacimiento del nio y, por ltimo,
se vincularon variables segn la respuesta, permitiendo el acceso a nuevas variables
(hojas o ventanas vinculadas) del formulario.
Es de suma importancia contar con una base de datos correctamente diseada ya que
permite obtener acceso a la informacin exacta y actualizada, siempre debe evitarse
informacin duplicada o datos redundantes ya que malgastan el espacio y aumentan la
probabilidad de que se produzcan errores e incoherencias. Si la base de datos contiene
informacin incorrecta los informes que de ella se desprendan contendrn tambin
informacin incorrecta, por lo tanto las decisiones que se tomen a partir de los informes
estarn mal fundamentadas [5].


Dentro de los resultados obtenidos, se comprob el beneficio en la carga de informacin por
los profesionales involucrados, as como tambin la eficacia de las herramientas que nos
brinda el Epi Info en la creacin de formularios, en cunto a: (1) fcil y dinmico carga de
datos sin sesgo de error; (2) incorporar informacin previa (DPN) y posterior al nacimiento,
permitiendo a los profesionales determinar la eficiencia de las estrategias de DPN como
predictoras del nacimiento de nios con AC; (3) monitorear tendencias de defectos
congnitos, identificar factores de riesgo a lo largo del tiempo, desarrollar herramientas de
prevencin de AC y (4) la incidencia al nacimiento de AC en la provincia se asemeja a la
reportada en pases desarrollados.
Contribuir a la creacin de la primera base de datos de AC que integra informacin del DPN
de la Argentina es de una relevancia inconmensurable adems dar respuesta segn lo
planteado por la OMS Subsisten importantes incertidumbres respecto a la
incidencia y mortalidad debidas a trastornos congnitos, sobre todo en pases que
carecen de un sistema adecuado de registro. Adems es uno de los logros ms
importante para este proyecto de extensin, pues fomenta la interaccin entre los equipos
de trabajo y la participacin y creatividad de los alumnos integrantes del mismo.
Respecto al anlisis de los datos se realiz un diseo epidemiolgico descriptivo transversal
con datos extrados de las historias clnicas de recin nacidos con AC asistidos en el HCR
en un lapso de tiempo de un ao (octubre 2011-2012), donde se registraron 12412
nacimientos. A partir esta de esta carga se calcularon tasa de incidencias de 0.56 de AC,
aproximndose a la de los pases desarrollados (1.06). A partir de la vinculacin entre los
nios con AC y el DPN se calcul la sensibilidad, como indicador estadstico que evala el
grado de eficacia a una prueba diagnstica (DPN), que es el cociente entre verdaderos
positivos (18 casos) y el total de nios con AC (70 casos) obtenindose un TPF (True
Positive Fraction) de 0,26 por lo que se requiere reforzar las estrategias para mejorar las
tasas de deteccin. Por otro lado se detect que la mayor incidencia de patologa
cromosmica es en mujeres mayores de 37 aos, como tambin la mayor parte de AC de
origen multifactorial se concentra en la franja etaria materna comprendida entre los 19 y los
37 aos. No se registraron casos de patologa cromosmica en mujeres de 25 a 30 aos. El
anlisis segn procedencia materna muestra una proporcin equilibrada entre los casos
provenientes del interior de la provincia y la zona de la Confluencia aunque se debe ajustar
segn la tasa de nacimientos por zona. No se detect asociacin significativa entre las AC y
el peso de nio, ni con edad gestacional ni la materna. La ecografa fue una herramienta
valiosa para diagnosticar AC del sistema urinario y las displasias esquelticas pero no se
logr el mismo ndice de deteccin ni para las cardiopatas congnitas ni las del Sistema
nervioso central.
El estudio y el anlisis de los registros de AC es una herramienta importante para evaluar
las intervenciones en el rea de DPN y las necesidades de los servicios de salud perinatal.
A futuro se incorporarn a dicha base datos de AC nios mayores a 30 das pues hay
diagnsticos posteriores al nacimiento que no se encuentran registrados formalmente.

Bibliografa
[1] Bermejo Snchez E, Martnez Fras ML. Vigilancia epidemiolgica de anomalas
congnitas en Espaa en el perodo 1980-1999. Boletn ECEMC. Versin obtenida el
25/06/2001. http://www.fundacion1000.es/ECEMC_6_2001_1.pdf
[2]Epi Info 7: Centers for Disease Control and Prevention. 2013. http://wwwn.cdc.gov/epiinfo/
[3] Chiu Alvarez, M. (2011) Gua para uso de Epi Info. DIPLAS-MINSAL. Versin obtenida
el 10/05/2013. http://epi.minsal.cl/epi/html/presenta/Taller2011/Dia2/Guia_Epiinfo.pdf
[4] Santilln, A. (27/01/2013) EpiInfo, EpiMap y EpiDat. Enfermera Basada en la
Evidencia. Versin obtenida el 20/05/2013. http://ebevidencia.com/archivos/608
[5] Office-Microsoft. Versin obtenida el 26/05/2013. http://office.microsoft.com/es-ar/access-
help/conceptos-basicos-del-diseno-de-una-base-de-datos-HA001224247.aspx


ALTERNATIVAS METODOLGICAS PARA EL ANLISIS DE LA
DISTRIBUCIN DEL PESO DE PERAS CV. ABATE FETEL

MENNI M. FERNANDA
1
, GITTINS CECILIA G.
2
, CALVO, PAULA C.
2

1
Area de Estadstica, INTA EEA Alto Valle.
2
Area de Fruticultura, INTA EEA Alto Valle.

fmenni@correo.inta.gov.ar

RESUMEN
La importancia del tamao en la pera est asociada con la comercializacin. La variable en
estudio es la distribucin del tamao de frutos en cuatro categoras mutuamente
excluyentes. Esta variable ha sido analizada generalmente como una variable continua y
normal. En este trabajo se proponen otros mtodos de anlisis que contemplan la naturaleza
multinomial ordinal de los recuentos: tablas de contingencia, anlisis de correspondencia
simple y multinomial ordinal generalizado. Los resultados mostraron que estos ltimos, son
congruentes respecto a las inferencias que pueden realizarse, indicando que la distribucin
del tamao difiere entre los tratamientos planteados. De manera antagnica, el ANOVA
muestra dentro de cada categora que no existen diferencias significativas entre los
tratamientos. Se destaca que dichas categoras son analizadas de manera independiente e
individual y no como una nica variable categorizada multinomial.

Palabras clave: recuento, tablas de contingencia, correspondencia simple, multinomial
ordinal generalizada.

Introduccin
Actualmente, Argentina es el primer exportador de peras a nivel mundial. La importancia de
la distribucin del peso de los frutos se asocia principalmente a la comercializacin. En el
ao 2012 nuestro pas alcanz una exportacin de alrededor de 400.000 toneladas de peras
en fresco [17]. El peso es una variable de tamao, es continua, habitualmente se la torna
categrica para estar en concordancia con su destino en el mercado. Las categoras que
generalmente se utilizan son Descarte, Pequeo, Mediano y Grande, pudindose mantener
el orden pero no la distancia. El tamao de los frutos en la pera puede estar relacionado con
la polinizacin y con la cantidad de semillas presentes ya que estas proveen las hormonas
de regulacin del crecimiento del mismo (auxinas y giberelinas) [16].
El anlisis clsico que se aplica sobre este tipo de variable est basado en el anlisis de la
varianza (ANOVA) [2][3][5][11][14][15]. La bibliografa muestra que la manera de analizar las
categoras propuestas sobre el tamao de los frutos es a travs de un modelo clsico como
el mencionado, observando los recuentos como porcentajes de cada categora sobre el total
de frutos. Este anlisis se vuelve restrictivo y sesgado sobre todo cuando los supuestos de
homogeneidad de varianza y de normalidad no se cumplen. El procedimiento se realiza a
travs de transformaciones muchas veces innecesarias para poder ajustar la realidad del
fenmeno bajo estudio al modelo conocido. El uso de transformaciones se adecua
solamente cuando la escala elegida permite que los supuestos se cumplan y tiene la
dificultad que las conclusiones a las que se llega se aplican solamente para las poblaciones
transformadas [6].
Existen otras metodologas ms eficaces para evaluar variables categricas ordinales,
como son las tablas de contingencia, mtodos exploratorios como los anlisis de
correspondencia o bien los modelos lineales generalizados multinomiales [1][12]. En este
trabajo se evalan distintas opciones para el anlisis de la distribucin del peso respetando
la distribucin per se de la variable en estudio como alternativa al anlisis clsico.

Materiales y Mtodos
Los datos utilizados para el anlisis corresponden a un ensayo que se realiz en la EEA Alto


Valle (39 1S, 62 40O) en un monte de peral cv. Abate Fetel de 11 aos de edad. Se
evaluaron tres tratamientos: Coscia (CO) y Fondant Thirriot (FT) como polinizadores y un
testigo sin polinizar (T). Para cada tratamiento se arm una estructura con mallas media
sombra donde se instal una colmena. En plena floracin se distribuyeron macetas con
ramas de los diferentes polinizadores, n=5 rboles por tratamiento. Al momento de la
cosecha se recolectaron la totalidad de los frutos de los rboles de cada tratamiento, y se
clasificaron segn su peso. Se establecieron 4 categoras de tamao de fruto: D=Descarte
(menor de 171 g]; P=Pequeo (171 a 239 g]; M=Mediano (239 a 311 g] y G=Grande (mayor
a 311g).
Metodologa clsica: ANOVA de una va, usando como variable respuesta el porcentaje de
frutos dentro de cada categora, para evaluar la diferencia entre los tratamientos planteados
(factor). En la categora G hubo que transformar la variable porque no cumpli con el
supuesto de homogeneidad de varianzas, utilizando para tal fin el logartmo natural.
Metodologa alternativa: el modelo sugerido es el Tamao del fruto con sus cuatro
categoras (D,P,M,G) como variable de respuesta, en funcin de los tratamientos de
polinizacin. Se trabaj con los siguientes anlisis:
a) Tablas de contingencia. Se utilizan para el anlisis de datos categorizados, presentados
de manera tabular. Se estudi el efecto de los polinizadores (tratamientos) sobre la
distribucin del tamao del fruto (variable respuesta). La independencia se comprob a
travs del estadstico Ji cuadrado de Pearson. [1][13].
b) Anlisis de correspondencia. Este anlisis es complementario a las tablas de
contingencia. Permiti realizar una exploracin grfica de las relaciones entre las variables
peso del fruto (categorizada), y los tratamientos, basndose en la matriz de desviaciones Ji
cuadrado [8].
c) Modelos lineales generalizados. La pertenencia del modelo propuesto a la familia
exponencial permiti contemplar la naturaleza multinomial ordinal de la variable, y modelar
el comportamiento esperado de la misma a travs de una funcin de enlace (logit en este
caso) quedando expresado el siguiente trinomio del modelo:
Distribucin de la variable aleatoria, asociado a cuatro categoras mutuamente excluyentes:
( )
grande categora la en encuentre se fruto el que de ad probabilid
mediano categora la en encuentre se fruto el que de ad probabilid
pequeo categora la en encuentre se fruto el que de ad probabilid
descarte categora la en encuentre se fruto el que de ad probabilid
,
gi
mi
pi
=
=
=
=
~ Y
t
t
t
t
t t t t
di
gi mi pi di
Multi , ,

Predictor Lineal est asociado al tratamiento testigo y descarte
Los parmetros de regresin se asocian al intercepto , al tratamiento de polinizacin
i ; con i = 1(CO), 2(FT ) y 3 (T). Funcin de enlace

A travs del mtodo de Mxima Verosimilitud se generaron estadsticos tanto de bondad de
ajuste (Deviance) como Wald, que permiti realizar estimaciones y predicciones sobre los
parmetros del modelo planteado. [4][7][10]

ANOVA. El anlisis de varianza dentro de cada categora mostr en los cuatro casos que no
hubo diferencia significativa (p>0,05) para la proporcin de frutos entre los tratamientos de
polinizacin. Cabe destacar que no se logra ver la distribucin del peso en conjunto para los
polinizadores dada la segmentacin del anlisis.
Tablas de Contingencia. El estadstico Ji cuadrado (p=0,0018) indic la dependencia
existente entre los tratamientos de polinizacin y las categoras de la variable en estudio de
manera conjunta. Este anlisis no contempla cmo es la relacin entre las categoras de
tamao y los tratamientos.
Correspondencia Simple. Este anlisis complementa el anterior dado que manifiesta de
manera grfica la asociacin existente entre tratamientos de polinizacin y el tamao de los
ij i i ij
X | | + =
0
( )
|
.
|
\
|
=
di
ki
ij
g
t
t
ln
di
0 i
|
i
|


frutos. Indica que el polinizador Coscia se asocia principalmente a los tamaos medios,
mientras que Fondant Thirriot y el Testigo estn vinculados con el descarte. La categora G
no mostr una buena representacin esto puede deberse a la baja cantidad de frutos en
dicha categora.
Multinomial Ordinal Generalizada. La Deviance indic un buen ajuste del modelo planteado
(Deviance/gl.=0,7). Las estimaciones muestran la diferencia altamente significativa entre el
polinizador Coscia y el testigo (p<0,001), pero no entre Fondant Thirriot y el testigo
(p=0,388) coincidiendo este resultado con los dos anlisis previos.
Se puede concluir respecto a los modelos observados, que no es indistinto trabajar con un
modelo que asume distribucin normal de la variable de recuento, como requiere el ANOVA,
y alternativas de anlisis que contemplan la naturaleza de la variable. Se observ que los
anlisis propuestos modelaron mejor el comportamiento de la variable en estudio. Se
sugiere trabajar con las distintas tcnicas de manera complementaria para un anlisis ms
enriquecedor.

Bibliografa
[1] Agresti, A. 1996: An Introduction to Categorical Data Analysis. A Wiley-Interscience
Publication; Ed. John Wiley y Sons, INC., Florida.
[2] Arenas-Bautista M.C.; J. E. Vlez-Snchez y J. H. Camacho-Tamayo. 2012: Evaluacin
de dos sistemas de riego por goteo en la produccin y la calidad de la fruta de pera (Pyrus
communis L.) variedad Triunfo de Viena. Acta Agronmica. vol.61 (1).
[3] Buwalda J.G.; D.J. Klinac and J.S. Meekings. 1989: Effects of time and degree of fruit
thinning on fruit size and crop yield at harvest for four nashi (Pyrus serotina Rehd.) cultivars.
Scientia Horticulturae, vol. 39 (2): 131141.
[4] Cox, C. 1984. Generalized Linear Models The Missing Link. Applied Statistics; vol. 33
(1) 18-24
[5] Curetti M.; R. Rodrguez; C. Magdalena and A. Rodrguez. 2011: Effect of Concentration,
Application Volume and the addition of a Surfactant to the Response of Benzyladenine as
Thinning agent of William`s Pears. Acta Hort. (ISHS) 909:395-401.
[6] Daz, P; Demetrio, C. 1999: Introduccin a los Modelos Lineales Generalizados. Su
Aplicacin en las Ciencias Biolgicas, con Ejemplos en GLIM. Screen Ed. Argentina.
[7]Johnson, D. 2000: Mtodos multivariados aplicados al anlisis de datos. International
Thompson Editores. Mxico.
[8] McCullagh, P; Nelder, J.A. 1989. Generalizad Linear Models. 2nd Ed. Chapman and
Hall, Chicago.
[9] Evans, M; Hasting, N; Peakock, B. 1993: Statistical Distributions 2nd Ed. A Wiley-
Interscience Publication; Ed. John Wiley y Sons, INC., New York.
[10] Lindsey, J. 1997: Applying Generalized Linear Models, Ed. Springer-Verlag. New
York.
[11] Naor, A.; Peres, M.; Greenblat, Y.; Doron, I.; Gal, Y. and Stern, R. A. 2000: Irrigation
and crop load interactions in relation to pear yield and fruit-size distribution. Journal of
Horticultural Science and Biotechnology, vol. 75 (5): 555-561
[12] Nelder, J. A; Wedderburn, W. M. 1972. Generalized Linear Models. Journal Royal
Statsitical Applied; vol. 135: 370-385 [part 3].
[13] Pea, D. 2002: Anlisis de datos multivariantes. Primera Edicin. McGraw-
Hill/Interamericana. Espaa.
[14] Stern R.A. and M. A. Flaishman.2003: Benzyladenine effects on fruit size, fruit thinning
and return yield of Spadona and Coscia pear. Scientia Horticulturae, vol. 98 (4): 499504.
[15] Stern R. A. and I. Doron. 2009: Performance of Coscia pear (Pyrus communis) on nine
rootstocks in the north of Israel. Scientia Horticulturae, vol. 119 (3): 252256.
[16] Theron K. I. 2011: Size matter: Factors influency fruits size in pear. Acta Horticulturae
909 vol.2: 545-556.
[17] Blog CFI, Argentina, Versin obtenida el 07/Junio/2013.
http://interpera2013.cfired.org.ar/la-pera-en-el-mundo-y-en-argentina/



COMPARACIN DE COMPONENTES DE VARIANZA
USANDO BASES DE DATOS COMPLETAS E
INCOMPLETAS MEDIANTE SIMULACIN

IBAEZ MA
1
, DI RENZO MA
1
y BALZARINI MG
2

1
Mejoramiento Gentico, Fac de Agronoma y Vet, Universidad Nacional de Ro Cuarto.
2
CONICET, Estadstica y Biometra, Fac Cs Agrop, Universidad Nacional de Crdoba.

mibanez@ayv.unrc.edu.ar

RESUMEN
Uno de los principales objetivos de la gentica cuantitativa es determinar las contribuciones
relativas de las influencias genticas y ambientales a la variacin y covariacin de los
caracteres cuantitativos. La varianza fenotpica (F) para un carcter es la suma de la
varianza genotpica (G), la varianza ambiental (E) y la varianza de la interaccin
genotipoambiente (GE). La relacin entre las componentes de varianza es importante para
la toma de decisiones en el mejoramiento vegetal. La relacin entre la varianza G y la
varianza GE es informativa ya que si la varianza G es mayor o igual a la de la interaccin no
existe la necesidad de identificar mega-ambientes. Las bases de datos en ensayos
multiambientales (EMA) suelen ser grandes y extremadamente incompletas. El objetivo de
este trabajo fue determinar si las contribuciones relativas, de los efectos de G, E e
interaccin GE, son robustas a la falta de datos y establecer en que escenarios podran
cambiar. Se utilizaron datos de rendimiento de grano de las bases de datos reales de los
ensayos comparativos de rendimiento (ECR) de dos subredes de la Red Nacional de
Cultivares de Maz del INTA y de tres campaas agrcolas. Para evaluar la robustez de las
estimaciones de los componentes de varianza obtenidos por mxima verosimilitud
restringida (REML), en el contexto de los modelos lineales mixtos ante distintos niveles de
informacin faltante, se diseo un estudio por simulacin de falta de datos. Los resultados
sugieren que la prctica comn de eliminar datos para trabajar con bases de datos
balanceadas podra llevar a subestimaciones de las varianzas genotpicas y por lo tanto
asignar un valor mayor al real a la componente de interaccin.

Palabras clave: parmetros genticos, datos incompletos, modelos lineales mixtos,
gentica estadstica.

Introduccin
Los modelos lineales de componentes de varianza que incorporan trminos aleatorios,
generan una matriz de varianzas y covarianzas con estructura conocida pero con valores
paramtricos desconocidos. Estos parmetros resultan de utilidad en el mejoramiento
gentico vegetal. La magnitud de las componentes de varianza se analiza frecuentemente
para determinar la contribucin relativa de los efectos principales de G en relacin a la
interaccin GE. Cuando la relacin es menor a uno y se ha probado estadsticamente que la
componente de varianza de interaccin GE es mayor que cero, la evaluacin de los
materiales debe realizarse poniendo nfasis en los diferentes ambientes o conjuntos de
ambientes (mega-ambientes), ya que al ser importante la interaccin, el desempeo relativo
de los genotipos podra depender de los ambientes de evaluacin. La Red Nacional de
Cultivares de Maz (RNM) provee informacin que permite identificar los hbridos
comerciales con un desempeo agronmico superior y evaluar la estabilidad del rendimiento
tanto en ambientes individuales como a travs de ambientes. La seleccin de los genotipos
superiores se realiza mediante ensayos multiambientales. Debido al poco tiempo que un
determinado hbrido permanece en el mercado, la mayora de ellos slo se evalan 2 o 3


aos. Adems, hay pocos hbridos comunes a travs de los distintos ambientes. La falta de
genotipos comunes a travs de ambientes y aos crea una base de datos altamente
incompleta. Dada la complejidad de las bases de datos multiambientales existen dos
alternativas: una opcin comn es restringir el anlisis solo a la base de datos completa y la
otra opcin consiste en realizar los anlisis entre hbridos con desigual nmero de datos (So
y Edwards, 2011). La estimacin de componentes de varianza con datos incompletos ha
dado lugar a diferentes mtodos de estimacin en los modelos lineales mixtos. El mtodo de
mxima verosimilitud restringida (REML) (Patterson y Thompson, 1971) es el mtodo de
eleccin para estimar parmetros genticos en situaciones de datos incompletos (Collaku,
2003). El objetivo de este trabajo fue determinar las contribuciones relativas de los efectos
de G, E y de la interaccin GE, derivados de la estimacin de componentes de varianzas
bajos distintos escenarios de falta de datos.

Desarrollo
Se utilizaron datos de rendimiento de grano (kg/ha) de las bases de datos de los ECR de
dos subredes de la Red Nacional de Cultivares de Maz del INTA. Para las dos regionales
seleccionadas, se conform una base de datos uniendo la informacin de las tres campaas
agrcolas consecutivas. Todos los ECR fueron diseados segn un diseo de bloques
completos al azar, con tres o cuatro repeticiones. Sobre cada base de datos se ajust un
modelo lineal mixto con efectos de G, E e interaccin GE aleatorios. Con este modelo se
estim la contribucin porcentual de la varianza genotpica, de la varianza ambiental y de la
varianza debida a la interaccin GE respecto de la variacin total observada no debida al
error experimental. Para evaluar la robustez de las estimaciones de los componentes de
varianza obtenidos por el mtodo de REML en el contexto de distintos niveles de
informacin faltante, se dise un estudio por simulacin usando un mecanismo
completamente aleatorio de eliminacin de datos (MCAR). Para las dos subredes se trabaj
con seis EMA, cada uno proveniente de una regional y una campaa particular. Para una
regional y un ao particular un conjunto de ensayos provee una base de datos completa ya
que todos los genotipos son evaluados en todos los ECR de una misma campaa. Para
cada una de los seis EMA se estimaron, va REML las componentes de varianza G y de la
interaccin GE, calculando la relacin varianza genotpica sobre varianza de interaccin.
Estimada la relacin desde las series de ECR completas, se implement un mecanismo
MCAR de un 25, posteriormente un 50 y finalmente de un 75% de los datos de las bases de
datos completas originales. Para cada escenario definido segn el nivel de incompletitud de
datos faltantes (0, 25, 50 o 75%) se estimaron las componentes de varianza y la relacin
entre la varianza genotpica y la de interaccin. Las componentes de varianzas fueron
estimadas por el mtodo REML usando el programa estadstico InfoStat (Di Rienzo et al.,
2011).

La varianza G fue igual en las subregiones y segn la prueba del cociente de verosimilitud,
realizada comparando el modelo ajustado (saturado) con otro modelo sin el efecto G, la
variabilidad G es, aunque menor que la ambiental, estadsticamente significativa. La
variabilidad genotpica representa en estos hbridos un 4% de la variabilidad debida a G, E e
interaccin. Un porcentaje igual o mayor correspondi a la interaccin GE. Si bien esta no
fue evaluada estadsticamente porque los modelos se ajustaron con la medias de G por
ambiente y no con las repeticiones, dado que su magnitud es no inferior a la variabilidad G
se infiere que el anlisis de interaccin es importante. Los resultados del estudio diseado
para evaluar el efecto de la incompletitud de datos sobre esta relacin sugieren que la
misma es robusta a la falta de datos cuando esta carencia de datos se produce al azar. Para
todos los EMA, independiente de la regional y el ao de ensayo, la relacin promedio entre
las componentes de varianza G y GE fue prxima a 1, tanto en las bases de datos
completas como con niveles de incompletitud de hasta un 25%. En escenarios con un
porcentaje de 50% de datos faltantes, la relacin entre varianzas cambi significativamente,


observndose un incremento en la estimacin de la varianza genotpica, donde la relacin
fue de 1,4 en promedio. El hecho de estimar las componentes de varianza en bases de
datos incompletas, an cuando el nivel de incompletitud es alto, lleva a considerar de un
mayor nmero de genotipos en la estimacin de la varianza genotpica. El alto nmero de
genotipos que intervinieron en el ensayo podra ser la causa de la estimacin de una
varianza gentica mayor. Estimaciones sesgadas de los componentes de varianza y sus
parmetros derivados (estimaciones de heredabilidad y estabilidad) pueden afectar
negativamente sobre las estimaciones del efecto de genotipo, pudiendo causar cambios en
la decisin de seleccin. Los resultados sugieren que la prctica comn de eliminar los
genotipos que no estn en todos los ambientes para conformar bases de datos completas,
podra conducir a subestimaciones de varianzas genotpicas y por tanto asignar un valor
mayor a la componente de interaccin GE. Los efectos de interaccin GE fueron
relativamente importantes en ambas redes, indicando que no es adecuado utilizar la media
general de rendimiento de un G como nico indicador del comportamiento del mismo, ya que
su desempeo podra depender significativamente del ambiente de evaluacin.

Bibliografa
Collaku, A. 2003. Restricted Maximum Likelihood procedure to estimate additive and
dominance variance components. Publicado en M. S. Kang (2003), Handbook of formulas
and software for geneticists and breeders. Haworth Press, NY. pp. 97108.
Di Rienzo, J. A.; Casanoves, F.; Balzarini, M. G.; Gonzlez, L.; Tablada, M. y Robledo, C. W.
InfoStat. 2011. Grupo InfoStat, FCA, Universidad Nacional de Crdoba, Argentina.
http://www.infostat.com.ar.
Patterson, H. D. y Thompson, R. 1971. Recovery of interblock information when block sizes
are unequal. Biomtrica, 58: 545554.
So, Y. y Edwards, J. W. 2011. Predictive ability assessment of linear mixed models in
multienvironment trials in corn (Zea mays L). Crop Science, 51: 542552.



REGRESIN GAMA APLICADA AL ANLISIS DE TASA DE
GERMINACIN EN SEMILLAS DE SOJA

GUIDO GUSTAVO HUMADA GONZLEZ, GILBERTO RODRIGUES LISKA, LDER
AYALA AGUILERA, AUGUSTO RAMALHO DE MORAIS

Departamento de Ciencias Exactas, Universidad Federal de Lavras, Minas Gerais, Brasil.
Departamento de Produccin Agrcola, Facultad de Ciencias Agrarias, San Lorenzo,
Paraguay.

gustavohumad@hotmail.com

RESUMEN
La soja es el principal rubro agrcola producido y comercializado en Paraguay. Dado el gran
impacto socioeconmico que la cultura genera en el pas, es necesario realizar estudios que
ayuden a mejorar la produccin y obtener mayores rendimientos, para ello, es necesario
utilizar semillas de alta calidad. La calidad de la semilla es reflejada principalmente por su
alto potencial gentico y por las calidades: fsicas. Ante lo expuesto, el objetivo del trabajo
fue estimar la tasa de germinacin de semillas de soja utilizando la regresin Gama. El
trabajo experimental fue conducido en el campus experimental de la Facultad de Ciencias
Agrarias, en San Lorenzo Paraguay. Fueron utilizadas semillas de soja variedad Coodetec
242RR. Las variables analizadas fueron: vigor, longitud de plntula, longitud de raz,
dimetro de la semilla y peso de mil semillas. Se concluye que la regresin Gama puede ser
utilizada para describir el comportamiento de la tasa de germinacin de semillas de soja
una vez que el ajuste para el teste de germinacin fue satisfactorio. El porcentaje de
germinacin de las semillas de soja es influenciado por el vigor y longitud de raz.

Palabras clave: glycine max L. merril, modelo linear generalizado, componentes de
calidad.

Introduccin
La soja (Glycine max L. Merril) es el principal rubro agrcola producido y comercializado en
Paraguay. Dado el gran impacto socioeconmico que la cultura genera en el pas, es
necesario realizar estudios que ayuden a mejorar la produccin, para ello, es necesario
utilizar semillas de alta calidad.
La calidad de la semilla es reflejada principalmente por su alto potencial gentico y por las
calidades: fsicas (peso de mil semillas, tamao de la semilla), sanitarias y fisiolgicas
(poder germinativo y vigor) [4]. El poder de germinacin de la semilla es expresado en
porcentaje, semillas de soja de alta calidad deben presentar porcentaje de germinacin
superior a 85%.
Ante lo expuesto, el objetivo del trabajo es estimar la tasa de germinacin de semillas de
soja utilizando regresin Gama.

Desarrollo
El trabajo experimental fue conducido en el laboratorio de anlisis de semillas en la
Universidad Nacional de Asuncin en los meses de febrero a marzo del 2011. Fueron
evaluadas semillas de soja, variedad coodetec 242 RR. Las variables analizadas fueron:
vigor (%), longitud de plntula (cm), longitud de raz (cm), dimetro de la semilla (cm) y peso
de mil semillas (gr). Los testes fueron conducidos e interpretados de acuerdo con los
criterios establecidos en las reglas de anlisis de semillas [2].


Considerando la naturaleza de los datos fue utilizado el modelo de regresin Gama con
componente sistemtico
0 1 1 2 2 3 3 4 4 5 5 6 6 i i
x x x x z x q | | | | | | | = + + + + + + , en que
1
x representa
la variable independiente (v.i.) vigor,
2
x la v.i. asociada a la longitud de plntula,
3
x la v.i.
asociada a la longitud de raz,
4
x la v.i. asociada al espesor de la semilla,
5i
z una variable
dummy relacionada al tratamiento i ( 1, 2,3 i = ),
6
x la v.i asociada al peso de mil semillas y
0 1 2 3 4 5 6
, , , , , ,
i
| | | | | | | los parmetro del modelo. La funcin de unin log-linear
1
j j j j
j
E Y q
(
= = =

X x , en que
j
representa la media da variable de respuesta
germinacin de la semilla en el vector de variables independientes
j
x .
Los parmetros de los modelos fueron estimados por el mtodo de la mxima
verosemejanza, descripto en [1]. La adecuabilidad del ajuste de los modelos fue analizada
considerando resultados asintticos para la deviance,
( )
; D y y un envelope simulado para
los residuos, propuesto por [3]. El criterio de informacin de Akaike (AIC) fue utilizado para
realizar el proceso de seleccin de variables va stepwise, que consiste en obtener el
modelo cuyas variables proporcionaron un menor valor de AIC.

Con base en el modelo completo fue aplicado el mtodo de seleccin de variables stepwise
para escoger el modelo con el menor valor de AIC. El componente sistemtico del modelo
final es
0 1 1 3 3 7 1 3
x x x x q | | | | = + + + . Luego, el modelo final es dado por (1).

0 1 1 3 3 7 1 3
1
E Y X x x x x x | | | |
( = = = + + +

(1)
En la tabla 1 se observa las estimativas de los parmetros del componente sistemtico del
modelo Gama posterior a la aplicacin del mtodo de seleccin de variables stepwise, existe
una reduccin en el nmero de variables de dicho componente sistemtico.

Tabla 1: Estimativas de los parmetros del componente sistemtico del modelo Gama,
posterior al proceso de seleccin de variables stepwise, con sus respectivos error
standard y valor-p, ajustados a los datos germinacin de semillas de soja.
Variable Estimativa Error standard Valor-p
Intercepto 0,06256 0,00884 0,00010
Vigor -0,00090 0,00026 0,00854
Longitud raz -0,00359 0,00069 0,00089
Vigor * Longitud raz 0,00006 0,00002 0,01227

La Deviance del modelo log-linear Gama fue (8 grados de libertad) que equivale al valor-
p=0,9999 lo que indica que el ajuste del modelo es adecuado. El grfico de envelope
simulado (Figura 1) corrobora la eleccin del modelo de regresin gama, para los datos
germinacin de semillas de soja, una vez que los residuos no cruzan el envelope
generado.
Las figuras 2 y 3 presentan el porcentaje de germinacin estimada de las semillas de soja
en relacin al vigor y longitud de raz. Se observa que para obtener el porcentaje de
germinacin necesario para que la semilla sea considerada de alta calidad es necesario que
la plntula tenga como mnimo longitud de raz prxima a 0,50 cm y vigor superior a 50 %.


-1.5 -1.0 -0.5 0.0 0.5 1.0 1.5
-
2
-
1
0
1
2
Normal Q-Q Plot
Percentis da N(0,1)
C
o
m
p
o
n
e
n
t
e

d
o

D
e
s
v
i
o
Normal Q-Q Plot Normal Q-Q Plot Normal Q-Q Plot

Figura 1: Grfico envelope simulado referente al modelo Gama ajustado a los datos de
germinacin de semillas de soja variedad coodetec 242 RR.

Figura 2: Grfico de superficie de
respuesta.
Figura 3: Grfico de contornos.

Concluyese que el modelo Gama se ajust satisfactoriamente a los datos germinacin de
semillas de soja. Semillas con vigor menor a 50% no alcanzaron los niveles mnimos de
germinacin para ser considerados semillas de alta calidad.

Bibliografia
[1] Mcculloch, C.E.; Saerle, S. R. (2001). Linear and Generalized Linear Mixed Models.
Wiley, New York.
[2] Ministrio da Agricultura, Pecuria e Abastecimento. Secretaria de Defesa Agropecuria.
Regras para anlise de sementes. Braslia. Brasil. Acceso: 24/abr./2013. Disponible en:
http://www.agricultura.gov.br/arq_editor/file/2946_regras_analise__sementes.pdf.
[3] Pregibon, D. (1981). Logistic regression diagnostics. Annals of Statistics, 9, p. 705-724.
[4] Santos, P. M. dos; et al. (2005). Influncia do tamanho de sementes de soja na qualidade
fisiolgica e sanitria durante o armazenamento. Acta Scientiarum Agronomy, Maring,
27(3), p. 395-402.


EVALUACIN DE LA INTERACCIN GENOTIPO-AMBIENTE DE
HBRIDOS DE MAZ MEDIANTE APROXIMACIN PARAMTRICA Y
ANLISIS MULTIVARIADO

CORCUERA, V.R.
1-2
; KANDUS, M.
2
; SALERNO, J.C.
2
; MORENO-FERRERO, V.
3

1
Comisin de Investigaciones Cientficas de la Prov. de Buenos Aires
2
Instituto de Gentica Ewald A. Favret CICVyA INTA Castelar
3
Depto. Biotecnologa ETSIAMN, Univ. Politcnica de Valencia (UPV)

vrcorcuera@gmail.com

RESUMEN
El objetivo de este trabajo fue identificar hbridos experimentales de maz de uso especial
altamente estables mediante estadsticos incluidos en la aproximacin paramtrica y
tcnicas de anlisis multivariado. Se calcul el tiempo trmico requerido para alcanzar la
floracin femenina de doce cruzas simples denominadas HC1 HC12 a travs de doce
ambientes (4 localidades, 3 aos). La estabilidad del carcter evaluado fue estimada
utilizando: coeficiente de variacin CV%; coeficiente de regresin de Finlay & Wilkinson (b
i
);
parmetro de desviacin de Eberhart & Russell (S
2
di
); ecovalencia de Wricke (W) y
coeficiente de determinacin de Pinthus (r
2
). La interaccin genotipo-ambiente, los patrones
de respuesta, clasificacin de ambientes y la estabilidad genotpica fueron estudiadas
mediante el anlisis de componentes principales utilizando los modelos AMMI 1 y SREG-
GGE. Los mtodos de aproximacin paramtrica permitieron reconocer a HC2, HC4, HC5,
HC8, HC10 y HC12 como genotipos estables. En cambio, los resultados del anlisis de
componentes principales demuestran que las cruzas simples HC6, HC7 y HC9 tienen un
comportamiento ms consistente a travs de los ambientes de evaluacin. El grfico
bidimensional AMMI1 revel que las localidades de Esperanza, Pergamino y Castelar son
las que ms contribuyeron (en orden decreciente) a la interaccin genotipo x ambiente.

Palabras clave: regresin linear conjunta; anlisis multivariado; maz

Introduccin
Los ensayos multiambientales (MET) son esenciales para interpretar la interaccin genotipo-
ambiente (IGA) que dificulta la eleccin y recomendacin de genotipos estables (De Len
Castillo et al., 2005; Balzarini et al., 2007). La IGA puede ser analizada a travs de distintas
tcnicas: anlisis de los componentes de la varianza, aproximacin paramtrica, anlisis
multivariado y mtodos cualitativos. La aproximacin paramtrica incluye varios estadsticos:
Coeficiente de variacin (CV%) de Francis y Kannenberg; Coeficiente de regresin (b
i
)
propuesto por Finlay y Wilkinson; Parmetro de desviacin (S
2
di
)

de Eberhart y Russell;
Ecovalencia (W) propuesta por Wricke y Coeficiente de determinacin (r
2
) de Pinthus. Estos
estadsticos son relativamente fciles de calcular pero solo brindan aspectos individuales de
la estabilidad pudiendo producir resultados confusos. En cambio, el anlisis de componentes
principales a travs de los modelos AMMI y/o de regresin por sitio SREG permite interpretar
la interaccin genotipo-ambiente desde una perspectiva multivariada con mayor nivel de
detalle (Crossa y Cornelius, 2002; Yan y Tinker, 2006).

Desarrollo
Se utilizaron doce hbridos simples experimentales de tipo waxy (wx), alta calidad proteica
(CP) y dobles mutantes wxo2 (DR). Los ensayos fueron conducidos durante tres aos
consecutivos en las localidades de Castelar, Llavallol, Pergamino (Prov. Bs. As.) y


Esperanza (Prov. Sta. Fe). La combinacin de localidades y aos defini doce ambientes
denominados con la inicial de la localidad seguida por el nmero de ao (L1, L2,...E3). Se
utiliz un diseo de bloques completamente aleatorizados con 3 repeticiones. La unidad
experimental fue una microparcela de 2,5 m de longitud debido a la naturaleza uniforme de
las cruzas simples. El tiempo trmico en grados Celsius (TT) hasta la fase de floracin
femenina (R
1
) fue calculado mediante el mtodo Ontario (Brown, 1978). Se determin la
estabilidad de los materiales ensayados mediante: coeficiente de variacin CV% (Francis y
Kannenberg, 1978); Coeficiente de regresin b
i
(Finlay y Wilkinson, 1963); Parmetro de
desviacin S
2
di
(Eberhart y Russell, 1966); Ecovalencia W (Wricke, 1962) y el coeficiente de
determinacin r
2
(Pinthus, 1973). Los patrones de respuesta al ambiente, identificacin de
ambientes y estabilidad de los genotipos se analizaron mediante anlisis de componentes
principales utilizando los modelos AMMI1 y SREG-GGE.

En la Tabla 1 se presentan los resultados del anlisis paramtrico y el TT medio de cada
genotipo a travs de los doce ambientes de evaluacin. El hbrido HC8 es el ms precoz y
HC5 tiene el mayor requerimiento trmico hasta R
1
. El coeficiente de variacin CV% seala
a los hbridos HC2, HC5 y HC4 como los ms estables en sentido biolgico. El coeficiente
de regresin b
i
identific a HC6, HC9 y HC11 como genotipos de estabilidad promedio (tipo
1) mientras que HC3, HC7, HC8, HC10 y HC12 con valores de b
i
muy superiores a 1 tienen
una estabilidad (tipo 1) inferior a la media. Los materiales HC1, HC2, HC4 y HC5 cuyo b
i
< 1
son altamente estables (tipo 1). El parmetro de desviacin S
2
di
indica que HC2, HC5, HC8 y
HC10 presentan la mayor estabilidad (tipo 3). De stos, HC2 y HC5 son los ms estables si
se considera en conjunto b
i
y S
2
di
. La ecovalencia de Wricke (W) distingui tambin a HC5,
HC8, HC10 y HC11 como los genotipos ms estables en sentido agronmico (tipo 2). Los
hbridos cuyo coeficiente de determinacin r
2
es igual o cercano a 1 (HC8, HC10 y HC12)
son altamente estables para el carcter evaluado. Se utiliz el coeficiente de correlacin de
rangos de Spearman (r
s
) para comparar los resultados obtenidos mediante los estadsticos
utilizados y se hall una asociacin altamente significativa entre los rangos atribuidos a cada
genotipo mediante b
i
con CV% (0,92) y r
2
(0,71) as como entre W con S
2
di
(0,81) y r
2
(0,71).
El enfoque multivariado permiti profundizar el estudio de la estabilidad e interaccin
genotipo-ambiente (IGA) a travs del mtodo de los componentes principales utilizando dos
modelos= AMMI 1 y SREG-GGE ya que la descomposicin de la suma de cuadrados total
revel una participacin equivalente del efecto ambiental y de la IGA (37,6%) pero superior
al efecto genotpico (23,8%). El anlisis de la IGA revel que los dos primeros ejes del
anlisis de componentes principales IPCA1 e IPCA2 explicaron el 75,1% de la suma de
cuadrados de la interaccin. El modelo AMMI 1 (Grfico 1) identific a HC1, HC2, HC4,
HC5 y HC9 como bien adaptados a la mayora de los ambientes vinculados con la localidad
de Esperanza y tambin a P3 y L2. El resto de los materiales mostraron preferencia por
todos los ambientes relacionados a Castelar y la mayora de ambientes vinculados a
Llavallol y Pergamino. Segn este anlisis, los hbridos HC6, HC7 y HC9 son los ms
estables o presentan la menor IGA. La localidad de Esperanza (Prov. Sta. Fe) se asocia a
los menores requerimientos de TT y los ambientes vinculados con ella y Pergamino (Prov.
Bs. As.) aportaron la mxima contribucin a la IGA. El modelo de regresin por sitio SREG-
GGE (Grfico 2) seala a HC5 y HC8 como de comportamiento extremo. Los genotipos
HC3, HC6 y HC9 son los ms cercanos al origen porque sus valores medios de TT son muy
similares a la media general del MET. Los hbridos HC7 y HC9 aparecen fuertemente
asociados a los ambientes de la provincia de Buenos Aires que por su parte influyeron de
forma similar sobre el comportamiento genotpico relativo y conforman un mismo grupo
ambiental o mega-ambiente (Grfico 2). En cambio, el ngulo que se observa entre los
vectores correspondientes a estas localidades y la de Esperanza (provincia de Santa Fe) es
igual o cercano a 90 apuntando que entre localidades de ambas provincias prevalece una
IGA de mayor magnitud que la existente entre las localidades de la provincia de Buenos
Aires. Este hecho indica que los componentes IPCA1 e IPCA2 estn asociados a la
adaptacin de los materiales a las localidades de la provincia de Buenos Aires o Santa Fe.


HC1
HC2
HC3
HC4
HC5
HC6
HC7
HC8
HC9
HC10
HC11
HC12
C1
P1
E1
C2
P2
E2
C3
P3
E3
L3
L2
L1
-0,4
-0,3
-0,2
-0,1
0
0,1
0,2
0,3
0,4
0,5
1300,0 1350,0 1400,0 1450,0 1500,0 1550,0 1600,0
CHU
I
P
C
A
1
Tabla 1. Medidas de la estabilidad del tiempo trmico a floracin femenina de hbridos simples de
maz ensayados en un MET.

HIBRIDO/TIPO TT Rango CV% Rango b
i
Rango S
2
di
Rango W Rango r
2
Rango
HC1-wx 1442,2 5 4,5 4
0,08 1
4577,1 10 99955,8 12 0,51 7
HC2-DR 1496,0 9 2,7 1
0,16 2
1715,0 3 49925,4 8 0,60 6
HC3-DR 1475,8 7 9,5 12
1,94 11
4379,9 9 84842,1 11 0,78 2
HC4-DR 1461,9 6 4,2 3
0,48 3
3108,8 7 43648,1 7 0,62 5
HC5-CP 1555,6 12 2,9 2
0,48 3
1116,0 1 23720,0 2 0,44 9
HC6-CP 1483,2 8 6,9 8
1,16 5
5377,9 12 54968,0 9 0,49 8
HC7-DR 1524,4 11 7,7 11
1,49 9
4805,0 11 59203,0 10 0,65 4
HC8-DR 1370,7 1 7,5 9
1,44 8
1908,5 4 28078,0 3 0,82 1
HC9-CP 1499,0 10 5,7 5
0,97 4
3683,0 8 36871,3 6 0,49 8
HC10-DR 1428,3 3 6,3 6
1,27 7
1488,7 2 18272,8 1 0,82 1
HC11-DR 1404,4 2 6,5 7
1,17 6
2894,3 6 30285,3 4 0,66 3
HC12-wx 1430,2 4 7,6 10
1,53 10
2200,1 5 35049,4 5 0,82 1
TT=expresado en C, rango ordenado en sentido decreciente; CV%= coeficiente de variacin; b
i
= coeficiente de regresin
(Finlay y Wilkinson); S
2
di
=cuadrados medios de la desviacin (Eberhart y Russell); W= ecovalencia (Wricke); r
2
=coeficiente de
determinacin (Pinthus). Los valores ms bajos de rango de los distintos parmetros indican mayor estabilidad.

Figura 1. TT medio versus las coordenadas de Figura 2. Biplot asociado al modelo SREG-GGE
ambientes y genotipos del primer eje para el TT medio de hbridos simples
de coordenadas principales (AMMI1). de maz.

Ref.: HC1 - HC12 (cruzas simples) Localidades de la Prov. de Bs. As: C (Castelar); L (Llavallol); P
(Pergamino) y de la Prov. Sta. Fe: E (Esperanza). CHU: crop heat units (mtodo Ontario).

Bibliografa
Balzarini, M.; Bruno, C.; Arroyo, A. 2007. Anlisis de ensayos agrcolas multiambientales.
Ejemplos con Info-Gen. Estadstica y Biometra, Universidad Nacional de Crdoba, Facultad
de Ciencias Agropecuarias, Argentina.
Brown, D.M. 1978. Heat units for corn in Southern Ontario. Ont. Minist. Agric. Food
Factsheet, Agdex 111/31, Order No. 75-077.
Crossa, J.; Cornelius, P.L.; Yan, W. 2002. Biplots of linear-bilinear models for studying
crossover genotype-environment interaction. Crop Sci.42:619-633.
De Len Castillo, H.; Rincn Snchez, F.; Reyes Valds, M.H.; Smano Garduo, D.;
Martnez Zambrano, G.; Cavazos Cadena, R.; de Dios Figueroa Crdenas, J. 2005.
Potencial de rendimiento y estabilidad de combinaciones germoplsmicas formadas entre
grupos de maz. Rev. Fitotec. Mexicana vol 28(2): 135-143.
Yan, W. L.; Tinker, N.A. 2006. Biplot analysis of MET data: principles and applications. Can.
J. of Plant Science 86: 623-645.


DIFERENTES ESTRATEGIAS DE MUESTREO EN UN PRONSTICO
TEMPRANO DE COSECHA EN VIAS
LLERA, J.
1
; MORELLI, Cl.
1
; MARTINENGO, N.; CNOVAS, L.
1
; GALIOTTI, H.
2
; SOSA, M.
2
y MATUS, S.
3

1
Ct. Clculo Estadstico y Biometra,
2
Ct. Enologa,
3
Ct. Viticultura, Facultad de Ciencias
Agrarias, Universidad Nacional de Cuyo

jllera@fca.uncu.edu.ar

RESUMEN
El objetivo de este trabajo es adecuar estrategias de muestreo probabilstico para realizar un
pronstico temprano parcelario de produccin en viedos var. Malbec. En una campaa i y
momento t de la cosecha, el problema est en determinar cul ser el valor de produccin
y
i,t
total de la parcela. Luego
t i j t i t i
y y
, , ,
c + =

, donde t-j determina el momento del pronstico
de cosecha anterior a t. El pronstico ms prximo a cosecha est dado por j=1, y j >1 son
considerados pronsticos tempranos. En el caso de
j t i j t i
z x j t i
N y

=
, ,
. .
,

, donde N
es la cantidad total de plantas de la parcela,
x
y
z
son promedios de racimos por planta y
de peso unitario de racimos, respectivamente, al momento t-j en la campaa i. Si j=1 ambas
medias se pueden estimar con los datos obtenidos mediante un muestreo de dos fases: en
la primera se muestrean plantas y se cuentan racimos, y en la segunda se muestrean
plantas y se pesan sus racimos. En ambas se emplean dos estrategias diferentes: 1) con
aplicacin de un muestreo sistemtico con arranque aleatorio y 2) con muestreo por
conglomerados en dos etapas (hilera- claro). En un pronstico temprano, al no disponer de
racimos maduros, debe estimarse su peso promedio con informacin previa disponible. En
este caso solo se aplican ambas estrategias a la primera fase. Se formalizan para el modelo
la determinacin de .
, j t i
y

, .
,
j t i
y
S

e intervalos de confianza. Para evaluar ambas estrategias
se determina la proporcin del error de pronstico. En un pronstico temprano, la aplicacin
de la primera estrategia con
j t i
z
,
estimada con informacin de la campaa anterior, es la
que resulta con menor error promedio. Estos resultados determinan un modelo general de
pronstico parcelario para la produccin de uvas y su correspondiente metodologa de
muestreo para estimar sus parmetros con una precisin fijada.

Palabras Clave: Pronstico- Muestreo- Produccin de uvas

Introduccin
Se han observado pronsticos inexactos debido a factores evitables como: productores que
determinan produccin basados en miradas subjetivas de una parcela, por conocimiento
de producciones anteriores o que, an, al usar mtodos objetivos, utilizan resultados poco
fiables sin estimaciones de sus errores (1). No slo se debe estimar la cosecha, sino
tambin medir la precisin de dicha estimacin. Los pronsticos se establecen para
planificar y controlar las operaciones a fin de guiar las decisiones, por lo tanto, adems de
elaborarlos es necesario evaluarlos (2). Este trabajo tiene como objetivo elaborar una
estrategia de muestreo probabilstico que permita, a partir de diferentes modelos,
pronosticar a un nivel parcelario la produccin de uvas. Los pronsticos se pueden realizar
en diferentes momentos, en los cuales se proponen estimaciones y una evaluacin de los
errores de estimacin a un nivel de confianza fijado. Se trata de formalizar modelos de
pronsticos, con sus correspondientes estimadores y errores de estimacin, que se calculan
a partir de una estrategia de muestreo probabilstico. Al momento t correspondiente a la


cosecha de uvas, queda por determinar cunto vale y
i,t
, peso total de racimos de la
parcela, en la campaa i, a se momento t? Este es el valor que se desea pronosticar en un
momento anterior a cosechar toda la parcela

Desarrollo
I.Modelos: El modelo estadstico propuesto para cualquiera sea el valor de j es el siguiente:

t i j t i t i
y y
, , ,
c + =

j=1, 2, 3, 4 ; i=1, 2, 3,
y
i,t-j
: es la produccin total de la parcela en el momento t-j antes de la cosecha, en la
campaa i
t i,
c : es un error aleatorio al momento de cosecha, en la campaa i.
Lo que se intenta es estimar a y
i,t-j
para una campaa i y un determinado momento t-j. Se
debe notar que
t i,
c tiende a un valor mnimo cuando t-j se acerca temporalmente a t,
logrando mayor exactitud en la estimacin de y
i,t.
Por otra parte, un menor error en la
estimacin de y
i,t-j
da como resultado una mayor precisin. Esto ltimo se puede lograr con
una correcta eleccin de la metodologa de muestreo y la forma de obtener sus estimadores.
Se deduce que el problema principal es determinar y
t-j
, para cualquier campaa, y en el caso
de un pronstico temprano, j = 2. El modelo base del presente trabajo
es:
t i z x t i
t i j t i
N y
, ,
1 , ,
. . c + =

j t i
x
,
Media poblacional de la cantidad de racimos por planta en la campaa i momento t-j

1 , t i
z
Promedio unitario poblacional del peso del racimo en la campaa i al momento t-1.
La cosecha total de la parcela puede ser estimada si se conoce: la cantidad promedio de
racimos por planta, el promedio del peso unitario de racimos y el nmero total de plantas de
la parcela (4).
En j=2 no se puede estimar

1 , t i
z
ya que no es posible pesar racimos. Por lo tanto, se

hace necesario fijar el valor del promedio del peso unitario de racimos a travs de:

1-Fijacin de C=
1 , t i
z
con informacin general de la variedad. Este valor de c es

promedio del peso unitario del racimo de la variedad, tomado como constante. Esta
alternativa solo es confiable en el caso de que el tcnico no disponga de ninguna
informacin histrica de la parcela y le interese realizar un pronstico temprano. Su
estimador del pronstico y su error tpico son:
N y
c j t i
=
/ ,
c x
j t i
.
,
, donde
j t i
x
,

promedio de la cantidad de racimos por planta en la campaa i al momento t-j y c constante
fijada como el peso promedio (kg) por racimo de la variedad al momento t-1. Luego
j t i c j t i
x y
S
n
n N N
c

=
, / ,
.
) (
.

o

2-Fijacin de
1 , 1
1

=
t i
z
c : Este valor de c1 es el verdadero promedio del peso unitario del
racimo que se calcula en la parcela, en la campaa anterior, en el perodo t-1. Su estimador
y error tpico (3) son:

N y
c j t i
=
/ ,
1 , 1 , t i j t i
z x
2
1
2 2 2
2
1 , 1
2
2
,
2
1
,
1
1 , 1 ,
1
1 , 1
,
. . . .
|
|
.
|
\
|
+ + =

i
x
r
z
i
x
t i
r
z
j t i y
n
s
n
s
n
s
z
n
s
x N S
j t i
i
t i j t i
i
t i
j t i

3-Fijacin de C
2
con informacin de las k campaas anteriores


2
c
, se estima de la siguiente manera:

= =

= =
1
1
*
, 1
1 ,
*
2
/
*
i
k i l
r
n
s
s t
t i
l
n z z c

Promedio unitario del peso de racimos en el momento t-1 de la campaa i calculado
como un promedio de todos los pesos de las muestras de racimos de k campaas anteriores
a i.
nmero de racimos muestreados en la l-sima campaa siempre en el perodo t-1.
n
*
= Total de tamaos de muestras de las k campaas anteriores a la campaa i
peso unitario de racimos, en el momento t-1, de la muestra de tamao n
*
racimos.
Su estimador y error tpico es
2
/ ,
c j t i
y

1 ,
*
,
.
= t i
j t i
z x N

2
1
2
*
2 2
2
1 ,
*
*
2
2
,
2
1
, 1 ,
*
, 1 ,
*
2
/ ,
. . . .
|
|
.
|
\
|
+ + =

i
x
z
i
x
t i
z
j t i y
n
s
n
s
n
s
z
n
s
x N S
j t i t i j t i t i
c j t i

II- Estrategias de muestreo:
Estrategia 1: Consiste en aplicar un muestreo en dos fases con muestreos sistemticos con
arranque aleatorio para seleccin de plantas.
Estrategia 2: Se aplica un muestreo en dos fases; la primera, un muestreo de
conglomerados bietpico, en donde se sortean hileras y luego claros, y en la segunda se
sortea una planta por claro.
III-Error de Pronstico: El valor de 100 . / %
, , , t i j t i t i t i
y y y e

= es el error porcentual de
pronstico que se comete para una determinada estrategia de muestreo y modelo aplicado.
IV-Parcela Experimental:
Se trabaj en una parcela de la Facultad de Ciencias Agrarias (2010-2013), Mendoza,
Argentina. Este viedo est compuesto por 1794 plantas de vid en espaldero alto,
compuesto de 23 hileras donde cada una tiene 14 claros con entre 4 y 5 plantas.

Cuando se utiliza informacin especfica de la variedad, los errores de pronstico son
superiores al 100% cualquiera sea la estrategia de muestreo utilizada. Valores tan generales
aplicados a casos particulares de una parcela, tienden a resultar en pronsticos con grandes
errores. Por otro lado, al fijar los valores de c con informacin de la campaa anterior o con
el promedio de las ltimas, los pronsticos resultan con errores cercanos o menores a los
prefijados del 10%, cuando la estrategia utilizada es la de muestrear plantas (estrategia 1).
Para ambas estrategias el pronstico subestim a la produccin real de toda la parcela.
Como conclusiones se tiene:1) el modelo II de produccin parcelaria para un pronstico
temprano, aplicando una estrategia de muestreo I resulta con menor error de pronstico. 2)
Se explicitan las formas de calcular las varianzas e intervalos de confianza para el
pronstico, segn la forma de fijar c que se utilice. 3) Los primeros resultados indican que la
estrategia de muestrear plantas a lo largo de toda la parcela produce menor error de
pronstico que en el caso de sortear claros. 4) En el modelo ensayo, la fijacin del valor de c
con informacin especfica de la parcela en las campaas anteriores resulta con un error de
pronstico aceptable para los valores fijados.

Bibliografa


* 1-CSIRO and NRE. 2001.Crop Development. Crop Estimation and Crop Control to secure
Quality and Production of Major Wine Grape Varieties: A National Approach.
* 2-Diebold, Francis. 2001. Elementos de los Pronsticos, Ed. Thomson.
* 3- Goodman,L.A.; 1960.On the exact variance of products. American Statistical
Association Journal, pp. 708-713.
* 4-Wolpert,J.A. y Vilas,E.1992. Estimating Vineyard Yields: Introduction to a simple, two
step method.American Journal Enology and Viticulture. Vol 43-N 4, pag 384-388.


ESTIMACIN VA REGRESIN NO LINEAL DEL TAMAO PTIMO
DE PARCELA EN EXPERIMENTO DE CAMPO CON BATATA

GUIDO GUSTAVO HUMADA GONZLEZ, AUGUSTO RAMALHO DE MORAIS, CSAR
ARNALDO CABALLERO MENDOZA, GILBERTO RODRIGUES LISKA

Departamento de Ciencias Exactas, Universidad Federal de Lavras, Minas Gerais, Brasil
Departamento de Produccin Agrcola, Facultad Ciencias Agrarias, San Lorenzo, Paraguay


RESUMEN
La bsqueda de nuevas variedades de batata altamente productivas demanda mayores
estudios en las reas de fitotecnia y tcnicas de experimentacin. Para obtener resultados
altamente confiables, es necesario utilizar experimentos bien planeados, de forma que sea
posible detectar variaciones entre los tratamientos. En todo experimento uno de los objetivos
principales est relacionado con la reduccin del error experimental que puede ser
controlado, por ejemplo, mediante la utilizacin de tamaos adecuados de parcelas. La
estimacin del tamao de parcela es algo complejo en funcin de la cantidad de variables
envueltas en el proceso. El objetivo del trabajo fue estimar el tamao ptimo de parcela en
experimento con batata con vista comparar los diferentes mtodos utilizados para la
obtencin del tamao de parcela. Los datos provienen de un ensayo de uniformidad en
sistema convencional con batata, variedad moroti, conducido en el campus experimental de
la Facultad de Ciencias Agrarias, en la ciudad de San Lorenzo Paraguay, en el perodo de
octubre/2011 a marzo/2012. Fueron utilizados dos mtodos: el mtodo de mxima curvatura
modificada (MMCM) y el modelo lineal segmentado con respuesta plat (MLSRP).
Concluyese que por el MMCM el tamao ptimo de parcela estimado es tres unidades
experimentales bsicas (UEB). Utilizando el MLSRP el tamao ptimo estimado fue once
UEB.

Palabras clave: solanum tuberosum, error experimental, mxima curvatura, modelo
segmentado.

Introduccin
La bsqueda de nuevas variedades de batata altamente productivas demanda mayores
estudios en las reas de fitotecnia y tcnicas de experimentacin. Para obtener resultados
altamente confiables, es necesario utilizar experimentos bien planeados, de forma que sea
posible detectar variaciones entre los tratamientos. En todo experimento uno de los objetivos
principales est relacionado con la reduccin del error experimental, el cual deriva de la
heterogeneidad de las parcelas, del material experimental y del suelo. Otras fuentes que
afectan la magnitud del error experimental son: tipo de tratamiento, presencia de plagas,
enfermedades, plantas dainas y las unidades experimentales bsicas ([5]; [3]).
El error experimental puede ser controlado, por ejemplo, mediante la utilizacin de tamaos
adecuados de parcelas [4]. Delante de lo expuesto, el presente trabajo tuvo como objetivo
estimar el tamao ptimo de parcela en experimento con batata con vista a la comparacin
de los diferentes mtodos utilizados para la obtencin del tamao de parcela.

Desarrollo
Los datos provienen de un ensayo de uniformidad en sistema convencional con batata,
variedad moroti, conducido en el campus experimental de la Facultad de Ciencias Agrarias,
en la ciudad de San Lorenzo Paraguay, en el perodo octubre/2011 a marzo/2012. El
conjunto de datos hace referencia a la produccin de batata, de 100 unidades
experimentales bsicas (UEB), dispuestas en un grade de terreno en 10 hileras por 10


columnas. Cada UEB fue formada por 1,00 m de largo y 0,30 m entre hileras, abarcando 0,3
m de rea. En cada UEB (1 planta) fue evaluada la produccin de tubrculos, la cual fue
expresada en gramos (gr). Las unidades experimentales fueron agrupadas de manera que X
(nmero de UEB por parcela simulada) sea divisor del nmero total de UEB, formando as
varios tamaos y formas de parcelas con X UEB.
Fueron utilizados dos mtodos para determinar el tamao ptimo de parcela: Mtodo de
mxima curvatura modificado (MMCM), propuesto por [1] para determinar el tamao ptimo
de parcela, mediante la tcnica de regresin, determina una ecuacin que relaciona el
coeficiente de variacin entre las parcelas con el tamao de parcela. A funcin es definida
por:
( ) X B
A
CV
X
= (1)

en que:
( ) X
CV es el coeficiente de variacin entre las parcelas de tamao X ; X representa
el nmero de unidades experimentales bsicas agrupadas; A y B son los parmetros a ser
estimados. El tamao ptimo de parcela fue estimado utilizando la expresin [6]:
( )
( )
1
2 2
2 2
0

2 1
2
B
A B B
X
B
+
(
+
(
=
( +

(2)
en que: es el valor de la abscisa correspondiente al punto de mxima curvatura, o sea, es
el estimador del tamao ptimo de parcela; y son las respectivas estimativas de A y B.
Otro mtodo para estimar el tamao ptimo es va Modelo lineal segmentado con respuesta
plat (MLSRP), Propuesto por [2] para la estimacin del tamao de parcela, partiendo
inicialmente de un ensayo en blanco se basa en la siguiente expresin:

( )
0 1 1 0
0
i
X
i
X se X X
CV
CVP se X X
| | c
c
+ + s
=

+ >

(3)
en que:
( ) X
CV representa el coeficiente de variacin entre el total de parcelas de tamao X ;
X es el nmero de unidades bsicas agrupadas;
0
X es el parmetro relativo al tamao
ptimo de parcela para el cual el modelo linear se transforma en plat, en relacin a la
abscisa; CVPrepresenta el coeficiente de variacin en el punto correspondiente al plat
(unin del segmento linear y el plat);
0
| es el intercepto del segmento linear;
1
| representa
el coeficiente angular del segmento linear;
i
c es el error asociado al
( ) X
CV .
El tamao ptimo de parcela (
0
X ) es dado por:
0
0
1
CVP
X
|
|
=
(4)

En la tabla 1 son presentados los diferentes agrupamientos posibles y los tamaos de
parcelas producto de tales agrupamientos de UEB, con sus respectivas reas para la cultura
de batata. Puede observarse que el rea de parcela va de 0,3 m hasta 15 m dependiendo
del formato y tamao de parcela agrupada.
El tamao ptimo de parcela estimado por el MMCM es 2,82 UEB (3 UEB). El coeficiente de
determinacin ajustado fue 97,09 %, indicando buen ajuste del modelo. Utilizando el
MLSRP, el tamao ptimo estimado fue de 10,90 UEB (11 UEB), equivalentes a 11 plantas
o rea de 3,3 m. El coeficiente de determinacin ajustado fue 77,77 %. Este resultado
concuerda con [2], que comparando mtodos de estimacin de tamaos de parcela
concluyeron que el MLSRP estima mayores tamaos de parcela que el MMCM.



Las Figuras 1 y 2 ilustran la tendencia de comportamiento de la variabilidad, medida por el
coeficiente de variacin, y el ajuste de los dos mtodos utilizados, lo que permite identificar
una mejor calidad de ajuste por el MMCM.
0 20 40 60 80
0
2
4
6
8
1
0
tamanho de parcela X (UEB)
C
V

(
%
)
MMCM
(2.82)

0 20 40 60 80
0
2
4
6
8
1
0
tamanho de parcela X (UEB)
C
V

(
%
)
(10,90)
MLSRP

Figura 1: Tamao ptimo de parcela via
mtodo de mxima curvatura modificada.
Figura 2: Tamao ptimo de parcela via
modelo lineal segmentado plat.

Concluyese que el MMCM se ajusta mejor a los datos pero subestima el tamao ptimo de
parcela. El tamao de parcela recomendado para la variedad moroti es 11 unidades
experimentales, estimado va modelo linear segmentado con respuesta plat.

Bibliografia
[1] Lessman, K. J.; Atkins, R. E. 1963. Optimum plot size and relative efficiency of lattice desings for
grain sorghum yield tests. Crop Science, Madison, v.3, n.5, p.477-481.
[2] Paranaba, P. F. et al. 2009. Tamanho timo de parcelas experimentais: comparao de mtodos
em experimentos de trigo e mandioca. Revista Brasileira de Biometria, v.27, p.81-90.
[3] Ramalho, M.A.P. et al. 2012. Aplicaes da Gentica Quantitativa no Melhoramento de Plantas
Autgamas. Lavras: UFLA, Brasil. 522p.
[4] Steel, R. G. D. et al. 1997. Principles and procedures of statistics. 3.ed. New York: Mcgraw Hill,
666p.
[5] Storck, L. et al. 2000. Experimentao vegetal. Santa Maria, RS: UFSM,Brasil. 2000. 198 p.


MODELO AUTOREGRESIVO ESPACIO-TIEMPO LINEAL
GENERALIZADO BASADO EN DISTANCIAS CON
PERTURBACIONES AUTORREGRESIVAS ESPACIO-TIEMPO

OSCAR MELO
1
, CARLOS MELO
2
, JORGE MATEU
3

1
Profesor Asociado, Departamento de Estadstica, Facultad de Ciencias, Universidad
Nacional de Colombia
2
Profesor Asociado, Programa de Ingeniera Catastral y Geodesia, Facultad de Ingeniera,
Universidad Francisco Jos de Caldas
3
Profesor Catedrtico, Departamento de Matemticas, Universidad Jaume I

oomelom@unal.edu.co

RESUMEN
Se presenta una solucin a problemas donde la variable respuesta es un conteo, una razn
o una respuesta binaria utilizando modelos lineales generalizados autorregresivos espacio-
temporales basados en distancias con perturbaciones autorregresivas espacio-temporales
(DBGLSTARAR). Este modelo puede tambin utilizar variables explicativas espaciales
adicionales, as como variables explicativas asociadas al tiempo. Se incorporan medidas
generales de distancia/disimilitud que se pueden aplicar a variables explicativas espaciales o
espacio-temporales: numricas, categricas o una mezcla de ellas. Se amplia la posibilidad
de contrastar o juzgar la especificacin de efectos fijos contra la especificacin de efectos
aleatorios en modelos de datos panel, para incluir la autocorrelacin del error espacio-
tiempo o una variable dependiente rezagada espacio-tiempo utilizando pruebas de
especificacin. Se estima la matriz de varianzas y covarianzas de los parmetros en estos
modelos extendidos. El proceso de estimacin de los diferentes parmetros se hace
mediante el mtodo de ecuaciones de estimacin generalizada para espacio-tiempo.
Adems, se presenta una medida de bondad de ajuste y el mejor pseudo-predictor lineal
insesgado cuando se utilizan estos modelos para propsitos de prediccin. En aplicacin de
estudio se utilizan variables sociales, econmicas, geogrficas y de presencia del Estado
para los 32 departamentos colombianos, con la finalidad de ver la relacin entre el nmero
de acciones armadas por cada 1000 km
2
que han realizado los grupos guerrilleros de las
FARC-EP y ELN durante los aos 2003 a 2009, con las covariables: tasa de atencin a
vctimas de la violencia (TAVV), desplazamiento forzado-hogares expulsados (DFHE),
desplazamiento forzado-hogares recibidos (DFHR), total de confrontaciones armadas (TCA)
por ao, nmero de acciones armadas por parte de las fuerzas militares (NAAFM) y
porcentaje de personas que residen el rea urbana (PPRAU) con respecto a la poblacin
total del departamento.

Palabras clave: perturbaciones autorregresivas espacio-temporales, modelos lineales
generalizados, autorregresivos espacio-temporales, distancia/disimilaridad, acciones
armadas.

Introduccin
En los ltimos aos, la literatura espacio-tiempo ha mostrado un creciente inters en la
especificacin y estimacin de las relaciones economtricas y de las ciencias sociales
basada en paneles espaciales. Los paneles espaciales suelen referirse a los datos que
contienen las observaciones de series de tiempo de un nmero de unidades espaciales
(cdigos postales, municipios, regiones, estados, jurisdicciones, pases, etc.). Este inters
se puede explicar por el hecho de que los datos panel ofrecen a los investigadores extensas
posibilidades de modelamiento en comparacin al ajuste de una sola ecuacin de corte
transversal, lo cual fue el objetivo principal de la literatura economtrica espacial por un


largo tiempo (Hsiao 2003). Un grupo considerablemente ms pequeo (Elhorst 2008) se ha
ocupado del anlisis social y economtrico de la dinmica espacial en los modelos de datos
panel temporalmente estticos.
Muchos de los trabajos y estudios presentados anteriormente establecen la importancia de
integrar rezagos espaciales y temporales en el anlisis de datos panel cuando la variable
respuesta no es normal. Sin embargo, la literatura en modelos con dinmica espacial y
temporal han presentado algunos progresos al tratar con esta clase de variable respuesta,
pero en muchos casos por separado.

Modelo lineal generalizado dinmico espacio-tiempo utilizando el mtodo
basado en distancias
Los modelos DBGLSTARAR en forma reducida se pueden expresar como

donde , es un vector de parmetros desconocido,
contiene una matriz con coordenadas principales. Las interacciones espacio-
temporales son modeladas a travs de rezagos espacio-temporales y errores espacio-
temporales. Adems, el modelo permite interacciones espacio-temporales en la variable
dependiente, las coordenadas principales y las perturbaciones.

Estimacin por mxima verosimilitud
La funcin de verosimilitud para un modelo de vector autorregresivo generalizado espacio-
tiempo no se puede escribir en forma cerrada, sino slo como una integral de alta dimensin

donde denota la funcin de distribucin normal multivariada de dadas las
covariables observadas , con el conjunto de los parmetros asociados a La
solucin a las ecuaciones de mxima verosimilitud para se lleva a cabo mediante un
proceso iterativo ponderado de mnimos cuadrados. Despus utilizando GEE se puede
estimar .

Se emplea la distancia euclidiana entre individuos porque todas las variables explicativas
son continuas. De este modo, se obtuvieron las distancias empleando las variables
explicativas centradas y la matriz . Luego se construyeron las coordenadas
principales utilizando las variables explicativas: TAVV, DFHE, DFHR, TCAA por ao,
NAAFM y PPRAU. Para seleccionar las coordenadas principales a incluir en el modelo, se
observ las ms significativas de acuerdo al valor ms alto de Wald.
Especficamente, para este estudio se seleccionaron siete coordenadas principales
( y ), lo cual fue realizado con la finalidad de mostrar el buen
funcionamiento del mtodo DB y observar la gran reduccin de variables explicativas en
comparacin al modelo GLSTARAR.
El modelo DBGLSTARAR se puede escribir como



con y , y donde y es un vector
de parmetros desconocido.
Todos los rezagos espaciales de los errores fueron significativos al 5%. Adems, como los
coeficientes de rezago espacial entre tiempos no son los mismos a lo largo del tiempo, se
puede decir que hay una interaccin entre espacio y tiempo en el modelo de error espacial.
Los signos de todos los parmetros son positivos, lo cual significa que un departamento con
alto/bajo error est rodeado de departamentos con alto/bajo error. El parmetro de escala es
, lo cual significa que la dispersin es baja y que este modelo es menos preciso
que el modelo GLSTARAR ( ), debido a que el del modelo DBGLSTARAR es
ms bajo que el del modelo GLSTARAR. Este comportamiento del mtodo DB en el modelo
de error espacial se presenta porque se tienen mucho menos variables (coordenadas
principales) que variables explicativas en el modelo GLSTARAR.
De otro lado, todos los rezagos espaciales del del nmero de acciones armadas fueron
significativos al 5%. Como los coeficientes de rezago espacial entre tiempos no son los
mismos (los signos y los parmetros estimados varan a travs del tiempo), hay una
interaccin entre espacio y tiempo en el modelo de rezago espacial. Esto significa que en un
momento en el tiempo, por ejemplo, para el ao 2009 (WY7.lag), un determinado
departamento tiene relacin positiva (0.0219) con sus departamentos vecinos, es decir que
un departamento tiene un nmero alto/bajo de acciones armadas de las FARC y ELN y sus
departamentos vecinos alrededor presentan un nmero alto/bajo de acciones armadas. Sin
embargo, en el ao 2006 (WY4.lag), esta relacin fue negativa (-0.00271), lo cual significa
que un departamento con un nmero alto de acciones armadas de las FARC y ELN tiene
departamentos vecinos alrededor que presentan un nmero bajo de acciones armadas o
viceversa. El parmetro de escala es , el cual significa que la dispersin es baja y
no hay problemas fuertes aparentemente de sobredispersin. Adems, como este
coeficiente es ms alto que el obtenido en el modelo GLSTARAR de rezago espacial
(0.615), entonces se puede decir que el modelo DBGLSTARAR de rezago espacial es ms
preciso que el modelo GLSTARAR.
En conclusin, se presentaron los modelos lineales generalizados autorregresivos espacio-
temporales basados en distancias con perturbaciones autorregresivas espacio-temporales.
Para este modelo, se desarrollaron la estimacin de los efectos fijos y aleatorios, y se
determinaron sus niveles de significancia. Se presentaron algunas medidas para realizar el
anlisis de residuos, se realiz el proceso de seleccin de las coordenadas principales y se
realiz la prediccin espacio-tiempo de un nuevo sujeto.

Bibliografa
[1] Anselin, L., Florax, R. J. G. M. and Rey, S. (2004). Advances in Spatial Econometrics,
Methodology, Tools and Applications. Springer, Berlin.
[2] Cuadras, C. M. and Arenas, C. (1990). A distance based regression model for prediction
with mixed data. Communications in Statistics A - Theory and Methods, 19: 2261-2279.
[3] Elhorst, J. P. (2008), A spatiotemporal analysis of aggregate labour force behavior by
sex and age across the european union. Journal of Geographical Systems, 10(2): 167-190.
[4] Hsiao, C. (2003). Analysis of Panel Data. 2nd edn, Cambridge University Press,
Cambridge.
[5] Liang, K. Y. and Zeger, S. L. (1986). Longitudinal data analysis using generalized linear
models. Biometrika, 73: 13-22.


MODELO LINEAL GENERALIZADO MIXTO PARA CONSTRUIR
PRONOSTICO DE PRODUCCION DE VARIABLE DE RESPUESTA
ORDINAL SUBJETIVA EN EL ALTOVALLE DE
RIO NEGRO Y NEUQUEN

GUSTAVO N. GIMENEZ
1
, NATALIA RUBIO
1
, VALENTIN TASSILE
1
, ANDREA LAVALLE
1
,
GARCIA A.
2

1
Departamento de Estadstica, Universidad Nacional del Comahue
2
Secretaria de Fruticultura de Ro Negro

gunegim@gmail.com
rubionatalia@yahoo.com.ar

RESUMEN
Los datos analizados en este trabajo surgen del convenio suscripto por autoridades de Ro
Negro y la Facultad de Ciencias Agrarias de la Universidad Nacional del Comahue en el cual
se realizaron trabajos de relevamiento de informacin, procesamiento y elaboracin del
pronstico de produccin de las principales variedades de frutales de pepita. Las
observaciones corresponden al recuento de frutos por planta y registro de dimetros en la
variedad peras Williams, se estudia la variable de respuesta tamao del fruto que consta
de cinco categoras: pequeo, medianamente pequeo, mediano, medianamente grande y
grande, siendo la variable de respuesta de naturaleza ordinal. Dicha variable se registr
objetiva y subjetivamente, analizndose sta ltima en este trabajo. Se tuvo en cuenta en la
modelizacin los efectos fijos: edad de la plantacin (10 a 19; 20 a 29; 30 a 39 y mayor de
40 aos), conduccin de las plantas (libre o en espaldera) y el efecto ao (2012, 2013) las
dos ltimas temporadas. Se ajust un Modelo Lineal Generalizado Mixto ya que los mismos
brindan herramientas poderosas que permiten corregir la variabilidad proveniente de las
observaciones. Teniendo en cuenta la ordinalidad de la variable de respuesta se utiliz el
Modelo Log-Acumulado. Las estimaciones de mxima verosimilitud de los parmetros se
proporcionan utilizando la aproximacin de Laplace. Se realizaron los perfiles de
verosimilitud y los intervalos de confianza para cada uno de los relevadores. Al igual que con
el pronstico con los datos objetivos, se detectaron diferencias en las temporadas 2012 y
2013, obteniendo frutos ms pequeos en el ao 2013. Tambin se observ que la
conduccin de las plantas no es significativa, mientras que la edad de los frutales si lo es en
cuanto al tamao de los frutos. El modelo mixto permiti estimar la variabilidad de los
relevadores.

Palabras clave: Pronstico de produccin, Modelos lineales multivariados mixtos,
Perfiles de verosimilitud.

Introduccin
Los datos analizados en este trabajo surgen del convenio en vigencia suscripto por
autoridades provinciales de la provincia de Ro Negro, y la Facultad de Ciencias Agrarias de
la Universidad Nacional del Comahue en el cul se realizaron los trabajos de relevamiento
de informacin, procesamiento y elaboracin del pronstico de produccin de las principales
variedades de fruta de pepita existentes en la regin [1]. Las observaciones corresponden al
recuento de frutos por planta y registro de dimetros en la variedad peras Williams. Las
mismas fueron realizadas por 20 relevadores los cuales registraron de forma subjetiva y
objetiva las mediciones de los frutos. Se entiende que las mediciones subjetivas se realizan
clasificando a los frutos de las plantas en pequeos, medianamente pequeos, medianos,


medianamente grandes y grandes, mientras que las medidas objetivas se realizan tomando
los registros del dimetro ecuatorial de los frutos en milmetros con un calibre digital. Debido
a que la variable de respuesta (Tamao de Fruto) consta de cinco categoras y es de
naturaleza ordinal, se plantea un Modelo Logit Acumulado [2]. Dado que en este trabajo se
analizan las apreciaciones subjetivas de los frutos es necesario considerar el efecto del
relevador como un efecto aleatorio [3]. Esta variable fue registrada durante 20 temporadas y
no haba sido estudiada hasta este momento.

Desarrollo
El total de observaciones obtenidas por los relevadores es de 835 para las dos temporadas.
Las categoras de la variable de respuesta Tamao de Fruto se codificaron de la siguiente
manera: 1: pequeo, 2: medianamente pequeo, 3: mediano, 4: medianamente grande, 5:
grande. En este trabajo se analizan las apreciaciones subjetivas de los relevadores de frutos
en los rboles por lo que es necesario considerar el efecto del relevador (que fue
identificado de 1, 2,, 20) como un efecto aleatorio, dado que cada observador tiene un
criterio diferente, por ejemplo lo que es para uno un fruto medianamente pequeo para otro
puede ser solo un fruto mediano. Al momento de la modelizacin se tuvieron en cuenta los
siguientes efectos fijos: edad de la plantacin, cuyos estratos son 10 a 19; 20 a 29; 30 a 39 y
mayor de 40 aos, la conduccin de las plantas (L: libre, E: en espaldera) y por ltimo el
efecto ao (2012, 2013) es decir, las dos ltimas temporadas. La modelacin se realiz a
travs del software libre R [4], utilizando la librera ordinal, las funciones clmm y clmm2 [5].
Se realizaron las representaciones de los intervalos de confianza para cada uno de los
relevadores, la verosimilitud relativa del efecto aleatorio en trminos del desvo estndar y
los perfiles de cada uno de los relevadores.

Figura 1. Perfil relativo de verosimilitud
Figura 2. Intervalos de confianza para cada
uno de los Relevadores.
Figura 3. Probabilidades para el relevador
promedio y extremos en distintas condiciones.

Se analiz desde un modelo saturado donde se tuvo en cuenta los efectos fijos y todas sus
interacciones, continuando el anlisis hasta arribar a un modelo parsimonioso que mejor
ajuste los datos con la menor cantidad de efectos fijos.
Para comparar los modelos y verificar el ajuste se utiliz el valor del AIC (criterio de Akaike),
el valor del Hessiano y la log-verosimilitud.

En una primera instancia se ajust un modelo log-acumulado para la variable de respuesta
tamao del fruto, teniendo en cuenta los efectos fijos: edad de la plantacin, conduccin de
las plantas, el efecto ao y todas sus interacciones triples y dobles. A travs del test de
verosimilitud se concluy que las interacciones no fueron significativas (Tabla 1). Luego se
modelaron los efectos principales donde nuevamente a travs del test de verosimilitud se
arrib a que el efecto Conduccin no era significativo (Tabla 1). De acuerdo a algunos
autores [5] para analizar el efecto aleatorio de un modelo log-acumulado, se compara a


travs de un test de verosimilitud el modelo con y sin el efecto aleatorio. En este caso el
efecto aleatorio relevador resulto altamente significativo.

Tabla 1. Test de Verosimilitud para los distintos modelos
Test 1. Modelo con interacciones
triples versus modelo con
interacciones dobles
Test 2. Modelo con interacciones
dobles versus modelo
con efectos principales
Test 3. Modelo con todos los efectos
principales versus modelo
sin efecto conduccin
AIC logLik LR df P(>
Chi)
AIC logLik LR df P(>Ch
i)
AIC logLik LR df P(>Chi)
1375.0 -670.48 1371.3 -675.63 1369.4 -675.71
1380.8 -670.40 0.174 3 0.98
16
1375.0 -670.48 10.28 7 0.172
8
1371.3 -675.63 0.173 1 0.6769

Tabla 2. Estimacin del Modelo: TAMAO ~ ANIO + EDAD + (1 | Enc)
Coeficientes Estimacin Std. Error z value Pr(>|z|) umbrales
ANIO 2013 0.5165 0.1966 2.628 0.0086 ** G|MG: -5.295
EDAD 10-19 -0.4001 0.2373 -1.686 0.0918 MG|M: -3.319
EDAD 20-29 -0.5469 0.2370 -2.308 0.0210 * M|MP: 1.434
EDAD 30-39 -0.5799 0.2328 -2.491 0.0127 * MP|P: 2.395

Se realizaron los perfiles de verosimilitud a partir de los cuales se calcularon los intervalos
de confianza para el efecto aleatorio, en particular para cada uno de los relevadores [6],
realizando los grficos correspondientes (Figuras 1, 2 y 3). Los valores obtenidos del efecto
aleatorio en trminos del desvo estndar con un 95% de confianza fueron de 1,18 y 2,32,
debido a que estos valores son distintos de 1 confirman la importancia del efecto aleatorio
en la modelacin de los datos. Una vez determinado el modelo se estimaron los parmetros
mediante el algoritmo de Laplace (Tabla 2). Para el efecto ao se obtuvo un odds ratio de
1,85 que representa que en el ao 2012 hubo casi el doble de los frutos ms grandes que
en el ao 2013. Las edades 20-29 y de 30-39, ambas respecto de la categora ms de 40,
tienen casi el doble (1,73 y 1,82 respectivamente) de tener frutos ms grandes. Los valores
obtenidos en el ajuste del modelo final fueron los siguientes: valor del AIC 1371, el valor del
Hessiano 150, recordando que dicho valor debe ser menor a 10
4
para asegurar su adecuado
ajuste y la convergencia del modelo [5], y por ltimo la Log-verosimilitud fue de -676. Debido
a que los pronsticos siempre se relativizan a la temporada anterior, este modelo es muy
consistente, permitiendo utilizar las apreciaciones subjetivas respecto del tamao de los
frutos, con ambas mediciones se arriba a similares conclusiones [1], contemplando la
variabilidad existente entre los relevadores.

Bibliografa
[1] Bramardi, S., Tassile, V., Gimenez, G. y Garca, G. Informe: Pronostico de produccin
de peras y manzanas para la provincia de Rio Negro. (2012). http://www.sefrn.gov.ar
[2] Agresti, Alan. Categorical Data Analysis, segunda edicin. Wiley. EEUU Pag. 514 -516.
[3] Tutz, G, Hennevogl, W, Random effects in ordinal regression moldels (1996).
Computational statistics & data analysis. VOl 22, pag 537-557.
[4] R Core Team (2012). R: A language and environment for statistical computing. R
Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL
[5] Christensen, R.H.B. (2012) ordinal regression models for ordinal data. http://www.cran.r-
project.org7package=ordinal.
[6] Esa Uusipaikka, Confidence intervals in generalized regression models, (2009) EEUU.
Champan & Hall. Capitulo8. Pag. 189.


MODELO CONDICIONAL PARA DATOS LONGITUDINALES
APLICADO A PREDICTORES DE XITO Y FRACASO EN LA
VENTILACIN NO INVASIVA EN LACTANTES

CARO PATRICIA
1
, MORELLI CANDELARIA
1
, FIGUEROA LAURA
2
, LAFFAYE FEDERICO
2

1
Facultad de Economa y Administracin, Estadstica, Universidad Nacional del Comahue
2
Unidad de Terapia Intensiva Peditrica, Hospital Provincial de Neuqun Dr. Castro Rendn

caropatriciaj@yahoo.com.ar

RESUMEN
La ventilacin no invasiva (VNI) es una alternativa en pacientes lactantes con insuficiencia
respiratoria aguda moderada-severa, permite mejorar la ventilacin y oxigenacin, disminuir
el trabajo respiratorio y evita, en un alto porcentaje, la intubacin endotraqueal. Se presenta
una experiencia en la unidad de terapia intensiva peditrica (UTIP) del hospital Castro
Rendn (Neuqun) con un estudio de tipo descriptivo, longitudinal, retrospectivo y sin
considerar grupo control sobre pacientes de 1 y 24 meses de edad o peso menor a 13 kg.,
en un lapso de 18 meses, conectados en forma precoz al CPAP burbuja (un tipo de VNI).
Los mtodos de anlisis utilizados son: regresin logstica, Kaplan-Meier, regresin de Cox
para la censura no informativa, modelos lineales generales y mixtos para datos
longitudinales con contemplacin de correlaciones entre observaciones provenientes de un
mismo paciente a travs del modelo autoregresivo de primer orden. Se identific como
predictores de xito de CPAP: disminucin del 15% de la frecuencia respiratoria (FR), odds
ratio [OR]=0,145, intervalo de confianza [IC] del 95% 0,048-0,43 y disminucin en 2 o ms
puntos del score de Tal (TAL), OR=0,10, IC del 95% 0,03-0,34. No se detectaron diferencias
entre el tipo de diagnstico (bronquiolitis y neumona). El 50% de nios con edad superior a
6 meses se recuperan a las 72hs de conexin al CPAP. Se observ una interaccin
estadsticamente significativa en FR (p<0.0036) y TAL (p<0,0001) respecto al tiempo
evaluado en cada una. La FR evidenci cambios en las dos primeras horas de conexin
mientras que TAL present variaciones en los tres momentos (a las 0, 2 y 6 horas, con
medias de 9,21; 5,44 y 4,94 respectivamente). La frecuencia cardaca careci interaccin
con el tiempo. En conclusin, los principales predictores de xito y fracaso de VNI, son FR
y TAL en las 2 primeras horas de conexin del CPAP.

Palabras clave: burbuja CPAP, modelos lineales mixtos, score de TAL, regresin de
Cox

Introduccin
La asistencia ventilatoria no invasiva (VNI) es una alternativa en pacientes lactantes con
insuficiencia respiratoria aguda moderada-severa; se logran los mismos beneficios que en
adultos: mejora la ventilacin y oxigenacin, disminuye el trabajo respiratorio y evita, en un
alto porcentaje, la intubacin endotraqueal y las consecuencias de la misma (traqueotoma,
neumona asociada al respirador, neumotrax, etc.).
A continuacin se presenta la experiencia de la aplicacin precoz del CPAP burbuja en la
UTIP del hospital Castro Rendn de la ciudad de Neuqun. Se analizaron variables de
diferentes naturalezas: dicotmicas, categricas multiestado y cuantitativas continuas. La
variable respuesta de inters fue el xito del CPAP (evitar el uso del respirador artificial). Se
comprobaron asociaciones entre todas las variables intervinientes en el estudio para
determinar las predictoras de dicho xito y fracaso en el CPAP.



Materiales y Mtodos
Se presentan resultados de un estudio descriptivo, longitudinal, retrospectivo y sin
considerar grupo control. Los datos fueron extrados de historias clnicas, de pacientes de 1
a 24 meses de edad o peso menor a 13 kg., en un lapso de 18 meses, conectados en forma
precoz al CPAP burbuja (un tipo de VNI). A partir de estudios y protocolos previos se
establecieron como criterios de xito del tratamiento a la presencia de dos o ms de las
siguientes condiciones a las 2 horas de haberse instaurado la VNI: disminucin del 15% de
la frecuencia respiratoria (FR), disminucin del 15% de la frecuencia cardaca (FC),
disminucin en 2 o ms puntos del score de Tal y saturacin mayor a 92 % con menor
FIO2. El criterio para definir la falla del tratamiento fue haber requerido asistencia
respiratoria mecnica.
Para los marcadores del xito de la VNI se trabaj con dos perspectivas de investigacin: el
punto de vista epidemiolgico, con herramientas de anlisis usualmente utilizadas por los
profesionales de la salud; y el punto de vista del profesional estadstico, mediante
modelizaciones de observaciones repetidas en el tiempo.
Desde la mirada epidemiolgica: (1) para la deteccin de variables predictoras del CPAP a
las 2 horas de su conexin (censura informativa), se utiliz odds ratio de test Mantel
Haenszel y un posterior ajuste de un modelo de regresin logstica y (2) para las variables
predictoras que producen una censura no informativa, al ser un diseo ensayo clnico
controlado con un seguimiento del tiempo y con mirada retrospectiva de un determinado
evento (xito de VNI), se evalu mediante el mtodo de Kaplan-Meier y se identific factores
relacionados utilizando el anlisis de regresin de Cox.
Desde la visin del estadstico formal: se trabaj sobre las observaciones repetidas en el
tiempo de frecuencias cardacas (FC), frecuencias respiratorias (FR) y Score de Tal, al
ingreso, a las 2 horas y con registros posteriores a las 6 horas. Se construyeron modelos de
datos longitudinales. Estos modelos, para cada una de las variables, requirieron adems, la
modelizacin de la estructura de medias y de covarianza (incluyendo correlacin y
heterocedasticidades) para considerar el efecto aleatorio de pacientes [3]. Se utiliz modelo
autoregresivo de primer orden (AR) pues contempla las correlaciones de las observaciones
provenientes de un mismo paciente.

Se analiz un total de 120 pacientes (58% femeninos). La mediana de edad fue 3 meses
(rango de 1 22) y el peso medio fue de 6,49 2,24 kg. Se alcanz el xito en el 72% de
los casos. Desde el enfoque epidemiolgico se identific como variables predictoras del
xito del CPAP: disminucin del 15% de la frecuencia respiratoria (FR), odds ratio
[OR]=0,004, intervalo de confianza [IC] del 95% 0,048-0,43 y disminucin en 2 o ms
puntos del score de Tal OR=0,10 IC del 95% 0,03-0,34 y saturacin mayor a 92 % con
menor FIO2 OR=3,27 IC del 95% 1,17-9,10. No se detect diferencias significativas entre el
tipo de diagnstico (bronquiolitis y neumonas). El 50% de nios con edad superior a 6
meses se recuper a lo sumo a las 72 horas de conexin al CPAP. Mediante los mtodos
estadsticos formales se observ una interaccin estadsticamente significativa de la variable
FR (p<0.0036) respecto al xito del CPAP y el tiempo. Es decir, la frecuencia respiratoria en
el tiempo de medicin no fue la misma respecto a los resultados del xito/fracaso del
CPAP, principalmente en el lapso de las 2 primeras horas de conexin al mismo. Se
encontraron resultados anlogos al estudiar el score de TAL (p<0,0001), que present
variaciones en los tres momentos (a las 0, 2 y 6 horas, con medias de 9,21; 5,44 y 4,94
respectivamente). En cuanto a la frecuencia cardaca no se observ una interaccin
estadsticamente significativa en los resultados de la VNI y el tiempo.
Desde ambas ramas metodolgicas trabajadas, se concluye complementariamente, que los
principales predictores de xito y fracaso de la VNI, son las mediciones/observaciones de la
frecuencia respiratoria y del Score de TAL en las dos primeras horas de conexin del CPAP.



Bibliografa
[1] Mayordomo-Colunga, J.; Medina, A.; Reyes, C.; Los Arcos, M; Concha, A y Menndez, S.
(2009). Predictores de xito y fracaso en la ventilacin no invasiva en la bronquilitis aguda.
Anales de Pediatra (Barc); 70(1): 34-39.
[2] Bonora, J.; Frachia, D.; Garca, M.; Fillipini, S.; Haimovich, A. y Olgun, G. (2011).
Ventilacin no invasiva en Cuidado Intensivo Peditrico, cuatro aos de experiencia. Arch.
Argent. Pediatr. vol.109 no.2 Buenos Aires. Versin obtenida el 26/05/2013.
http://www.scielo.org.ar/scielo.php?pid=S0325-00752011000200006&script=sci_arttext
[3] West, B; Welch K, N.; Galecki, A. (2007). Linear Mixed Models. Chapman & Hall, New
York.


DISEOS PTIMOS A DOS VAS DE CLASIFICACIN SIN
INTERACCIN CON RESPUESTA BETA

CARLOS ALBERTO RAMOS SOLER
1
, LUIS ALBERTO LOPEZ PEREZ
2

1
Estudiante de Maestra, Departamento de Estadstica, Universidad Nacional de Colombia
2
Profesor Titular, Departamento de Estadstica, Universidad Nacional de Colombia

caramoss@unal.edu.co
lalopezp@unal.edu.co

RESUMEN
Los diseos ptimos buscan obtener bajo ciertas condiciones experimentales controladas, la
mayor precisin en la estimacin de los parmetros y reducir las corridas del experimento
con lo cual se garantiza una economa en tiempo y costos. La literatura estadstica
especializada ha abordado ampliamente el problema para respuestas no normales,
principalmente cuando la variable de inters son proporciones no continuas (respuesta
binaria principalmente y conteos), sin embargo cuando la respuesta es una proporcin
continua (tasas de desgaste, porcentaje de dao debido a infecciones, etc), estos diseos
no han sido estudiados ampliamente; solamente se destacan los trabajos de Fedorov et al
(2001), Ford et al (1992), Atkinson et al (2007) entre otros donde, en todos ellos solo se
considera un factor de clasificacin. Para modelar este tipo de respuestas se hace mediante
modelos de regresin Beta los cuales fueron propuestos inicialmente en Cepeda (2001) y
abordados ms ampliamente en Ferrari y Cribari Neto (2004). En el campo de los diseos
experimentales a dos vas de clasificacin, este problema no ha sido abordado; por lo tanto
en este trabajo se tiene como principal objetivo realizar una extensin de los trabajos de
Fedorov et al (2001), aplicando la regresin a diseos ptimos cuando se tienen dos
factores de clasificacin. En el proceso de construccin y optimizacin, se tiene en cuenta el
criterio D-optimo y la matriz aumentada de informacin de Fisher, finalmente se ilustran los
resultados teniendo la informacin proveniente de un ensayo de experimentos donde se
ensayan dosis de nutrientes, adicionalmente se lleva acabo simulaciones, algunos
resultados de este proceso se incluyen en este documento.

Palabras Clave: Diseos ptimos, Proporcin continua, Regresin Beta, Matriz de
Informacin.
Introduccin
En investigaciones desarrolladas en diferentes campos del conocimiento se intenta describir
y cuantificar relaciones entre variables, en algunas situaciones el inters se centra en
explicar una variable en funcin de otras, generalmente esto se logra mediante el ajuste de
un modelo de regresin, en la literatura existen diferentes modelos y tcnicas dependiendo
de la naturaleza de la variable respuesta; un caso particular se da cuando la respuesta se
encuentra restringida a una proporcin en el intervalo (0,1), lo cual conlleva a una respuesta
no normal, en la literatura se ha trabajado ampliamente la construccin y validacin de
modelos para variables con respuestas binarias (proporciones no continuas), y conteos
principalmente . Sin embargo cuando se trata de proporciones tales como: ndices o tasas
continuas el trabajo no ha sido tan amplio salvo los trabajos presentados por Fedorov et al
(2001), Ford et al (1992), Atkinson et al (2007) entre otros, adems en todos ellos solo se
considera un factor de clasificacin. La modelacin de este tipo de variables fue propuesta
inicialmente por Cepeda (2001) y abordada ms ampliamente por Ferrari y Cribari Neto
(2004) en este trabajo se considera que la variable respuesta tiene distribucin Beta y su
media se relaciona con un conjunto de variables regresoras a travs de un predictor lineal y
una funcin de enlace, desarrollando procesos similares a los propuestos para los modelos
lineales generalizados (MLG) como se presenta en McCullagh y Nelder (1989). De acuerdo


a las especificaciones dadas en la construccin del diseo experimental, se puede optar por
tener ms de un factor de clasificacin y una respuesta medida en una escala continua en el
intervalo (0,1), lo cual conlleva a problemas de dependencia de los parmetros a estimar
esto lleva a una cierta dificultad en la estimacin de los parmetros. En este sentido se
hace necesario contar con informacin a priori de los parmetros de localizacin y
dispersin, y en este caso los diseos ptimos son una buena alternativa cuando se tiene
uno o dos factores de clasificacin, de ac la importancia de este trabajo, en donde
consideramos optimizar un diseo cuando se tiene una proporcin continua con dos
factores de clasificacin, extendiendo los trabajos de Fedorov et al (2001) Se realiz una
aplicacin con datos provenientes de un ensayo experimental en fitomejoramiento y
mediante simulacin.

Desarrollo
La teora estadstica muestra diferentes opciones cuando se especifica la distribucin de la
variable respuesta, una de estas se da cuando la respuesta est restringida a un intervalo
abierto que da cuenta de tasas, ndices y proporciones continuas, es as como cobra gran
importancia la distribucin Beta ya que esta permite modelar datos restringidos a un
intervalo especialmente en (0,1).
Modelo de Regresin Beta: Se dice que la variable aleatoria Y tiene distribucin Beta con
parmetros a > 0 y b > 0 si su funcin de densidad est dada por:
en la cual y
Donde a y b son los parmetros de localizacin y escala respectivamente. Con el fin de
obtener una estructura de regresin para la media teniendo en cuenta un parmetro de
precisin, Ferrari y Cribari Neto propusieron la siguiente parametrizacin de la distribucin
Beta. Sea y de lo cual se tiene que y , as
tenemos que: y donde , as es la media de la
variable respuesta y puede ser interpretado como el parmetro de precisin, debido a que
si se fija un valor de , valores grandes de disminuyen la varianza de y, la funcin de
densidad de la variable y bajo la parametrizacin propuesta por los autores es:

Diseos ptimos: La teora de diseos ptimos tiene como fundamento la teora clsica de
diseo de experimentos, haciendo un aporte significativo, en el sentido de mejorar la calidad
de la inferencia y las corridas del experimento con lo cual se garantiza una economa en
tiempo y costos. Estos diseos buscan determinar las condiciones experimentales ptimas
para realizar una inferencia adecuada acerca del comportamiento de la variable respuesta y
el nmero de rplicas que han de tomarse bajo cada una de las condiciones establecidas.
Un diseo ptimo es una medida de probabilidad con soporte finito. La notacin para un
dise ptimo con n puntos de soporte en un espacio compacto es:

con wi = (x
i
), como una medida de probabilidad definida en , conjunto de Borel de que
incluye los conjuntos unitarios; tal que tiene soporte finito. El soporte de es [x
1
,...,x
n
] y las
observaciones Y(x) se hacen en x
1
,...,x
n
con frecuencias (o pesos) aproximadamente
proporcionales a w
1
,...,w
n
. Adicionalmente se tiene que corresponde a la regin diseo, la
cual se refiere al conjunto de posibles condiciones experimentales y el Soporte de diseo
, el cual es el conjunto de puntos para los cuales el diseo tiene puntos distintos de
cero. . Para cada diseo se define la matriz de informacin:
o equivalentemente
Esta matriz mide la informacin que aporta el diseo para la estimacin del vector de
parmetros . La teora de diseos ptimos (Kiefer, 1959) est relacionada con la seleccin
de un diseo que maximiza algn funcional de la matriz de informacin, en este sentido la


forma de cuantificar la informacin suministrada por la matriz de informacin depende de los
criterios de optimalidad. En este trabajo solo se considero el criterio de D-optimalidad:
equivale a minimizar el volumen del elipsoide asociado a la estimacin del sistema de
parmetros, el inters se centra en optimizar la estimacin de los parmetros del modelo. El
teorema general de equivalencia es la base terica para la construccin y validacin de
diseos y da las condiciones necesarias y suficientes para que un diseo
*
sea ptimo, este
teorema se puede ver en Fedorov et al (2001).

Algunos de los resultados de las simulaciones se presentan en este trabajo, en el proceso
se consideran los dos factores de clasificacin, considerando diferentes escenarios para los
parmetros iniciales, se simula la respuesta en el intervalo (0,1), y para diferentes valores de
los parmetros y , se simulan las distribuciones algunas de las cuales se presentan a
continuacin, para mantener el diseo en un rango ptimo, se busca la eficiencia a partir del
determinante de la matriz para los diferentes diseos.

La aplicacin se llevo a cabo con un ensayo experimental proveniente de un estudio de
fitomejoramiento donde se ensayan dos diferentes nutrientes en cultivos perennes, y se
evala la proporcin de dao tanto en plantas como en frutos (proporcin continua de dao).
Se encuentra un diseo D-ptimo para estimar , es decir, se halla un diseo
que minimice , siendo;

Bibliografa
Atkinson A. C, Donev A.N and Tobias R.D (2007) Optimun Experimental Design, with SAS ,
Oxford University Press USA.
Fedorov, V.V (1972) Theory of optimal experiments, Moscow State University, Academic
Press New York and London.
Ferrari SL y Cribari-Neto F (2004): Beta Regression for Modelling Rates and Proportions. J
Applied Statistics, 31, 788-815.


ANLISIS DEL CONSUMO DE ALCOHOL EN ARGENTINA
MEDIANTE UN MODELO CON RESPUESTA CATEGRICA
ORDENADA

RODRIGO GARCA ARANCIBIA
1
, EDITH DEPETRIS GUIGUET
2
, GUSTAVO ROSSINI
3
,
JIMENA VICENTIN
4

1
Instituto de Economa Aplicada Litoral, FCE / Universidad Nacional del Litoral/ CONICET
2
Instituto de Economa Aplicada Litoral, FCE / Universidad Nacional del Litoral
3
Instituto de Economa Aplicada Litoral, FCE / Universidad Nacional del Litoral
4
Instituto de Economa Aplicada Litoral, FCE / Universidad Nacional del Litoral/ CONICET

rgarcia@fce.unl.edu.ar

RESUMEN
Considerando el patrn de consumo de bebidas alcohlicas, desde la abstinencia, al
consumo ocasional, moderado, excesivo o abusivo, se estima un modelo logstico ordenado
parcialmente generalizado en el que dichas categoras ordenadas se modelan en funcin de
diferentes caractersticas socioeconmicas y demogrficas de los individuos y de sus
hogares. Los resultados muestran que todas las variables seleccionadas resultan
estadsticamente significativas, con efectos diferenciales segn se trate de un consumo
moderado o riesgoso.

Palabras Clave: *logit ordenado generalizado *Caractersticas Socioeconmicas
*Sustancias Psicoactivas

Introduccin
En el consumo de alcohol pueden identificarse diferentes patrones que van desde el
ocasional y moderado, al consumo episdico excesivo o abuso de bebidas alcohlicas, con
diferentes consecuencias en torno a la salud de los individuos y dems costos sociales
relacionados al consumo de sustancias psicoactivas. Generalmente las variables que hacen
al status social de los individuos y a los aspectos econmicos y demogrficos del hogar al
que pertenecen, tienen un gran peso para la explicacin del consumo (Le et al., 2009;
Garca Arancibia et al., 2011, entre otros). Para estudiar los diferentes patrones de consumo
de alcohol, en general se tiene en cuenta su carcter politmico, llevando a modelar los
diferentes consumos a travs de modelos logsticos multinomiales (como ser, Lopes et al.,
2008; Rodriguez Donate et al., 2009) como tambin su carcter de respuesta con algn
orden natural que va desde el consumo ocasional al frecuente y excesivo, especificndose
con modelos probit o logit ordenados (como ser, Laixuthai y Chaloupka, 1993). Para estos
ltimos, el supuesto de lneas paralelas suele ser restrictivo dada la diferente naturaleza de
los consumos, por lo que ha llevado a plantear dichos modelos en un marco multinomial
ordenado generalizado (Harris et al., 2006). En esta lnea, el presente trabajo especifica un
modelo logstico ordenado parcialmente generalizado para estudiar la influencia de variables
socioeconmicas, demogrficas y regionales, sobre la probabilidad de un consumo
ocasional, moderado, episdico excesivo o abusivo, para Argentina en el perodo 2008-
2011.

Desarrollo
Sea
*
i
A una variable latente (continua) que indica la cantidad de alcohol consumida por el
individuo i en un periodo dado de tiempo, luego suponemos que

i i i
u A + = X '
*
(1)

Donde
i
X es un vector de variables seleccionadas. En particular se toman las
caractersticas demogrficas y socioeconmicas del individuo y de su hogar, la percepcin


subjetiva de la salud, y variables indicadoras de la regin a la que pertenecen los individuos
a los fines de captar las posibles heterogeneidades culturales de las diferentes regiones
argentinas. Por su parte,
i
u es un trmino de error aleatorio. La variable
*
i
A define un
conjunto de categoras ordenadas a medida que cambia y atraviesa determinados umbrales
no conocidos. En el presente contexto, se definen las siguientes categoras respecto al
consumo de alcohol: abstinente (j=1), ocasional (j=2), moderado (j=3), excesivo (j=4) y
abuso (j=5). Cada una de estas categoras son excluyentes y est definidas por la
prevalencia y cantidad de tragos de bebidas alcohlicas (combinados y ponderados). Por lo
tanto se tiene la siguiente variable observada:

5 , 4 , 3 , 2 , 1 con sii
1
*
= s s =
+
j U A U j A
j i j i
(2)
Donde
6 1
,...,U U representan los umbrales, asumiendo que =
1
U y + =
6
U . Sea F la
funcin de distribucin de u luego de (1) y (2) se tiene que

( ) ( ) ( ) ' - ' Pr
1 j i j j i j i
U F U F j A X X = =
+

(3)

Suponiendo que u tiene una distribucin logstica con ( ) )] exp( 1 /[ ) exp( u u u F + = , luego (3)
especifica un modelo logit ordenado generalizado (Williams, 2006). El vector de parmetros
( ) U
j
, es estimado por mxima verosimilitud. De (3) puede notarse que
j
difiere entre las
categoras relajando totalmente el denominado supuesto de lneas paralelas. La ventaja de
contar con un solo parmetro es que facilita la interpretacin en los modelos ordenados.
Por tal motivo, se realizan Test de Wald a los efectos de contrastar qu variables violan o no
el supuesto de lneas paralelas.
Como variables explicativas se considera el sexo, la edad, el nivel de instruccin, la
situacin conyugal (si est en pareja o no), relacin de parentesco con el jefe (si es jefe/a o
no), la situacin ocupacional, la cantidad de horas trabajadas (si trabaja ms de 45 horas), el
nivel de escolaridad y la percepcin subjetiva de su salud. Adicionalmente como
caractersticas del hogar se toma: el tipo de hogar (si es unipersonal o no), la cantidad de
miembros entre 16 y 65 aos, cantidad de miembros menores de 16 y mayores de 65 aos,
si en el hogar existen o no necesidades bsicas insatisfechas (NBI) y el nivel de ingresos
(por rangos). Se incorporan variables dummies para denotar las diferentes regiones
argentinas y una variable para indicar si pertenece a una urbanizacin menor o mayor de
100.000 habitantes.
Los datos corresponden a la base de las Encuesta Nacional sobre Prevalencia de Consumo
de Sustancias Psicoactivas (EnPreCoSP) de los aos 2008 y 2011 (Ministerio de Salud de la
Nacin e INDEC- Argentina). El estudio es de corte transversal, identificando el ao por
medio de una variable binaria, y ajustando los rangos de ingresos por inflacin utilizando el
IPC.

Todas las variables seleccionadas resultan estadsticamente significativas para explicar las
diferentes categoras de consumo. En lo que hace a las caractersticas individuales se
encuentra que cualquier tipo de consumo es menos probable en las mujeres, y tales
diferencias de gnero se acentan al considerar las categoras ms extremas de exceso y
abuso de alcohol. El efecto de la edad es similar, en el sentido de que disminuye la
probabilidad de cualquier tipo de consumo. Por otra parte, las personas que viven solas y
que no estn en pareja son ms propensas al consumo de bebidas alcohlicas, con efectos
similares en cada categora. Entre las caractersticas econmicas individuales se observa
que un mayor nivel de escolaridad disminuye significativamente las probabilidades de abuso
de alcohol, incrementando la probabilidad de un consumo moderado. A su vez, este efecto
es coincidente con el del nivel de ingresos del hogar. Es decir, que los individuos en hogares
con mayor poder adquisitivo son ms propensos a un consumo moderado (y tambin
excesivo) pero las probabilidades de abusar son menores. En la misma lnea, el hecho de


que el hogar no presente algn indicador de NBI favorece a disminuir los consumos
riesgosos. La situacin ocupacional muestra que los individuos ocupados tienden a
consumir ms alcohol (en todas sus categoras) reforzndose este efecto cuando los
mismos tienen una jornada laboral mayor a 45 horas semanales.
En relacin a la composicin demogrfica del hogar se observa que la cantidad de nios y
de adultos mayores en el hogar tiene un efecto negativo sobre las probabilidades de todo
tipo de consumo, mientras que, cuanto mayor es la cantidad de miembros en grupos etarios
intermedios, mayor es la probabilidad de consumo en exceso.
La percepcin subjetiva de la salud muestra que los individuos que se siente peor, ms
propensos son a un consumo excesivo o abuso de alcohol, ocurriendo lo contrario para el
caso del consumo ocasional y moderado.
Se encuentran importantes diferencias regionales destacndose el hecho de que en el norte
argentino son ms propensos a consumos riesgosos respecto al GBA, ocurriendo lo
contrario en la regin cuyana. Tambin se observa que el hecho de que el individuo
pertenezca a una urbanizacin mayor, incrementa las probabilidades de todos los tipos de
consumo. Por ltimo, al comparar entre los dos aos considerados se tiene que en 2011 se
han incrementado las probabilidades del consumo episdico excesivo y de abuso de
alcohol, reducindose los consumos ocasionales y moderados, lo que no deja de ser un
resultado preocupante para las polticas pblicas.

Bibliografa
Garca Arancibia R., Depetris Guiguet E. y G. Rossini (2011) Participacin en el Consumo
de Bebidas Alcohlicas en Santa Fe: Un Enfoque Multivariado, XXXIX Coloquio Argentino
de Estadstica, SAE-UNL, Santa Fe
Harris, M., P. Ramful, and X. Zhao. (2006). An Ordered Generalised Extreme Value Model
with Application to Alcohol Consumption in Australia. Journal of Health Economics 25: 782-
801.
Laixuthai, A. and F. Chaloupka (1993). Youth Alcohol Use and Public Policy, Contemporary
Policy Issues, 11 (4), 70-81.
Le C., Chongsuvivatwong V. Geater A. And N. Apakupakul (2009) Contextual and Individual
Demographic Determinants of Alcohol Consumption and Smoking: A Comparative Study in
Southwestern China y Southern Thailan Southeast Asian Journal of Tropical Medicine and
Public Health, 40 (2), March.
Lopes,C., Andreozzi, V., Ramos, E. and Carvalho, M. (2008). Modelling over week patterns
of alcohol consumption Alcohol & Alcoholism, 43 (2): 215222.
Rodrguez Donate, M., Cceres Hernndez, J., Guirao Prez, G. and Cano Fernndez, V. J.
(2009) Individual profiles and wine consumption patterns in Tenerife. A multinomial logit
model. Spanish Journal of Agricultural Research, 7(4): 759-769.
Williams, R. (2006) Generalized Ordered Logit/Partial Proportional Odds Models for Ordinal
Dependent variables, The Stata Journal, 6 (1), 58-82.



CURVAS DE CRECIMIENTO DEL PERMETRO CEFLICO
EN NIOS DE 0 A 3 AOS. UNA NUEVA APROXIMACIN

LAILA YANED GONZALEZ BEJARANO
1
,

FABIO HERNN TEJEDOR G
2
,

LUIS ALBERTO LOPEZ PEREZ
3
,

CLEMENTINA INFANTE CONTRERAS
4

1
Candidata MsC en Odontologa, Profesor Asistente, Departamento de Salud Oral,
Facultad de Odontologa, Universidad Nacional de Colombia.
2
Candidato MsC en Estadstica, Departamento de Estadstica, Facultad de Ciencias,
Universidad Nacional de Colombia.
3
PhD Estadstica
,
Profesor Titular, Departamento de Estadstica, Facultad de Ciencias,
Universidad Nacional de Colombia.
4
DMD, Especialista en Ortodoncia, Profesora Titular, Departamento de Salud Oral, Facultad
de Odontologa, Universidad Nacional de Colombia.

lygonzalezb@unal.edu.co

RESUMEN
El permetro ceflico es una medida antropomtrica indicadora de salud, aporta informacin
del neurodesarrollo en la primera infancia por lo que debe monitorearse. Usualmente, los
patrones de referencia OMS utilizan el modelo Box Cox Power exponential y el mtodo LMS
para modelar el comportamiento del crecimiento del permetro ceflico, comparndolo con
una mediana poblacional. Los modelos longitudinales mixtos son tiles para modelar el
crecimiento craneofacial; introducen efectos fijos y efectos aleatorios, permitiendo evaluar la
variabilidad entre sujetos. Objetivo: construir curvas de crecimiento para el permetro
ceflico por medio de modelos longitudinales mixtos. Sujetos y mtodos: siendo ste un
estudio longitudinal prospectivo, los criterios de elegibilidad para los nios obedecieron a
factores de inclusin y exclusin cumpliendo recomendaciones de la OMS para conformar
una muestra prescriptiva; adems que padres, abuelos y nios hubiesen nacido en
Colombia. La muestra obtenida, 265 (116/nias, 149/nios) residentes en Bogot,
distribuidos en 3 grupos G1: (0-12], G2: (1224], G3: (2436) meses. Los nios entraron al
estudio en diferentes edades, fueron medidos cada 3 meses durante 1 ao. Error del
mtodo: 2 examinadores se entrenaron para la toma de datos antropomtricos y variables
cualitativas. Se realiz continua estandarizacin y monitoreo de la adherencia a los
procedimientos de recoleccin y calidad de datos. Por medio de prueba F ANOVA con dos
factores (tiempo y observador) y valor de p <0.05, se calcul el error del mtodo intra (error
aleatorio) e interobservador (error sistemtico). Las curvas de crecimiento fueron
construidas usando los modelos longitudinales mixtos. Para la estimacin del modelo se
utiliz el mtodo de estimacin de mxima verosimilitud restringida (REML). Se utiliz
software estadstico R versin libre 2.15.1; para el ajuste de los modelos el paquete lme4.
Se ajustaron 6 modelos de crecimiento, los cuales mostraron una mayor pendiente de
crecimiento de 0 a 12 meses.
Palabras clave: antropometra, curvas de crecimiento, craneofacial, crecimiento y
desarrollo, estndares de referencia, estudios longitudinales.

Introduccin
El permetro ceflico constituye el mejor predictor del neurodesarrollo infantil y provee una
visin dinmica del crecimiento global del cerebro y las estructuras internas. Las mediciones
antropomtricas como son la longitud, talla, peso y permetro ceflico se utilizan
universalmente como indicadores de salud para cada edad y sexo, y se grafican mediante
curvas de crecimiento generalmente obtenidas a partir de patrones de referencia
internacional y nacional. En Colombia se han manejado los patrones de referencia de la


National Center for Health Statistics (NCHS) y las referencias de crecimiento de la OMS.
Tradicionalmente, la circunferencia de la cabeza se muestra en percentiles y desviaciones
estndar (SD) (puntuacin Z). Con este criterio de puntuacin Z se ubica a un nio(a) dentro
de una clasificacin basada en percentiles pero no caracteriza un modelo de crecimiento a
partir del cual se pueda hacer un pronstico del mismo; esto nos lleva a presentar esta
propuesta donde el objetivo del estudio consisti en describir en nios de 0 a 3 aos el
patrn de crecimiento del permetro ceflico y su variabilidad a partir de un modelo
longitudinal mixto mediante curvas de crecimiento; caracterizando diferentes modelos de
crecimiento de acuerdo a grupos de edad y sexo.

Desarrollo
Para la aplicacin de la metodologa estadstica propuesta en este trabajo, se consider el
hecho que los individuos entrarn al estudio en diferentes momentos en el tiempo (factor
aleatorio no controlado) y teniendo en cuenta diferentes factores controlados o fijos (edad,
sexo, escolaridad, nivel socioeconmico, el estrato, duracin de la lactancia materna, entre
otros) y dado que la variable respuesta es de tipo continuo, entonces se opt por los
modelos longitudinales mixtos; los cuales se adecan bien en una situacin comn de los
estudios longitudinales de crecimiento craneofacial, cuando los intervalos de tiempo no son
iguales para todos los individuos o cuando los individuos comienzan las mediciones a
diferentes edades presentndose desbalance en los datos como en este caso. Son una
herramienta para modelar la relacin entre una variable explicada (permetro ceflico) y las
covariables (ejemplo longitud/talla, peso). Segn Singer et al, (2012), el modelo se puede
escribir como:
(1.1)
Donde y son, respectivamente, los vectores de respuestas y los errores de medicin
para el i -simo sujeto, y son respectivamente los vectores de efectos fijos (parmetros
de la poblacin) y efectos aleatorios (parmetros individuales) y y son las matrices
de diseo asociadas a los efectos fijos y a los efectos aleatorios. En el modelo (1.1)
es un vector respuesta asociado a unidad muestral tiene
distribucin normal multivariada ver Singer et al con vector de medias y matriz de
covarianzas respectivamente dado por:
(1.2)
(1.3)
En esta investigacin se trabaj con una matriz no estructurada (NE) de Varianzas-
Covarianzas la cual tiene la siguiente forma: para el caso de los individuos evaluados en las
4 diferentes mediciones.

La estimacin de los parmetros del modelo se realiz por medio del mtodo de mxima
verosimilitud restringida (REML) y la evaluacin del modelo se hizo teniendo en cuenta los
estimadores BLUE y BLUP para los parmetros y obtenidos a partir de las expresiones
(1.4)
(1.5)
Donde y .
Se utiliz el criterio como criterio de bondad de ajuste en las versiones


ms modernas de SAS MIXED (SAS Institute, 2001).

Para la construccin de los perfiles de crecimiento del permetro ceflico se consider en el
estudio como factores fijos la edad, el sexo, la escolaridad de los padres, el estrato y el lugar
de origen entre otros y como factor aleatorio el tiempo en que los individuos entraron al
estudio, en razn a que todos no entraron en el mismo momento, con esto se justifica la
aplicacin del modelo (1.1). Los resultados mostraron una mayor pendiente de crecimiento
de 0 a 12 meses; se encontraron 6 modelos de crecimiento de tipo lineal por grupos de edad
G1, G2 y G3 y por sexo. Al modelar los datos por grupos de edad, se observ una mejor
distribucin de los residuales en los grupos G1 y G2 lo que indica que el modelo logr un
mejor ajuste para estos grupos, contrario al comportamiento presentado en el grupo G3; el
cual present mayor cantidad de datos atpicos por fuera de las bandas de confianza o
envelopes, bandas estrechas y menor ajuste de los residuales con relacin a los grupos G1
y G2. En este caso los ritmos de desarrollo son ms variables y con los modelos propuestos
no se capta esta fuerte variabilidad.Un resultado importante es que en la medida en que
crece el nivel de confianza, representado por los percentiles 80%, 90% y 95%, los residuales
se mantienen dentro de las bandas de confianza, con lo cual se garantiza el buen ajuste de
los modelos propuestos para evaluar el desarrollo craneofacial en los diferentes grupos de
edad. En cuanto al comportamiento del crecimiento del permetro ceflico por sexo, se
encontr en G1 mayor incremento de crecimiento (de 0 a 12 meses) en nios que en nias y
una mayor pendiente de la curva comparada con los grupos G2 y G3; en los cuales se
observ un menor incremento en el crecimiento, sin embargo, fue mayor en nios que en
nias, evidencindose dimorfismo sexual. En Conclusin la metodologa usada permiti
entender el comportamiento del permetro ceflico y analizar los datos con estructuras de
desbalance, constituyendo una buena aproximacin para modelar el crecimiento
craneofacial. As mismo permiti evaluar la variabilidad interindividual y la identificacin de
datos atpicos que conlleva a un anlisis ms preciso de la presencia de normalidad o
alteracin. Para el futuro se propone introducir covariables que permitan un mejor desarrollo
del modelo que pueda ser implementado en la clnica como soporte diagnstico y en los
programas de promocin y prevencin de la poltica pblica.

Bibliografa
1. WHO, Multicentre Growth Reference Study Group. 2007. WHO child growth standards:
Head circumference-for-age, arm circumference for-age, triceps skinfold-for-age and
subscapular skinfold-for-age: Methods and development. Geneva.

3. Singer JM, Nobre JS, Rocha FS.2012. Captulo2. Modelos lineales para datos
gaussianos. Anlisis de datos longitudinales. Departamento de Estadstica. Universidad de
Sao Pablo. Brasil. pp. 39-65.

5. Cole T.J, Williams A. F., Wright C. 2011. Revised birth centiles for weight, length and
head circumference in the UK-WHO growth charts. Annals of Human Biology, vol (38): 711.


EVALUACIN DE PRADERAS DE ALGAS MARINAS MEDIANTE
ANLISIS FACTORIAL MLTIPLE. DOS DEFINICIONES PARA LOS
GRUPOS DE VARIABLES

JOS RAMN SARAVIA
1

1
Subsecretara de Pesca, Ministerio de Agricultura, Ganadera, Bosques y Pesca de Chubut

josesaravia@speedy.com.ar

RESUMEN
En este trabajo se evalan los resultados obtenidos al aplicar un Anlisis Factorial Mltiple a
un grupo de datos donde las mismas variables estn medidas sobre los mismos individuos
en diferentes perodos. Las tablas se constituyeron de dos maneras distintas ofreciendo
resultados diferentes y complementarios. Los datos provienen de un estudio sobre praderas
de algas marinas de la Provincia del Chubut. Los diferentes anlisis mostraron la
importancia de las temperaturas extremas (invierno y verano) coincidiendo con valores
inversos de oxgeno disuelto. La presencia de altos valores de nitratos fue importante en la
determinacin de los individuos.

Palabras clave: Anlisis Factorial Mltiple, algas, biomasa.

Introduccin
En investigaciones ecolgicas, las relaciones entre los Individuos y las Variables son
medidas en diferentes momentos en el tiempo, tratando de incluir ms de un ciclo biolgico.
Esta informacin se presenta en varias tablas Individuos por Variables resultando datos de
tres modos. El anlisis por separado de cada tabla conlleva el problema de la comparacin
de resultados y el anlisis de una tabla yuxtapuesta, juntando todos los momentos,
confunden las variabilidades entre y dentro de las tablas individuales (Baccal, 2004).
Una solucin para este problema es la utilizacin de mtodos que obtengan una estructura
comn o configuracin de consenso como el Anlisis Factorial Mltiple (AFM).
Adems, la definicin de grupos de variables no es una cuestin tan estructurada como
aparenta. En efecto, algunos conjuntos de datos poseen determinadas caractersticas, para
los que son posibles numerosas particiones en el conjunto de las variables. Cada particin
corresponde entonces a un punto de vista de los datos. Un ejemplo tpico es aquel en el que
se observan las mismas variables a lo largo del tiempo, sobre los mismos individuos. Un
grupo puede estar constituido por una misma variable en diferentes perodos o por el
conjunto de las variables observadas en el mismo perodo. Los dos AFM darn resultados
diferentes y complementarios (Escofier, B. et Pags, J., 1990).
La Provincia del Chubut posee las nicas praderas de algas Gracilaria gracilis de la
Argentina, Esta especie tiene una gran importancia comercial debido a que es utilizada en la
obtencin de agar, coloide espesante en la fabricacin de dulces, gelatinas y productos
lcteos.

Desarrollo
El estudio se realiz en tres praderas de algas, donde se registraron diez variables: cinco
ambientales (pH, Salinidad, Temperatura, Conductividad, Oxgeno disuelto), dos biolgicas
(Biomasa gracilaria y Biomasa algas acompaantes) y tres nutrientes (Nitratos, Nitritos y
Fosfatos), en nueve momentos que abarcaron dos aos de muestreo.

Para el anlisis se agruparon las tablas de dos maneras:



1) Por fechas: Se obtuvieron nueve tablas de Variables por Individuos, una para cada
momento.

Grupo 1 Grupo 2 Grupo 9
Indiv pH1 Cond1 Acomp1 pH2 Cond2 Acomp2 pH9 Cond9 Acomp9
B23
.
.
M15

2) Por variables: Se obtuvieron diez tablas donde se concentr cada variable en los
diferentes momentos.

Grupo 1 Grupo 2 Grupo 10
Indiv pH1 pH2 pH9 Cond1 Cond2 Cond9 Acomp1 Acomp2 Acomp9
B23
.
.
M15

Del anlisis por fechas, se concluy que con los tres primeros ejes principales, se explica un
53,76 % de la varianza total, segregada de la siguiente manera:

Valor propio 6,07 4,01 3,04
% Varianza 24,89 16,42 12,45
% Varianza acumulada 24,89 41,31 53,76

Estos porcentajes son similares para el anlisis por variable.
En el caso del anlisis por variable, los grupos que ms contribuyen en la formacin del eje
1 son Temperatura, Oxigeno y Nitritos, las cuales poseen tambin la mejor calidad de
representacin. En cuanto al eje 2, las ms contributivas son Salinidad, Nitrato y
Conductividad, pero solo Salinidad y Conductividad estn bien representadas.
Con respecto al anlisis por fechas, los grupos ms contributivos al eje 1 son Invierno,
Verano y Otoo del primer ao y para el eje 2 son Primavera e Invierno del segundo ao.
Con mejor calidad de representacin estn Invierno y Verano del primer ao, para el eje 1 e
Invierno del segundo ao, para el eje 2.
Con respecto a los individuos, ambos anlisis producen resultados similares, destacndose
la contribucin al eje 1 de los individuos B23 y B18 aunque solo el B23 posee una buena
calidad de representacin. Para el eje 2, es evidente la contribucin y calidad de
representacin del individuo M15.
La figura 1 muestra a los individuos en el plano principal donde se puede observar la
conformacin de tres grupos claramente distinguibles coincidiendo con las praderas
estudiadas.
El individuo M15 muestra un comportamiento extremo, presentando los mayores valores de
Nitratos.


Con el anlisis por fecha se pudo determinar la importancia de las temperaturas extremas,
tanto en verano como en invierno, mientras que del anlisis por variables surge la
importancia de la temperatura, influyendo al oxgeno disuelto y la presencia de nitratos.

-3,93 -2,11 -0,28 1,55 3,37
Dim 1 (24,89%)
-7,09
-4,57
-2,04
0,48
3,00
D
i
m

2

(
1
6
,
4
2
%
)
B18
B23
B28
B33
B38
C43
C45
C47
M01
M03
M05
M07
M09
M10
M13
M15
B18
B23
B28
B33
B38
C43
C45
C47
M01
M03
M05
M07
M09
M10
M13
M15

Figura 1. Primer plano factorial para individuos medios.

Bibliografa
Baccal, N. (2004). Contribuciones al Anlisis de Matrices de Datos Multiva: Tipologa de
las variables. Tesis Doctoral. Departamento de Estadstica, Universidad de Salamanca.
Espaa.
Escofier, B. etPags, J. (1990). Analyses Factorielles Simples et Multiples: Objectifs,
Mthodes et Interprtation. Dunod. Bordas. Paris. Francia.


HACIA UN ESTUDIO DE CARGA AMBIENTAL DE LA ENFERMEDAD

SNCHEZ DIANA CAROLINA
1

1
Ctedra de Bioestadstica. Facultad de Ciencias de la Salud. Consejo de Investigacin de
la Universidad Nacional de Salta.

csanchez@unsa.edu.ar

RESUMEN
La planificacin estratgica en Salud Pblica puede acelerar el desarrollo del sector y el
logro de las metas de salud. Dicha planificacin ha de tener en cuenta las necesidades que
el sistema sanitario tiene que satisfacer; es decir, quienes disean las polticas tienen que
tener muy presente la carga relativa de las enfermedades y los factores de riesgo que los
causan, as como la forma en que esta carga podra cambiar si se adoptaran diversas
polticas e intervenciones. Hay dos enfoques bsicos para evaluar la carga de enfermedad
asociada a factores de riesgo ambientales: uno basado en la exposicin y el enfoque
basado en la respuesta. Mientras que el enfoque basado en la exposicin estima la carga de
la enfermedad sobre la base de la exposicin de la poblacin, el enfoque basado en la
respuesta es sobre la base de la fraccin atribuible de la carga de la enfermedad a un
determinado factor de riesgo. Se plantea una metodologa para proveer una estimacin
armonizada de carga ambiental de la enfermedad en menores de 5 aos para factores
ambientales seleccionados en la Provincia de Salta: agua potable y saneamiento y
condiciones de vivienda, con un enfoque de resultados.

Introduccin
La planificacin estratgica en Salud Pblica puede acelerar el desarrollo del sector y el
logro de las metas de salud. Dicha planificacin ha de tener en cuenta las necesidades que
el sistema sanitario tiene que satisfacer; es decir, quienes disean las polticas tienen que
tener muy presente la carga relativa de las enfermedades y los factores de riesgo que los
causan, as como la forma en que esta carga podra cambiar si se adoptaran diversas
polticas e intervenciones.
La Organizacin Mundial de la Salud (OMS) ha desarrollado una metodologa para evaluar
la carga global de las enfermedades y cuantificar el estado de salud de la poblacin para
desarrollar planes estratgicos y orientar las acciones de intervencin en el campo de la
salud pblica (Murray, 1996). As es como se desarrollaron medidas de resumen del estado
de salud de la poblacin, entre las ms usadas estn los aos de vida ajustados por
enfermedad (DALY, por su sigla en ingls), que extiende el tradicional concepto de aos de
vida perdidos por mortalidad prematura e incorpora el equivalente de aos de vida saludable
perdidos en virtud de que los individuos caen en estados pobres de salud o enfermedad.
Este indicador ha sido especialmente destacado para exposiciones mltiples a factores de
riesgo ambiental (de Hollander, 1999).
Hay dos enfoques bsicos para evaluar la carga de enfermedad asociada a factores de
riesgo ambientales: uno basado en la exposicin y el enfoque basado en la respuesta.
Mientras que el enfoque basado en la exposicin estima la carga de la enfermedad sobre la
base de la exposicin de la poblacin, el enfoque basado en la respuesta es sobre la base
de la fraccin atribuible de la carga de la enfermedad a un determinado factor de riesgo.

Desarrollo
El objetivo del presente trabajo es plantear una metodologa para proveer una estimacin
armonizada de carga ambiental de la enfermedad en menores de 5 aos para factores
ambientales seleccionados en la Provincia de Salta: agua potable y saneamiento y
condiciones de vivienda, con un enfoque de resultados.



Los factores ambientales seleccionados, lo han sido por ser los de mayor peso para la
poblacin de nios menores de 5 aos. La vivienda es el lugar donde el nio pasa la mayor
parte de su vida, por lo que sus condiciones (ventilacin, aislacin trmica de paredes y
techo, barreras para mosquitos, etc.) son muy influyentes en el estado de salud enfermedad
del mismo. La disponibilidad de agua y la evacuacin de excretas, condicionan fuertemente
la calidad sanitaria del lugar donde el nio se desarrolla (UNEP, UNICEF, WHO, 2002).
La eleccin de un enfoque basado en los resultados, para las patologas definidas segn el
CIE relacionadas a los factores ambientales seleccionados en menores de 5 aos para la
Provincia de Salta en el ao 2010. A partir de estos diagnsticos se seguir el modelo de
estimacin de carga integral de enfermedad que se presenta en la Figura 1.

Figura 1. Modelo de determinacin de la carga de la enfermedad atribuible al ambiente en nios menores de 5
aos. Elaboracin propia.

El mtodo desarrollado por Murray y Lopez (Murray, 1996) aplicado en el estudio de Carga
de Enfermedad para Argentina, resulta adecuado para estimar carga ambiental de las
patologas seleccionadas para los factores de exposicin porque permite la cuantificacin de
los estados de enfermedad como un indicador universal: los aos de vida perdidos por
muerte o discapacidad (AVPMD) que se definen como la suma entre los aos perdidos por
muerte prematura (AVPMP) y por discapacidad (AVPD, YLD).
Estimar la prdida de los aos de salud plena debido a una enfermedad determinada
(AVPD, o YLD por sus siglas en ingls) requiere conocer la incidencia y la duracin
promedio de dicha afeccin en el perodo considerado hasta su remisin o hasta la muerte y
un ponderador de la discapacidad que ocasiona. Es evidente que debe considerarse la
prdida de aos de vida por enfermedad como un estimador con valor social dependiente de
la edad (especialmente para el grupo etario que considera el presente estudio de menores
de 5 aos) y el sexo de la persona.
Este modelo de anlisis planteado ser aplicado a los datos habitacionales y de servicios
bsicos emanados del Censo Nacional de Poblacin y Vivienda 2010 para la provincia y
datos epidemiolgicos (Direccin de Epidemiologa del Ministerio de Salud de la Provincia
de Salta) para el mismo ao, para el ajuste del modelo.



Bibliografa
Borruel M., Mas P., Borruel G. (2010) Estudio de Carga de Enfermedad. Argentina.
Ministerio de Salud de la Nacin.
Mathers CD, Vos T, Lopez AD, Salomon J, Ezzati M (2001). National Burden of Disease
Studies: A Practical Guide. Edition 2.0. Global Program on Evidence for Health Policy.
Geneva: World Health Organization.
Murray CJL, Lpez AD (1996) The Global Burden of Disease and Injury Series. Volume I.
World Health Organization. Cambridge. Harvard University Press.
de Hollander A.E.M., Melse J.M., Lebret E., Kramers P.G.M. (1999) An aggregate Public
Health Indicator to represent the Impact of Multiple Environmental Exposures. Epidemiology
Vol. 10. N 5.
Prss stn A., Corvaln C. (2006) Preventing disease through healthy environments.
Towards an estimate of the environmental burden of disease. World Health Organization.
Geneva.
Prss-stn A., Campbell-Lendrum D., Corvaln C., Woodward A. (2003) Introduction and
Methods: assessing the environmental burden at national and local levels. World Health
Organization. Geneva.
UNEP, UNICEF, WHO (2002) Children in the New Millennium: Environmental Impact on
Health. United Nations Environment Programme, United Nations Childrens Fund and World
Health Organization. Malta.
Ezzati M., Lopez, A.D., Rodgers, A., Murray, C.J.L. (2004). "Comparative Quantification of
Health Risks - Global and regional burden of disease attributable to selected major risk
factors". World Health Organization. Vol I, II y III. Geneva.



CHAEA-32: PROPUESTA BASADA EN ANLISIS MULTIVARIANTES

M CONCEPCIN VEGA HERNNDEZ
1
,

M CARMEN PATINO ALONSO
2
, M
PURIFICACIN VICENTE GALINDO
3
, PURIFICACIN GALINDO VILLARDN
4

1,2,3,4
Departamento, Estadstica / Universidad de Salamanca

mariacvegher@gmail.com
carpatino@usal.es
purivg@usal.es
pgalindo@usal.es

RESUMEN
El objetivo de este trabajo es analizar la estructura factorial y evaluar, desde un punto de
vista psicomtrico, el cuestionario CHAEA de estilos de aprendizaje, en una poblacin de
estudiantes de distintas facultades de la Universidad de Salamanca. Para comprobar la
validez del cuestionario se ha realizado un Anlisis Factorial Exploratorio y se ha efectuado
la bondad de ajuste del modelo mediante un Anlisis Factorial Confirmatorio. Dado que la
estructura factorial de nuestros datos, no se ajusta al modelo terico, estudiamos la
informacin que proporciona cada dimensin del cuestionario CHAEA y cada uno de los
tems de dichas dimensiones, para saber cules son los que realmente aportan informacin
y cules no. Para ello utilizamos la TRI, que nos permite realizar un anlisis desagregado de
los diferentes tems. Partiendo de los 80 tems que posee el cuestionario, encontramos que
podemos reducirlo tanto en el nmero de tems como en categoras sin perder informacin
relevante.

Palabras clave: chaea, biplot, anlisis factorial confirmatorio, TRI.

Introduccin
Tradicionalmente el aprendizaje se ha entendido como un proceso esttico propio de la
etapa escolar; sin embargo, actualmente es un proceso dinmico que se desarrolla a lo
largo de toda la vida. El sistema universitario anterior a Bolonia (proceso de Convergencia
Europea de la Educacin Superior) primaba la reproduccin de la informacin; actualmente
lo que se exige a los alumnos universitarios, es la adquisicin de competencias. Por tanto, la
tarea de los docentes en las aulas no solo es transmitir conocimientos sino ensear cmo
aprender. Evidentemente no todos aprendemos de la misma manera y es responsabilidad
de los docentes ayudar a los estudiantes a descubrir su estilo (Carbonero, Romn, Martn-
Antn y Reoyo, 2009).
Tras una exhaustiva revisin bibliogrfica realizada por Hall y Moseley (2005), de ms de
800 artculos, se identificaron 71 instrumentos de medida de estilos de aprendizaje. Sin duda
el ms utilizado en habla hispana es el cuestionario CHAEA (Cuestionario Honey-Alonso de
Estilos de Aprendizaje), Alonso, Gallego, y Honey (1995) el cual es una adaptacin del LSQ
(Learning Styles Questionnair) de Honey y Mumford, (1986), al mbito acadmico y al
idioma espaol. El CHAEA consta de 80 tems. Los autores identifican cuatro diferentes
estilos de aprendizaje de acuerdo a las preferencias individuales de acceso al conocimiento:
Activo (Buscan experiencias nuevas, son de mente abierta, nada escpticos y acometen con
entusiasmo las tareas nuevas), Reflexivo (Anteponen la reflexin a la accin), Terico
(Buscan la racionalidad y la objetividad, huyendo de lo subjetivo y lo ambiguo) y Pragmtico
(Les gusta actuar rpidamente y con seguridad, con aquellas ideas y proyectos que les
atraen).
Sin embargo, estudios muy recientes entre los que cabe destacar (Silveira, 2013) llevados a
cabo en un Politcnico de Portugal en el que participaron 1785 estudiantes de las 6 carreras
que se imparten en ese Centro (Agraria, Artes Aplicadas, Educacin, Gestin, Salud,


Tecnologa), demuestran que esa estructura no es reproducible. Los estudios realizados en
Espaa, utilizando este cuestionario, no se han planteado ni la posible discordancia entre la
estructura latente terica y la observada, ni sus implicaciones. Por esta razn nos fijamos
como objetivo de este trabajo contrastar el modelo terico con estudiantes universitarios de
la Universidad de Salamanca y tras capturar la estructura factorial latente y evaluar su
consistencia interna, analizar la capacidad discriminante de cada tem a partir de un modelo
de Respuesta Graduada de Samejima (1969), para proponer, sin prdida de informacin,
una versin del cuestionario CHAEA, con la misma carga informativa, pero con mayor
validez factorial, ms consistente, con mayor poder discriminante y ms rpido de aplicar.
Solo si las dimensiones latentes se identifican correctamente tendr sentido puntuar y
clasificar a los estudiantes segn su perfil mayoritario para actuar despus en consecuencia
y poder mejorar el rendimiento acadmico.

Desarrollo
Participantes: se realiz un estudio transversal de carcter exploratorio. La muestra est
compuesta por 690 estudiantes de primero de distintas facultades de la Universidad de
Salamanca. (Muestreo no probabilstico).
Instrumentos: el instrumento utilizado fue el Cuestionario Honey-Alonso de Estilos de
Aprendizaje (CHAEA) (Honey y Mumford, 1986). El cuestionario consta de 80 tems,
estructurado tericamente en cuatro grupos de 20 tems correspondientes a los cuatro
Estilos de Aprendizaje (Activo, Reflexivo, Terico y Pragmtico). Las respuestas se
presentan en una escala tipo Licker que va desde cero (Nada o Nunca) hasta 5 (Muchsimo
o Siempre).
Anlisis estadstico: La estructura factorial se estudi con un Anlisis Factorial Exploratorio
(solucin en Componentes Principales y rotacin varimax tal como hacen los autores que
proponen el cuestionario). La validez factorial se estudia con un Anlisis Factorial
Confirmatorio (Mtodo de Mxima Verosimilitud). El incremento en el ajuste se busca no
slo a travs del tratamiento especfico de las covarianzas entre las variables
contaminadoras (trminos de error) Pearl, (2009) sino tambin a travs del estudio de las
correlaciones entre los tems y entre las variables latentes obtenidas al analizar la
bigeometra resultante de un GH-Biplot (Gabriel, 1971).
La consistencia interna se evalu con el alfa de Cronbach. La capacidad discriminante de
cada dimensin latente, y/o de cada tem, con el modelo de respuesta Graduada de
Samejima (1969). El software utilizado fue el SPSS, versin 21, el MULTILOG (Thissen,
1991), y el MULTBIPLOT, (Vicente-Villardn 2010).

El 57,4% de los estudiantes tienen entre 18 y 19 aos, siendo ms de la mitad mujeres
(58,3%). El 46.52% eran estudiantes del rea de Salud (Medicina, Enfermera y Farmacia),
39.27% de Ciencias e Ingenieras y el resto de Ciencias Sociales.
El Anlisis Factorial Exploratorio puso de manifiesto que la estructura terica no se
reproduce en nuestros datos y que muchos tems presentan cargas factoriales muy bajas en
todos los ejes. Se repiti el estudio con aquellos tems que presentaban cargas mayores de
0.5 en alguno de los ejes y aunque la estructura esperada apareca ms limpia, no era
coincidente con lo esperado. El Anlisis Factorial Confirmatorio tampoco nos permiti
afirmar que los datos se ajusten al modelo terico.
El siguiente paso fue evaluar la capacidad informativa (capacidad discriminante) de los
tems del cuestionario utilizando el modelo de Samejima, y de sus categoras de respuesta,
a travs del estudio de sus curvas caractersticas.
La capacidad informativa ms alta la aporta la dimensin latente Estilo Reflexivo; sin
embargo, slo siete de los veinte tems que conforman tericamente la dimensin tienen
poder discriminante. Tambin se demuestra que, prcticamente en la totalidad de los tems,
no son necesarias seis respuestas.
Para el Estilo Terico, slo 8 de los tems tienen carga informativa y de nuevo no son
necesarias seis categoras de respuesta. Lo mismo sucede para el Estilo Activo.


Para el Estilo Pragmtico, con carga informativa cuantitativamente muy parecida a los dos
anteriores, 9 tems aportan informacin.
Con el estudio realizado sobre el cuestionario hemos visto que es posible simplificarlo tanto
en el nmero de preguntas como en el nmero de categoras de los tems, sin perder
informacin relevante. Tampoco en este caso son necesarias seis respuestas.
A la vista de los resultados conjuntos proponemos una simplificacin de la escala CHAEA
con 32 tems en lugar de 80, con alta validez discriminante, alta validez factorial y mucho
menor tiempo necesario para la captacin de la informacin, lo cual es tambin muy
importante a la hora de conseguir los datos y a la hora de garantizar la calidad de los
mismos.
No obstante pensamos que sera conveniente ampliar el tamao de muestra en Facultades
pertenecientes a Ciencias Sociales ya que la muestra est desequilibrada en este sentido.
Si los resultados anteriores se mantienen, stos avalaran ms an la propuesta de escala
CHAEA simplificada.
Nuestros resultados estn en la misma lnea que los estudios realizados por autores como
Prado (2004) y Silveira (2013), no encontrando una estructura similar a la terica y siendo
muy pocos los estudiantes que presentan estilos de aprendizaje puros.

Bibliografa
Alonso, C.M.; Gallego, D.L.; Honey, P. (1995). Los estilos de aprendizaje. Procedimientos de
diagnstico y mejora. Ediciones Mensajero, Espaa.
Carbonero, M.A.; Romn, J.M.; Martn, L.J.; Reoyo, N. (2009). Efecto del programa de
habilidades docentes motivadoras en el profesorado de secundaria. Revista de
Psicodidctica, 4(2): 229-244.
Gabriel, K.R. (1971). The biplot graphic display of matrices with application to principal
component analysis. Biometrika, 58: 453-467.
Hall, E. y D. Moseley. (2005). Is there a Role for Learning Styles in Personalized Education
and Training. International Journal of Lifelong Education, 24(3): 243-255.
Honey, P. y Mumford, A. (1986). Using our learning styles. Peter Honey, Inglaterra.
Pearl, J. (2009). Causal Inference en Statistics. An Overview. Statistics Surveys, 3: 96-146.
Prado, M. (2004). Estilo de aprendizaje y rendimiento acadmico en un entorno virtual.
Informe de investigacin presentado en el II Congreso Online del Observatorio para la
CiberSociedad.
Samejima, F. (1969). Calibration of latent ability using a response pattern of graded scores.
Psychometrika Monograph Supplement. 17.
Silveira, P. (2013). Anlisis Multivariante de la relacin entre estilos/Estrategias de
Aprendizaje e Inteligencia emocional, en alumnos de Educacin Superior. Universidad de
Salamanca. Departamento de Estadstica, Espaa.
Thissen, D. (1991). MULTILOG: Multiple category item anlisis and test scoring using item
response theory. Scientific Software Internacional, Inc. Chicago.
Vicente, J.L. (2010). MULTBIPLOT: A package for Multivariate Analysis using Biplots.
Departamento de Estadstica. Universidad de Salamanca, Espaa. 27/03/2013.
(http://biplot.usal.es/ClassicalBiplot/index.html)


EFECTO DE LA PRESENCIA DE DATOS FALTANTES EN LA
INTERPRETACIN DE COMPONENTES DE VARIANZA DE LA
INTERACCIN GENOTIPO POR AMBIENTE

VCTOR PRIETO
1
, JUAN BURGUEO
2

1
Depto. de Biometra, Estadstica y Computacin, Facultad de Agronoma. Avda. E. Garzn
780. Cd. Postal 12900 Montevideo, Uruguay.
2
Biometrics and Statistics Unit, Crop Informatics Lab. (CRIL), International Maize and Wheat
Improvement Center (CIMMYT), Apdo. Postal 6-641, Mexico, D.F., Mexico

vprieto@fagro.edu.uy

RESUMEN
Como consecuencia del proceso selectivo de cultivares se obtiene un conjunto de datos
altamente desbalanceado, con un importante nmero de celdas vacas para los datos de
ao x lugar x cultivar. En los ensayos de cultivares muchos de los materiales son
descartados para aos siguientes mientras que son incorporados otros nuevos. Otras
fuentes de desbalance son la prdida de parcelas y el uso de materiales locales o
diferentes. Estos datos desbalanceados son comnmente analizados con procedimientos de
modelos lineales mixtos que posibilita el tratamiento de observaciones faltantes de forma
directa, suponiendo que la naturaleza de su falta sea aleatoria. Estos modelos adems
permiten modelar la estructura de covarianza de la interaccin genotipo por ambiente, pero
una pobre estimacin de los componentes de varianza afectara la estimacin de los efectos
genotpicos, causando posiblemente el cambio en las decisiones de seleccin.
El presente trabajo tiene como objetivo cuantificar el cambio en las estimaciones de los
componentes de varianza a partir de simulaciones de diferentes grados de prdida de datos
a travs de un procedimiento de muestreo aleatorio. Para ello se compararon las matrices
de varianza-covarianzas resultantes del anlisis de un modelo lineal mixto de una matriz de
datos del rendimiento por parcela de 49 genotipos de trigo en 19 localidades de siembra,
asumiendo un modelo de factores analticos como estructura de covarianza para sitios. Los
resultados obtenidos muestran que hay una prdida constante de similaridad, siendo
importante cuando supera el 30 % de los datos. Se manifiestan cambios de escala,
translacin y rotacin de la configuracin de puntos de la matriz GE, estudio que surge del
anlisis de Procrustes. Estos resultados permiten a los investigadores tomar decisiones
respecto a la confiabilidad que pueden presentar los resultados de sus anlisis dependiendo
de la prdida de informacin que tengan.

Palabras clave: datos faltantes, modelos mixtos, factores analticos.

Introduccin
En el mejoramiento de cultivares un nmero extenso de genotipos son normalmente
probados sobre un amplio rango de ambientes, que incluye sitios, aos, pocas de siembra
y prcticas de cultivo, entre otros. Esto se debe a las diferencias de expresin de los
genotipos segn el ambiente, lo que se conoce como interaccin genotipo-ambiente (GEI).
Esta respuesta diferencial, medida en valores de caracteres observables (fenotipo) como
rendimiento, altura de planta, resistencia a sequa, etc. puede ocasionar incluso el cambio
de posicin relativa o ranking de cultivares entre diferentes ambientes (Kang and Gauch,
1996; Annichiarichio, 2002).
La consecuencia fundamental para el fitomejorador es que cuanto ms se manifieste el
componente GE por sobre el valor genotpico (G), menor heredabilidad para el carcter se
obtendr en el proceso de seleccin y por ende, mayor es la dificultad de su mejora. Otras
implicancias determinantes para un programa de mejoramiento gentico son que (a) se


dificulta la identificacin de materiales superiores, ya que podra existir cambio de rankings
de genotipos (lo que se conoce como GE cruzada) y (b) se incrementan los costos de
evaluacin, debido a que la prueba debe realizarse en varios lugares representativos de
reas de cultivo claves (Kang, 2002)
En los programas de mejoramiento gentico la metodologa de anlisis de varianza
(ANOVA) ha sido intensamente utilizada para la estimacin de componentes de varianza,
relacionado a diversas fuentes de variacin, incluida la GEI. Tambin pueden obtenerse
estimaciones mediante el mtodo de mxima verosimilitud (ML), aunque stas son
sesgadas. Con el mtodo de mxima verosimilitud restringida (REML) se supera esta
desventaja y produce idnticos estimadores que ANOVA si los datos son balanceados. Una
fuerte limitante del mtodo ANOVA es que puede ser invlido para el anlisis de
experimentos desbalanceados, cosa que no sucede bajo el anlisis REML (Freeman, 1973;
Crossa, 1990).
En ensayos de mltiple ambiente (MET), las pruebas de cultivares pueden presentar
situaciones de desbalance, no necesariamente debido a la prdida no prevista de parcelas.
De los diversos motivos, es comn que algunos genotipos sean evaluados slo en algunos
sitios o aos y que algunos otros ingresen (nuevos materiales a evaluar) o sean
descartados. Como consecuencia del proceso selectivo de cultivares se obtiene un conjunto
de datos altamente desbalanceado, con un importante nmero de celdas vacas para los
datos de ao x sitio x cultivar. Estos datos desbalanceados son comnmente analizados
bajo un enfoque de modelos lineales mixtos, que posibilita el tratamiento de observaciones
faltantes de forma directa bajo el supuesto de que su naturaleza sea aleatoria (Balzarini,
2002).
El presente trabajo tiene como objetivo el anlisis del rendimiento de ensayos MET
provenientes de un programa de evaluacin de cultivares, simulando diferentes grados de
prdida de datos. ste anlisis, bajo un enfoque de modelos mixtos y estimacin REML, y
modelando el componente GE a travs de una estructura de factores analticos permiti no
solo cuantificar el efecto de la prdida aleatoria de datos sino tambin mejorar la
interpretacin de la GE mediante la metodologa de Procrustes.

Desarrollo
Para llevar a cabo el trabajo se utilizaron datos de rendimiento en grano de 49 genotipos de
trigo [Triticum aestivum L.] tipo semi-rido provenientes de ensayos SAWYT del CIMMYT,
para 19 localidades internacionales de siembra, analizados bajo un diseo experimental de
bloques completos al azar con 2 replicaciones por sitio. Esta matriz de datos fue sometida a
diferentes prdidas de celdas simuladas por un proceso de muestro al azar simple, que van
desde un 5 a 50% de datos faltantes. De esta manera, se obtuvieron cincuenta muestras
para cada tipo de prdida, que hacen un total de 500 muestras a analizar. El modelo de
datos completos est dado por

Y
ijk
= + s
i
+ rk
(i)
+ gs
ji
+ e
ijk

donde Y
ijk
es la variable de respuesta (fenotipo), es la media general, s
i
es el efecto del
sitio, rk
(i)
es el efecto de la replicacin dentro de sitios, gs
ji
el efecto (aleatorio) de la
interaccin genotipo-ambiente y e
ijk
el error residual.
La comparacin entre las matrices de varianzas-covarianzas se bas en el estadstico r de
la prueba de Mantel y para el estudio de efectos de escala, traslacin y rotacin sobre los
loadings ambientales se utiliz la tcnica de Procrustes. sta consiste en la comparacin,
mediante un algoritmo de ajuste que minimiza la suma de cuadrados de los residuales entre
dos matrices. El grado de ajuste, a travs del estadstico m
2
de Procrustes es un indicador
vlido de la concordancia / similaridad entre matrices (Jackson, D.A. 1995; Peres Neto, P.R.
& Jackson, D.A., 2001). Para ambos anlisis fueron utilizadas diferentes libreras
implementadas en el paquete R (R Development Core Team, 2010). Para el ajuste de los
modelos lineales mixtos fue utilizado el software ASReml (VSN International, 2010).


De la comparacin entre la matriz de correlacin gentica del modelo completo y las que
surgen de la simulacin se observa una consistente prdida de similaridad, expresada en el
coeficiente r de Mantel. Una lnea de tendencia sugiere que por encima del 25 % de prdida
de datos, el coeficiente de r entre el modelo original y los modelos incompletos caen por
debajo de 0.5. De cualquier forma, no permite trazar un punto de corte claro a partir del cual
es o no recomendable analizar los datos, ya que la cada en la similaridad sigue una
tendencia lineal. Teniendo en cuenta sta tendencia, adems del hecho de que la
variabilidad entre las muestras con igual % de prdida es muy similar nos sugiere que la
naturaleza de la prdida es muy importante, es decir, no cuantos datos se pierden sino
cuales genotipos y en que ambientes se pierden. Claramente se observan cambios en la
configuracin de los puntos, en relacin al modelo incompleto, donde el anlisis Procrustes
permite cuantificar ese cambio debido a los tres efectos ya mencionados. Para el efecto de
escala, pudo notarse que existe un paulatino descenso en los valores siendo estos muy
importantes por encima del 25-30% de prdida de datos. De la misma forma, pudo
observarse que existe un efecto de traslacin de los datos, y que este es mayor en la
medida que sea mayor el porcentaje de prdida. Se evidencia ste efecto en el alejamiento
de los puntos al origen. Por ltimo, el efecto de rotacin se manifiesta en el cambio en los
ejes de la configuracin de puntos, buscando minimizar la suma de cuadrados de las
diferencias entre la matriz original y la que surge de los tratamientos de prdida. Es as que
se generaron tantos grficos como muestras tuvo el anlisis, donde cada uno de esos
grficos se observa los ejes de rotacin y la direccin y valor de cambio para cada punto
(ambiente) en el plano. En los grficos pudo observarse que una muestra con mayor
prdida, el ngulo de rotacin es mucho mayor que si la prdida es en menor porcentaje, as
como tambin es mayor la magnitud de los residuales para cada punto (sitio).
Por ltimo, podemos decir que la tcnica de Procrustes mostr ser una metodologa apta
para el anlisis de la estructura de covarianza de la GE, permitiendo cuantificar el cambio
debido a prdida de datos aleatoria, a su vez mejora su interpretacin ya que permite
visualizar grficamente en que sitios y para que genotipos fue mayor el cambio.

Bibliografa
Annicchiarico, P. (2002). Genotype x environment interaction : challenges and opportunities
for plant breeding and cultivar recommendations. FAO plant production and protection paper,
174. Food and Agriculture Organization of the United Nations.
Balzarini, M. (2002). Applications of Mixed Models in Plant Breeding, pp. 353-365. CABI
Publishing.
Crossa, J. (1990). Statistical Analyses of Multilocation Trials, Volume 44 of Advances in
Agronomy, pp. 55-85. Elsevier.
Freeman, G. H. (1973). Statistical methods for the analysis of genotype-environment
interactions. Heredity 31(3), 339-354.
Jackson, D. A. (1995). PROTEST: A PROcrustean randomization TEST of community
environment concordance. Ecoscience, 2 (3), 297-303.
Peres Neto, P. R., & Jackson, D. A. (2001). How well do multivariate data sets match? the
advantages of a procrustean superimposition approach over the mantel test. Oecologia, 129
(2).
Kang, M. S. (2002). Quantitative genetics, genomics, and plant breeding. CABI Publishing.
Kang, M. S. and H. G. Gauch (1996). Genotype -by- environment interaction. CRC Press.
R Development Core Team (2010). R: A language and environment for statistical computing.
R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL
VSN International (2010). ASReml. Hemel Hempstead, UK.


APLICACIONES ESTADSTICAS PARA EPIDEMIOLOGA EN EL
SOFTWARE INFOSTAT

GONZALEZ LAURA ALICIA
1
, TABLADA ELENA MARGOT
1
, PERRACCHIONE MARCOS
1
,
MUOZ MORALES DUBERNEY
2

1
Facultad de Ciencias Agropecuarias, Universidad Nacional de Crdoba
2
Estudiante de doctorado en Ciencias de la Ingeniera, Universidad Nacional de Crdoba

gonzalez.lauraalicia@gmail.com

RESUMEN
La disponibilidad de una herramienta de software que integre los mtodos necesarios para
la prctica profesional en una interfaz amigable y econmicamente accesible es clave para
para el soporte de trabajos de investigacin.
Nuestra experiencia como consultores y colaboradores de trabajos cientficos en medicina
muestra que en Crdoba existe una demanda insatisfecha de formacin en estadstica-
epidemiolgica, en el manejo de software especializado y en la interpretacin de resultados
provistos por el software.
El principal objetivo de este trabajo fue incorporar un men de procedimientos estadsticos,
para el anlisis epidemiolgico de datos de salud, en el software estadstico InfoStat.
En esta primera etapa del desarrollo se implementaron procedimientos para el anlisis en
demografa y tablas de contingencia. Se elaboraron bases de datos para ejemplificacin y la
documentacin tutorial respectiva.
Este trabajo es el resultado del desarrollo del proyecto avalado por la Secretara de Ciencia
y Tecnologa de la Universidad Nacional de Crdoba.

Palabras clave: bioestadstica, anlisis de datos, software estadstico

Introduccin
La epidemiologa es una disciplina cientfica que, basada en la investigacin, genera
conocimientos utilizados para resolver problemas sanitarios. Hoy los conocimientos
aportados desde la epidemiologa intervienen activamente en la definicin de polticas de
administracin de servicios, en la gestin y gerenciamiento de redes sanitarias y en la
evaluacin de la calidad de atencin en los centros de salud. La evaluacin de tratamientos
y de prcticas teraputicas o de intervenciones comunitarias, son ejemplos de la necesidad
de contar con anlisis crticos sobre la validez y efectividad de procedimientos y servicios en
el mbito de la salud.
Dada la complejidad de los problemas que aborda la epidemiologa se requiere la
interaccin con otras disciplinas. La Bioestadstica es una ciencia clave en el desarrollo de
modelos que soportan la estimacin de parmetros epidemiolgicos y el contraste de
hiptesis sobre ellos. Un ejemplo de ellos son los informes que prepara regularmente la
Organizacin Mundial de la Salud (OMS) sobre tasas de mortalidad especficas por edad y
sexo, o la prevalencia de los problemas de salud por edad, sexo y gravedad, entre otros
(OMS, 2011).
La prctica epidemiolgica supone la creacin y procesamiento de bases de datos y la
consiguiente utilizacin de software estadstico especializado. Ejemplos de software
especializado son: Epidat, EpiInfo, Epilinux, EpiData, OpenEpi y SIGEpi. Uno de los
inconvenientes de estas aplicaciones es la excesiva especializacin, lo que implica la
necesidad de utilizar varios de ellos u otros paquetes estadsticos para completar un
proceso de anlisis.


El propsito de este trabajo fue incluir procedimientos comnmente utilizados en la prctica
del anlisis epidemiolgico en un software estadstico desarrollado en la Universidad
Nacional de Crdoba que actualmente cuenta con una versin libre.
Este desarrollo est dirigido a mdicos, investigadores, profesionales y trabajadores de la
salud, epidemilogos y docentes en biologa, agronoma y medicina.

Desarrollo
Los procedimientos desarrollados se incluyeron en un mdulo del software estadstico
Infostat. La implementacin se realiz utilizando una combinacin de herramientas de
programacin: Delphi R (R Development Core Team, 2011), en el mismo modelo de
desarrollo que se ha utilizado para la implementacin de modelos lineales generales y el
intrprete de R. Esta combinacin con R, permite acelerar los tiempos de desarrollo y utilizar
paquetes internacionalmente validados y conocidos para el anlisis epidemiolgico como
por ejemplo los paquetes Epitools y Pyramid.
Para definir un plan de implementaciones se realiz una clasificacin de las metodologas
estadsticas segn ejes definidos en funcin del propsito de la aplicacin tecnolgica. Estos
ejes abordaron problemticas relacionadas con la inferencia epidemiolgica, indicadores
epidemiolgicos y demografa.
Se elabor un tutorial sobre el uso de las nuevas herramientas implementadas, similar al
realizado para otros mdulos especializados implementados en InfoStat. Asimismo se
crearon y documentaron las bases de datos de los ejemplos de referencia del tutorial.

Resultados
Se desarroll un men especfico para los procedimientos estadsticos implementados, tales
como: obtencin y ajuste de tasas por mtodo directo e indirecto, herramientas para
demografa (indicadores y pirmides), anlisis de tablas de contingencia simples o
estratificadas para estudios de tipo transversal, de cohortes y caso-control. Cada uno de
estos procedimientos constituye un submen dentro del men principal.
Se elaboraron bases de datos simples que sirven para la ejemplificacin de los
procedimientos.
Se gener documentacin tutorial sobre el uso del mdulo.

Bibliografa
BALZARINI M.G; CASANOVES, F.; DI RIENZO, J.A.; GONZALEZ, L.A.; ROBLEDO, C.W.;
TABLADA, E.M. 2008. InfoStat versin 2008. Manual del usuario. Grupo InfoStat, FCA,
Universidad Nacional de Crdoba. 1 edicin. Ed. Brujas. ISBN: 978-987-591-110-9. 336 p.
Crdoba.
DI RIENZO J.A., CASANOVES F., BALZARINI M.G., GONZALEZ L., TABLADA M.,
ROBLEDO C.W. InfoStat versin 2011. Grupo InfoStat, FCA, Universidad Nacional de
Crdoba, Argentina. URL http://www.infostat.com.ar
DI RIENZO J.A. (2009). fgStatistics. Statistical software for the analysis of experiments of
functional genomics. RDNDA. Argentina. 756587. http://sites.google.com/site/fgStatistics/
DI RIENZO J.A, GONZALEZ L., TABLADA M. (2009). fgStatistics. User Manual.
http://sites.google.com/site/fgStatistics/
HENQUIN RUTH P. (2011). Introduccin a Epidemiologa y Estadstica.
Ediciones elaleph.com.
HERNNDEZ VILA, MAURICIO. (2009). Epidemiologa. Diseo y anlisis de estudios. 406
p. Editorial Mdica Panamericana. Buenos Aires, Argentina.
HERNNDEZ-AGUADO, ILDEFONSO, et al. (2011). Manual de Epidemiologa y Salud
Pblica. Para grados en ciencias de la salud. 400 p. Editorial Mdica Panamericana. Buenos
Aires, Argentina.
NORDNESS, ROBERT. (2006). Epidemiologa y Bioestadstica. Secretos. 294 p. Elsevier.
Espaa.


ANLISIS DE DATOS LONGITUDINALES A TRAVS DE
DISTANCIAS USANDO ECUACIONES DE ESTIMACIN
GENERALIZADA

SANDRA E MELO
1
, OSCAR O MELO
2
, JULIO C MELO
3

1
Universidad Nacional de Colombia, Departamento de Agronoma
2
Universidad Nacional de Colombia, Departamento de Estadstica
3
Universidad Autnoma de Colombia, Ciencias Naturales y Exactas

semelom@unal.edu.co

RESUMEN
En este trabajo se propone una metodologa para analizar datos longitudinales a travs de
distancias entre pares de observaciones (o individuos) con respecto a las variables
explicativas y distancias entre tiempos usado para ajustar variables respuestas con
distribucin no normal. Se presenta el modelo propuesto, se desarrolla el proceso de
estimacin de los parmetros y pruebas de hiptesis; este proceso es hecho utilizando una
mezcla entre la metodologa de ecuaciones de estimacin generalizadas (GEE) y el mtodo
basado en distancias. Adicionalmente, se realiza la inferencia y el proceso de validacin del
modelo. La informacin analizada en la aplicacin del trabajo hace parte de un proyecto de
conservacin, cra y manejo de abejas silvestres, realizado en una zona rural de Acacias
(Meta, Colombia). El objetivo en esta aplicacin fue estudiar la actividad de forrajeo de polen
(entindase forrajeo como el proceso de recoleccin en este caso de polen, desarrollado por
abejas de la especie Melipona fasciata) en cinco diferentes nidos y as determinar el efecto
que puede tener la temperatura y la humedad relativa sobre la actividad. El uso del mtodo
basado en distancias con la estrategia GEE es til para predecir datos faltantes y futuras
observaciones con bajos errores de prediccin que los modelos tradicionales.

Palabras clave: Distancia de Gower, modelo basado en distancias, ecuaciones de
estimacin generalizadas, datos longitudinales.

Introduccin
Varias tcnicas se han propuesto para el anlisis de datos longitudinales, algunas de stas
exploran la relacin entre los datos observados en los puntos de tiempo sucesivos, teniendo
en cuenta tales relaciones en los modelos utilizados para la representacin de este tipo de
datos. Ejemplos de estas tcnicas son el anlisis de los factores longitudinales, anlisis de
factores dinmicos, anlisis multivariante de series de tiempo, modelamiento espacio-estado
(Jorgensen et al., 1996) y anlisis de curvas de crecimiento Chaganty y Mav (2007). Estas
tcnicas estn todas basadas en suposiciones de la distribucin que no siempre pueden ser
plausibles en la prctica.
En la aplicacin de este trabajo se evidencia un problema de sobredispersin el cual merece
un estudio particular, lo cual motiva a abordar este problema proponiendo una metodologa
basada en distancias bajo respuestas no normal con algunas variantes para el anlisis de
este tipo de datos. Trabajos usando distancias, que es parte fundamental del soporte terico
para desarrollar la metodologa propuesta, son estudiados por Cuadras (1989) y Melo
(2013), donde se hace la aplicacin de funciones distancia, junto con anlisis de
coordenadas principales, para algunos problemas multivariantes, a saber regresin mltiple,
manova , anlisis discriminante y datos longitudinales junto con su inferencia estadstica.

En este trabajo, se presenta una metodologa para analizar datos longitudinales mediante
distancias en las variables explicativas, con la finalidad de ajustar variables respuesta de
tipo continuo; se presenta el modelo propuesto, se realiza la estimacin de los diferentes


parmetros involucrados bajo el mtodo GEE, se propone como realizar la inferencia y se
lleva a cabo el proceso de validacin del modelo propuesto. A partir del enfoque planteado
se realiza una aplicacin en donde se ajusta el modelo longitudinal usando distancias
mediante el uso de la distancia de Gower en las variables explicativas ya que se trabaj con
variables mixtas. Se encuentran ganancias en el ajuste del modelo respecto a las
metodologas clsicas, se puede evidenciar ganancia en la calidad de las predicciones y
resulta ms fcil lograr estacionariedad cuando hay autocorrelacin, finalmente por ser un
buen mtodo de prediccin resulta til en la estimacin de datos faltantes y una buena
alternativa para el anlisis de datos longitudinales cuando se desean obtener buenas
predicciones del modelo ajustado.

Desarrollo
Este trabajo presenta la metodologa propuesta para el anlisis de datos longitudinales con
variables respuesta distribuida no normal. Se inicia presentando el modelo propuesto, junto
con las principales ideas que dan su origen. Despus, se desarrolla la estimacin de
parmetros y pruebas de hiptesis. La estimacin se hace usando la metodologa GEE,
asumiendo condiciones usadas para la estadstica de Wald y la hiptesis lineal general para
el caso matricial.
La informacin aqu analizada hace parte de un proyecto de conservacin, cra y manejo de
abejas silvestres, realizado en una zona rural de Acacas (Meta, Colombia) y fue tomada por
Rodriguez (2005) con el fin de estudiar la actividad de forrajeo de polen (entindase forrajeo
como el proceso de recoleccin, en este caso de polen, desarrollado por abejas de la
especie Melipona Fasciata) en cinco nidos diferentes de abejas obreras de Melipona
Fasciata y determinar as el efecto que podan tener la temperatura y la humedad relativa
sobre esta actividad. Para cumplir con estos objetivos, el investigador registr, en tres das
diferentes, el nmero de entradas de abejas con cargas de polen, desde las 6:00 a.m. hasta
las 9:00 a.m., (horario de mayor actividad de forrajeo de polen) cada hora, durante 10
minutos. En cada uno de los nidos de estudio; paralelamente, se tomaron mediciones de
temperatura y humedad relativa, cada hora de dichos nidos. Este proceso fue realizado
durante los meses de enero y febrero de 2004, cuando el nivel de precipitaciones es menor
(poca seca) y luego en los meses de abril y mayo del mismo ao, considerado poca
lluviosa dado el aumento considerable de precipitaciones (lluvias).
De acuerdo al tipo de variable respuesta se pens inicialmente en un modelo con respuesta
Poisson, pero despus de realizar el anlisis se encontr que no es bueno el ajuste por este
modelo y que al haber sobredispersin en los datos se deba buscar una funcin de varianza
que controlar esto. Entonces, se procedi a probar un modelo Binomial Negativo debido a
la naturaleza de la variable respuesta. Para el mtodo clsico con los datos del experimento
se procede a plantear un modelo que permita identificar si las variables independientes:
poca (lluviosa o seca), da, hbitat de las abejas codificadas como grupos (cajas o rboles
vivos), temperatura y humedad relativa, intervienen en el proceso de recoleccin de polen
para los nidos estudiados. En el trabajo se realizan ambos anlisis bajo la metodologa
propuesta usando DB y el mtodo clsico de GLM.
Dado que en este estudio se realizaron conteos en cuatro ocasiones, es decir las
mediciones realizadas desde las 6:00 a.m. hasta las 9:00 a.m., es necesario tener en
cuenta, en la construccin del modelo la correlacin que pueda existir entre estas
observaciones para cada uno de los nidos (unidades experimentales). Inicialmente, se
realiz un anlisis basado en distancias para aplicar la metodologa propuesta. Se busca
que modelo lineal generalizado ajustar para la variable respuesta: nmero de entradas con
polen y se realiza distancias entre las variables explicativas estudiadas. Ya que los datos
son mixtos se utiliz la distancia de Gower en las variables explicativas. Para la variable
tiempos que fueron cuatro se utiliz la distancia valor absoluto y se procedi a construir la
matriz de datos, despus de construir las matrices de coordenadas principales. En ambos
casos se modelo la sobredispersin por ambos mtodos.



Se propuso una metodologa para analizar datos longitudinales bajo respuesta no normal
mediante modelos lineales generalizados) usando distancias entre observaciones (o
individuos) con respecto a las variables explicativas con variables respuesta de tipo
continuo. Se encontraron resultados similares a la metodologa clsica, pero al agregar ms
componentes de la matriz de coordenadas principales se encuentra ganancia en las
predicciones con respecto a los modelos clsicos. Por lo cual, resulta ser una metodologa
alternativa frente a la clsica para realizar predicciones y la ventaja de poder modelar datos
de respuesta continua no normal en el tiempo. Adems, se present como realizar inferencia
sobre los parmetros involucrados en el modelo.
Por medio de una aplicacin real se ilustr la metodologa propuesta, se realiz el ajuste del
modelo, se obtuvo la estimacin de los diferentes parmetros involucrados, junto con la
inferencia estadstica del modelo y la validacin del modelo propuesto. El mtodo tiene la
ventaja de poder hacer predicciones en el tiempo, se puede modelar la estructura de
autocorrelacin, adems es posible trabajar con datos donde las variables explicativas sean
mixtas, binarias, categricas o continuas y garantizando independencia en las componentes
de la matriz de coordenadas principales mientras que con las variables originales no se
puede garantizar siempre independencia.
Por ltimo, el mtodo propuesto arroja buenas predicciones para estimar datos faltantes, ya
que al agregar una o ms componentes en el modelo con respecto a las variables
explicativas originales de los datos, se puede mejorar el ajuste sin alterar la informacin
original y por consiguiente resulta ser una buena alternativa para el anlisis de datos
longitudinales y de gran utilidad para investigadores cuyo inters se centra en obtener
buenas predicciones.

Bibliografa
[1] Cuadras, C. M. (2008). Distance based association multi-sample tests for general
multivariate data. In: Advances in Mathematical and Statistical Modeling, (B.C. Arnold,
N. Balakrishnan, J. M. Sarabia, R. Mnguez, Eds), Birkhauser, Boston, 61-71.
[2] Cuadras, C. M. (2009). Distance-based approach in multivariate association.
Classification and Data Analysis. Short Papers. (S. Ingrassia and R. Rocci, eds.), Catania,
17-20.
[3] Chaganty, N. R. & Mav, D. (2007). Estimation methods for analyzing longitudinal data
occurring in biomedical research. Computational Methods in Biomedical Research, 12: 371-
400.
[4] Jorgensen, B., Lundbye, S., Song, P. and Sun, L. (1996). State-space models for
multivariate longitudinal data of mixed types. The Canadian Journal of Statistics, 24(3): 385-
402.
[5] Jowaheer, V. and Sutradhar, B. (2002). Analysing longitudinal count data with
overdispersion. Biometrika, 89(2): 389-399.
[6] Melo, S. and Melo, O. (2013). Distance-based approach in univariate longitudinal data
analysis. Journal of Applied Statistics, 40(3): pg 674-692.


PROPIEDADES ORGANOLEPTICAS Y ALMACENAMIENTO DE
CERVEZA. UN MODELO FACTORIAL PARA SU ANALISIS

CONTINI L.E.
1
, PAONESSA A.M.
2,3
, SCOTTA M.
3
, SIMONIELLO M.F.
2
, AVILA, O. B.
1

1
Departamento de Matemtica, Facultad de Bioqumica y Ciencias Biolgicas. Universidad
Nacional del Litoral.
2
Ctedra de Toxicologa, Farm. y Bioq. Legal. Facultad de Bioqumica y Ciencias Biolgicas.
Universidad Nacional del Litoral.
3
Control de Calidad de CICSA CCU Argentina

lcontini@fbcb.unl.edu.ar

RESUMEN
La cerveza requiere especial atencin durante el almacenamiento y la distribucin ya que la
calidad organolptica se ve alterada si las condiciones no son adecuadas, evidencindose a
travs de cambios bioqumicos, turbidez y calidad organolptica. Para estudiar como el
producto terminado vara con el almacenamiento y la distribucin, se tom un lote fresco de
cerveza, que fue dividido en 4 sub lotes iguales sometido a diversas condiciones adversas:
Temperatura, Radiacin UV, Temperatura y Radiacin UV y se lo compar con las
condiciones adecuadas de almacenamiento a travs de la medicin de Oxigeno Total, ndice
de Acido Tiobarbiturico, Turbidez y Degustacin.
Se realiz un diseo de dos factores con medidas repetidas en uno de ellos: el tiempo con
seis niveles y el otro, la condicin de almacenamiento con 4 niveles con tres rplicas para
cada combinacin de niveles.
Se concluy que las variables Oxigeno Total (TPO) e ndice de Acido Tiobarbiturico (TBZ)
no resultaron buenos marcadores del comportamiento del producto a lo largo del tiempo ni
de la condicin de almacenamiento. Turbidez y Degustacin si lo fueron.
Se observ que los valores de Turbidez aumentan mientras que los de Degustacin
disminuyen con el transcurso del tiempo en todas las condiciones de almacenamiento,
resultando altamente significativas las diferencias con el control cuando en el
almacenamiento hay Radiacin UV + Temperatura.

Palabras clave: Modelo factorial, Medidas repetidas, Cerveza, Propiedades
organolpticas.

Introduccin
En un mundo cada vez ms competitivo y globalizado, mantener los estndares de Calidad
de producto es el inters principal de toda Empresa. Las industrias se han visto en la
necesidad de emplear nuevas estrategias competitivas que les ayuden a sobresalir en el
mercado. En particular, una de las que ms ha crecido en los ltimos aos tanto a nivel
nacional como mundial ha sido la cervecera. Como estrategia de mercado, la Cadena de
Valor conceptualiza que cada eslabn agrega valor al producto final con el objetivo de lograr
productos de Calidad que satisfagan los requisitos del consumidor final.
La cerveza requiere especial atencin durante el almacenamiento y la distribucin ya que la
calidad organolptica se ve alterada si las condiciones no son adecuadas, evidencindose
turbidez en el lquido, producto de una condensacin oxidativa que tiene lugar entre las
protenas y taninos que la componen. La degustacin del producto en estas condiciones
indica adems un marcado deterioro en su degustacin, variaciones que son percibidas no
solo por el panel entrenado de catadores sino tambin por el consumidor final.
El objetivo de este trabajo es describir, a travs de variables seleccionadas (analticas y
organolpticas), cmo se modifica el producto a lo largo del tiempo cuando es almacenado y
distribuido en condiciones adversas.
Para ello se consider la medicin de Oxigeno Total (TPO) ya que el oxgeno no es un


oxidante fuerte, pero si el oxgeno libre se activa dentro del envase tiene un alto poder
oxidante actuando como catalizador de envejecimiento (1). Por otra parte, el ndice de cido
tobarbitrico (TBZ) representa un valor indicativo de la exposicin trmica a que fue
sometida la cerveza (1). Adems es importante considerar que los responsables ms
directos en la formacin de turbidez en la cerveza son los flavonoides y los taninos (2). En la
cerveza envasada y pasteurizada, se puede decir que estos tipos de compuestos estn
cerca de la frontera entre soluble e insoluble. Un factor importante para que exista
condensacin de los flavonoides es la presencia de oxgeno, la temperatura y la agitacin a
la que est sometido el producto en la Logstica (3).

Desarrollo
-Condiciones de almacenamiento
Para estudiar como el producto terminado vara con el almacenamiento y la distribucin, se
tom un lote fresco de cerveza en botellas color mbar marca Schneider (n= 336), que fue
dividido en 4 sub lotes iguales (n= 84) sometido a diversas condiciones adversas como son
la Temperatura a 37 1 C durante 4 hs diarias (Calor), la radiacin UVA-UVB durante 30
minutos diarios (UV), la Temperatura a 40 1 C durante 4 horas diarias con el agregado
radiacin UVA-UVB durante 30 minutos diarios (Calor + UV) y el ltimo se conserv en las
condiciones adecuadas de almacenamiento a 20 1 C en oscuridad (Control). Las
variables seleccionadas fueron registradas cada 15 das con un perodo total del
experimento de 90 das.
-Variables analizadas
TPO: para determinar el oxgeno disuelto y total en cerveza envasada se utiliz un medidor
de oxgeno disuelto Orbisphere modelo 3600. Expresndose los resultados como mg/l.
TBZ: para determinarlo se hizo reaccionar la muestra con una solucin de cido
tiobarbitrico, acidificado con cido actico desarrollndose un color amarillo que fue medido
espectrofotomtricamente a 448 nm. Los resultados se expresaron en unidades arbitrarias -
ndice.
Turbidez: se utiliz el Turbidmetro Haffmanns Vos Rota 90. El valor de turbidez se informa
en unidades EBC.
Degustacin: al finalizar el perodo de tratamiento, se les present a los jueces entrenados,
las muestras expuestas a las diferentes variables, tomando como referencia cerveza fresca.
El puntaje otorgado fue un rango entre 5,0 y 7,5.
Todos los anlisis se realizaron por triplicado, para cada uno de las cuatro condiciones de
almacenamiento y para cada uno de los tiempos.
-Tratamiento estadstico de los resultados
Se realiz un diseo de dos factores con medidas repetidas en uno de ellos: el tiempo,
medido a los 15, 30, 45, 60, 75 y 90 das y el otro, la condicin de almacenamiento con 4
niveles: Control; Calor, UV y UV+Calor; con tres rplicas para cada combinacin de factores.
Se verificaron los supuestos: independencia a travs de la prueba de esfericidad de Mauchly
y homogeneidad de varianzas de los niveles del factor intra e inter sujetos con los
estadsticos de Box y Levene respectivamente. Adems se realizaron las pruebas de
normalidad de residuos, en todos los casos, con Kolmogoro-Smirnov (4, 5). El nivel de
significancia adoptado fue 0.05. El software utilizado fue SPSS, 17.0, disponible en la FBCB,
UNL.

TPO: Todos los estadsticos multivariados tuvieron un p< 0.001, lo que implica que existen
diferencias significativas entre las medias de TPO para cada tiempo y que la interaccin
tiempo condicin de almacenamiento tambin fue significativa. Para el anlisis univariado,
no se verific el test esfericidad (p<0.001) y en el anova con la correccin correspondiente
resultaron significativos el tiempo y la interaccin.
Del grfico de perfiles y de los estadsticos descriptivos se observ que hay una marcada
diferencia entre el Control y el resto de los niveles de este factor, en los primeros 60 das,
presentando el control valores medios de TPO siempre superiores. No se observaron


diferencias entre los otros niveles entre s pero s con el Control. A partir de los 60 das la
respuesta dio valor cero para todas las condiciones de almacenamiento.
TBZ: Los anlisis multivariados y univariados dieron resultados similares a los obtenidos con
TPO. Del anlisis del grfico de perfiles y de los estadsticos descriptivos se observ que
para los tiempos 15 y 30 das la TBZ del control da valores superiores a los dems niveles y
que Calor + UV los menores; esta situacin se invirti a partir de los 45 das, es decir, los
valores mayores de TBZ lo dieron el nivel calor + UV y los menores son para el Control. Las
otras dos: Calor y UV separados, se mantuvieron entre los dos niveles mencionados, si bien
para los tiempos 60, 75 y 90 das el Control y Calor tomaron valores prcticamente iguales.
Turbidez: Los estadsticos multivariados dieron un p< 0.016, lo que implica que existen
diferencias significativas entre las medias de turbidez para cada tiempo y que la interaccin
tiempo condicin de almacenamiento tambin es significativa.
La prueba de esfericidad no se rechaza (p=0.097). Del grfico de perfiles se observ que los
valores medios de Turbidez fueron menores para el Control en todos los tiempos estudiados
y que siempre resultaron mayores para UV + Calor, estando los valores para los otros dos
niveles (UV, Calor) entre el Control y UV+ Calor. Para los tiempos 15 y 30 das los valores
medios de Turbidez de Calor y UV se confunden y a partir de los 45 das, se separan siendo
menores los valores de la turbidez para UV que para solo Calor.
Degustacin: En las pruebas multivariadas se observ que hay diferencias
estadsticamente significativas entre las medias de Degustacin en cada tiempo (p<=0.016)
y la interaccin tiempo condicin de almacenamiento no fue significativa (p0.396). No se
rechaza la prueba de esfericidad (p=0.622). Las comparaciones de a pares dieron que los
niveles del factor condicin de almacenamiento son todos diferentes entre s (prueba de
Bonferroni, p0.005) excepto para UV y Calor donde el p = 0.069, resultando no significativa
la diferencia. En el grfico de perfiles se observ que los valores medios de Degustacin son
mayores para el control en todos los tiempos. Disminuyen para UV, luego le siguen los de
Calor y los ms chicos son UV + Calor. Al no haber interaccin condicin de
almacenamiento-tiempo significativa las lneas que marcan el decaimiento a lo largo del
tiempo de Degustacin son casi paralelas.
Resumiendo: a) la TPO no es un buen marcador del comportamiento del producto a lo largo
del tiempo. Si bien se observa que el tipo de almacenamiento en los primeros tiempos afecta
sus valores (todos menores al control), no es posible diferenciar cambios entre los otros
niveles. A partir del tiempo 60 das todos tienen valor cero.
b) la TBZ no es un buen marcador del comportamiento del producto a lo largo del tiempo
pues no refleja cambios entre las diferentes condiciones de almacenamiento.
c) Turbidez es un buen marcador. Se observaron diferencias estadsticamente significativas
a lo largo del tiempo para los diferentes tipos de condicin de almacenamiento, siendo su
valor mayor cuando en el almacenamiento hay exposicin a calor.
d) Degustacin es un buen marcador del comportamiento del producto. Se observaron
diferencias estadsticamente significativas a lo largo del tiempo para las diferentes
condiciones de almacenamiento. Los valores son menores cuando en el almacenamiento
hay exposicin a calor.

Bibliografa
[1] Vanderhaegen, B.; Neven, H.; Verachtert, H.; Derdelinckx, G. (2006).The chemistry of
beer aging a critical review. Food Chemistry 95: 357381.
[2] Mebak. (1999). Mtodos de Anlisis Cerveceros, Tomo II, ALAFACE. Alemania.
[3] Kaneda, H., Kobayashi, M., Furusho, S., Sahara, H., Koshino, S. (1995). Reducing
activity and flavor stability. MB AA Technical Quarterly 32: 9094
[4] Ho, R. (2006). Handbook of univariate and multivariate data anlysis and interpretation
with SPSS. Chapman & Hall CRC. Taylor & Francis Group. Boca Ratn, USA. Paginas 117
156.
[5] Leech, N.; Barret, K.; Morgan, G. (2005). SPSS for Intermediate Statistics. Use and
Interpretation. Lawrence Erlbaum Associates, Publishers. New Jersey London. Pginas 147
161.


REGIN DE SIGNIFICANCIA MEDIANTE PROCEDIMIENTO DE
JOHNSON-NEYMAN EN UN MODELO GLMM APLICADO A
RESULTADOS EDUCACIONALES EN CHILE

HCTOR ARAYA CARVAJAL
1,2
, SEBASTIN ALIBAUD SARAGONI
1

1
Departamento de Estadstica, Universidad de Valparaso,
Valparaso, Chile.
2
Departamento de Matemticas y Estadstica, Universidad de Playa Ancha,
Valparaso, Chile.
arayahector8@gmail.com

RESUMEN
En los ltimos aos, el sistema educacional chileno ha sido un foco constante de atencin
por parte de investigadores, debido principalmente a que participan sectores privados y
pblicos en la formacin de estudiantes. Este sistema es financiado principalmente por el
estado y entrega recursos a las instituciones tanto pblicas como privadas, dependiendo del
nmero de alumnos que compongan los distintos cursos de cada escuela (Schabenberger,
2005). Para determinar los logros de cada establecimiento, el Ministerio de Educacin utiliza
pruebas estandarizadas, las que se aplican todos los aos y permite evidenciar los logros
obtenidos en cada alumno. Una forma de comparar el rendimiento entre los
establecimientos es mediante el anlisis de covarianza (ANCOVA), el que permite
determinar diferencias entre los distintos tipos de escuelas chilenas, incluyendo el ndice de
vulnerabilidad econmico, como covariable en el anlisis. Cuando las diferencias entre los
establecimientos son significativas, estas dependern del nivel de la covariable. Es aqu
donde usualmente los investigadores necesitan determinar estos puntos mediante la regin
de significancia, el que identifica los valores donde las curvas ajustadas difieren. Un
procedimiento que permite obtener esta regin de significancia es el de Johnson-Neyman.
En este trabajo, se analizarn los resultados del ao 2010 por establecimiento respecto al
sistema de medicin de la calidad de la educacin (SIMCE) y se determinar la regin de
significancia presente en un anlisis de covarianza, cuando se incorpora un modelo lineal
generalizado mixto (GLMM) al anlisis, mediante el procedimiento de Lazard&Zerbe (2011),
el que regula el nivel de significacin de cada lnea ajustada utilizando el criterio de Scheff.

Palabras clave: sistema educacional chileno, ministerio de educacin, anlisis de
covarianza, regin de significancia, simce.

Introduccin
En la actualidad, Chile presenta un sistema educacional escolar mixto, en el que participan
sectores pblicos y privados tanto en el financiamiento como en el desarrollo de esta
actividad. Existen varios tipos de administradores de establecimientos, entre los que se
cuentan las corporaciones municipales, las direcciones de administracin de educacin
municipal (DAEM), corporaciones privadas y los establecimientos particulares
subvencionados y pagados.
La hiptesis que sustenta este trabajo es la diferencia real que se presenta entre los
rendimientos educacionales de establecimientos pblicos y privados en las pruebas de
medicin establecidas por el gobierno, como lo es la prueba SIMCE. Para este estudio se
utilizarn los datos recopilados de dicha prueba para el ao 2010 en el curso de cuarto ao
bsico en la prueba de matemtica dictada para ese ao.

Desarrollo
El modelo utilizado es un modelo lineal generalizado mixto, la estimacin del modelo se llev
a cabo por medio del mtodo de pseudo verosimilitud, dentro de los supuestos tericos est
la suposicin de existencia de normalidad en la variables respuesta, Sin embargo, debido a


la naturaleza de los objetivos se extender este supuesto a todas las distribuciones
pertenecientes a la familia exponencial que sean apropiadas para modelar los resultados de
las pruebas SIMCE.
Por otra parte, se supondr que los parmetros que representan las estructuras entre
comunas, pertenecen a la distribucin normal y adems, los trminos de error definidos en
el nivel dos del modelo propuesto es independiente del tipo de establecimiento y delIVE
(ndice del vulnerabilidad econmica) respectivo. Para el proceso de ajuste, se asume
que el valor esperado de las observaciones de respuesta, toma la forma de un modelo lineal
mixto despus de haber aplicado una transformacin montona.
El clculo de las regiones de significancia se llev a cabo por medio del mtodo de Johnson-
Neyman.
Para la aplicacin primero se llev a cabo un anlisis exploratorio, luego se presenta el
ajuste del modelo propuesto al utilizar los resultados de la prueba SIMCE de matemtica
ao 2010, junto con el resultado del contraste que establece diferencias entre
establecimientos municipalizados y particulares subvencionados. Adicionalmente, se
presentan los resultados del contraste que establece diferencias entre las medias de los
resultados de escuelas municipalizadas (publicas) y establecimientos particulares (privados).
En el caso de existir diferencias significativas en la realizacin de los contrastes, se
calcular la regin de significancia mediante procedimiento de Johnson-Neyman.
Finalmente, se analiza la escalabilidad de los resultados obtenidos con la muestra
disponible, al analizar el comportamiento del error en el ajuste, cuando se utilizan muestras
de menor tamao.

Si bien los resultados de la diferencia entre establecimientos subvencionados y municipales
no es significativa, lo que impidi realizar el clculo de regin de significancia, es posible
determinar que existe una escasa diferencia entre estas dependencias al momento de
explicar los puntajes promedios cuando se incluye la vulnerabilidad econmica en el modelo.
Por otra parte, en el estudio de diferencias entre establecimientos pblicos y privados, el
modelo mostro resultados similares a trabajos previos realizados en esta rea. Si bien, en
determinados niveles de vulnerabilidad la diferencia entre las dependencias existe, es
posible concluir que los puntajes promedios esperados de los establecimientos pblicos, no
son significativamente mejores ni peores que los resultados de los establecimientos
privados, cuando el ndice de vulnerabilidad econmica centrado por comuna, se encuentre
entre los puntos que forman la regin de significancia.
Sin embargo, es importante destacar que cuando la vulnerabilidad econmica es
considerada alta, las escuelas pblicas obtienen mejores resultados que las escuelas
privadas, este hecho considerado contradictorio desde un punto de vista social, se debe a
que el rendimiento en el puntaje promedio esperado de las escuelas privadas se ve muy
afectado por el nivel de vulnerabilidad econmica, caso contrario a lo que sucede con los
establecimientos pblicos, donde es posible determinar que sin importar el nivel de
vulnerabilidad econmica que se presente, el rendimiento en el puntaje promedio esperado
ser bajo pero similar.

Bibliografa
[1] Aedo, C. & Sapelli, C. (2001). El sistema de vouchers en la educacin: una revisin de la
teora y la evidencia emprica para Chile. Instituto de Economa, P. Universidad Catlica de
Chile.
[2] Arzola, M. & Troncoso, R. (2011). Efecto de la dependencia del colegio sobre la
evolucin de los puntajes en el SIMCE. Santiago de Chile: Libertad y Desarrollo.
[3] Breslow, N. R. & Clayton, D. G. (1993). Approximate Inference in Generalized Linear
Mixed Models. Journal of the American Statistical Association, 88, 9-25.
[4]Contreras, D., Seplveda, P. & Bustos, S. (2010). When Schools Are the Ones that
Choose: The Effects of Screening in Chile. Social Science Quarterly, 91, 1349-1368.


[5] Kowalski, C. J., Schneiderman, E. D. & Willis, S. M. (1994). ANCOVA for nonparallel
slopes: the Johnson-Neyman technique. International Journal of Bio-Medical Computing,
37(3), 273-286.
[6] Lazard, A. A. &Zerbe, G. O. (2011). Solution for Determining the Significance Region
Using the Johnson-Neyman Type Procedure in a Generalized Linear (Mixed) Models.
Journal of Educational and Behavioral Statistics, 36, 699 - 719.
[7] Schabenberger, O. (2005). Introducing the GLIMMIX Procedure for Generalized Linear
Mixed Models.Proceedings of the Thirtieth Annual SASr Users Group International
Conference. Cary, NC: SAS Institute Inc.



COMPARACIN DE TCNICAS DE ANLISIS MULTIVARIADO Y
REDES NEURONALES ARTIFICIALES CON DATOS DE CONJUNTOS
MLTIPLES
CURIA LISANDRO
1
, LAVALLE ANDREA
2
, BRAMARDI SERGIO
2,3
, COSTA TRTARA
SABRINA
4
, CURTI RAMIRO
5

1
Departamento de Matemtica, Universidad Nacional del Comahue.
2
Departamento de Estadstica, Universidad Nacional del Comahue.
3
Ctedra de Clculo Estadstico, Universidad Nacional de La Plata.
4
Departamento de Produccin Vegetal, UNLu.
5
Ctedra de Produccin Vegetal, Universidad de Buenos Aires (FAUBA) y CONICET.

lisandro.curia@faea.uncoma.edu.ar

RESUMEN
Los estudios de variabilidad y caracterizacin gentica se basan en el registro de un
conjunto de mediciones realizadas sobre el material vegetal mediante variables que en
general son de distinta naturaleza. En estos casos, los datos se presentan a travs de los
denominados conjuntos mltiples, donde se cuenta con varios conjuntos de variables y un
mismo conjunto de individuos y condiciones; es decir en cada condicin se miden diferentes
variables a los mismos individuos. En este trabajo se utiliza un conjunto de datos de tres
modos formado por 25 accesiones de qunoa (Chenopodium quinoa Willd.) nativa del
Noroeste Argentino caracterizadas simultneamente a travs de 17 variables cuantitativas y
22 loci de microsatlites. Es decir, un conjunto de individuos medido a travs de dos grupos
de variables. Las tcnicas utilizadas para el anlisis de este tipo de datos, tienen como
principal objetivo la obtencin de una configuracin consenso, o configuracin media, de los
individuos. Una de las ms utilizadas a tal fin es el Anlisis de Procrustes Generalizado
(APG) (Gower, 1975). El APG es una tcnica enteramente geomtrica que se basa en la
bsqueda de una configuracin consenso ptima, en el sentido de aproximar lo mximo
posible las distintas configuraciones asociadas a cada grupo de variables. Los resultados de
esta tcnica se comparan con los obtenidos a travs de un tipo de Red Neuronal Artificial
denominado Mapa Autoorganizado (SOM) (Kohonen, 1995). Los SOM son algoritmos
capaces de encontrar relaciones entre datos de alta dimensin, realizando una proyeccin
lineal de un espacio p-dimensional a un espacio de menor dimensin. Los agrupamientos de
individuos obtenidos a partir de ambas tcnicas son similares. Se destaca que el uso de los
SOM proporciona adems una descripcin de los grupos de individuos a travs de las
variables cuantitativas y no necesita de pre procesamiento de datos.

Palabras clave: Anlisis de Procrustes Generalizado, Mapas Autoorganizados, Qunoa

Introduccin
La conservacin de recursos fitogenticos tiene como propsito la preservacin de la
variabilidad gentica de la especie, resultado de los procesos evolutivos a lo largo del
tiempo, de potencial uso en agricultura y/o restauracin. A partir de la evaluacin de estos
recursos se cuenta con conjuntos de datos que permiten describir a las entradas en funcin
de su variabilidad morfolgica y gentica. Ambas caracterizaciones pueden ser analizadas
por separado, obtenindose en cada caso una ordenacin de las accesiones. En trabajos
anteriores (Costa Trtara et al. 2010; Curti et al. 2010) se mostr que las configuraciones
resultantes de los anlisis por separado presentaron diferencias en el agrupamiento de
algunos genotipos. Consecuentemente, se busc una caracterizacin simultnea a travs de
Anlisis de Procrustes Generalizado logrndose un agrupamiento segn el ambiente de
origen (Costa Trtara et al. 2011). Dicha tcnica utiliza como entrada las configuraciones


obtenidas de cada tcnica por separado. La propuesta que aqu se incluye utiliza los Mapas
Autoorganizados como una alternativa al Anlisis Multivariado, ya que permiten encontrar un
agrupamiento de las entradas sin necesidad de pre procesar los datos.

Desarrollo
Se caracterizaron 25 accesiones de qunoa nativa del Noroeste Argentino conservadas en el
Banco Base de Germoplasma de INTA Castelar, a travs de 17 variables cuantitativas
morfolgicas y 22 loci de microsatlites.
El APG (Gower, 1975; Dijksterhuis & Gower, 1991), armoniza las configuraciones
individuales, o las representaciones geomtricas en el plano, a travs de pasos algebraicos
iterativos que transforman cada configuracin individual. Estos pasos incluyen traslacin,
rotacin, reflexin y escalado de las coordenadas de los puntos bajo dos premisas:
mantener la distancia relativa entre elementos de cada configuracin individual y minimizar
la suma de cuadrados entre puntos homlogos, es decir, puntos que corresponden al mismo
elemento bajo diferentes configuraciones. La configuracin consenso es obtenida como el
promedio de estas configuraciones individuales transformadas.
Un mtodo alternativo para el tratamiento de datos de diferente naturaleza lo constituye un
tipo de Red Neuronal Artificial denominado Mapa Autoorganizado (SOM) (Kohonen, 1995;
Hagan & Demuth, 1996). Los SOM son algoritmos capaces de encontrar relaciones entre
datos de alta dimensin, realizando una proyeccin lineal de un espacio p-dimensional a un
espacio de menor dimensin. El SOM crea una nueva representacin de objetos dispuestos
en una red de nodos. Los nodos contienen un cierto conjunto de entradas similares, y a su
vez, los nodos topolgicamente ms cercanos son ms similares que los nodos
topolgicamente alejados.
Para implementar el APG, se realiz en una primera etapa un Anlisis de Componentes
Principales (ACP) a los datos morfolgicos cuantitativos y un Anlisis de Coordenadas
Principales (ACooP) con la distancia de Prevosti a los datos moleculares. Para la obtencin
del consenso se utilizaron las configuraciones de los individuos resultantes de la etapa
previa.
La implementacin del SOM se realiz en Matlab mediante una herramienta especfica
llamada Kohonen and CP-ANN toolbox (Ballabio et al., 2009). La topologa utilizada es
cuadrada con cuatro neuronas. Se us un algoritmo de entrenamiento secuencial y la
inicializacin de los pesos de las conexiones entre las neuronas se realiz mediante
autovalores.

Como primer resultado se indica que la correlacin vectorial (Coeficiente RV) entre la
configuracin morfolgica y la molecular es de 0,569 indicando que la informacin
proveniente de ambos grupos de variables es complementaria.
Los resultados del APG muestran un claro agrupamiento de las poblaciones que se
corresponde con los ambientes contrastantes presentes en el Noroeste: altiplano, valles
secos, valles de altura y valles orientales hmedos; y ratifica la estructura que presentan las
accesiones colectadas en el NOA respecto a las caractersticas del ambiente, resultando en
diferentes grupos genotpicos. Los resultados del SOM muestran el mismo agrupamiento
salvo la poblacin 482 que pertenece a los valles de altura y fue agrupada con las
poblaciones de los valles secos. Esta poblacin tambin resulta mal clasificada en el
Anlisis de Coordenadas Principales. Como ejemplo de los SOM se muestra la estructura de
salida (Fig. 1a) y la caracterizacin de los grupos mediante dos variables cuantitativas (Fig.
1b) en las que la mayor intensidad de color indica valores ms altos de la variable:



Fig. 1a: Estructura de 4 neuronas de salida

Nmero de ramas

Dimetro del tallo

Fig. 1b: Caracterizacin por
variables

Las poblaciones de los valles secos tienen nmero promedio de ramas y presentan los
mayores dimetros de tallo. Las poblaciones del altiplano tienen el menor nmero de ramas
y los dimetros ms finos. Las poblaciones de los valles hmedos orientales son las de
mayor nmero de ramas. Las poblaciones de los valles de altura poseen valores medios en
ambas variables.
Cabe notar que como el APG utiliza como punto de partida las configuraciones provenientes
de otros mtodos, no guarda la informacin relativa a las variables. Esta es una
caracterstica adicional que ofrece el SOM y que permite una caracterizacin de los grupos
de poblaciones clasificadas.

Bibliografa
Ballabio D, Consonni V, Todeschini R. (2009). The Kohonen and CP-ANN toolbox: a
collection of MATLAB modules for Self Organizing Maps and Counterpropagation Artificial
Neural Networks. Chemometrics and Intelligent Laboratory Systems, 98, 115-122.
Costa Trtara S.M., Manifesto M.M., Bertero H.D. (2010) Caracterizacin gentica de
Chenopodium quinoa nativa del Noroeste Argentino y su relacin con germoplasma de
Sudamrica. Disertacin, III Congreso Mundial de la Quinua, Oruro, Bolivia.
Costa Trtara S, Curti R, Bramardi S, Manifesto M, Bertero H. (2011) Anlisis simultneo de
variables morfolgicas cuantitativas y marcadores moleculares para la caracterizacin de
accesiones nativas de quinoa del noroeste argentino. XIV GAB. Salta
Curti R, Bertero H, Andrade A.J., Velsquez B., Bramardi S. (2010) Caracterizacin morfo-
fenolgica preliminar del germoplasma nativo de quinoa (Chenopodium quinoa Willd.) del
Noroeste Argentino. Disertacin, III Congreso Mundial de la Quinua, Oruro, Bolivia.
Dijksterhuis, G.B. y Gower, J.C. (1991). The interpretation of Generalized Procrustes
Analysis and allied methods. Food, Quality and Preference, 3(2), 67-87.
Kohonen, T. (1995). Self-Organizing Maps. Springer. Berlin.
Gower, J.C. (1975). Generalizad Procrustes Analisys. Physchometrika, 40, 33-51
Hagan, M. y Demuth, H. (1996). Neural Network Design. Publishing Company Thomson
learning, USA.

Valles secos Altiplano
Valles
hmedos
orientales
Valles de
altura


APLICACIN DE MTODOS CUASIEXPERIMENTALES PARA LA
EVALUACIN DE LA ASIGNACIN UNIVERSAL POR HIJO

PATRICIA ALEGRE
1
y ANA FERNANDEZ BLANCO
2

1
Universidad Nacional de Mar del Plata
2
Universidad Nacional de Mar del Plata

palegre@mdp.edu.ar ana_ferblanco@hotmail.com

RESUMEN
En este estudio se busc conocer el impacto de la Asignacin Universal por Hijo (AUH)
sobre el bienestar de los hogares perceptores a partir de datos provenientes de la Encuesta
Permanente de Hogares (EPH) para el aglomerado Mar del Plata-Batn.
Al no disponer de datos experimentales y, por lo tanto, no estar garantizada la condicin de
independencia entre la asignacin del plan y los resultados, se propuso comparar grupos de
hogares que muestran una distribucin similar de caractersticas observables. De esta
forma, condicionando a estas variables, la asignacin del plan resultara independiente de
las respuestas potenciales.
Dentro de los mtodos cuasi-experimentales, aquellos basados en la propensity score (PS)
son frecuentemente utilizados en el anlisis de datos de estudios observacionales. La PS se
define como la probabilidad condicional de recibir cierto tratamiento dado un grupo de
variables y resulta suficiente condicionar a la PS para garantizar la independencia entre el
tratamiento y las respuestas (Rosenbaum y Rubin, 1983). Uno de los procedimientos
basados en la PS se denomina matching o emparejamiento que en este trabajo se emple
para la evaluacin del impacto de la AUH.
Los resultados alcanzados indican que se gener un impacto positivo sobre los hogares,
dado que la percepcin de la AUH ha brindado un ingreso adicional lo que permitira una
mayor estabilidad y posibilidad de acceso a diversos bienes.

Palabras clave: propensity score, mtodos cuasi-experimentales, polticas sociales.

Introduccin
El impacto de un programa sobre los ingresos de los hogares perceptores se define como la
diferencia entre los ingresos que obtienen al participar del programa y los que hubieran
obtenido en caso de no haber participado.
Una herramienta usualmente utilizada para anlisis de este tipo es el estudio de panel que
permite observar a un mismo hogar en dos momentos de tiempo diferentes, antes y despus
del programa. Sin embargo, el tamao acotado de la muestra de la EPH para el aglomerado
Mar del Plata-Batn limit la aplicacin de dicha tcnica.
Dada esa restriccin se opt por utilizar una metodologa cuasi-experimental de evaluacin
basada en una comparacin entre hogares beneficiarios (grupo tratado) y hogares no
beneficiarios (grupo control).
Para la conformacin de dichos grupos previamente se seleccionaron los hogares elegibles,
es decir, aquellos que presentaban las condiciones para recibir la AUH. Se utilizaron las
bases de datos de EPH del aglomerado Mar del Plata-Batn para el perodo comprendido
entre el 1 trimestre de 2010 y el 4 trimestre de 2011. Una vez identificados se procedi a
diferenciarlos en base a la percepcin o no de la AUH en grupo tratado (hogares elegibles
que perciben AUH) y grupo control (hogares elegibles que no perciben AUH). Tanto para la
identificacin de hogares elegibles como de hogares perceptores fueron seguidos los
criterios de Bustos y Villafae (2011).


Al no poder garantizarse la condicin de independencia entre la asignacin del beneficio y
los resultados, ya que la AUH no es otorgada aleatoriamente a los distintos hogares sino
que son ellos mismos los que gestionan el cobro, es deseable que los grupos a comparar
muestren una distribucin similar de las caractersticas observables. De tal manera,
condicionado a dichas variables, la percepcin de la AUH resultara independiente de las
respuestas potenciales.
El mtodo de matching o emparejamiento por PS, probabilidad previamente estimada por
medio de un modelo de regresin, permiti relacionar un hogar con AUH con otro sin AUH
que tena la misma PS o similar (Stampf, 2005) eliminado, de esta manera, el sesgo de
seleccin.
Luego de realizado el emparejamiento, se estim el impacto promedio de la AUH sobre el
Ingreso Total Familiar (ITF) y sobre el Ingreso per cpita Familiar (IPCF) de los hogares
perceptores.

Desarrollo
Una vez identificados los hogares elegibles, la muestra final qued conformada por 228
hogares, de los cuales 145 fueron identificados como beneficiarios de la AUH.
Posteriormente, fue calculada la PS en base a las siguientes variables observadas:
semestre de relevamiento
1
, tipo de hogar
2
, tipo de vivienda
3
, rgimen de tenencia
4
, cantidad
de miembros menores de 18 aos y caractersticas del jefe de hogar como sexo, edad, nivel
educativo
5
y condicin de actividad
6
. Las rutinas empleadas fueron programadas en
lenguaje R-2.13.1 (R Development Core Team, 2011). La funcin de densidad estimada de
la PS para ambos grupos se muestra en el siguiente grfico:

0.0 0.2 0.4 0.6 0.8 1.0
0
1
2
3
4

N = 560 Bandwidth = 0.04164
D
e
n
s
i
t
y
con AUH sin AUH

A continuacin, se efectu el proceso de emparejamiento por PS considerando la posibilidad
que ms de un hogar con AUH se empareje con el mismo hogar sin AUH debido a que la
cantidad de hogares en el grupo control es inferior al grupo de tratados. Se obtuvieron 138
pares de hogares por lo que, el 95% de los hogares identificados como beneficiarios de la
AUH fue emparejado con un hogar similar (elegible sin AUH) en cuanto a sus caractersticas
observables. El resultado de un anlisis de balanceo, para los pares de hogares obtenidos,
mostr que todas las variables involucradas en el proceso de emparejamiento no

1
1 semestre 2010, 2 semestre 2010, 1 semestre 2011, 2 semestre 2011.
2
Hogares monoparentales (slo jefe), Hogares nucleares (jefe y cnyuge).
3
Casa, Departamento, Otros.
4
Propietario, Inquilino, Otros.
5
Bajo (hasta secundaria incompleta), Medio (secundario completo o superior incompleto), Alto (superior
completo).
6
Ocupado, Desocupado, Inactivo.


evidenciaron asociacin con la percepcin de la AUH. Tal como muestra el siguiente cuadro,
los valores p mayores a 0,05, correspondientes a la prueba de independencia chi cuadrado
para el caso de variables categricas y a la prueba t para diferencia de medias en el caso de
variables continuas, dieron prueba de ello (Berenson y Levine, 1996).

Variable de emparejamiento Valores p
Semestre 0,412
Tipo de hogar 0,894
Tipo de vivienda 1,000
Rgimen de tenencia 0,869
Menores de 18 aos 0,538
Sexo del jefe 1,000
Edad del jefe 0,506
Nivel educativo del jefe 0,356
Condicin de actividad del jefe 0,869

Finalmente, fueron estimados los efectos de la AUH sobre el ITF y el IPCF de los hogares
seleccionados. Los resultados obtenidos permitieron afirmar, con un nivel de confianza del
95%, que el efecto promedio de la asignacin es positivo, tanto en el ingreso total como en
el per cpita de los hogares perceptores de la AUH en el aglomerado Mar del Plata-Batn
para el perodo bajo anlisis.

Variable Efecto DS (IC 95%)
Ingreso Total Familiar (ITF) 562,73 195,65 (179,26 946,19)
Ingreso Per Cpita Familiar (IPCF) 106,38 45,46 (17,29 195,48)

El hecho de que los intervalos de confianza (IC) no incluyeran al valor cero permiti llegar a
la conclusin de que el efecto del programa evaluado es positivo (Berenson y Levine, 1996).
Igualmente, se considera conveniente mencionar que inferencias ms precisas acerca de la
magnitud exacta del impacto medio en los ingresos de los hogares ($562 para el caso del
ITF y $106 para el IPCF) deben realizarse con precaucin dada la amplitud de los intervalos
de confianza.

Bibliografa
Berenson, M.L. y Levine, D.M. (1996) Estadstica bsica en administracin, conceptos y
aplicaciones. Sexta edicin. Prentice Hall Hispanoamericana, S.A. Mxico.
Bustos, J. M. y Villafae, S. (2011) Asignacin Universal por Hijo. Evaluacin del impacto
en los ingresos de los hogares y el mercado de trabajo. En: Serie Estudios 10. Trabajo,
ocupacin y empleo, MTEySS, Argentina.
R Development Core Team (2011) R: A language and environment for statistical
computing. R Foundation for Statistical Computing, http://www.R-project.org.
Rosenbaum, P. y Rubin, D. (1983) The central role of the propensity score in observational
studies for casual effects. En: Biometrika, 70, 1, pp. 45-51.
Stampf, S. (2005) Propensity score based data analysis using nonrandom. R Foundation
for Statistical Computing, http://www.R-project.org.


EXPLORACIN DE LA RELACIN ENTRE EL COEFICIENTE DE
CORRELACIN Y EL DIFERENCIAL DE SELECCIN DIRECCIONAL
PARA SU USO EN META-ANLISIS DE ESTUDIOS DE SELECCIN
NATURAL

PALACIO, F. X.
1,2
, ORDANO, M.
1,2

1
Instituto de Ecologa, Fundacin Miguel Lillo, Tucumn
2
CONICET

facundo_palacio@yahoo.com.ar

RESUMEN
La intensidad de la accin de la seleccin natural es representada bsicamente con
parmetros de modelos de regresin. Por su relacin con el coeficiente de correlacin
producto-momento de Pearson (r), la variacin en la intensidad de la seleccin puede
estudiarse con aproximaciones meta-analticas. Estas aproximaciones se emplean bajo el
supuesto de que el estimador meta-analtico de la magnitud del efecto basado en la
correlacin es un estimador insesgado, exacto y preciso de la intensidad de la seleccin. En
este trabajo evaluamos el uso de r como estimador meta-analtico mediante el anlisis de:
(1) la relacin entre la intensidad de seleccin, la correlacin y la oportunidad de seleccin;
(2) el uso de r para estudios de seleccin natural mediada por frugvoros sobre el nmero de
frutos en plantas. Para el primer objetivo, nos basamos en que el diferencial de seleccin se
relaciona con el valor de r, y adems con la varianza de la adecuacin relativa (i.e.,
oportunidad de seleccin, I). En este caso esperaramos situaciones en las que la magnitud
del efecto basada en r no sea un buen estimador de la intensidad de la seleccin. Para el
segundo objetivo, aplicamos meta-regresiones a dos conjuntos de datos de seleccin
mediada por aves frugvoras sobre el despliegue del nmero de frutos en plantas. Los
resultados indican que el coeficiente de correlacin no siempre es un estimador adecuado
de la intensidad de la seleccin lineal. Se discute sobre la necesidad de verificar a priori la
relacin entre r e intensidad de la seleccin mediante modelos de meta-regresin y el uso
alternativo de enfoques bayesianos.

Palabras clave: seleccin univariada, oportunidad de seleccin, meta-regresin.

Introduccin
La intensidad de la accin de la seleccin fenotpica sobre un rasgo es descrita bsicamente
mediante parmetros de modelos de regresin (Lande & Arnold 1983, Endler 1986, Brodie
et al. 1995). Bsicamente, la pendiente de una regresin entre un rasgo y el xito
reproductivo (i.e., adecuacin) representa una medida de la intensidad de la seleccin.

En estudios de sntesis, como en meta-anlisis, este parmetro puede ser representado por
un estimador meta-analtico (Z
r
) basado en el coeficiente de correlacin producto-momento
de Pearson (r). En este trabajo evaluamos el uso de r como estimador meta-analtico
mediante el anlisis de: (1) la relacin entre la intensidad de seleccin, la correlacin y la
oportunidad de seleccin; (2) el uso de r para estudios de seleccin natural mediada por
frugvoros sobre el nmero de frutos en plantas.

Mtodos
Relacin analtica entre el coeficiente de correlacin y el diferencial de seleccin direccional
La medida ms simple de seleccin fenotpica univariada direccional es el diferencial de
seleccin direccional S, el cual indica cambios en las medias poblacionales de los


caracteres, favoreciendo fenotipos altos (si son positivos) o bajos (si son negativos; Endler
1986). Se explora analticamente la relacin que existe entre el coeficiente de correlacin
producto-momento de Pearson entre un rasgo fenotpico y su adecuacin absoluta W, y el
diferencial de seleccin direccional estandarizado S. Asimismo, se explora la relacin con la
oportunidad de seleccin (I, varianza de la adecuacin relativa), la cual establece un lmite
superior sobre la fuerza (o intensidad) de seleccin que puede actuar sobre un rasgo
determinado (Arnold & Wade 1984). Se sigue la nomenclatura de Lande & Arnold (1983) y
Arnold & Wade (1984).
Sea z un rasgo fenotpico estandarizado
2
(z =0, =1) , el diferencial de seleccin
direccional se define como

S= z * -z ,

donde z y z * representan las medias del rasgo antes y despus del episodio de seleccin,
respectivamente (Lande & Arnold 1983). Definida la oportunidad de seleccin I como la
varianza de la adecuacin relativa (Crow 1958), es posible establecer que

xW
S=r I ,

donde r
xW
es el coeficiente de correlacin entre el rasgo fenotpico no estandarizado x y la
adecuacin absoluta W.

Bsqueda bibliogrfica y criterio de seleccin de estudios
Tomamos como modelo de estudio los sistemas mutualistas de dispersin de semillas por
endozoocoria, con el fin de evaluar la intensidad de la seleccin natural mediada por aves
frugvoras sobre el nmero de frutos desplegados por planta (i.e., tamao de la cosecha).
Realizamos una revisin de la literatura disponible en la base de datos ISI Web of
Knowledge (http://isiwebofknowledge.com) utilizando las palabras claves fruit, crop,
selection y birds para encontrar estudios publicados en cualquier ao e idioma.
Seleccionamos aquellos estudios que mostraban relaciones entre el tamao de la cosecha y
dos estimadores de adecuacin: el nmero de frutos removidos y la proporcin de frutos
removidos. En aquellos estudios donde se reportaban datos de ms de una especie, se
consider un tamao del efecto independiente para cada especie (Mungua-Rosas et al.
2011).

Meta-regresin de efectos mixtos
Se obtuvieron un total de 10 publicaciones y 36 coeficientes de correlacin de 18 sistemas
planta-dispersor (k = 18). Se construyeron dos bases de datos a partir de los mismos 18
sistemas (i.e., misma composicin de especies) en base a los dos estimadores de
adecuacin (nmero y proporcin de frutos removidos). Los coeficientes de correlacin se
transformaron en valores de Z
r
utilizando el algoritmo de Fisher (Hedges & Olkin 1985). Se
realizaron meta-regresiones de efectos mixtos (Berkey et al. 1995) para evaluar la relacin
entre el coeficiente de correlacin y el diferencial de seleccin direccional (i.e., se consider
el diferencial de seleccin como un moderador).

Meta-regresin de efectos mixtos
En el caso de la proporcin de frutos removidos como estimador de adecuacin, hubo una
relacin positiva significativa entre el coeficiente de correlacin y el diferencial de seleccin
direccional (Tabla 1). En el caso del nmero de frutos removidos, en contraste, no existi
una relacin entre ambos estimadores meta-analticos (Tabla 1).

Tabla 1. Modelos de regresin meta-analtica (k = 18) entre el coeficiente de correlacin
estandarizado y el diferencial de seleccin direccional sobre el tamao de la cosecha para


dos estimadores de adecuacin: el nmero y la proporcin de frutos removidos. Los
parmetros se estimaron mediante Mxima Verosimilitud Restringida.

Discusin y conclusiones
El ejemplo de aplicacin muestra que el coeficiente de correlacin, clsicamente utilizado
como estimador meta-analtico en estudios de seleccin natural, no siempre se relaciona
lineal y positivamente con la intensidad de la seleccin direccional.

Analticamente, el coeficiente de correlacin lineal se relaciona con el diferencial de
seleccin direccional, y con la varianza de la adecuacin relativa. Por lo tanto, la eventual
falta de asociacin entre ambos estimadores meta-analticos podra estar relacionada con
un efecto indirecto de la oportunidad de seleccin.

Si se desea utilizar el coeficiente de correlacin como estimador de la intensidad de la
seleccin direccional, se propone en la prctica verificar a priori la existencia de una relacin
positiva significativa entre ambos magnitudes de efecto. En contraste, Kingsolver et al.
(2012) sugieren que el uso de modelos bayesianos basados en cadenas de Markov Monte
Carlo podra ser ms apropiado para meta-anlisis de seleccin natural.

El desarrollo de estimadores meta-analticos de la intensidad de la seleccin es un rea
promisoria de investigacin, y que promovera la investigacin en preguntas de la biologa
evolutiva que tienen el desafo de lidiar con sesgos derivados en las relaciones analticas
entre parmetros biolgicos.

Bibliografa
Arnold, S. J. & Wade, M. J. (1984). On the measurement of natural and sexual selection:
theory. Evolution 38(4): 709-719.
Berkey, C. S., Hoaglin, D. C., Mosteller, F. & Colditz, G. A. (1995). A random effects
regression model for meta-analysis. Statistics in Medicine 14(4): 395-411.
Brodie, E. D., Moore, A. J. and Janzen, F. J. (1995). Visualizing and quantifying natural
selection. Trends in Ecology and Evolution 10(8): 313-318.
Endler, J. A. (1986). Natural Selection in the Wild. 1st Ed., Inglaterra.
Hedges, L. V. and Olkin, I. (1985). Statistical Methods for Meta-analysis. 1st Ed., USA.
Kingsolver, J. G., Diamond, S. E., Siepielski, A. M., and Carlson, S. M. (2012). Synthetic
analyses of phenotypic selection in natural populations: lessons, limitations and future
directions. Evolutionary Ecology 26(5): 1101-1118.
Lande, R. and Arnold, S. J. (1983). The measurement of selection on correlated characters.
Evolution, 37(6): 1210-1226.
Mungua-Rosas, M. A., Ollerton, J., Parra-Tabla, V. and Arturo De-Nova, J. (2011). Meta-
analysis of phenotypic selection on flowering phenology suggests that early plants are
favoured. Ecology Letters 14(5)511-521.
Crow, J. F. (1958). Some possibilities for measurement selection intensities in man. Human
Biology 30: 1-13.
Adecuacin Parmetro Coeficiente Error estndar P
Nmero de frutos
removidos
Intercepto 1.450 0.312 < 0.0001
Diferencial direccional 0.391 0.254 0.123
Proporcin de
frutos removidos
Intercepto 0.043 0.060 0.470
Diferencial direccional 1.611 0.463 < 0.001


IDENTIFICACIN DE LIMITANTES A LA EXPRESIN DEL
POTENCIAL DE RENDIMIENTO EN GIRASOL EN URUGUAY
MEDIANTE GGE BIPLOTS Y PLS REGRESSION

PABLO GONZLEZ BARRIOS
1
, OSVALDO PREZ
2
, MARINA CASTRO
2
, SERGIO
CERETTA
2
,

DIEGO VILAR
2,3
, LUCA GUTIRREZ
1

1
Facultad de Agronoma, Departamento de Biometra, Estadstica y Computacin, Udelar,
Uruguay
2
INIA La Estanzuela, Programa Nacional de Investigacin Cultivos de Secano, Uruguay
3
Sursem S.A., Mejoramiento Gentico y Programa de Maz, Argentina

pablog@fagro.edu.uy

RESUMEN
El girasol (Helianthus annuus L.) a pesar de ser un cultivo de histrica importancia en
Uruguay y mostrar caractersticas deseadas dentro de las rotaciones agrcolas, ha visto
reducida drsticamente su rea de siembra a causa de la fuerte competencia de la soja y a
epidemias de Phomopsis de cancro del tallo (Diaporte helianthi) y dao de pjaros que
afectan los rendimientos. La utilizacin de herramientas estadsticas modernas permite
estudiar cules son las causas que limitan esta expresin de potencial y cules son los
cultivares mejor adaptados a cada ambiente. Anlisis de GGE biplots y regresiones PLS
fueron utilizados con informacin proveniente de la Evaluacin Nacional de de Cultivares,
convenio INASE-INIA, entre los aos 2003 y 2006. Los resultados obtenidos muestran un
fuerte efecto principal del ambiente e interaccin con los genotipos sobre el rendimiento. Las
fechas de siembra tardas incidieron negativamente. La precipitacin en la fase vegetativa y
de llenado de grano tuvo baja incidencia en la determinacin de rendimiento, sin embargo
altas temperaturas en fase vegetativa y altas temperaturas mnimas en llenado de grano
incidieron negativamente. Mayor contenido oleico, menor altura y mayor largo de das del
ciclo floracin a cosecha, fueron los caracteres ms importantes que se relacin con el
rendimiento.

Palabras clave: Helianthus annuus; GEI; GGE biplot; PLS Regression.

Introduccin
El girasol ha tenido tradicionalmente una gran importancia dentro de las rotaciones agrcolas
en Uruguay. Su importancia est dada por tratarse de un cultivo que diversifica las
rotaciones, presenta mayor rango de fechas de siembra, menor susceptibilidad al estrs
hdrico y tiene una alta diversificacin de productos. Sin embargo su permanencia dentro de
las rotaciones se encuentra en riesgo debido a la fuerte competencia de la soja baja
expresin de potencial de rendimiento y prdidas por Phomopsis de cancro de tallo y dao
de pjaros. El estudio de la interaccin genotipo ambiente (IGA) resulta de gran utilidad para
conocer la adaptacin de los cultivares y las causas que limitan la expresin del rendimiento.
La IGA puede ser estudiada a travs de tcnicas estadsticas como los modelos AMMI que
combinan el anlisis de la varianza con el anlisis de componentes principales [2], los cuales
pueden ser representados grficamente mediante biplots [1][6] en donde se representan las
correlaciones y asociaciones de los cultivares con los diferentes ambientes. Los GGE
biplots, tambin modelos bilineales multiplicativos, han sido una herramienta grfica
desarrollada por [5] para el anlisis de redes de ensayos multiambiente, en donde a
diferencia del AMMI en donde se visualiza la interaccin GE, en los GGE se utiliza la
interaccin GGE y el efecto principal del genotipo en forma combinada. La utilizacin de
modelos que incorporen estas dos fuentes de variabilidad como sucede con los GGE biplots
han mostrado buenos resultados en la identificacin de cultivares superiores. Factorial


Regression y Partial Least Squares Regression han sido utilizadas para el estudio de las
variables ambientales que afectan la IGA. La utilizacin de estas 2 tcnicas fue evaluada [3],
encontrando similares resultados entre ambas. Los objetivos de este trabajo fueron analizar
con el uso de GGE biplots y PLS regression la IGA en girasol y determinar qu variables
diferentes a enfermedades y plagas comnmente impiden la expresin del potencial de
rendimiento. Un mejor entendimiento de las variables que limitan la expresin del potencial
de rendimiento de girasol contribuir a tomar mejores decisiones de manejo del cultivo y de
caracteres de seleccin en programas de mejoramiento.

Desarrollo
Para la realizacin de este trabajo fue utilizada informacin proveniente de la Evaluacin
Nacional de Cultivares, convenio INASE-INIA, entre los aos 2003 y 2006. Se utilizaron 11
cultivares comerciales de girasol y 11 ambientes de evaluacin, los cuales fueron
combinaciones de aos, localidades (Young y La Estanzuela) y fechas de siembra (1 y 2).
Para todos los cultivares y ambientes la informacin incluye ciclo a floracin, altura de
planta, contenido de aceite de los aquenios, rendimiento y los registros de temperatura y
precipitaciones. Se utilizaron biplots que permiten la visualizacin conjunta de genotipos y
ambientes en un grfico [1][6], a partir de la matriz de medias estandarizadas de los
cultivares para cada ambiente centradas por ambiente. Este tipo de anlisis es conocido
como GGE biplot anlisis (Yan and Kang, 2003). Se utiliz el siguiente modelo multiplicativo:

donde Y
ij
es la media ajustada y estandarizada del rendimiento del i-simo cultivar en el j-
simo ambiente, la media general, j es el efecto principal del j-simo ambiente,
m
la
inercia o varianza explicada (valor propio) por el m-simo eje,
mi
y
mj
son las proyecciones
de los cultivares y los ambientes en el m-simo eje y
ij
es el residuo. Se utiliz un biplot
para la visualizacin de las similitudes entre los ambientes y para la identificacin de los
genotipos y ambientes causantes de la interaccin. Para estudiar el comportamiento de un
grupo de variables de respuesta (rendimientos por ambiente) en funcin de un grupo de
variables regresoras (caractersticas climticas o atributos agronmicos) se utilizaron
regresiones PLS. Para la representacin de los PLS, tambin se utilizaron biplots basados
en la descomposicin del valor singular generalizado, que contiene informacin sobre la
magnitud y direccin de las relaciones lineales entre variables de uno y otro grupo de
variables [4].

El GGE biplot (Figura 1) muestra que los cultivares con menores rendimientos fueron INIA
Buti, Pannar Pan 7031 y Dekasol 4050 en todos los ambientes de evaluacin. Los mega
ambientes que pueden definirse en dicho grfico indican que NK 55 RM fue el mejor cultivar
en los ambientes conformado por poca 1 de siembra en Young en 2005 y 2006 y La
Estanzuela en 2005. Por otro lado Pannar Pan 7355 fue el cultivar con mejores rendimiento
en el mega ambiente donde se encuentran La Estanzuela poca 1 y Young poca 1 en
2005. Los ambientes con peores desempeos por parte de los materiales evaluados fueron
aquellos con fechas de siembras tardas (Young poca 2). El anlisis de regresin PLS
(Figura 2) muestra que el efecto de las variables climticas en la determinacin del
rendimiento es significativo, teniendo las altas temperaturas en el ciclo vegetativo, as como
altas temperaturas en post floracin un efecto negativo. Los ambientes correlacionados con
estas caractersticas coinciden con todos los aos en Young poca 2. Cuando se estudiaron
los atributos agronmicos se observ que los cultivares de mayor altura de planta y das a
floracin, afectaron su rendimiento. El contenido de aceite (%) result ser el atributo ms
significativo.



Figura 1. GGE Biplot para los ambientes y genotipos evaluados.

Figura 2. Biplot para regresin PLS de variables climticas y atributos agronmicos.
La utilizacin de GGE biplots y regresiones PLS permiti obtener buenos resultados en la
interpretacin de la IGA y en la determinacin de las variables que limitan los rendimientos.
Se concluye que una medida simple de manejo como es la siembra temprana de octubre se
asocia con altos rendimientos de girasol y con el escape a las altas temperaturas durante la
fase vegetativa, las cuales se asociaron negativamente con el rendimiento. Respecto a IGA,
se identific cultivares de bajo rendimiento en todos los ambientes y cultivares de
comportamiento diferente segn los ambientes. Para obtener altos rendimientos de aceite el
mejoramiento debera enfocarse ms en la obtencin de materiales con mayor contenido de
aceite y menor altura de planta que en mayor rendimiento de aquenios.

Bibliografa
1. Gabriel, K. 1971. The biplot graphic display of matrices with applications to principal
components analysis. Biometrika, 58:453-467.
2 Gauch, H. 1988. Model selection and validation yield with interaction. Biometrics, 44:85-93.
3. Vargas, M.; Crossa, J.; van Eeuwijk, F.; Ramirez, M.; Sayre, K. 1999. Using Partial Least
Squares Regression, Factorial Regression and AMMI models for interpreting genotype x
environment interaction. Crop Science, 39(4):955-967.
4. Vsquez, M.; Ramirez, G.; Camardiel, A.; Aluja, T. 2008. Un dispositivo grfico Biplot para
modelar relaciones entre dos conjuntos de variables. Economa, 33:117-130.
5. Yan, W.; Cornellius, P.; Crossa, J.; Hunt, L. 2001. Two types of GGE biplot for analyzing
multi environments trial data. Crop Science 41:656-633.


6. Yan, W.; Kang, M. 2003. GGE biplot analysis: A graphical tool for breeders, geneticist and
agronomist. CRC Press, Boca Raton, FL.


APLICACIN DE ANLISIS MULTIBIPLOT A LA EVALUACIN
DE RECURSOS FITOGENTICOS

MARTICORENA, M.
1
, BRAMARDI, S.
1,2
, DEFACIO, R.
3

1
Universidad Nacional del Comahue
2
Universidad Nacional de La Plata
3
Estacin Experimental Agropecuaria INTA Pergamino

m.marticorena@yahoo.com.ar

RESUMEN
La evaluacin multivariante de distintos conjuntos de recursos genticos a travs de
diferentes entornos genera matrices de datos de tres modos. El estudio integral de este tipo
de datos requiere de una metodologa que permita establecer relaciones entre todas las
entradas simultneamente. Una tcnica estadstica apropiada es el anlisis Multibiplot,
diseado especficamente para el anlisis descriptivo de tablas mltiples (de tres modos),
est fundamentado en el Anlisis de Componentes Principales Clsico (ACP). Requiere la
transformacin de las tablas de datos originales en una tabla de dos modos, contempla dos
fases que se efectan sobre submatrices de la tabla: en la primera etapa se realiza un ACP
de cada una de las subtablas y en la segunda se ponderan sus elementos por el inverso
multiplicativo del primer vector propio resultante de los ACP individuales. Finalmente se
realizan los Biplot Mltiples, un JK Biplot y/ HJ Biplot, dependiendo del inters del anlisis.
En este trabajo se utiliz el Multibiplot para analizar datos correspondientes a 10 ensayos de
caracterizacin del Banco de Germoplasma de la EEA INTA Pergamino que totalizan 401
poblacionales nativas de maz. En cada ensayo, sobre distintos conjuntos de entradas, se
registraron las mediciones de un mismo conjunto de variables agro-morfolgicas
repitindose el registro de caracteres en diferentes condiciones ambientales. Los resultados
del mtodo, visualizados en un JK Biplot, permitieron el anlisis integral de las estructuras
conformadas por los distintos grupos de poblaciones con respecto a las variables
consideradas.

Palabras clave: datos de tres modos, maz.

Introduccin
En diseos experimentales multivariantes de caracterizacin de recursos genticos en los
que las interrelaciones genotipos-variables son evaluadas en diferentes condiciones
ambientales, cada observacin es originada por tres modos: genotipos, variables y
ambientes. Cuando en cada condicin ambiental se evalan distintos conjuntos de entradas,
se tienen datos de conjuntos mltiples (Kiers, 1988, 1991). La estructura que conforman
estos datos debe ser considerada en el anlisis estadstico al momento de seleccionar una
metodologa que permita establecer relaciones entre todas las entradas en conjunto.
Entre las tcnicas estadsticas multivariantes que pueden ser utilizadas con los fines
mencionados, una opcin es el anlisis Multibiplot, identificado dentro de los mtodos
diseados para el anlisis de datos de tres modos, permite representar los distintos grupos
de individuos y las variables en el mismo espacio ya que se obtiene un espacio de
comparacin comn o consenso, de todos los grupos (Baccal, et al., 2006). La tcnica fue
propuesta por Baccal (2004) como una alternativa a los Biplot Interactivos y Conjuntos
(Carlier y Kroonenberg, 1996) en el estudio simultneo de tablas mltiples, y considerada
por Crdenas, et al. (2007) como una alternativa al Anlisis Factorial Mltiple (Escofier y
Pages, 1984) y al mtodo Statis Dual (LHermier des Plantes, 1976), ya sea que el anlisis
se realice sobre las matrices de datos yuxtapuestas o concatenadas por columnas. Las
configuraciones resultantes del anlisis se pueden visualizar en un JK Biplot (Gabriel, 1971)


que aproxima los valores de la matriz inicial y/o en un HJ Biplot (Galindo, 1986) que
aproxima las relaciones individuos/variables
En este trabajo se utiliz el anlisis Multibiplot para evaluar 401 poblaciones nativas de
maz, parte de una coleccin mayor, del Banco Activo de Germoplasa de la EEAA INTA
Pergamino, sobre las que se registraron mediciones de 10 variables agro-morfolgicas. El
material de subdividi en 10 conjuntos de entradas evaluadas en igual nmero de ensayos.
En cada ensayo el registro de caracteres se repiti en dos condiciones ambientales
constituidas por combinaciones aos-localidades.

Desarrollo
Los datos consistieron en diez conjuntos de poblaciones nativas de maz (pobl), que
totalizan 401 entradas, evaluadas en diez ensayos (E.) de caracterizacin, mediante diez
caracteres agro-morfolgicos: longitud de mazorca (lmz), dimetro de mazorca (dmz),
nmero de hileras (nhiL), ancho de grano (agr), longitud de grano (lgr), granos por hilera
(grhil), peso de 1000 granos (p1000), rendimiento (rend); altura de la planta (altpl) y, altura
de mazorca (altmz). Cada ensayo se repiti en diferentes temporadas de siembra en las
localidades de Pergamino (Per) y Ferr (Fer), de la provincia de Buenos Aires. Las
combinaciones aos-localidades conformaron distintos ambientes (A.). Los datos se
recogieron en tablas mltiples,
k
T con k=1,...,20; de dimensiones (I
k 10):

1
T : E1A1,
2
T : E1A2 - E1: 60 pobl. (I
1
= I
2
=60). A1: 2003/04-Perg. A2: 2003/04-Fer.
3
T : E2A3,
4
T : E2A4 - E2: 45 pobl. (I
3
= I
4
=45). A3: 2004/05-Fer. A4: 2005/06-Perg.
5
T : E3A3, 6
T : E3A4 - E3: 32 pobl. (I
5
= I
6
=32). A3: 2004/05-Fer. A4: 2005/06-Perg.
7
T : E4A3, 8
T : E4A4 E4: 8 pobl. (I
7
= I
8
=8). A3: 2004/05-Fer. A4: 2005/06-Perg.
9
T : E5A3, 10
T : E5A5 E5: 26 pobl. (I
9
= I
10
=26). A3: 2005/06-Perg. A5: 2005/06-Fer.
11
T : E6A5,
12
T : E6A8 E6: 46 pobl. (I
11
= I
12
=46). A5: 2005/06-Fer. A8: 2007/08-Perg.
13
T : E7A6,
14
T : E7A7 E7: 50 pobl. (I
13
= I
14
=50). A6: 2006/07-Perg. A7: 2006/07-Fer.
15
T : E8A6, 16
T : E8A7 E8: 39 pobl. (I
15
= I
16
=39). A6: 2006/07-Perg. A7: 2006/07-Fer.
17
T : E9A8, 18
T : E9A9 E9: 43 pobl.(I
17
= I
18
=32). A8: 2007/08-Perg. A9: 2007/08-Ferr.
19
T : E10A8, 20
T : E10A9 E10: 52 pobl. (I
19
= I
20
=52). A8: 2007/08-Perg. A9: 2007/08-Ferr.

Los modos considerados fueron poblaciones, variables y ambientes. Concatenando las
k
T
tablas, se las transformaron en una matriz de (80210) que fue centrada y estandarizada
por columnas obtenindose la matriz X(normada). Se separXen submatrices
k
X de
forma tal que,
1 t 20 [ ] , , , , ' = X X X X . Se realiz un ACP no normado en cada submatriz de la
particin y se seleccion el primer valor propio, k;1
para k=1,...,20. Se construy la matriz
diagonal en bloques, Dde orden (802802), en la que cada
ii
D es diagonal (I
k
I
k
) y los
elementos en la diagonal principal de
ii
D iguales al inverso multiplicativo de k;1
. Se obtuvo
= X DX. Por ltimo, se realiz un JK Biplot de X, dado que el inters del anlisis es la
obtencin de una estimacin de X, con ptima representacin de las poblaciones.

Se seleccionaron los tres primeros ejes, que explican el 74 % de la variabilidad total de la
matriz Xy el 68,56 % de la variacin total de X.
En el plano 1-2 las variables mejor representadas fueron: rend, grhil, lgr, altmz y altpl.
Presentando una alta asociacin positiva altmz y altpl; y grhil asociada a rend y lgr. Los
resultados ms contrastantes se dieron en E1-A2 y en E9 en los dos ambientes. Las
poblaciones de E1A2, excepto la 44, fueron las de mayores valores en rend, lgr y grhil y de
menores valores en altpl y altmz. Inversamente en E9 en ambos ambientes, las entradas


presentaron los menores valores en rend, lgr y grhil y los mayores de todas en altpl y altmz.
En el plano 1-3 quedaron bien representadas y asociadas positivamente, dmz y nhil. En las
dos variables las poblaciones de E1A2 tienen valores altos a medios altos, excepto las 61 y
62 que presentaron valores bajos en dmz y los ms bajos en nhil. En los dos ambientes de
E9 la mayora de las poblaciones presentaron valores medios. Se destacan con los valores
ms altos en A9 la poblacin 4029 y en E8 la 4081 y con el valor ms bajo de todas en A9 la
entrada 4060.
Los resultados del anlisis Multibiplot, posibilitaron el estudio global de las estructuras
conformadas por los diferentes conjuntos de accesiones con respecto a los caracteres
evaluados, poniendo de manifiesto comportamientos opuestos y similares de los grupos,
como as tambin realizar una descripcin detallada de cada grupo. Por consiguiente, se
puede concluir que el mtodo utilizado es una importante herramienta de anlisis en
estudios similares al realizado, en los que un problema recurrente es el manejo de gran
cantidad de taxones lo que dificulta el proceso de evaluacin de todas las entradas
simultneamente.

Bibliografa
[1] Baccal, N. (2004). Contribuciones al anlisis de matrices de datos multiva: Tipologa
de las variables. Tesis Doctoral. Universidad de Salamanca. Espaa.
[2] Baccal, N.; Galindo, M.P.; Fernandez Gomez, F. (2006). Multibiplot para el tratamiento
de datos de conjuntos mltiples. Jornadas Internacionales de Estadstica 10 al 13 de
octubre de 2006. Rosario. Argentina. Res. pag. 30. diarium.usal.es/pgalindo/hi-biplot
[3] Crdenas, O.; Galindo, P; Vicente-Gallardn, JL. Los mtodos Biplot: evolucin y
aplicaciones. Revista Venezolana de Coyuntura, 2007, enero-junio, ao/vol. XIII, No. 001.
Universidad Central de Venezuela. pp. 279-303
[4] Carlier, A., Kroonenberg, P.M. (1996). Decompositions and biplots in Three-way
Correspondence Analysis. Psychometrika, 61 (2): 355:373.
[5] Escofier, B. et Pags, J. (1984). Analyse factorielle multiple. Cahiers du BURO, 2, ISU,
Paris.
[6] Gabriel, K. R. (1971). The Biplot graphic display of matrices with applications to principal
components anlisis. Biometrika, 58 (3). 453-467.
[7] Galindo, M.P. (1986). Una alternativa de representacin simultnea: HJ-Biplot. Qestiio,
10(1): 13-23.
[8] Kiers, H.A.L. (1988). Comparison of Anglo-Saxon and French. Three Mode Methods.
Statistique of Analyse des Donnes, 13:14-32.
[9] Kiers, H.A.L. (1991). Hierarchical relations among three-way methods. Psychometrika,
56. 449-470.
[10] Lhermier des Plantes. (1976). Structuration des tableaux trois indices de la
statistique. Theory et applications dune mthode danalysie conjointe. Thse de 3 cycle,
USTL, Montpellier.


UTILIDAD DEL TEST DE APNEA EN EL DIAGNSTICO DE MUERTE
ENCEFLICA

Dra. NEZ, M.
1
; Lic. PONTEVILLE, Ch.
1
; Dr. PREVIGLIANO, I.J.
2
, Dra. CABEZAS, D.V.
2
;
Dr. ANTIK, A.A.
2

1
Ctedra de Matemtica. Facultad de Farmacia y Bioqumica. UBA.
2
Buenos Aires
Trasplante.

myriam@ffyb.uba.ar

RESUMEN
Se trabaj sobre una muestra de 388 comunicaciones de muerte enceflica (ME) de las
cuales 353 generaron procesos de donacin. El objetivo de este trabajo es evaluar la utilidad
del test de apnea (TA) en el diagnstico de muerte enceflica, como as tambin analizar su
utilidad con enriquecimiento de la mezcla de dixido de carbono al 7%. Se registraron los
siguientes datos: Factores demogrficos: Sexo, Edad. Factores de Riesgo: Paro cardaco,
Gases pre y post TA (pH, PCO2, PO2), Presin Arterial Media, Temperatura Corporal,
Presencia de Diabetes Inspida, Sepsis, Fallo Multiorgnico. Otros Factores: Drogas
Vasoactivas y Depresoras, Causa de Muerte, Donacin, Test de Apnea Previo, Craneotoma
Descompresiva y Mtodo Instrumental.
El Anlisis de Correspondencias Mltiples nos permiti tener una idea del comportamiento
de todos los factores de riesgo en su conjunto.
Se analizaron la Sensibilidad y la Especificidad del mtodo. Se determinaron el valor
predictivo positivo (VPP) y el valor predictivo negativo (VPN) y la razn de verosimilitudes
positiva (RV+).
Se estudiaron si existan diferencias significativas antes y despus de realizarse el TA para
cada una de las siguientes variables: ph, PCO2, PO2.
Dado que el TA es un test ideal para el diagnstico de ME, la realizacin previa del mismo
por parte de los denunciantes permitira acelerar el proceso de diagnstico de ME lo cual
producira ms procesos de donacin. Cuando el TA no puede realizarse aumenta en forma
significativa el uso de medios diagnsticos ms complejos (PESS y DTC).

Palabras Claves: Anlisis de Correspondencias Mltiples, Sensibilidad, Especificidad.

Introduccin
Con el fin de evaluar la utilidad del test de apnea (TA) en el diagnstico de muerte enceflica
e identificar las complicaciones y contradicciones que surgen de la utilizacin del (TA) con
enriquecimiento de la mezcla de dixido de carbono al 7 %, se estudiaron 388
comunicaciones de muerte enceflica, de las cuales 353 generaron procesos de donacin.

Desarrollo
Se realiz un anlisis retrospectivo sobre una muestra de 388 comunicaciones de muerte
enceflica (ME) de las cuales 353 generaron procesos de donacin. Se registraron los
siguientes datos: Factores demogrficos: Sexo, Edad. Factores de Riesgo: Paro cardaco,
Gases pre y post TA (pH, PCO2, PO2), Presin Arterial Media, Temperatura Corporal,
Presencia de Diabetes Inspida, Sepsis, Fallo Multiorgnico. Otros Factores: Drogas
Vasoactivas y Depresoras, Causa de Muerte, Donacin, Test de Apnea Previo, Craneotoma


Descompresiva y Mtodo Instrumental.
En cuanto al anlisis estadstico de los datos se aplic el Anlisis Factorial de
Correspondencias Mltiples que nos permiti tener una idea del comportamiento de todos
los factores de riesgo en su conjunto.
Se analizaron la Sensibilidad y la Especificidad del mtodo. Se determinaron el valor
predictivo positivo (VPP) y el valor predictivo negativo (VPN) y la razn de verosimilitudes
positiva (RV+).
Se estudiaron si existan diferencias significativas antes y despus de realizarse el TA para
cada una de las siguientes variables: ph, PCO2, PO2.

De los 353 procesos de donacin efectivizados el 58% eran de sexo masculino.
Entre las causas ms frecuentes de muerte el 31% correspondan a los pacientes que
presentaron Hematoma Intracerebral (HIC), mientras que el 25% presentaron Traumatismo
de Crneo (TEC) y el 20% Hemorragia Subaracnoidea (Hsa).
El 21% de los pacientes tuvieron un Paro Cardaco (PC).
La Temperatura Corporal fue de 35,9 1,6, la Presin Arterial Media fue de 86,2 mmHg
18,7.
El Test de apnea se realiz en el 78% de los pacientes, de los cuales 261 presentaban
control gasomtrico y 16 no.
Las causas de que no se les realizar el Ta al 22% de los pacientes restantes fueron:
Inestabilidad Hemodinmica 39%, Tiopental 21%, Hiupoxemia 9%, PC 9%, actividad
electroenceflica 7%, no se les realiz el diagnstico 14%.
Se complet el diagnstico en el 53%, 36% presentaron PC antes de ser evaluados y 14%
estaban vivos.
Slo el 5,2% de los pacientes tenan TA previo.
Presentaron complicaciones el 1,8% (PC 0,7%; Hipoxemia 0,7% y TV 0,3%, otras
complicaciones el 0,1%).
El TA fue positivo en el 91,7%; negativo en el 7,58%; e indeterminado en el 0,72%.
El Anlisis de Correspondencias Mltiples nos permiti tener una idea del comportamiento
de todos los factores de riesgo en su conjunto, el sexo y la presencia o no de diabetes
inspida no resultaron influyentes.
La sensibilidad (S) del TA para diagnosticar ME fue de 99% y la especificidad (E) de 98%. El
valor predictivo positivo es en este caso del 99% y el valor predictivo negativo 98%. La razn
de verosimilitudes positiva (RV+) result 49,5.
Dado que el TA es un test ideal para el diagnstico de ME, la realizacin previa del mismo
por parte de los denunciantes permitira acelerar el proceso de diagnstico de ME. Cuando
el TA no puede realizarse aumenta en forma significativa el uso de medios diagnsticos ms
complejos Potenciales evocados (PESS) y Doppler (DTC).

Bibliografa
[1] Benzecri, J.P. (1973) Lanalyse des Donnes. Vol. 2. Lanalyse des correspondences.
Dunod. Paris. Francia.
[1] Escofier, B. (2003) Analyse des Correspondances. Recherches au coeur de LAnalyse
des Donnes. Presses Universitaires de Rennes. Francia.
[4] Altman D.G., Bland J.M. (1994) Statistics Notes: Diagnostic tests 1: sensitivity and
specificity. BMJ ; 308: 1552.
[4] Joffe AR, Shemie SD, Farrell C, Hutchison J, McCarthy-Tamblyn L. (2013). Brain death in
Canadian PICUs: demographics, timing, and irreversibility. Pediatr Crit Care Med. Jan;
14(1):1-9.
[4] Muralidharan R, Mateen FJ, Shinohara RT, Schears GJ, Wijdicks EF. (2011). The
challenges with brain death determination in adult patients on extracorporeal membrane
oxygenation. Neurocrit Care. Jun; 14(3):423-6.


[4] Webb A, Samuels O. (2012). Brain death dilemmas and the use of ancillary
testing.Continuum (Minneap Minn). Jun; 18(3):659-68



ANLISIS FACTORIAL, ANLISIS DEL IMPACTO Y TRI, EN LA
CREACIN DE VERSIONES CORTAS DE CUESTIONARIOS DE
CALIDAD DE VIDA RELACIONADA CON LA SALUD

ENRIQUE VICENTE GALINDO; PURIFICACIN VICENTE GALINDO

Departamento, Estadstica / Universidad de Salamanca

kvg78a@hotmail.com
purivic@yahoo.com

RESUMEN
El trabajo consiste en realizar un estudio comparativo de tres mtodos estadsticos, Anlisis
Factorial, Anlisis del Impacto y TRI, utilizados en la simplificacin de cuestionarios
genricos o especficos de Calidad de Vida Relacionada con la Salud.
Adems de analizar las caractersticas tericas, se aplican al QUALEFFO, un cuestionario
especfico para evaluar CV en pacientes osteoporticos, en Atencin Primaria. El Anlisis de
los datos tomados en 741 pacientes, procedentes de un estudio multicntrico, pone de
manifiesto una clara discordancia entre los resultados de los tres mtodos de Anlisis y
sugiere la conveniencia de utilizarlos, no individualmente, sino conjuntamente.

Palabras clave: anlisis factorial; impacto; TRI; cvrs; qualeffo

Introduccin
A medida que en las sociedades desarrolladas se ha ido disminuyendo la mortalidad
prematura, los ndices de cantidad de vida, por ejemplo la esperanza de vida, han ido
perdiendo sensibilidad para monitorizar el nivel de salud de la poblacin, y el inters por la
cantidad de vida, ha dado paso al inters por la calidad de vida. Esta nueva forma de
abordar los estudios sociolgico epidemiolgicos conlleva una serie de nuevos problemas,
desde el punto de vista metodolgico, que requieren ser abordados y resueltos. Entre ellos
est Cmo medir la calidad de vida? y Con qu instrumentos?
Una bsqueda on line hecha por HAAS [1], de la frase Quality of Life en Medline, Cinahl,
Psyc-Info, Eric, y Social Science Abstract, proporcion una lista de 16.021 artculos
publicados entre 1993 y 1998. De esos artculos, ms de 4.000 eran sobre Calidad de Vida
Relacionada con la Salud (CVRS). Salvo en la literatura terica, no existe una definicin
explcita de CV. En los trabajos empricos, los autores no definen CV sino que normalmente
la definicin viene implcitamente determinada por el instrumento seleccionado para su
medida. Se han desarrollado muchos instrumentos para valorar CVRS, especialmente en los
pases de habla inglesa, tanto genricos como especficos. Este trabajo consiste en realizar
un estudio comparativo de tres mtodos estadsticos, Anlisis Factorial, Anlisis del Impacto
y TRI, utilizados en la simplificacin de cuestionarios genricos o especficos de Calidad de
Vida Relacionada con la Salud, aplicndolos al cuestionario QUALEFFO.

Desarrollo
Participantes: El diseo fue descriptivo, transversal y observacional. Se han analizado 741
pacientes de dos Centros de Atencin Primaria (uno en Burgos y otro en Salamanca,
Espaa), que verificaban los criterios de inclusin. A estos pacientes se les realiz una
medicin ultrasnica en el calcneo, obteniendo el BUA que valora la densidad y estructura
sea a partir de la atenuacin de la seal ultrasnica al atravesar el calcneo, y el T-Score
que nos proporciona el nmero de desviaciones tpicas que el valor del BUA se desva del
valor medio de la poblacin. Este ltimo valor permiti clasificar a los pacientes estudiados
en sujetos Osteoporticos, Osteopnicos y Normales. Los puntos de corte empleados en
dicha clasificacin fueron de -1 DE y -2.0 DE.


Instrumentos: El instrumento utilizado fue El QUALEFFO (Questionnaire of the European
Foundation for Osteoporosis) que es el cuestionario especfico ms utilizado, en medicina
contempornea, para medir la Calidad de Vida en pacientes con osteoporosis, validado en
diferentes pases, entre ellos Espaa. Consta de 35 tems las cuales se refieren a siete
dimensiones de salud: A: Dolor (5 tems), B: Actividades Cotidianas (3 tems), C: Tareas
Domsticas (5 tems), D: Movilidad (6 tems), E: Actividades Sociales y de Tiempo Libre (4
tems), F: Percepcin de la Salud General (2 tems) y G: Estado de nimo (10 tems). Las
preguntas se expresan en escala politmica con cinco categoras. El estudio original de
validacin del Cuestionario QUALEFFO [2] en el mbito hospitalario define siete
dimensiones de la Calidad de Vida relacionada con la Salud: Dolor, Actividades Cotidianas,
Tareas Domsticas, Movilidad, Actividades Sociales, Salud Global, Estado de nimo.
Anlisis estadstico: Como tcnica estadstica para contrastar la validez del constructo se
usa el Anlisis Factorial Exploratorio (EFA), solucin en componentes principales y rotacin
varimax. La consistencia interna se evalu con el alfa de Cronbach. El impacto de los tems
se realiz siguiendo a Allen y Locker [3]; es decir, se calcula la frecuencia de cada tem, en
un segundo paso la importancia (puntuacin media de cada uno de los tems sin tener en
cuenta la puntuacin nunca) y en un tercer paso se calcula el impacto, multiplicando
frecuencia por importancia. La capacidad discriminante de cada dimensin latente, y/o de
cada tem, se calcula con el modelo de respuesta Graduada de Samejima [4], modelo
logstico de la TRI de dos parmetros. El software utilizado fue el SPSS, versin 21 y el
MULTILOG [5].

Un 32.47% de la muestra tiene menos de 60 aos entre los que se encuentra que slo hay
un 12.60% de los ms jvenes (menos de 40 aos); la gran mayora (67.53%) tienen ms de
60 aos. 550 individuos de los encuestados eran mujeres, mientras que 191 eran varones.
Un 18.37% de los pacientes considerados haban tenido fractura despus de los 40 aos; y
un 9.34% tiene antecedentes familiares con fractura de caderas; el 26.20% de los 540
pacientes que contestaron a esta pregunta, tuvo menopausia prematura; el 40% manifiesta
que es el problema de los huesos el que ms influye en su estado de salud. Tras la
evaluacin con ultrasonido, 298 pacientes fueron considerados Osteoporticos, 229
Osteopnicos y 192 como Normales.
El primer estudio hecho en pacientes con osteoporosis en Atencin Primaria [6] no se
encontraron exactamente las dimensiones latentes tericas. Otros autores ya haban
obtenido resultados similares a los encontrados en Atencin Primaria, en pacientes con
Osteoporosis, evaluados en ambiente hospitalario, si bien el estudio se hizo con la versin
con 41 tems del cuestionario QUALEFFO [7]. Aunque Vicente-Galindo no encontr las 7
dimensiones postuladas en el instrumento QUALEFFO y tampoco encontr invarianza
estructural, al comparar los tres grupos, lo que si es cierto, es que hay ciertas dimensiones
que s se detectan de forma invariante en los tres grupos; concretamente las relativas al
Dolor y al Miedo a las Fracturas. Ciertas manifestaciones del Estado de nimo positivo y
negativo, y ciertas manifestaciones de Salud Fsica, tambin estn presentes en los tres
grupos, pero con correlaciones ms bajas.
Para cada tem se calcularon la frecuencia, la importancia y el impacto. Los tems con ms
impacto fueron el A1 y A2, B7 y B8, C12 y C13, D15 y D16, F24 y F25, G29 y el G30.
Los resultados de la TRI aplicados al QUALEFFO permiten identificar los dos tems con
mayor capacidad informativa (discriminante) para cada dimensin. Ver detalles en Snchez-
Barba, [8].
La tabla siguiente recoge los resultados ms relevantes con los tres mtodos estadsticos
utilizados, para todas y cada una de las dimensiones latentes del QUALEFFO y pone de
manifiesto que los tems con mayor impacto no tienen capacidad informativa desde el punto
de vista de la discriminacin y tampoco coinciden con los tems con mayores cargas
factoriales.



Con el AFE Impacto TRI
DIMENSIN
Dolor A1 y A3 A1 yA2 A1 yA2

Actividades Cotidianas

B6 y B7 B7 y B8 B6 y B7
Tareas Domsticas

C10 y C11 C12 y C13 C10 y C11
Movilidad D14 y D18 D15 y D16 D14 y D17

Actividades Sociales y T.
Libre

E22 y E23 E20 y E21 E22 y E23
Salud General F24 y F25 F24 y F25 F24 y F25

Estado de nimo G33 y G34 G29 y G30 G33 y G34

Tabla 1- tems que deberan formar el cuestionario QUALEFFO reducido, segn los tres mtodos
estadsticos

Como conclusiones resaltamos las siguientes: Los tems con mayor impacto no son los de
mayor carga factorial, lo cual era esperable ya que los tems con ms impacto son
generalmente los ms frecuentes y para esos tems no hay mucha variabilidad, siendo sta
la esencia del Anlisis Factorial. Los tems seleccionados con el Anlisis Factorial son los
ms relevantes, si estamos interesados en la validez factorial, y aqullos con ms impacto,
los ms asociados con Validez de Contenido.
Los tems seleccionados con la TRI no son los de ms impacto, lo cual era esperable ya
que si el sntoma asociado al tem lo presentan la mayora de los pacientes, ese tem no es
bueno para discriminar entre pacientes con distintos niveles de Calidad de Vida.
Los tres procedimientos, que hasta ahora se han usado por separado, deberan utilizarse
conjuntamente para poder disponer de cuestionarios con alta validez factorial, alta validez
de contenido y alto poder discriminante.
Por tanto, nuestra propuesta sera una versin corta del cuestionario QUALEFFO, en
ambiente de Atencin Primaria, conformada por los tems: A1, A2 y A3 (Dolor); B6, B7 y B8
(Actividades Cotidianas); C10, C11, C12 y C13 (Tareas Domsticas); D14, D15, D16, D17 y
D18 (Movilidad); E20, E21, E22 y E23 (Actividades Sociales y de Tiempo Libre); F24 y F25
(Salud General); G29, G30, G33, G34 (Estado de nimo), ya que esta versin tiene alta
validez factorial, alta validez de contenido y alto poder discriminante.

Bibliografa
[1] Haas, B. K. (1999). A Multidisciplinary Concept Analysis of Quality of Life. Western
Journal of Nursing Research. 21( 6): 728- 743.
[2] Badia,X. y Herdman, M. (1999). Adaptacin transcultural al espaol de los cuestionarios
OQLQ y QUALEFFO para la evaluacin de la calidad de vida relacionada con la salud de
mujeres con fractura vertebral osteoportica. Rev Esp Enf Met Oseas. 8, 135-140.
[3] Allen, F. y Locker, D. (2002). A Modified Short Version of the Oral Health Impact Profile
for Assessing Health-Related Quality of Life in Edentulous Adults. The International Journal
of Prosthodontics; 15(5): 446.450.
[4] Samejima, F. (1969). Calibration of latent ability using a response pattern of graded
scores. Psychometrika Monograph Supplement. 17.
[5] Thissen, D. (1991). MULTILOG: Multiple category item anlisis and test scoring using


item response theory. Ed. Scientific Software Internacional, Inc. Chicago.
[6].Vicente-Galindo, P. (2003). Contribuciones al anlisis de datos de Calidad de Vida
Relacionada con la Salud. Tesis Doctoral. Universidad de Salamanca.
[7] Murrell, P.; Todd, C.J.; Martn, A.; Walton, J.; Lips, P. y Reeve, J. (2001). Postal
administration compared with nurse-supported administration of the QUALEFFO-41 in a
population sample: comparison of results and assessment of psychometric
properties.Osteoporos Int. 12(8): 672-679.
[8] Snchez-Barba, M. (2008). Aportaciones al anlisis de datos de calidad de vida
relacionada con la salud desde una perspectiva multivariante. Tesis Doctoral. Univ.
Salamanca.


COMPARACIN DE SEIS MODELOS DE CURVAS DE LACTANCIA
EN BOVINOS HOLANDO Y HOLANDOXJERSEY EN ARGENTINA

BERIBE M. J.
1
, CARIGNANO, H.
1
, ROLDAN, D.
1
, LOPEZ-VILLALOBOS, N.
2
, RASCHIA,
M.A.
1
, POLI, M.
1

1
Instituto de Gentica Ewald A. Favret, INTA Castelar
2
Institute of Veterinary, Animal and Biomedical Sciences, Massey University, Palmerston
North, New Zealand.

mberibe@cnia.inta.gov.ar

RESUMEN
Se evalu la capacidad predictiva de seis funciones matemticas usando modelos de
regresin aleatoria para describir la curva de lactancia en bovinos productores de leche. Las
funciones matemticas fueron curva exponencial de Wilmink, polinomio de Ali-Schaeffer y
polinomios ortogonales de Legendre de cuatro rdenes: 3, 4, 5 y 6. Fueron utilizados
125528 registros de produccin de leche de las primeras lactancias correspondientes a
17614 vacas Holando y cruzas HolandoxJersey de la cuenca lechera de Santa Fe. Los
criterios utilizados para evaluar la capacidad de ajuste fueron: coeficiente de determinacin,
coeficiente de concordancia, cuadrado medio del error de prediccin, criterio de informacin
de Akaike (AIC), criterio de informacin Bayesiano (BIC) y anlisis de los residuos. Los
polinomios de Legendre mostraron pocas diferencias en los criterios de comparacin, y pol6
fue el modelo que mejor ajust a los datos, ya que fue uno de los que present los mejores
valores de los 5 criterios y menor error de prediccin.

Introduccin
En Argentina, los tambos de mediana y alta produccin realizan dos ordeos diarios a partir
del segundo da despus del parto y hasta que se produce su secado. Teniendo en cuenta
la viabilidad de registrar la produccin de leche diaria de cada animal durante todo ese
tiempo, es posible describir una curva de lactancia que se divide generalmente en tres
etapas; ascenso, pico de lactancia y descenso. Aproximadamente una vez al mes, se
registra la produccin de leche (controles lecheros CL) de cada animal, durante el perodo
de lactancia. Estos datos pueden ser utilizados para el modelado de la curva de lactancia. El
conocimiento preciso de las curvas de lactancia tiene relevancia para la gestin y la
investigacin de los sistemas de produccin de leche: como niveles nutricionales. Las
curvas de lactancia pueden ser evaluadas en funcin de los das en lactancia. Todas las
funciones matemticas pueden ser usadas en modelos de regresin aleatoria, los cuales
permiten el ajuste de una curva nica de lactancia para cada individuo -regresin aleatoria -
expresada como la desviacin de una curva media de la poblacin o de un grupo (Schaeffer
y Jamrozik 1996). El objetivo de este trabajo fue comparar la bondad de ajuste de seis
modelos de regresin aleatoria utilizando a funcin exponencial de Wilmink (Wilmink, 1987),
el polinomio de Ali-Schaeffer (Ali y Schaeffer, 1987) y cuatro polinomios ortogonales de
Legendre (Olori et al., 1999): polinomios de orden 3, 4, 5 y 6 con el fin de encontrar la
funcin matemtica que mejor se ajuste a este conjunto de datos de produccin de leche.

Desarrollo
Datos
El conjunto de datos const de los registros de produccin de leche de 125528 controles
lecheros, medidos a intervalos irregulares, dos veces al da -por la maana y por la tarde-,
entre los aos 1998 y 2012. Dichos CL corresponden a 17614 primeras lactancias de vacas
hijas de 30 toros- de 37 establecimientos lecheros comerciales ubicados en la cuenca
lechera central de la Argentina. El 75% de las vacas fueron Holando y el 25% fueron cruzas
HolandoxJersey. Las edades de las vacas al momento del parto variaron entre 2 y 4 aos.
Para incluir una lactancia en el conjunto de datos a analizar, se requiri un mnimo de 4 CL


por lactancia que el primer CL de cada lactancia se haya realizado antes de los 60 das
despus del parto. Las medias generales ( desviacin estndar) para la duracin de la
lactancia y produccin de leche diaria fueron 29965 das y 18.564.60 kilogramos (kg),
respectivamente. Los valores de produccin de leche variaron entre 2.0 y 36.8 kg.
Funciones matemticas.
Sea y
ij
la produccin de leche (en kilogramos) en un CL en el tiempo t
j
, t
j
= das en lactancia
en la observacin j, para la vaca i. Las funciones matemticas elegidas para la evaluacin
de la curva de lactancia fueron los siguientes:
1) La funcin exponencial de Wilmink (1987) (wilmink).

ij
t
i j i i
t
j ij
e e c t b a ce bt a y
j j
+ + + + + + =
05 . 0 05 . 0

donde a, b, c, son coeficientes de regresin fijos y a
j
, b
j
, c
j
, son los coeficientes de regresin
aleatorio.

2) modelo de regresin aleatoria basado en el modelo de Ali y Schaeffer (1987), (alisch).

ij j i j i j i j i i j j j j ij
e f d c b a f d c b a y + + + + + + + + + + =
2 2 2 2
e e e e
donde ) 305 ln( 305
j j j j
t t = = e
a, b, c, d y f son coeficientes de regresin fijos y a
j
, b
j
, c
j
, d
j
y f
j
, son los coeficientes de
regresin aleatorio.

3) 4 modelos de regresin aleatoria usando polinomios ortogonales de Legendre de cuatro
grados diferentes (pol3 (n=3), pol4 (n=4), pol5 (n=5) y pol6 (n=6)) (Kirkpatrick et al., 1990).
( ) ( )
ij
n
k
k ik
n
k
k k ij
e w w y + + =

= = 0 0
| o | o
siendo
k
los coeficientes de regresin fijos y
kj
los coeficientes de regresin aleatoria y

( ) ( ) ( ) 1 ) ( 2 ; ) 1 ( ) 1 ( 5 . 0 ) ( ); ( 2 ) 1 2 (
min max min
0
= +
|
|
.
|
\
|
= + =

=
t t t t w w w
l
k
w P w P k w
j
l l k
k
l
k k k
|

En todos los modelos, se supuso que los errores e
ij
son independientes con distribucin
normal, con esperanza cero y varianza constante y los
kj
tienen distribucin normal con
esperanza cero, no asignando un patrn matemtico particular a la matriz de covarianza
(unstructured). Los parmetros estimados de los seis modelos se obtuvieron mediante el
procedimiento MIXED de SAS (SAS Institute), para cada animal, incluidos los componentes
de varianza.
Criterios de bondad de ajuste.
Con los parmetros estimados (coeficientes fijos y aleatorios del modelo), se utilizaron los
modelos para calcular las producciones predichas y los residuos, definidos estos ltimos
como la diferencia entre la produccin observada y predicha. Los criterios de bondad de
ajuste utilizados fueron: coeficiente de determinacin (R
2
), coeficiente de concordancia (
c
)
(Lin, 1989), criterio de informacin de Akaike (AIC), criterio de informacin Bayesiano (BIC) y
el error de prediccin se calcul como la raz del error cuadrtico medio (MSPE) y
expresado como porcentaje de la produccin media observada (RMSPEY). Se realiz un
anlisis de los residuos para comprobar los supuestos realizados sobre los errores de cada
modelo, para ello los residuos promedio son graficados frente a los das en lactancia. El
supuesto de distribucin normal de los errores fue evaluado a travs del grfico de
probabilidad normal. Se utiliz el test de Durbin-Watson (DW) para probar la existencia de
autocorrelacin de primer orden entre residuales.

Los valores de los distintos criterios de bondad de ajuste se muestran en la Tabla N1. Los
modelos de regresin aleatoria con una funcin de polinomios de Legendre muestran un
mejor ajuste a los datos observados que los modelos wilmink y alisch. Los modelos pol4 y
pol6 explicaron en mayor magnitud la produccin de leche y los valores de produccin
predichos surgidos de ambos modelos fueron los que presentaron mayor grado de acuerdo


con los observados, junto a los de pol5. Los valores de BIC y AIC ms bajos fueron de los
modelos pol6 y pol 5, wilmink muestra el peor ajuste con el BIC y AIC ms altos. El error de
prediccin medido a travs de RMSPEY disminuy de 12.96 para los modelos wilmink y
alisch, a 9.86 para el modelo pol6. Los grficos de los residuos vs das en lactancia,
muestran la distribucin de residuos medios en el intervalo 2-400 das. En ellos se observ
un patrn comn en los seis modelos, en el que los residuos promedio oscilaron entre
negativo y positivo durante la lactancia y la variabilidad no es constante. Para los primeros
80 das, los errores fueron mayores (valor absoluto) para pol3 y pol4. Los patrones
indicaran que los residuos no estaran distribuidos al azar durante la lactancia, lo cual est
apoyado por los resultados del test de DW los cuales resultaron significativos (o=0.05) para
todos los modelos rechazando la hiptesis de inexistencia de autocorrelacin de los errores.

Tabla N1 Criterios de bondad de ajuste
pol3 pol4 pol5 pol6 wilmink alisch
R
2
(%) 82 86 85 86 74 81
c 0.88 0.89 0.90 0.90 0.83 0.87
RMSPEY (%) 11.06 10.41 10.12 9.86 12.96 12.96
BIC 665082.1 663390.1 661847.9 661633 669031 664283.7
AIC 665167.6 663515.3 662018.5 661858 669085.5 664408.1

Los polinomios de Legendre mostraron pocas diferencias en los criterios de comparacin, y
fue pol6 el modelo que mejor ajust a los datos, debido a que fue uno de los que present
los mejores valores de los cinco criterios y el menor error de prediccin. Los polinomios
ortogonales tienen las siguientes ventajas: la funcin es ortogonal y es til para analizar
patrones de variacin gentica (Kirkpatrick et al., 1990), los datos faltantes pueden ser
predichos con ms exactitud que con la curva de Wilmink, altos rdenes son estables y
favorecen la convergencia donde los polinomios convencionales fallan (Pool y Meuwissen,
2000), proveen correlaciones pequeas relativas entre los coeficientes de regresin
estimados (Schaeffer, 2004) y una mayor flexibilidad en cuanto al requerimiento de clculo
(Macciotta et al., 2005). El paso siguiente ser analizar el efecto de diferentes factores
ambientales y de manejo; tales como tambo de ordeo, estacin de parto, edad al parto; que
podran afectar los valores de produccin de leche a lo largo de la lactancia y estudiar su
impacto en el ajuste de estos modelos y considerar heterogeneidad en la varianza.

Bibliografa
Ali, T. E. and Schaeffer L. R. (1987). Accounting for covariances among test day milk yields
in dairy cows. Can. J. Anim. Sci. 67: 637644.
Kirkpatrick, M., Lofsvold D., and Bulmer M. (1990). Analysis of inheritance, selection, and
evolution of growth trajectories. For. Genet. 124: 979993.
Lin Lawrence I-Kuei. (1989). A Concordance Correlation Coefficient to Evaluate
Reproducibility. Biometrics 45: 255-268.
Macciotta, N.P.P., Vicario D. and A. Cappio-Borlino. (2005). Detection of different Shapes of
Lactation curve for milk yields in Dairy cattle by Empirical Mathematical Models. J. Dairy Sci.
88:1178-1191.
Olori, V. E., Brotherstone S., Hill W. G., and McGuirk B. J.. (1999). Fit of standard models of
the lactation curve to weekly records of milk production of cows in a single herd. Livest. Prod.
Sci. 58: 5563.
Pool, M.H. and Meuwissen, T.H.E. (2000). Reduction of the number of parameters needed
for a polynomials random regression test day model. Livest. Prod. Sci. 64: 133-145.
SAS Institute, 1990. SAS STAT Version 6 Users Guide. SAS Institute Inc., Cary, NC.
Schaeffer, L.R. (2004). Application of random regression models in animal breeding. Livest.
Prod. Sci. 86:35-45.
Schaeffer, L. R. and Jamrozik, J. (1996). Multiple-trait prediction of dairy cattle lactation
yields. J. Dairy Sci. 79: 2044-2055.
Wilmink, J. B. M. (1987). Adjustment of test-day milk, fat and protein yield for age, season


and stage of lactation. Livest. Prod. Sci. 16:335348.



SELECCIN DE UN VOCABULARIO SENSORIAL ESPECFICO
PARA EL ANLISIS DE OLOR Y FLAVOR DE AJOS HORNEADOS

PEREYRA, A.M.
1
, COSTE, E.B.
1
,

PICALLO, A.
1
, ALTENDORFF, L.
2

1
Departamento de Produccin Animal, Facultad de Agronoma, UBA
2
Facultad de Economa y Administracin, UNCOMA

anamariapereyra@yahoo.es

RESUMEN
El ajo (Allium sativum L.) es muy apreciado en diversas culturas por sus caractersticas
sensoriales distintivas que realzan y enriquecen el valor culinario, y por sus efectos
benficos para la salud, sin embargo, no existe en la actualidad una definicin precisa de los
descriptores sensoriales que lo caracterizan. El objetivo de este trabajo fue desarrollar y
seleccionar un vocabulario sensorial para describir el olor y flavor de 9 cultivares
mendocinas INTA de ajos, previamente horneados: Morado, Unin, Nieve, Norteo, Perla,
Castao, Fuego, Sureo, Gostoso. Los trminos se generaron y seleccionaron siguiendo la
metodologa indicada en ISO 11035:1994. Se utiliz anlisis de componentes principales
(ACP) para seleccionar los descriptores que diferencian entre cultivares y/o que describen
las principales caractersticas sensoriales de los ajos. 15 descriptores fueron seleccionados
por ACP: 4 para el olor (intensidad global, caramelo, pimienta y tostado) y 11 para el flavor
(intensidad global, manzana cocida, cebolla, repollo, caramelo, gustos dulce, cido y
amargo, pungencia, retrogusto y persistencia). Adems este anlisis permiti separar los
cultivares en cuatro grupos bien diferenciados. Esta investigacin aporta una terminologa
especfica que contribuye a la caracterizacin sensorial de este producto.

Palabras clave: ajos horneados, anlisis sensorial, ACP, descriptores.

Introduccin
El ajo (Allium sativum L.), alimento con demostrados efectos benficos para la salud, es muy
apreciado por la gastronoma y su aceptacin se debe principalmente a sus caractersticas
sensoriales. Teniendo en cuenta que las descripciones sensoriales son de mximo inters
para conseguir situar objetivamente productos en el mercado, que en la actualidad no existe
una definicin precisa de las propiedades sensoriales que caracterizan al ajo y que, para
lograr una caracterizacin es necesario disponer de tcnicas de evaluacin objetivas y
reproducibles de las caractersticas del producto, el anlisis sensorial constituye una
herramienta fundamental para caracterizar las cultivares de ajos en estudio y determinar
diferencias entre ellas y/o debidas a la industrializacin y/o conservacin de las mismas,
(Coste et al, 2007 y Picallo et al, 2009).
Para seleccionar los trminos descriptivos relevantes y aquellos que pueden diferenciar entre
cultivares se utilizan tcnicas multivariadas. El anlisis multidimensional permite la evaluacin
de la importancia relativa y la contribucin de los descriptores en diferenciar productos, ya
que permite la visualizacin de todos estos productos al mismo tiempo, as como la
correlacin entre los descriptores (Brcenas et al, 1999 y Ruiz-Prez-Cacho et al, 2005).
El objetivo de esta investigacin fue desarrollar y seleccionar un vocabulario sensorial para
describir el olor y flavor de 9 cultivares de ajos, previamente horneados, procedentes de la
Estacin Experimental Agropecuaria INTA La Consulta, Mendoza. Con este estudio se
pretende contribuir a la caracterizacin de este producto aportando un vocabulario
especfico con sus definiciones.

Desarrollo
Los 9 cultivares analizados fueron: Fuego INTA (V-1), Gostoso INTA (V-6), Castao INTA


(V-7) y Sureo INTA (V-3), del grupo fisiolgico 4 (ajos colorados o castaos); Perla INTA
(V-2), Nieve INTA (V-4), Unin INTA (V-5) y Norteo INTA (V-8) del grupo fisiolgico III
(blancos); y Morado INTA (V-9) del grupo fisiolgico I (ajos morados).
Para la preparacin de la muestra, se seleccionaron 3 bulbos de cada cultivar, se
envolvieron en papel aluminio con dos gotitas de aceite de girasol y se cocinaron en horno
con calor envolvente durante 2 horas a 130-150 C. Las pastas de ajo resultantes fueron
presentadas a los evaluadores dentro de cajas de Petri cerradas y codificadas con nmeros
aleatorios de tres dgitos al azar, Picallo et al (2009). Las muestras se presentaron a 60-
70C para su evaluacin. Como barredor entre muestras se utiliz pan y como enjuague
bucal, agua de mesa.
Siete evaluadores, seleccionados y entrenados de acuerdo a las normas internacionales
desarrollaron el lenguaje descriptivo para las muestras. Se analizaron tres muestras por
sesin. La generacin y seleccin del vocabulario se realiz segn las normas ISO (1994).
Una vez obtenida la lista inicial de descriptores, se realiza la primera reduccin de trminos.
Para ello, se presenta a los evaluadores las nueve muestras de ajo y se les pide que para
cada uno de los descriptores juzguen la intensidad percibida con una escala que vara
desde uno (muy dbil) hasta cinco (muy fuerte), asignndose el valor de cero en el caso de
que el descriptor no se perciba. Para reducir el nmero de descriptores, se clasifican primero
en funcin de su media geomtrica, calculada para cada descriptor como la raz cuadrada
del producto de la frecuencia con que se citan por la intensidad relativa con la que se
percibe cada descriptor. La clasificacin de descriptores de acuerdo con el valor de su media
geomtrica permite eliminar aquellos con valores relativamente bajos, ISO (1994).
Se utiliz Anlisis de Componentes Principales (ACP) para realizar una segunda reduccin
de trminos y para evaluar la importancia relativa y la contribucin de los descriptores, a fin
de obtener un nmero final de 15 descriptores relevantes (ISO, 1994) en este caso, de ajos
horneados. Esta segunda reduccin hace posible agrupar sinnimos (correlacionados
positivamente) o antnimos (correlacionados negativamente) y eliminar descriptores que no
provean un aporte significativo en la caracterizacin y diferenciacin entre los productos
evaluados. Los datos se analizaron usando InfoStat (2002).

Como resultado de la generacin de trminos, se obtuvo una lista inicial con 82 descriptores
simples, 54 para el olor y 28 para el flavor.
Al calcular la media geomtrica de cada descriptor, se observ que los valores variaban
desde 75,61% (Pungencia) hasta 0 (Olor a perejil). Se decidi excluir aquellos trminos que
presentaron una media menor a 20 (M%20%), aunque se agreg el descriptor Retrogusto
(M%=19,57%) por su valor y significado sensorial, en tanto pudiera aportar a la descripcin.
Se eliminaron, por lo tanto, 59 descriptores para el anlisis multidimensional posterior.
En segunda instancia, a partir de la aplicacin del ACP sobre los 23 descriptores
seleccionados en la primera etapa y de sus correlaciones se eliminaron 8 descriptores.
Finalmente, con los 15 descriptores obtenidos se realiz un nuevo ACP, en el que los dos
primeros ejes explicaron el 55% de la varianza total. Del anlisis del primer plano vectorial,
Grfico 1, se concluye que: 1) Los cultivares Fuego, Perla y Gostoso (V-1, V-2 y V-6) son
caracterizadas principalmente por los descriptores Aroma a caramelo (Acaram) y Aroma a
Cebolla (Acebol), y con menor contribucin por Aroma por Aroma a manzana cocida
(Amanzcoc) y Retrogusto (Retrog); 2) Los cultivares Castao y Norteo (V-7 y V-8), se
caracterizan por los descriptores Gusto Amargo (GAmargo), Gusto Acido (GAcido), Olor a
caramelo (OlCarame), Olor a pimienta (OlPimien), Intensidad de olor (Ainten); Olor tostado
(OlTostad), Pungencia (Pungen) y Persistencia (Persist); 3) Los cultivares Sureo y Morado
(V-3 y V-9) se caracterizan por los descriptores Aroma a repollo (Arepoll) e Intensidad de
aroma (Ainten); 4) Los cultivares Nieve y Unin (V-4 y V-5) se caracterizan por el descriptor
Gusto dulce (Gdulce), siendo los menos intensos.



-3,50 -1,63 0,25 2,13 4,00
CP 1 (30,8%)
-3,00
-1,50
0,00
1,50
3,00
C
P

2

(
2
3
,
9
%
)
V-1
V-2
V-3
V-4
V-5
V-6
V-7
V-8
V-9
Gamargo
Gdulce
Gacido
Amanzcoc
Ainten
Acaram
Arepoll
Acebol
OlCarame
OlIntens
OlPimien
OlTostad
Persist
Pungen
Retrog
V-1
V-2
V-3
V-4
V-5
V-6
V-7
V-8
V-9
Gamargo
Gdulce
Gacido
Amanzcoc
Ainten
Acaram
Arepoll
Acebol
OlCarame
OlIntens
OlPimien
OlTostad
Persist
Pungen
Retrog
Ajos Horneados: ACP obs.

Grfico 1: Representacin de las dos primeras componentes principales

Este estudio permiti seleccionar un vocabulario especfico para los cultivares de ajos
horneados. Si bien algunos de los descriptores coincidieron con los publicados por Civille y
Lyon (1985) para ajos frescos y ms recientemente por Coste et al (2010), este trabajo
aporta trminos nuevos y especficos que contribuyen a una mejor caracterizacin sensorial
de este producto. El ACP permiti agrupar las cultivares en 4 grupos bien diferenciados.

Bibliografa
Brcenas, P.; Prez Elortondo, F.; Salmern, J.; Albisu, M. (1999). Development of a
preliminary sensory lexicon and standard references of ewes milk cheeses aided by
multivariate statistical procedures. Journal of Sensory Studies. 14: 161-179.
Civille, G.; Lyon, B. (1985). Aroma and flavour Lexicom for sensory evaluation. Gua ASTM
DS 66-USA.
Coste, B.; Picallo, A.; Sance, M.; Bauz, M. (2009). Protocolo para anlisis sensorial
descriptivo de ajos: parte 2. Captulo 5 del Curso/Taller sobre Produccin, Comercializacin
e Industrializacin de ajo. 141-144. INTA EEA La Consulta, Mendoza, Argentina.
Coste, B.; Picallo, A; Bauz, M.; Sance, M. (2010). Generacin preliminar de descriptores
para el anlisis sensorial de ajos desecados y liofilizados. Revista de la Facultad de Ciencias
Agrarias de la Universidad Nacional de Cuyo, 42 (1) 159-168. Mendoza.
Coste, E.; Picallo, A.; Bauz, M.; Sance, M. (2007). Generacin de un vocabulario sensorial
especfico para el anlisis del olor y del flavor de ajos desecados y liofilizados. Actas XI
Congreso Argentino de Ciencia y Tecnologa de Alimentos. 33-43.
InfoStat (2002). InfoStat versin 1.1. Grupo InfoStat, FCA, Universidad Nacional de Crdoba,
ISO, International Standard 11035. Sensory analysis Methodology-. Identification and
selection of descriptors for establishing a sensory profile by a multidimensional approach.
Ref. No. ISO 11035:1994 (E). (1994). International Organization for Standardization,
Genve.
Picallo, A.; Coste, B.; Sance, M.; Bauz, M. (2009). Protocolo para anlisis sensorial
descriptivo de ajos: parte 1. Captulo 5 del Curso/Taller sobre Produccin, Comercializacin
e Industrializacin de ajo. 139-140, INTA EEA La Consulta, Mendoza, Argentina.
Ruiz-Prez-Cacho, M.P.; Galn Soldevilla, H.; Len Crespo, F.; Molina Recio, G., (2005).
Determination of the sensory attributes of Spanish dry-cured sausage. Meat Sc. 71:620-633.


VENTAJA DE LA MODELACIN DE LA ESTRUCTURA DE
COVARIANZAS EN UN ENSAYO COMPARATIVO DE RENDIMIENTO

FERNANDO AGUATE
1
, MARIANO CRDOBA
1
, MNICA BALZARINI
1

1
Facultad de Ciencias Agropecuarias, Universidad Nacional de Crdoba, CONICET,
Crdoba-Argentina.

mbalzari@agro.unc.edu.ar

RESUMEN
Los ensayos comparativos de rendimiento de genotipos en maz (Zea Mays) son
frecuentemente realizados bajo un diseo en bloques completos aleatorizados. Sin
embargo, el bloqueo no siempre asegura el control de la variabilidad espacial. El uso de
modelos mixtos permite un anlisis contemplando correlaciones espaciales y
heteroscedasticidad en los datos. En el presente trabajo se evala las diferencias en los
ranking de genotipos bajo distintos modelos mixtos que contemplan la variabilidad espacial y
la heteroscedasticidad de 31 genotipos de maz bajo un diseo en bloques completos
aleatorizados con un testigo repetido a la par.

Palabras clave: Correlacin espacial, heteroscedasticidad, testigos a la par

Introduccin
En las etapas finales de un programa de mejoramiento gentico se realizan ensayos de
hbridos con el fin de seleccionar aquellos superiores, principalmente teniendo en cuenta el
rendimiento y otros caracteres de importancia agronmica, como la resistencia a ciertas
enfermedades o a factores de estrs ambiental. El anlisis correcto y la efectiva
interpretacin de estos ensayos resultan cruciales en las etapas de seleccin.
Los ensayos comparativos de rendimiento son frecuentemente implementados bajo un
diseo de bloques completos aleatorizados (DBCA) para controlar la variacin de las
unidades experimentales a travs de los bloques. Un DBCA asume heterogeneidad a travs
de bloques, homogeneidad dentro de stos y supone que las diferencias entre genotipos se
mantienen constantes de bloque a bloque. Sin embargo, con bloques de gran tamao las
parcelas dentro de un bloque pueden tener diferencias debidas a irregularidades que se
producen en el terreno a menor escala o por otros factores post-diseo que hacen que las
diferencias entre genotipos dependan de su ubicacin espacial en el bloque. Por lo tanto un
DBCA no siempre garantiza el control de la variacin espacial [1]. Si no se controla esta
variacin espacial se suma a la variacin en los residuos afectando al error estndar usado
para comparar las medias de genotipos y consecuentemente se afecta la recomendacin en
la seleccin.
Para estimar la magnitud de la correlacin espacial y ajustar esta variacin, los datos
obtenidos de cada parcela deben estar georreferenciados, es decir, contar con un set de
coordenadas de la posicin de la observacin en el arreglo espacial. El anlisis estadstico
de datos georreferenciados puede llevarse a cabo con el uso de modelos lineales mixtos
(MLM). El anlisis en el contexto de MLM permite considerar posibles correlaciones
espaciales a travs de las observaciones de parcelas vecinas para modelar una estructura
de correlacin de los trminos de error aleatorio del modelo.
Con muchos hbridos es comn que la variabilidad de los rendimientos asociado a cada uno
de ellos cambie, sobre todo cuando hay uno o ms hbridos ms repetidos por el esquema
de testigos a la par. El problema de heteroscedasticidad en la varianza residual tambin
puede ser considerado con el uso de MLM [2]. La teora de los MLM provee un marco
unificado para la comparacin de modelos alternativos y la seleccin del modelo ms
apropiado entre los ajustados. La precisin de modelos alternativos para analizar los datos


puede ser reflejada por la magnitud de la varianza residual para evaluar la significancia de
diferencias entre genotipos. Se supone que el modelo de mejor ajuste es el que producir
los mejores rankings de genotipo. El objetivo de este trabajo es evaluar el impacto de la
modelacin de la correlacin espacial y heteroscedasticidad en un ensayo comparativo de
rendimiento de maz conducido bajo un DBCA con testigo a la par.

Desarrollo
Se compararon los rendimientos corregidos al 14,5% de humedad de 31 hbridos de maz
bajo un diseo en bloques completos aleatorizados con testigos a la par. Las parcelas
fueron sembradas a una distancia de surco de 0,52 metros en fecha tarda en la zona centro
de la provincia de Crdoba en tres bloques.
Los materiales a evaluar se ubicaron en forma aleatoria dentro de cada bloque intercalando
siempre entre ellos un testigo comn. La presencia de este testigo es la que permiti evaluar
los efectos sistemticos de la calidad del terreno donde se ubican las parcelas
experimentales.
Para evaluar el desempeo de los diferentes hbridos evaluados se utilizaron los siguientes
modelos: 1.DBCA clsico (DBCA). 2.DBCA con varianzas heterogneas (DBAHet). 3.DBCA
con correlacin espacial exponencial y varianzas homogneas (DBCAce). 4.DBCA con
correlacin espacial exponencial y varianzas heterogneas (DBCAceHet).
Para la consideracin de varianzas heterogneas se conformaron tres grupos de hbridos
usando la varianza del testigo (VT), Grupo 1(<0.5*VT), Grupo 2 (0.5*VT 1.5*VT) y Grupo 3
(>1.5*VT). Estos modelos se corrieron en dos situaciones diferentes: Una con el efecto
hbrido como fijo para la comparacin clsica de medias (BLUEs, Best Linear Unbiased
Estimator) y otra con el efecto hbrido como aleatorio para la comparacin de BLUPs (Best
Linear Unbiased Predictors). Para evaluar la concordancia entre las dos alternativas se
compararon los ordenamientos de los hbridos (Top 10) y se calcularon coeficientes de
correlacin lineal de Pearson entre los BLUEs y BLUPs. La comparacin de los modelos se
realiz utilizando el cociente de verosimilitud (LRT, =0.05).
Con los EE estimados en la comparacin de medias se calcularon los cocientes entre los
errores estndares del modelo DBCA con los EE del modelo DBCAHet. Este cociente da
una idea de la reduccin en la cantidad de repeticiones necesarias para obtener igual
precisin que el mejor modelo produce en comparacin con el modelo DBCA clsico. Los
anlisis fueron realizados con el software estadstico InfoStat a travs de su interface con el
software R [3].

El comportamiento del rendimiento del hbrido testigo vara segn la posicin que ocupa en
el terreno y este efecto es similar en los tres bloques. Se observa una fuerte heterogeneidad
dentro de los bloques, siendo la parte intermedia del mismo la de menor rendimiento.
Bloque 1 Bloque 2 Bloque 3
0 5 10 15 20 25 30 35 40 45 50 55 60 65
Posicin
0
2000
4000
6000
8000
10000
12000
R
e
n
d
i
m
i
e
n
t
o

(
k
g
/
h
a
)
Bloque 1 Bloque 2 Bloque 3

Figura 1. Rendimiento del hbrido testigo segn su posicin en el terreno por bloque.



Los criterios de bondad de ajuste (AIC y BIC) y la prueba LRT (Tabla 1 y 2), muestran que el
modelo DBCAceHet provee el mejor ajuste, tanto para los ajustes considerando al hbrido
como fijo o aleatorio (los criterios de bondad de ajuste para los modelos con hbrido como
efecto aleatorio no son presentados). El modelo DBCA clsico fue incapaz de detectar
diferencias significativas entre hbridos (p>0.05), contrariamente al resto de los modelos que
si lograron detectar diferencias. El modelo DBCAceHet presenta menores EE para las
medias ajustadas en comparacin al modelo DBCA clsico y permite una ganancia de
informacin equivalente a la adicin de 1.5 ms repeticiones en el DBCA original. Adems
hubo cambios en el ranking de genotipos superiores sugeridos por ambos modelos. El
testigo, que por la cantidad de repeticiones es el hbrido mejor estimado, aument 3
posiciones en el ranking cuando se ajusta el modelo con correlacin espacial y
heterogeneidad de varianzas.
El coeficiente de correlacin de Pearson entre los BLUEs y los BLUPs obtenidos a partir del
modelo DBCAcehet fue de 0.71, si bien hay una clara correlacin, esta es menor a la
sugerida por Piepho et al., 2006 [4].
Se concluye que el modelo DBCAcehet mejora la estimacin del ranking de hbridos y
tambin permite encontrar diferencias significativas, incorporando variabilidad que en un
DBCA clsico no es considerada.

Tabla 1. Criterio de bondad de ajuste para los modelos ajustados con efecto hbrido fijo.

AIC BIC
1. DBCA 2808,61 2910,97
2. DBCAhet
2773,85 2882,23
3. DBCAce
2713,94 2819,31
4. DBCAcehet
2691,7 2803,09

Tabla 2. Test del cociente de verosimilitud (LRT) basada en los estimadores REML para los
modelos de la tabla 1.
Model df AIC BIC logLik Test L.Ratio p-value
1 34 2808,61 2910,97 -1370,3
2 36 2773,85 2882,23 -1350,92 1 vs 2 38,76 <0,0001
3 35 2713,94 2819,31 -1321,97 2 vs 3 57,91 <0,0001
4 37 2691,7 2803,09 -1308,85 3 vs 4 26,24 <0,0001

Bibliografa
[1] Mariotti, J. A., Jerez, E. F., Mariotti Martnez, J. A., (1997). Efectividad de los diseos
utilizados para el control local de la heterogeneidad en experimentos con variedades de
caa de azcar. Revista Industrial y Agrcola de Tucumn, 74 (1-2), 21-27.
[2] Casanoves, F., Macchiavelli, R., Balzarini, M., (2005). Error variation in multienvironment
Peanut trials: within-trial spatial correlation and betweentrialheterogeneity. Crop Science.
45, 1927-1933.
[3] Di Rienzo, J.A., Casanoves, F., Balzarini, M.G., Gonzalez, L., Tablada, M., Robledo,
C.W., InfoStat versin 2012. Grupo InfoStat, FCA, Universidad Nacional de Crdoba,
Argentina. URL http://www.infostat.com.ar
[4] Piepho, H.P., Mhring, J. (2006). Selection in Cultivar TrialsIs It Ignorable?. Crop
Science, 46(1), 192-201



EFECTO DEL ESTADO FISIOLGICO SOBRE VARIABLES
REPRODUCTIVA EN UNA LINEA MATERNAL DE CONEJOS

FERNNDEZ E.N.
1
, BIRCHMEIER A.
2
, ABBIATI N.N.
3
, MARTINEZ R.D.
1
,
2

1
Ctedra de Mejora y Conservacin de Recursos Zoogenticos, FCA, UNLZ
2
Mejoramiento Gentico Animal, FAUBA
3
Ctedra de Biometra y Diseo Experimental, FCA, UNLZ

ednfer@yahoo.com

RESUMEN
El estado fisiolgico (EF) de la coneja al momento de la monta, constituye un factor
ambiental sistemtico que puede afectar a variables reproductivas y su efecto depende de
las lneas y caracteres considerados. El objetivo de este trabajo es describir este efecto,
sobre caracteres vinculados a la performance reproductiva, en una lnea maternal de
conejos sujeta a un proceso de seleccin por el nmero de gazapos destetados. Los datos
corresponden a la lnea materna A, sujeta a 26 generaciones de seleccin. Se relevaron las
variables: nacidos totales, nacidos vivos, nacidos sanos, y nmero de destetados. Se
consideraron tres estados fisiolgicos, dependiendo si al momento de la monta la coneja es
Nulpara, Lactante o No lactante. Los registros de las conejas fueron resumidos
promediando a nivel generacin. Para describir el efecto del estado fisiolgico en relacin al
proceso de seleccin, se conformaron tres grupos en funcin a la cantidad de generaciones
de seleccin, generaciones iniciales, generaciones intermedias y generaciones finales. Se
emplearon las tcnicas de Anlisis de Componentes Principales y Anlisis Discriminante. Se
observ separacin entre los grupos de generaciones por un lado y entre las Nulparas y el
resto.

Palabras clave: Anlisis de Componentes Principales, Anlisis Discriminante, conejos.

Introduccin
En conejos, el nmero de gazapos al nacimiento y al destete por camada son los criterios de
seleccin ms empleados a los efectos de mejorar la produccin anual por coneja. En
adicin al mrito gentico de los animales existen factores ambientales sistemticos que
afectan a estos caracteres, como el estado fisiolgico (EF) de la coneja al momento de la
monta. El EF en conejas receptivas vara segn las mismas sean nulparas, multparas
lactantes o multparas no lactantes [1]. Su efecto depende de las variables medidas y
tambin del material gentico empleado [2]. El objetivo de este trabajo es describir este
efecto, sobre caracteres vinculados a la performance reproductiva, en una lnea maternal de
conejos sujeta a un proceso de seleccin por el nmero de gazapos destetados.

Desarrollo
Se dispuso de 9500 registros para las variables nacidos totales (NT), nacidos vivos (NV),
nacidos sanos (NS), y nmero de destetados (ND) de la lnea materna A, seleccionada por
este ltimo carcter. Los datos corresponden a 3212 conejas y 26 generaciones de
seleccin. Se consideraron tres estados fisiolgicos de las conejas, dependiendo si al
momento de la monta la coneja es Nulpara (1), Lactante (2) o No lactante (3). Los registros
de las conejas fueron resumidos promediando a nivel generacin a los fines de realizar un
anlisis preliminar basado en datos continuos aproximadamente normales. Para describir el
efecto del estado fisiolgico en relacin al proceso de seleccin, se conformaron tres grupos
en funcin a la cantidad de generaciones de seleccin, generaciones iniciales (GI): primeras
8 generaciones, generaciones intermedias (GM): entre la generacin 9 y la 18 y
generaciones finales (GF): entre la 19 y la generacin 26. A los efectos de explorar la


variabilidad del conjunto de datos resumido, considerando todas las variables se emple
Anlisis de Componentes Principales [3]. Para estudiar la posible interaccin entre los
grupos de generaciones y los estados fisiolgicos, se emplearon anlisis de varianza
individuales con la prueba de ordenamiento de medias de Duncan y Anlisis Discriminante
[4]. El procesamiento de los datos se realiz mediante de los software SAS [5] e InfoStat [6].
Se trabaj con un nivel de significacin del 5%.

En el cuadro 1 figuran los estadsticos descriptivos, segn grupos de generaciones y EF,
para las variables observadas. Se observa que en todas las variables el promedio aumenta
de los EF (1) a (3) en los tres grupos de generaciones. A su vez, las medias de los grupos
de generaciones crecen del GI al GF.

Cuadro 1. Estadsticos descriptivos para NT, NV, NS y ND segn grupos de generaciones y
EF
NT 6,75 (0,42) 7,67 (0,81) 7,74 (1,01) 7,47 (0,63) 8,65 (0,54) 8,97 (0,62) 8,60 (0,33) 9,26 (0,56) 9,84 (0,51)
NV 6,30 (0,49) 7,11 (0,85) 7,25 (1,10) 7,15 (0,57) 8,19 (0,46) 8,39 (0,68) 8,08 (0,35) 8,65 (0,58) 9,06 (0,61)
NS 4,57 (0,91) 4,86 (0,99) 5,19 (1,25) 5,90 (0,60) 6,58 (0,36) 6,60 (0,48) 6,47 (0,69) 6,92 (0,73) 7,16 (0,77)
ND 5,24 (0,66) 5,73 (0,86) 5,94 (0,99) 6,33 (0,46) 7,15 (0,37) 7,26 (0,56) 7,13 (0,33) 7,74 (0,55) 7,91 (0,53)
GM GI GF
Variable
(1) (2) (2) (3) (3) (3) (1) (2) (1)

Todas las variables estn positivamente correlacionadas. En ACP se trabaj con los datos
originales, con dos componentes principales se captur el 99% de la variabilidad de los
datos. La primera componente (94%) es de tamao y aproximadamente da la misma
ponderacin a todas las variables. En cambio la segunda componente contrapone NT y NV
con NS. En el biplot se observa que las generaciones asociadas a No lactantes se
desplazan hacia valores promedios de las variables ms altos, seguidas por las Lactantes y
las Nulparas. Adems, la relacin NS de NT es mayor para Nulparas (grfico 1).

Grfico 1. Biplot de las variables y las generaciones discriminadas segn EF

En el ANVA, no se detect interaccin entre grupos de generaciones y EF para ninguna de
las 4 variables (p>0.05). La prueba de Duncan orden las medias de los grupos de
generaciones en forma ascendente y detect diferencias entre las Nulparas y las
Multparas, no detectndose diferencias entre Lactantes y No lactantes. Los dos primeros
ejes cannicos muestran una discriminacin del 97%. En el primer eje (79% de
discriminacin) tienen mayor incidencia las variables NV y ND contraponindose. En el
segundo eje se contraponen ND y NT. El grfico 2 muestra que el primer eje separa
ordenadamente los grupos de generaciones. El segundo eje evidencia separacin entre las
-6,00 -3,00 0,00 3,00 6,00
CP 1 (94,0%)
-4,00
-2,00
0,00
2,00
4,00
C
P

2

(
4
,
9
%
)
NV
NT
ND
NS
NV
NT
ND
NS
Nulparas
Lactantes
No lactantes


Nulparas y el resto a excepcin de las correspondientes a GP donde se separan No
lactantes del resto.

Grfico 2. Primer plano discriminante segn grupo de generaciones y EF

Este trabajo exploratorio aporta elementos para definir los niveles del EF a considerar
empleando Modelos Lineales Mixtos, donde si se considerar la falta de independencia por
parentesco.

Bibliografa
[1] Theau-Clment, M. (2007). "Preparation of the rabbit doe to insemination: a review".
World Rabbit Sci., 15: 61- 80.
[2] Baselga Izquierdo, M. y Blasco Mateu, A. (1989). Mejora gentica del conejo para la
produccin de carne. Madrid: Ediciones Mundi-Prensa, Espaa.
[3] Cuadras, C. M. (2012). Nuevos Mtodos de Anlisis Multivariante. Barcelona: CMC
Editions, Espaa. Versin obtenida el 18/03/2013
http://www.ub.edu/stat/personal/cuadras/metodos.pdf
[4] Pea, D. (2002). Anlisis de datos multivariantes. Madrid: McGraw-Hill/Interamericana de
Espaa, S. A. U..
[5] SAS Institute Inc. (2009). SAS OnlineDoc 9.2. Cary, NC: SAS Institute Inc., USA.
[6] Di Rienzo, J. A., Casanoves F., Balzarini M. G., Gonzalez L., Tablada M. y Robledo C. W.
(2012). InfoStat versin 2012. Grupo InfoStat, FCA, Universidad Nacional de Crdoba,
Argentina. URL http://www.infostat.com.ar.
-3,77 -1,65 0,46 2,58 4,70
Eje Cannico 1
-3,34
-1,78
-0,23
1,33
2,89
E
j
e

C
a
n
n
i
c
o

2
GI
GM
GF
GI
GM
GF
Nulparas
Lactantes
No lactantes
GI
GM
GF


INTEGRACIN ESPACIAL EN EL MERCADO INTERNACIONAL DE
ACEITE DE SOJA

CORONEL MARIANO
1
, DEPETRIS EDITH
2
, GARCA ARANCIBIA RODRIGO
3

1
Docente JTP Organizacin Industrial, IECAL, FCE-UNL
2
Docente Titular Organizacin Industrial, IECAL, FCE-UNL
3
Docente Profesor Asociado Organizacin Industrial, IECAL, FCE-UNL

mcoronel@fce.unl.edu.ar

RESUMEN
El objetivo del presente trabajo consiste en estudiar la integracin del mercado internacional
de aceite bruto de soja, teniendo como referencia la Ley del Precio nico (LPU). Para el
anlisis se utiliza la metodologa de cointegracin de Johansen, entre el precio FOB de
Argentina, de Brasil y de los Estados Unidos, siendo estos los principales mercados a nivel
mundial. Se trabaja con datos mensuales (1995-2012). Los resultados muestran una
elevada integracin, especialmente entre el precio FOB de Argentina y Brasil, sin embargo,
existe evidencia en contra del cumplimiento de la LPU para el mercado en su conjunto.
Tambin se desprende que el precio FOB de Brasil influye sobre los restantes,
comportndose el primero como lder.

Palabras clave: Complejo Sojero, Ley del Precio nico, Cointegracin.

Introduccin
El complejo productivo de la soja en Argentina ha cobrado enorme relevancia durante la
ltima dcada, tanto por su generacin de divisas y recursos fiscales, como por sus efectos
indirectos sobre la produccin y rentabilidad de los dems bienes agropecuarios.
En el plano internacional, las commodities producidas por dicho complejo gozan de elevados
niveles de competitividad, posibilitando que Argentina sea el principal exportador de harina y
aceite de soja, y el tercero en porotos. Especficamente para el aceite de soja en bruto,
tomando el perodo comprendido entre los aos 2009 y 2012, Argentina posee una
participacin del 48% sobre el valor total de las exportaciones mundiales, seguido por Brasil
con el 18% y Estados Unidos con el 12% (COMTRADE, 2013).
Teniendo en cuenta la funcin que cumple el precio internacional como determinante clave
en la asignacin de recursos, resulta de inters analizar las interrelaciones entre los
diferentes precios que conforman el mercado internacional del aceite bruto de soja.
Lo anterior tiene como trasfondo el funcionamiento de la Ley del Precio nico (LPU), ya que
de cumplirse la misma se observara la igualacin entre los distintos precios. Esta se
sustenta en una serie de supuestos a partir de los cuales, las operaciones de arbitraje
funcionan como mecanismo que asegura la igualdad de precios (Krugman y Obstfeld, 2007).
En este sentido, la intervencin del Estado Argentino en el comercio exterior a partir de
retenciones, sumado a la elevada concentracin de las exportaciones en tan slo tres
pases, ameritan el estudio de esta problemtica.

Desarrollo
Siguiendo a Roldn Casas y Dios-Palomares (2008), la LPU puede ser entendida como una
relacin de equilibrio a largo plazo, representada como:

= =
= | = | = | + + | + | + |
n
i
i
n
i
it i nt n t t t
con P P P P P
1 1
3 3 2 2 1 1
0 , 0 ... (1)



Donde
i
P corresponde al precio FOB en dlares del aceite de soja en bruto, con
Unidos Estados Brasil Argentina i , , = , en el momento t . Este planteo posee la ventaja de
estar directamente relacionado con la teora de la cointegracin. La existencia de
cointegracin entre los diferentes precios internacionales indicara que los mismos
conforman una relacin estable a largo plazo, permitiendo desajustes transitorios respecto al
equilibrio en el corto plazo.
Para estimar (1) se sigue la metodologa de Johansen (1991;1995), la cual contempla la
existencia de mltiples vectores de cointegracin, lo que tiene particular inters en el marco
de la LPU. El cumplimiento de la LPU se corresponde con la existencia de n 1 relaciones
de cointegracin y la verificacin, en cada una de ellas, de la relacin (1, 1) entre los
diferentes pares de series de precios (Roldn Casas y Dios-Palomares, 2008).
Una vez realizadas las pruebas de raz unitaria sobre las variables y determinada la
existencia de cointegracin entre las mismas, se procede a estimar el siguiente modelo de
correccin de errores (VECM):

=

c + A I + H + = A
L
i
t i t i t t
y y v y
1
1
(2)

Donde
t
y A es el vector de las n variables en diferencias; H es un vector de coeficientes
n n ; Ies un vector de coeficientes L n que contiene los parmetros de corto plazo; v es
un vector de constantes 1 n ; y
t
c es el vector de trminos de error 1 n .
Si la matriz H tiene rango reducido ( ) n r < < 0 puede separarse en dos matrices de
dimensin r n , o y | , en donde o| = H . La matriz o contiene los coeficientes de ajuste
a corto plazo, mientras que | contiene los coeficientes de la relacin de cointegracin.
Los precios FOB de aceite bruto de soja para Argentina, Brasil y Estados Unidos, fueron
obtenidos del Sistema Integrado de Informacin Agropecuaria, dependiente del Ministerio de
Agricultura, Ganadera y Pesca de la Nacin. Los mismos se encuentran en frecuencia
mensual y expresados en logaritmo neperiano, abarcando el perodo que va desde el mes
de octubre de 1995 hasta el mes de julio de 2012, contabilizando en total 202
observaciones.

Los contrastes de raz unitaria sobre cada una de las series indican que las mismas son
integradas de orden 1, condicin necesaria para la existencia de cointegracin. Antes de
realizar las pruebas de cointegracin es preciso determinar la estructura ptima de rezagos
a incluir en el modelo de correccin de errores. Las pruebas realizadas para esto ltimo
indican la inclusin de 2 rezagos
1
. Tanto el test de la traza como el del autovalor mximo
permiten concluir que existen 2 relaciones de cointegracin, con lo que se cumple la
condicin necesaria de existencia de n 1 vectores de cointegracin
2
.
Ahora bien, para que se cumpla la LPU se debe dar que, en cada una de las dos ecuaciones
de cointegracin, se acepten de manera simultnea relaciones de la forma (1, 1) entre las
diferentes parejas de series de precios. El valor calculado del test ( ) 879 , 6
2
= _ con un p-
valor de 0,032 indica que la hiptesis nula de cumplimiento de la restriccin impuesta por la
LPU puede ser rechazada al 10% y 5%, pero no al 1%. El cuadro 1 muestra la estimacin de
los parmetros de largo plazo. Del mismo se observa que existira una integracin perfecta
entre el precio FOB de Brasil y el de Argentina, no as entre el de Argentina y los Estados
Unidos.

1
Luego de la estimacin del modelo y ante la presencia de autocorrelacin, se incluyen 5 rezagos.
2
Por razones de espacio no son incluidas las tablas de las correspondientes pruebas, pudiendo ser solicitadas al
autor.


Cuadro 1. Relaciones de cointegracin
VARIABLES
Precio
FOB USA
Precio
FOB Brasil
Precio
FOB
Argentina
1
CE 1 0
-0,854***
(0,04866)
2
CE 0 1
-1,001***
(0,00858)
Nota: ***,**,* significativo al 1%, 5%, y 10% respectivamente
Errores estndar entre parntesis

Adicionalmente, el cuadro 2 muestra los contrastes de exogeneidad dbil de las tres series
de precios, a partir del cual el precio FOB de Brasil aparece como el nico dbilmente
exgeno, es decir, el precio FOB de Brasil influye en el resto de los precios.

Cuadro 2. Constrastes de Exogeneidad Dbil
VARIABLES
Precio
FOB USA
Precio
FOB Brasil
Precio
FOB
Argentina
) 2 (
2
_ 8,183 1,685 6,092
p-valor 0,017 0,431 0,048

De lo anterior puede concluirse que: i) existe un elevado nivel de integracin en el mercado
internacional de aceite bruto de soja, en especial entre Argentina y Brasil, aunque no puede
aceptarse el cumplimiento de la LPU entre los tres precios, ii) aunque Argentina es el
principal exportador el liderazgo en el mercado internacional del aceite bruto de soja estara
dado por Brasil.

Bibliografa
Johansen, S. (1995) "Likelihood-based Inference in Cointegrated Vector Autoregressive
Models" Oxford University Press, Oxford.
Johansen, S. (1991) "Estimation and Hypothesis Testing of Cointegration Vectors in
Gaussian Vector Autoregressive Models" Econometrica, Vol(59): 1551-1580.
Krugman, P. y Obstfel, M. (2007), Economa internacional: teora y poltica, Pearson
Educacin, Madrid.
Roldan Casas, J.A. y Dios-Palomares, R. (2008) "Ley de Precio nico en el Mercado
Espaol de Aceite de Oliva" Economa Agraria y Recursos Naturales, Vol(8): 37-55.
United Nations Commodity Trade Statistics Database (2013) http://comtrade.un.org/


EVALUACIN DE TERNEZA MUSCULAR EN BOVINOS
EMPLEANDO LOS MTODOS TRADICIONAL Y PICROSIRIUS RED

BLANCO M.R.
1
, ABBIATI N.N.
2
, ROVEGNO M.S.
2
, MAROTTA P.
1

1
Ctedra de Anatoma, Facultad de Ciencias Agrarias, UNLZ
2
Ctedra de Biometra y Diseo Experimental, Facultad de Ciencias Agrarias, UNLZ

norabbi2000@yahoo.com.ar

RESUMEN
La terneza es una caracterstica de importancia econmica y depende de muchos factores
que la hacen altamente variable. El mtodo ms utilizado es el de Warner-Bratzler (WB). Las
fibras que contienen colgeno de tipo I (fibras colgenas) y aquellas ricas en colgeno de
tipo III (fibras reticulares) son las mayores componente del tejido conectivo intramuscular
(TCI). Un elevado contenido de las mismas afecta la terneza. Un mtodo adecuado para
efectuar las determinaciones de los porcentajes de fibras es el histolgico de Picrosirius red.
Hay marcadas diferencias en tipo y cantidad de fibras en el TCI entre diferentes msculos
de un animal y entre animales, que influyen en la calidad y dependen de factores como
ubicacin corporal, edad sexo y raza. El objetivo de este trabajo fue estudiar la terneza de
los msculos Largo dorsal y Glteo medio para dos categoras bovinas de una cruza,
mediante las tcnicas de WB y picrosirius red. Se dispuso de una muestra de 16 machos
castrados de la cruza Angus x Mestizo y se evaluaron dos categoras bovinas: novillitos y
novillos. Se obtuvieron los cortes carniceros Largo dorsal y Glteo medio en frigorfico y
fueron posteriormente evaluados mediante la tcnica WB y de Picrosirius red modificado
(porcentaje de fibras colgenas y de fibras reticulares). Para el anlisis estadstico se
emplearon Anlisis de Correlaciones, de Componentes Principales y Discriminante. El
mayor porcentaje de fibras colgenas promedio se dan en G con relacin a L. Por otro lado,
el anlisis multivariado de los datos permiti detectar un comportamiento diferencial segn
categora y msculo de las tres formas de medir terneza. Con relacin a L, se observ una
alta correlacin entre WB y el porcentaje de Fibras Colgenas. En cambio para G se detect
una alta correlacin negativa entre los porcentajes de Fibras Reticulares y Colgenas.

Palabras clave: anlisis de componentes principales, anlisis discriminante, terneza
muscular, bovinos de carne.

Introduccin
La terneza es una caracterstica de gran importancia econmica, debido a que incide en la
reiteracin de compra de la carne por parte de los consumidores. Depende de muchos
factores que actan en forma aislada y/o combinada, lo que la hace altamente variable. A
diferencia de otros fenotipos detectables en el animal vivo, la terneza no es verificable hasta
despus de la faena y por lo tanto, el acceso a una metodologa de seleccin de
reproductores por medio de marcadores, provee a los criadores de una herramienta que
proporciona criterios de seleccin objetivos, sin tener que esperar a la faena del animal o a
la de obtener su descendencia, para saber si transmiti esta caracterstica. El mtodo
objetivo ms utilizado internacionalmente, es el de determinacin del esfuerzo de corte (en
Kg) con una cizalla de Warner-Bratzler (WB): a mayor valor de fuerza de corte, menor
terneza. Este mtodo es muy cuestionado y los resultados obtenidos muy contradictorios. El
colgeno es el principal responsable de la terneza de base de la carne, que despus va a
estar afectada por la maduracin; ste vara mucho de un msculo a otro. Las fibras que
contienen colgeno de tipo I (fibras colgenas) y aquellas ricas en colgeno de tipo III (fibras
reticulares) son el mayor componente del tejido conectivo intramuscular (TCI). Un elevado
contenido de las mismas afecta la terneza as como tambin el valor biolgico de la protena


crnica [1]. Estudios histolgicos que evalen al TCI y lo relacionen con la terneza de la
carne son muy escasos. El conocimiento in vivo o post mortem de la proporcin de fibras
colgenas y reticulares del TCI puede ser una medida posible para inferir la terneza de la
carne y/o reducir su variabilidad. Un mtodo adecuado para efectuar estas determinaciones
es el histolgico de Picrosirius red modificado [2]. Hay marcadas diferencias en tipo y
cantidad de fibras en el TCI en diferentes msculos de un animal y entre animales, que
influyen en la calidad y dependen de factores como ubicacin corporal, edad y raza [3]. El
objetivo de este trabajo fue estudiar la terneza de los msculos Largo dorsal y Glteo medio
para dos categoras bovinas de una cruza, mediante las tcnicas de WB y Picrosirius red.

Desarrollo
Se dispuso de una muestra de 16 machos (castrados) de la cruza Angus x Mestizo cara
blanca, criados y alimentados sobre una pastura natural. Se evaluaron dos categoras
bovinas: 8 novillitos (NT) de 2 aos y 8 novillos (N) de 3 aos de edad. Los cortes carniceros
Largo dorsal (L) y Glteo medio (G) de los animales trazados fueron obtenidos en un
frigorfico y posteriormente evaluados mediante la tcnica WB y de Picrosirius red
modificado (% de fibras colgenas y de fibras reticulares). Asociadas a cada animal, se
conformaron 6 variables: terneza medida por WB en L y en G (WB_L, WB_G), terneza
medida por % de fibras colgenas en L y en G ( FC_L, FC_G) y terneza medida por % de
fibras reticulares en L y en G ( FR_L, FR_G). Para el anlisis estadstico, en la parte
descriptiva se emple Anlisis de Componentes Principales (ACP) [4] y en la parte
inferencial Anlisis de Correlaciones y Anlisis discriminante (AD) con seleccin de variables
mediante el mtodo stepwise con un nivel de significacin tanto de entrada como de
permanencia de las variables del 15%. Se emple la tasa de error por mala clasificacin de
validacin cruzada [5]. En las pruebas de hiptesis se trabaj con un nivel de significacin
del 5%. Se utilizaron los software InfoStat y SAS, [6] y [7].

En el cuadro 1 se presentan estadsticos descriptivos para las variables segn categora.
Para G se detect correlacin entre los % de Fibras Reticulares y Colgenas (r = -0.7794;
valor p = 0.0004). En cambio, para L se detect correlacin entre la Terneza empleando WB
y los % de Fibras Colgenas (r = 0.5355; valor p = 0.0326). Adems, se detectaron
correlaciones entre los % de Fibras Reticulares de G y los % de Colgenas de L (r = -
0.7238; valor p = 0.0015); entre FC_L, FC_G (r = 0.7384; valor p = 0.0011) y entre FC_G y
WB_L (r = 0.5859; valor p = 0.0171). En ACP se trabaj con datos estandarizados, con dos
componentes principales se captur el 70% de la variabilidad de los datos. La primera
componente (52%) se relaciona positivamente con FC_G, FC_L y WB_L que se
contraponen con FR_G. En cambio la segunda componente contrapone WB_G y FR_L. En
el biplot se observa que permite una separacin de las categoras (grfico 1).

Cuadro 1: Medias y desvos estndares para las variables segn categora

Con relacin al anlisis discriminante, donde la variable de agrupamiento fue la categora, la
prueba Chi Cuadrado empleando todas las variables no detect heterogeneidad de
varianzas (_
2
= 21.530629, valor P = 0.4270), con lo cual se emple discriminacin lineal. El
mtodo stepwise seleccion las variables FC_G, FR_L y WB_G. Se utiliz discriminacin
Categora Variable Media D.E. Categora Variable Media D.E.
NT FR_G 8,31 0,83 N FR_G 6,95 0,47
NT FC_G 12,46 0,32 N FC_G 14,19 0,29
NT WB_G 38,45 13,59 N WB_G 47,04 12,73
NT FR_L 6,78 0,48 N FR_L 6,28 0,29
NT FC_L 10,50 0,88 N FC_L 11,79 0,53
NT WB L 27,05 6,51 N WB L 36,12 8,38


lineal y la tasa de error por mala clasificacin fue del 0%. El grfico de la caja del eje
cannico muestra la separacin entre ambas categoras (Grfico 2).

La posicin anatmica de los msculos determina el contenido de colgeno, ya que los
msculos ms activos y/o involucrados en los movimientos contienen, naturalmente, la
mayora del tejido conectivo. Las piernas de los animales se hallan ms involucrados en el
movimiento y los msculos del lomo en la espalda son usados primordialmente para
sostener la estructura esqueletal del animal. Por lo tanto, es lgico que el mayor porcentaje
de fibras colgenas promedio se den en G que en L. Por otro lado, el anlisis multivariado
de los datos permiti detectar un comportamiento diferencial segn categora y msculo de
las tres formas de medir terneza. Tanto en ACP como en AD, las variables medidas (o un
subconjunto de ellas) mostraron diferencias entre NT y N. Con relacin a L, se observ una
correlacin entre WB y el % de Fibras Colgenas. En cambio para G se detect una
correlacin negativa entre los % de Fibras Reticulares y Colgenas.
A futuro resta realizar un anlisis de comparacin de medias empleando un arreglo factorial
de categoras y cortes, empleando modelos mixtos para contemplar las correlaciones
existentes entre tipos de medicin de terneza y los cortes de un mismo animal.

Bibliografa
[1] Bosselmann, A., Mller, C., Steinhart, H., Kirchgessner y M., Schwarz, F. J. (1995).
Pyridinoline cross-links in bovine muscle collagen. Journal of Food Science, 60(5): 953-
958.
[2] Montes, G.S. (1996). Structural biology of the fibres on the collagenous and elastic
system. Cell Biology Int., 20(1): 15-27.
[3] Blanco, M. R. y Alonso C. R. (2007). Collagen. Type I and III in bovine muscles.
Archivos de Zootecnia, 56(214): 253-257.
[4] Cuadras, C. M. (2012). Nuevos Mtodos de Anlisis Multivariante. Barcelona: CMC
Editions, Espaa. Versin obtenida el 18/03/2013
http://www.ub.edu/stat/personal/cuadras/metodos.pdf
[5] Pea, D. (2002). Anlisis de datos multivariantes. Madrid: McGraw-Hill/Interamericana de
Espaa, S. A. U..
-4,00 -2,00 0,00 2,00 4,00
CP 1 (52,0%)
-4,00
-2,00
0,00
2,00
4,00
C
P

2

(
1
7
,
7
%
)
FR_G
FC_G
WB_G
FR_L
FC_L
WB_L
FR_G
FC_G
WB_G
FR_L
FC_L
WB_L
NT
N
Grfico 1. Biplot de las variables y los bovinos
discriminados segn categoras.
Grfico 2. Box-Plot del eje cannico segn
categoras.
N NT
-5,00
-2,25
0,50
3,25
6,00
E
j
e

C
a
n
n
i
c
o
N NT


MORPHOLOGYCAL INDEX TO ASSESS THE EFFECT OF
CHROMIUM IN Hansenula spp. CULTURES

M. CRISTINA ROMERO*
1
, M. INS URRUTIA
2
, ROMINA DELLA VEDOVA
1

& ENSO H. REINOSO
1

1
Facultad de Cs Veterinarias, Ct. de Micologa Mdica e Industrial,
2
Facultad de Ciencias
Agrarias y Forestales, calle 60 y 119, s/ n - Universidad Nacional de La Plata, 1900 La
Plata, ARGENTINA.

cmriar@yahoo.com.ar or urrutia@cespi.unlp.edu.ar

ABSTRACT
Fungi transform heavy metals by producing changes of the inorganic ions, reduction,
sequestration and intra or extrecellular binding. Hexavalent chromium is toxic, mutagenic and
in-vitro studies have shown inhibition of Na
+
/K
+
, ATP-ases, acid and alkaline phosphatases
and affect the cell morphology. The yeast dimorphism is a well know phenomenon and
usually is determined by environmental factors and culture conditions. Therefore, the aim of
this study was to estimate the yeast dimorphism by a relationship between the changes of
the cell yeast types and the fluctuation of the adverse factor of the cultural or environmental
habitat. Hansenula spp. was isolated from polluted areas and cultured with hexavalent
chromium, with n-hexadecane as carbon source. Extremes morphologycal forms were cell
yeast and mycelia, and a morphology index, Mi, was established by studing the variations of
Hansenula spp. cell parameters. The variations of maximum cell length (l), maximum cell
diameter (d) and septal diameter (s) fitted to the empirical equation Mi = 2.10 + 1.10 log
10
(ls /
d
2
), obtaining the intercept and the slope with the data. Mi were around 1 for yeast spherical
cells or 4 for large hyphal ones, with pseudohyphae or elongated cells giving intermediate
values, 2 or 3. This index allowed us to quantify morphological changes in relation to
hexavalent chromium concentrations. The graphic obtained from the cultures with different
Cr
6+
levels, revealed the formation of a population, with a Mi value around 3, that appeared
when Cr
6+
, temperature, pH, xenobiotics presence and other adverse factors appeared in the
medium.

Keywords: dimorphism, environmental index, hexavalent chromium, morphological
patterns, yeasts

Introduction
All fungi have some capacity to grow in two basic morphological forms - spheres and tubes -
therefore it could be argued that they are all, to some extent, dimorphic. For many
filamentous fungi spherical growth may only be expressed during the formation of spores and
many yeast-like fungi have only the remnants of a true filamentous growth habit [1,6].
However, the many shapes and forms found among the 64 000 recognized species of fungi
are by and large generated by employing these two basic patterns of cell wall expansion [2].
Moreover, the presence of pollutants, as heavy metals increase the dimorphic development
in yeasts; and as the distribution of morphologycal types are in relation with different
environmental conditions, so they can be used as pollution indication [3]. By relating the
maximum lenght, maximum and septal diameters of cells in a mathematical model, a
morphology index, Mi, was established. So, the Mi for Hansenula spp. were obtained to
quantify the dimorphic transition under different chromium concentrations, us an


environmental pollution index.

Materials and methods
The yeast was isolated from polluted sediments, and cultured in mineral liquid medium with 1
% n-hexadecane as carbon source and 5 chromium levels (0, 10, 40, 80 and 120 ppm).
To quantify the dimorphic process in each metal concentration, the morphology index (Mi) in
terms of the relationship between the maximum cell length (l), maximum cell diameter (d)
and septal diameter (s) led to the equation Mi = 2.10 + 1.10 log
10
(ls / d
2
). The intercept and
slope were such that Mi was around 1 for yeast spherical cells or 4 for larged hyphae, and
pseudohyphae or elangated cells gave intermediate values, 2 or 3. This discriminatory factor
was used to quantify morphological population mixtures through Mi histograms.

Results
The dimorphic fungi are taken to represent those organisms in which the equilibrium between
polarized and spherical growth was such that vegetative growth occured in either hyphal or
budding mode according to environmental conditions. The term dimorphism is a misnomer
since many of the so-called dimorphic fungi produce a variety of cell forms and therefore are
really polymorphic.
In Hansenula spp. cultures with chromium, morphologycal extremes were the yeast-like (Y)
phase and the mycelial (M) form, with transitional cells like elongated structures, yeast-like
chains or undefined structures occured at intermediate Cr
6+
levels. During the induced
transition due to the different cultural factors, such as the presence of hexavalent chromium,
mean Mi varied linearly with Cr
6+
concentrations, suggesting a that the process depended of
the metal levels.
Others cultural features like temperature, pH, higer pressure, n-heptadecane, pyrene and
others organic xenobiotics presence determined the development of mixed populations, so
the use of Mi alone could led to a misleading, as this index was also obtained with other
adverse cultural factors. To enhance the Mi relation with the yeast morphology, graphics
obtained from the experimental data were plotted and them clearly separated each cell types
into groups of different Mi values.
To quantified the Y M transition in Hansenula spp. assays with chromium values,
histograms were prepared from the asssays, and revealed the formation of an intermediate
population with Mi value between 2 and 3, followed by the appearance of a third population
of true hyphal structures, Mi closer to 4. This process coincided when yeast to hyphal
development starts 1 day after the Cr
6+
changes, with the formation of mycelial buds or
primary hyphae which were thicker and shorter than typical one (Mi between 2 and 3).
Others authors [1] used the logarithm of the relation Mr = ls / d
2
to calculate the dimorphic
transition in C. albicans, and demonstrated the shape fluctuations with other fungi.
Mathematical approaches to fungal and plant cell enlargement had also been proposed by
other researches [4,5] by means of governing equations that describe the relevant physical
processes in terms of biophysical and biomechanical parameters which were controlled by
relevant biological processes.
In conclusion, the morphology index Mi and histograms provided an objetive estimation of
morphology and dimorphism in Hansenula spp. cultured in heavy metal presence.

References
|1| Merson-Davies, L.A. & Odds, F.C. (1989) A morphology index for the characterization of
cell shape in Candida albicans. J. Gen. Microbiol. 135: 3143-3152.
|2| Ortega, J.K.E. (1990) Governing equations for cell growth. Physiol. Plant 79: 116-121.
|3| Ortega, J.K.E., Smith, M.E. & Espinosa, M.A. (1995) Cell wall extension behavior of
Phycomyces sporangiophores during the pressure response. Biophys J. 68, 702-707.
[4] Romero, MC, Urrutia, MI, Reinoso, EH & Moreno Kiernan, M (2010). Benzo|a|pyrene
degradation by soil filamentous fungi. J. Yeast Fungi Research vol 1,
http://www.academicjournals.org/JYFR.


[5] Romero, MC; Reinoso, EH; Urrutia, MI & Moreno Kiernan, A. (2011). Effects of the
sorption/desorption process on the fluoranthene degradation by wild strains of Hansenula
angusta and Rhodotorula minuta. Inter. Res. J. Microbiology vol 2 (7): 230-236. -
http://www.interesjournals.org/IRJM
[6] N.A.R. Gow, The Growing Fungus. (1995).G.M. Gadd (ed), Springer Netherlands, pp
403-422



ESTUDIOS MORFOMTRICOS EN MIMOSA DIVERSIPILA
(MIMOSOIDEAE, LEGUMINOSAE)

ARENAS LUIS
1
, MORALES MATAS
2

1
Facultad de Economa y Administracin, Universidad del Comahue, Neuqun, Argentina.
2
Facultad de Agronoma y Ciencias Agroalimentarias, Universidad de Morn, Morn,
Argentina. CONICET, Argentina.

luis.arenas@faea.uncoma.edu.ar

RESUMEN
En este trabajo se describe la variabilidad morfolgica en M. diversipila. Esta especie
comprende dos variedades que fueron distinguidas por medio del indumento [1]: M.
diversipila var. diversipila y M. diversipila var. subglabriseta. Sin embargo, se encontraron
problemas para identificar las variedades propuestas en [1]. Adems, se encontr una alta
variacin dentro de la especie en caracteres cuantitativos. El objetivo de este trabajo fue
lograr una adecuada clasificacin de las variedades en M. diversipila mediante el estudio de
los caracteres morfolgicos cuantitativos, utilizando individuos de distintas procedencias en
el rea de distribucin de la especie. Utilizando diversas tcnicas estadsticas multivariadas
se pudo observar que los caracteres cuantitativos podran ser de utilidad para identificar las
variedades. Para clasificar los especmenes se aplicaron rboles jerrquicos, como as
tambin dos tcnicas de rboles no jerrquicos: particionamiento K-Means y
particionamiento alrededor de medoides (PAM). Luego se compararon los resultados
arrojados por las tcnicas anteriores con los obtenidos mediante Anlisis de Variables
Cannicas (AVC) y el test de Anlisis de Variancia Multivariado no paramtrico
(npMANOVA). La metodologa utilizada ha posibilitado identificar patrones de agrupamiento
y diferencias significativas entre individuos a nivel infraespecfico.

Palabras clave: rboles jerrquicos y no jerrquicos, anlisis de variables cannicas,
manova no paramtrico, Mimosa diversipila, estudio morfomtrico

Introduccin
Mimosa diversipila es una especie dentro de la Seccin Mimosa Subserie Brevipedes, que
se diferencia bien del resto de las especies de Mimosa por varios caracteres morfolgicos,
en particular, el hbito de crecimiento, tipo de inflorescencia y pubescencia. Sin embargo,
esta especie presenta una elevada variabilidad morfolgica en algunos caracteres: los
cualitativos son bastante estables pero los caracteres cuantitativos, en especial los
vegetativos son muy variables entre individuos. Barneby [1] propuso dos variedades dentro
de M. diversipila:
- M. diversipila var. diversipila, con indumento de pelos plumosos.
- M. diversipila var. subglabriseta, con indumento de pelos simples o escabrosos.
En trabajos anteriores [2], se observaron algunos especmenes con pubescencia intermedia
entre las variedades, lo cual hara pensar que deberan ser considerados como una variedad
diferente o un posible hbrido entre las mismas. Adems de la variacin en el tipo de
indumento, se encontr cierta relacin con algunos caracteres cuantitativos. El objetivo de
este trabajo fue dilucidar el conflicto taxonmico existente e identificar las variedades en M.
diversipila mediante el estudio de los caracteres morfolgicos cuantitativos de individuos de
esta especie, procedentes de localidades en toda su rea de distribucin. Se compararon
las siguientes hiptesis:
- Existen dos entidades taxonmicas: 1) M. diversipila var. diversipila; 2) M. diversipila
var. subglabriseta


- Existen tres entidades taxonmicas: 1) M. diversipila var. Diversipila; 2) M. diversipila
var. Subglabriseta; 3) hbridos entre ambas o una variedad nueva.
El conjunto de datos analizado contiene 74 individuos a los que se midieron diversos
caracteres morfolgicos cualitativos y cuantitativos. Sobre este conjunto de especmenes se
realizaron las siguientes tareas [2]:
1. Se identificaron todos los ejemplares siguiendo la propuesta de Barneby [1]. En
consecuencia, quedaron 3 grupos formados: diversipila, subglabriseta, posibles hbridos.
2. Se estudi el agrupamiento de los especmenes de acuerdo con los caracteres tanto
cualitativos como cuantitativos, mediante anlisis de coordenadas principales sobre una
matriz de distancias calculadas con el ndice de similaridad de Gower.

Desarrollo
El punto de partida del anlisis consisti en estandarizar las variables cuantitativas y generar
una matriz de distancias eucldeas entre especmenes. Luego se aplic la siguiente
metodologa:
1. Se utiliz agrupamiento jerrquico para clasificar los especmenes
a. Mediante correlacin cofentica y distancias matriciales de Gower se seleccion el
mejor mtodo de encadenamiento: mnimo, mximo, UPGMA, Ward.
b. En el cluster seleccionado, se determin la particin optima con tres criterios de puntos
de corte: grficas de niveles de fusin, grficas de ancho de silueta y comparacin
entre matriz de distancias y matrices representando particiones (correlacin Mantel).
2. Se aplicaron dos tcnicas de agrupamiento no jerrquico: particionamiento K-Means y
particionamiento alrededor de medoides (PAM) [3,4,6] y se compararon las particiones
obtenidas con la dada por el agrupamiento jerrquico.
3. Para finalizar, se aplicaron el test de anlisis de variancia multivariado no paramtrico
(npMANOVA) [7] y el anlisis de variables cannicas (AVC) [5]. Estos resultados se
compararon con el anlisis de clusters.

Entre los mtodos de encadenamiento utilizados, result mejor el UPGMA. La configuracin
final del dendograma, se obtuvo comparando particiones de 2, 3 y hasta 9 grupos mediante
las grficas de siluetas, las grficas de fusin y la correlacin Mantel. El anlisis realizado
permiti seleccionar una particin final de cinco grupos; con esta cantidad se obtiene un
ancho promedio de silueta razonable y los grupos obtenidos tienen sentido: El grupo 1:
diversipila y el grupo 3: especmenes hbridos y subglabriseta.

En la tcnica K-means el ndice SSI (Simple Structure Index) [3] seal que el nmero
ptimo de grupos es 6. La conformacin de estos grupos no coincide con la del dendograma
UPGMA, sin embargo, se llega a una conclusin similar: los especmenes de M. diversipila
var. subglabriseta e hbridos forman un mismo grupo, mientras que los especmenes de M.


diversipila var. diversipila quedan clasificados en otro grupo. En el particionamiento
alrededor de Medoids (PAM), segn el ancho promedio de silueta, se obtiene un
agrupamiento razonable con 4 grupos. Podemos afirmar que los grupos no coinciden con los
UPGMA, ni con los K-Means pero se llega a una conclusin similar en cuanto a la
conformacin de los grupos.
Los promedios de ancho de silueta, permiten una comparacin de los agrupamientos
obtenidos por UPGMA, K-Means y PAM. En funcin de est indicador (UPGMA=0.25; K-
Means=0.11; PAM=0.15), el mtodo jerrquico de clasificacin con encadenamiento
UPGMA tiene la mejor performance, mientras que K-Means es el que tiene la peor. Los
grupos formados por UPGMA, estaran mejor definidos que los proporcionados por los otros
mtodos.
En el biplot obtenido por el anlisis de variables cannicas (CVA) [5] se pueden efectuar las
siguientes observaciones (no se presenta aqu el biplot por razones de espacio):
Quedan determinados dos agrupamientos. A la derecha, los especmenes hbridos y
subglabriseta, mientras que a la izquierda se concentran especmenes diversipila
Las variables que mejor discriminan a los grupos son: nmero de hojas, hoja/segmento,
segmento interfoliolar/raquis, ancho de hoja, longitud de hoja.
El test npMANOVA permite hallar diferencias entre las medias de grupos definidos a priori
[7]. El test global result altamente significativo (P=0.0001). Las comparaciones a posteriori
sealan diferencias entre las variedades diversipila y subglabriseta e hbridos (P=0.0001) y
no se observan diferencias entre especmenes hbridos y subglabriseta (P=0.7899).
Finalmente podemos decir que la metodologa utilizada ha posibilitado dar algunas
respuestas a las hiptesis planteadas al inicio del trabajo:
- Los tres mtodos de clasificacin usados: UPGMA, clasificacin no jerrquica K-Mean y
Medoids (PAM) resultaron coincidentes en cuanto a que los especmenes de la variedad
subglabriseta y los posibles hbridos conforman un nico grupo. Estos especmenes no
son diferenciables entre s, es decir que podran asociarse a la misma variedad.
- En contraste, los tres mtodos colocaron en grupos diferentes a los especmenes
diversipila y los subglabriseta e hbridos, es decir: existen dos variedades: diversipila
y subglabriseta.
- El Anlisis de variables cannicas (CVA) y el test npMANOVA, arrojan resultados
coincidentes con los obtenidos mediantes los mtodos de clasificacin.

Bibliografa
[1] Barneby, R. (1991). Sensitivae Censitae: A description of the genus Mimosa Linnaeus
(Mimosaceae) in the New World. Memoirs of New York Botanical Garden 65: 1835.
[2] Luna-Castro, J.; Morales, M.; Fortunato, R., (2012). Mimosa diversipila var. subglabriseta
(Fabaceae), a new record for the flora of Paraguay. Boletn de la Sociedad Argentina de
Botnica 47(3-4): 457460.
[3] Borcard, D.; Gillet, F.; Legendre, P. (2011), Numerical Ecology with R. Springer New
York, USA.
[4] Legendre, P.; Legendre, L. (1998); Numerical Ecology. Second English Edition. Elsevier
Science B.V. Holanda.
[5] Huberty, C.; Olejnik, S. (2006); Applied MANOVA and Discriminant Analysis. Second
Edition. John Wiley & Sons, Inc., Hoboken, New Jersey. USA.
[6] Kaufman, L.; Rousseeuw, P. (2005); Finding Groups in Data. An Introduction to Cluster
Analysis. John Wiley & Sons, Inc., Hoboken, New Jersey. USA.
[7] Anderson, M. (2001). A new method for non-parametric multivariate analysis of variance.
Austral Ecology Vol. 26, 3246.


MODELLING in-vitro GROWTH OF FILAMENTOUS FUNGI IN
PHENANTHRENE PRESENCE

M. CRISTINA ROMERO
1
, M. INS URRUTIA
2
, FRANCISCO J. REYNALDI
1

& ENSO H. REINOSO
1

1
Facultad de Ciencias Veterinarias,
2
Facultad de Ciencias Agrarias y Forestales, calle 60 y
119, UNLP, 1900 La Plata, ARGENTINA

cmriar@yahoo.com.ar or urrutia@cespi.unlp.edu.ar

ABSTRACT
Cellular aggregation and pellets formation in Fusarium solani cultures were increased by
polycyclic aromatic hydrocarbon presence, as sole carbon source. In phenanthrene flasks,
two pellet sub-populations were found; moreover, dissolved oxygen levels as well as
phenanthrene determined the pellet stability. The hyphal growth and the biofloculants
excretion incremented the cell wall hydrophobic. Hyphae brought together by adhesive
forces stimulated by phenanthrene particles, us this compound is an adverse factor that
required enzymatic adaptation. The Power model was developed based on the rheology
properties to predict the size of the pellets formed in fungal cultures in the presence of
aromatic hydrocarbons. Further the model was validated by studying the effect of various
parameters on the cellular aggregation and pellet size such as viscosity, temperature, share
rate, surface/interfacial tension, density difference between pellet forming and cultural
components. Cellular aggregation and pellets were prepared in assays with different
phenanthrene levels. The Power law model successfully predicted the cellular aggregation
that led to pellets in in-vitro cultures. Bioaugmentation is a remediation strategy that required
the inoculums production of fungi able to degrade aromatic hydrocarbons; and especially
useful in hydrodynamic optimization and computational fluid simulation with different
industrial applications.

Keywords: cellular aggregation, filamentous fungi, pellets, phenanthrene, mathematical
model, morphology

Introduction
Control of mycelial morphology is often a prerequisite for industrial application, as in the case
of Penicillium chrysogenum and Aspergillus niger to produce penicillin and citric acid,
respectively. The factors influencing cellular aggregation are inoculum size, age,
bioflocculants, polymers biosysthesis, surfactants and chelators presence, temperature,
medium composition and viscosity. It is difficult to define the mechanism for pellets formation,
and often more than one parameter is the adjusted variable.
A number of process parameters, such as inoculums conditions, growth rate, medium
composition, dissolved oxygen level in the assay and mixing intensity affect cell morphology
and consequently have a profound influence on the culture rheology, which, was responsible
for mass, heat and other parameters variations during in-vitro culture.
Mixing and aeration supplied oxygen to the fungi and removed carbon dioxide, and cooling,
which leads away the metabolic heat, having a strong influence on the productivity and
efficiency of the entire process [1,2].
Different mathematical models expressed the fungal growth depending on the factors that
dominated the culture, most of them showed Newtonian behaviour, but others responded to
the Power, Herschel-Bulkley, Bingham or Casson model [3,4]. The aim of this study was to
evaluate the Power law to predict the pellets size formed in fungal cultures in the presence of
aromatic hydrocarbons in relation with the parameters that affected the cellular aggregation.


Materials and methods
Filamentous fungi were isolated from sediments of the YPF-Refinery effluents, La Plata,
Argentina, in a agar-mineral medium with phenanthrene as sole carbon source, with 0, 25,
50 75, 100, 150, 200 and 250 g/l phenanthrene. The fungi was cultured in the same liquid
medium, to evaluate the mycelial pellet formation with and without (control flask)
hydrocarbon. Pellet size was analyzed by sieving mycelial flocs, bore sizes 0.2, 0.5, 0.8, 1.0,
1.4, 1.6, 2.0 m.
The Power law model was applied to describe the relationship between the shear
rates and the pellet sizes; this model characterized the flow properties of a fluid culture to
perform the mycelial aggregation. The Power model is expressed as: = K .
n

where:
shear stress () was the force required to move a given area of the fluid culture (Newtons /
m
2
, also known as Pascal); the constant (K) termed as the consistency index served as a
viscosity index of the system; shear rates () was defined as the rate of movement and was
measured in reciprocal seconds (1/s) and the factor, n, was the flow behavior index which
indicates the tendency of the fluid to shear thin.
Viscosity (K) had been defined as the ratio of shear stress over shear rate, so the units are
Newton seconds / m
2
or Pascal seconds. To obtain the tendency of a fluid culture to form
mycelial plellets at different phenanthene concentrations, temperature (15-25C) and shear
rate (1-1000/s), simple correlations were developed.

Results and discussion
Fusarium solani formed spherical pellets of varying sizes in phenanthrene presence. At low
inoculum sizes (10
6
spores/ m
3
), most of the pellets were larger than 2mm, the cellular yield
was 0.3-0.6 g dry wt/ml. In contrast, with higher inoculums the fungi yield was around a
constant value c.a. 1.6 g dry wt/m). So, the relation of the inoculums size with the mass yiels
responded to an hyperbolic curve.
Average pellet sizes fitted to the relation: S
av
= Si (Vi / Vi ), where Si was the
arithmetical mean of bore size (upper to lower sieve, m), Vi was the volume of settle bed of
lets minus voidage.
The Power model fitted to the experimental data at various temperatures and phenanthrene
concentrations by means of multiple non-linear regressions and the least
square technique; the correlation coefficient (R
2
) indicated that the model fitted the
experimental data over the entire hydrocarbon concentrations
Tabla I: Linear regression parameters for different phenanthrene concentrations
phenanthrene parameters R
g/l K n
25 1.71E-01 7.06E-02 9.83E-01
50 6.87E-01 1.13E-02 9.89E-01
75 6.58E-01 8.73E-02 9.68E-01
100 9.37E-01 2.06E-01 9.79E-01
150 1.75E+00 9.56E-02 9.97E-01
200 9.21E+02 2.29E-01 9.91E-01
250 1.08E+03 3.44E-01 9.89E-01

This phenomenon was related to poor growth rate due to oxygen limitation inside large
pellets and to the hydrocarbon presence. At 10
10
spores/m
3
in shake flasks and 10
12
spores/
m
3
in nonshaked flasks, small unstable pellets were formed during the 2
nd
day culture, that
disappeared later. With the increase in inoculum level, pulp growth was the prevalent
development. The average pellet size seemed to be inversely proportional to the inoculum
sizes; however, it appeared that within large inoculum ranges the average pellet size
reached a plateau, remaining close to 1 m.
Analysis of pellet size distributions showed a bimodal relation, with two pellet sub-


populations, one either large to > 2.5 m or small to < 0.4 m, and a symmetric one with
median pellet size of 1.4 m. On the contrary, in the control flasks, only one population was
observed with average pellet size = 1.0 m.
The ability of hyphae to form pellets and the pellet numbers were determined by the cultural
conditions. At harvest time of each pellet was 10 times higher than the pellet yields/per spore
at the same inoculation size, but the distribution was different, as one populations was
obtained with 0.7 m as dominant size. The smaller sizes and larger pellet units may be
explained by phenanthrene presence, dissolved oxygen levels (OD), as the stability of the
pellets was limited by both factors.
The OD limitation determined that cells seemed to adapt by forming smaller flocs, resulting
greater surface area per unit cell volume, and hence in increased oxygen transfer to cells [7].
Moreover, an increment in growth rate was correlated not only with the decreased in pellet
size, but also with the hydrophobicity of cell walls, as expressed in contact angles of cells
with water. Different conditions yielding smaller pellets reducing the cell wall hydrophobicity;
thus contact angles demonstrated that larger pellets were more hydrophobic. The
hydrophobicity depended upon soluble factors, since washed cells were considerable less
hydrophobic [8,9].
In conclusion, the phenanthrene levels, temperature and shear rates influenced the flow
characteristics of the fungal culture; its viscosity increased exponentially with the aromatic
hydrocarbon concentrations and decreased exponentially with higher temperature and shear
rates. Power law showed good agreement with the experimental data and provide better
prediction of the cultural factors.
The models are especially useful in hydrodynamic optimization and computational fluid
dynamic simulation with different industrial applications; in this case in the optimization of
diverse bioremediation strategy like the fungal bioaugmentation and activated sludge
processes, where viscosity plays a major role on the hydrodynamic regime, oxygen transfer
and mass transport and consequently influences the system performance.

Bibliography
[1] Cheboyina S, O'Haver J, Wyandt CM. (2006). A mathematical model to predict the size of
the pellets formed in freeze pelletization techniques: parameters affecting pellet size. J.
Pharm Sci.95 (1): 167-180.
[2] Rahman MA, Ahuja A, Baboota S, Bhavna, Bali V, Saigal N, Ali J. (2009). Recent
advances in pelletization technique for oral drug delivery: a review. Curr Drug Deliv. 6 (1):
122-129.
[3] Yang F, Bick A, Shandalov S, Brenner A, Oron G. (2009). Yield stress and rheological
characteristics of activated sludge in an airlift membrane bioreactor. J. Membr. Sci., 334: 83
90.
[4] Nieminen L, Webb S, Smith MCM, Hoskisson PA .(2013). A flexible mathematical model
platform for studying branching networks: experimentally validated using the model
Actinomycete, Streptomyces coelicolor. PLoS ONE 8 (2): e54316.
[5] Davidson F .(1998). Modelling the qualitative response of fungal mycelia to
heterogeneous environments. J. Theoret. Biol. 195: 281292.
[6] Boswell GP, Davidson FA (2012) Modelling hyphal networks. Fungal Biol.Rev. 26: 3038.
[7] Bastian P, Chavarra-Krauser A, Engwer C, Jger W, Marnach S (2008). Modelling in-
vitro growth of dense root networks. J. Theoret. Biol. 254: 99109.
[8] Birol G, Undey C, Parulekar SJ, Cinar A (2002). A morphologically structured model for
penicillin production. Biotechnol. Bioeng. 77: 538552
[9] Kalili-Garakani, A, Mehrnia MR, Mostofi N, Sarrafzadeh MH., (2011). Analyze and control
fouling in an airlift membrane bioreactor: CFD simulation and experimental studies, Process
Biochem., 46(5): 1138-1145.


APLICACIN DE MODELOS MIXTOS A LA EVALUACION DE
TCNICAS DE VINCULACIN Y APRENDIZAJE NO TRAUMTICO
EN POTRILLOS CRIOLLOS BAJO CRA SEMI EXTENSIVA

ABBIATI N.N.
1
, PAZ S.
2
, FLORES M.
2
, REFOJO D.
2

1
Ctedra de Biometra y Diseo Experimental, Facultad de Ciencias Agrarias, UNLZ
2
Ctedra de Equinotecnia, Facultad de Ciencias Agrarias, UNLZ

norabbi2000@yahoo.com.ar

RESUMEN
En Argentina el sistema de cra equina es mayoritariamente bajo sistemas extensivos o
semi-extensivos, con partos a campo, teniendo sus primeros vnculos con los operadores
entre los 6 a 8 meses de vida, desaprovechndose el periodo de aprendizaje del animal,
retrasando la sociabilizacin con el humano. Se aplicaron Tcnicas de Vinculacin y
Aprendizaje no Traumtico ad hoc durante las primeras semanas de vida de los potrillos,
midindose los tiempos de tardanza en la ejecucin en diferentes momentos en ese perodo
y tambin al destete. El objetivo del trabajo fue evaluar, empleando modelos mixtos, el
comportamiento de Tcnicas de Vinculacin y Aprendizaje no Traumtico, ajustadas a
sistemas de cra semi-extensivos. El estudio se realiz con caballos de Raza Criolla,
tomndose mediciones al aprendizaje (AP) y al destete (DT). Al AP se emple un diseo
completamente aleatorizado con un arreglo factorial 2x2 (utilizacin de una rutina ordenada
de acuerdo a su complejidad, de bloques de maniobras o desordenada; utilizacin o no de
sujecin al palenque). Al DT, se trabaj con un conjunto reducido de los animales del inicio,
a los que se les continu ese da el mismo tratamiento que en el AP, ms testigos similares
seleccionados por su facilidad de acercamiento al humano. A estos ltimos se les efectu
dos tratamientos: rutina ordenada de bloques de maniobras o desordenada, con utilizacin
de palenque. Se analizan las variables: Tiempos de Tardanza de Elevacin de Miembros,
de Casqueo, de Avance y de Manga. Para el anlisis estadstico se emplearon Modelos
Lineales Mixtos. El tratamiento Ordenado con Palenque posee una disminucin de tiempo
de maniobra con respecto al Aleatorio con Palenque. Al DT hubo una gran variabilidad entre
tratamientos que no permite mostrar diferencias entre tratados al AP y los potrillos no
tratados dciles.

Palabras clave: Modelos lineales mixtos, mediciones repetidas, potrillos criollos,
tcnicas de aprendizaje no traumticas.

Introduccin
En Argentina el sistema de cra equina es mayoritariamente bajo sistemas extensivos o
semi-extensivos, con partos a campo, teniendo sus primeros vnculos con los operadores
entre los 6 a 8 meses de vida [1], desaprovechndose el periodo de aprendizaje del animal y
retrasando la sociabilizacin con el humano. Las tcnicas imprinting, difundidas en sistemas
intensivos como Polo, pueden influir en el comportamiento del caballo adulto y reducir su
miedo a los humanos y otras situaciones de distress [2]. Se aplicaron Tcnicas de
Vinculacin y Aprendizaje no Traumtico ad hoc durante las primeras semanas de vida de
los potrillos, midindose los tiempos de tardanza en la ejecucin en diferentes momentos a
lo largo de ese perodo y tambin al destete. El objetivo de este trabajo fue evaluar
empleando modelos mixtos, el comportamiento de Tcnicas de Vinculacin y Aprendizaje no
Traumtico, ajustadas a sistemas de cria semi-extensivos.



Desarrollo
El estudio se realiz en Estancia La Repblica, Lujn, Buenos Aires, Argentina,
establecimiento de cra semi-extensiva de caballos de Raza Criolla, tomndose mediciones
al aprendizaje (AP) y al destete (DT). Al AP se emple un diseo completamente
aleatorizado con un arreglo factorial 2x2 (utilizacin de una rutina ordenada de acuerdo a su
complejidad, de bloques de maniobras o desordenada; utilizacin o no de sujecin al
palenque). Las unidades experimentales fueron 30 potrillos de 48-72 horas de nacidos a
campo. Las rutinas se aplicaron desde el da 7 de iniciado el ensayo hasta el da 21. Al DT,
se trabaj con un conjunto reducido de los animales del inicio, a los que se les continu ese
da el mismo tratamiento que en el AP, ms testigos de edad similar del mismo
establecimiento seleccionados por su facilidad de acercamiento al humano. A estos ltimos
se les efectu dos tratamientos: una rutina ordenada de bloques de maniobras o
desordenada, con utilizacin de sujecin al palenque. Se analizan las variables: Tiempos de
Tardanza (en segundos) de Elevacin de Miembros (TEM), de Casqueo (TC), de Avance
(TA) y de Manga (TM). Para el anlisis estadstico se emplearon Modelos Lineales Mixtos
(MLM) [3]. La parte fija model arreglos factoriales con interaccin utilizndose, segn el
modelo, los factores Orden (Ordenado, Aleatorio), Palenque (Con Palenque, Sin Palenque),
Testigo (Si, No) y Da (7, 14, 21 y DT). Se recurri al criterio de informacin de Akaike para
la eleccin de la estructura de R que model la correlacin a lo largo del tiempo y/o la
heterogeneidad de varianzas. En los anlisis de varianza (ANVA) y de comparaciones
mltiples de Tukey-Kramer se trabaj con un nivel de significacin del 5%, ajustndose los
grados de libertad del denominador por el mtodo de Kenward y Roger. El procesamiento de
los datos se realiz mediante de los software SAS [4] e InfoStat [5].

En el cuadro 1 figuran estadsticos descriptivos, segn tratamiento y da, de las variables
para los potrillos tratados entre el inicio y DT. Se observa alta variabilidad en el inicio y en el
DT en TEM y TC. Los promedios, en general, tienden a disminuir del inicio al da 21 pero a
incrementar en el DT (grfico 1). Salvo en el da 14 para TM y TA donde se produce una
gran variabilidad entre los tiempos en general.

Cuadro 1. Estadsticos descriptivos segn tratamiento y da para TEM, TC, TM y TA

En el ANVA para TEM y TC se detect diferencias en el Orden (p=0.0238 y p=0.0137,
respectivamente), con mayor tardanza en el Aleatorio, y, en el Da (p<0.0001 y p=0.0007,
respectivamente), no detectndose diferencias entre los das inicial y DT por un lado, y entre
los intermedios por el otro. En TM no hubo diferencias entre tratamientos, pero si entre los
das (p=0.0003), siendo el 21 el de menor tardanza. En TA no hubo diferencias entre
tratamientos, pero si entre los das (p=0.0434), difiriendo los das inicial y al DT, siendo
menor la tardanza al DT. Es de hacer notar que tanto en TM como en TA se present una
gran variabilidad en los tiempos para el da 14. En al anlisis al DT de los potrillos tratados al
AP y control, puede observarse una gran variabilidad en TEM y TC en todos los casos salvo
Media D.E. Media D.E. Media D.E. Media D.E.
7 249.86 144.19 133.14 104.19 16.29 11.53 35.00 25.24
14 131.00 60.11 60.00 13.09 10.43 5.80 26.29 3.30
21 96.14 33.12 71.71 31.90 8.43 1.40 28.29 13.59
DT 262.00 172.88 151.71 200.24 25.29 27.87 23.29 3.45
7 172.86 57.66 198.43 109.90 14.57 9.74 41.43 30.31
14 95.57 69.24 60.43 22.82 9.71 6.40 54.57 70.90
21 86.86 34.31 61.43 16.94 7.29 1.60 24.29 3.30
6 DT 220.83 171.58 166.67 215.66 14.83 4.62 24.17 2.23
7 131.75 49.65 89.88 41.97 15.50 7.87 28.63 11.10
14 119.88 51.30 63.50 36.98 21.88 33.82 55.25 48.79
21 86.25 25.56 44.13 15.85 8.14 2.27 29.00 9.36
5 DT 161.20 75.08 76.00 30.44 16.60 8.11 27.80 10.85
7 141.00 44.20 104.50 33.01 13.88 10.80 30.88 12.32
14 129.13 39.83 75.13 31.67 23.75 33.36 25.50 3.66
21 87.50 21.27 46.13 11.01 8.38 1.77 26.50 11.75
6 DT 175.50 71.54 89.33 46.22 12.67 6.44 24.33 3.27
TA
Da
7 Aleatorio Con Palenque
Tratamiento Potrillos
TEM TC TM
Aleatorio Sin Palenque
7
8
Ordenado sin Palenque
8
Ordenado Con Palenque


en aquellos potrillos tratados Ordenados con Palenque. En cambio en TM y TA la mayor
variabilidad se presenta en los testigos del tratamiento Aleatorio Con Palenque (cuadro 2).

Grfico 1. Variables a lo largo de las fechas segn tratamientos. Promedios y E.E.

Cuadro 2. Estadsticos descriptivos segn tratamiento en potrillos tratados al AP y testigos

En el ANVA no se detect interaccin ni diferencias entre tratamientos ni tipo de potrillos
(testigos o tratados al AP), (p>0.05), para las variables, posiblemente debido a la gran
variabilidad existente. En TC no se tuvo en cuenta en el anlisis el testigo ordenado con
palenque, pues a ninguno de los potrillos pudo realizrsele la tarea en el tiempo estipulado
como mximo (10). Los resultados obtenidos confirman la presencia de la ventana de
aprendizaje. La reduccin de tiempos en AP no se mantiene en DT. Este efecto negativo se
podra deber a: el tiempo transcurrido hasta el DT; el periodo de 21 das podra ser
insuficiente para consolidar el aprendizaje. En AP, en general, se observa una disminucin
de los tiempos de maniobra. A excepcin de TA, todas las variables incrementan sus
tiempos a DT. El tratamiento Ordenado con Palenque posee una disminucin de tiempo de
maniobra con respecto al Aleatorio con Palenque. A excepcin de TA, en el periodo de 21
das hasta DT, los tiempos de maniobra se incrementan alcanzando valores cercanos a los
establecidos al inicio del aprendizaje. Al DT hubo una gran variabilidad entre tratamientos
que no permite mostrar diferencias entre tratados al AP y los potrillos no tratados dciles.

Bibliografa
[1] Dowdall, R. (1982). Criando Criollos. Buenos Aires: Editorial Hemisferio Sur, Argentina.
[2] Lansade, L.; Bertrand, M. y Bouissou M. (2005). Effects of neonatal handling on
subsequent manageability, reactivity and learning ability of foals. Applied Animal Behaviour
Science, 92: 143-158.
[3] Mc Culloch, C. E. y Searle, S. R. (2001). Generalized, Linear, and Mixed Models. New
York: John Wiley & Sons, USA.
Media D.E. Media D.E. Media D.E. Media D.E.
Si 7 262.00 172.88 151.71 200.24 25.29 27.87 23.29 3.45
No 5 369.60 256.31 374.20 309.32 136.20 259.37 139.60 257.38
Si 5 161.20 75.08 76.00 30.44 16.60 8.11 27.80 10.85
No 3 292.67 270.10 600.00 0.00 20.67 13.20 19.33 1.53
Tratamiento
Tratado al
AP
Potrillos
TEM TC TM TA
Aleatorio Con Palenque
Ordenado Con Palenque

Ord. con Pal. Ord. sin Pal.
Aleat. con Pal. Aleat. sin Pal.
7 14 21 DT
Da
5
14
23
31
40
T
M
Ord. con Pal. Ord sin Pal.
7 14 21 DT
Da
60
128
195
263
330
T
E
M
Ord. con Pal. Ord sin Pal.
Aleat. con pal. Aleat. sin Pal.
7 14 21 DT
Da
40
93
145
198
250
T
C
Aleat. con pal. Aleat. sin Pal.
7 14 21 DT
Da
20
35
50
65
80
T
A




CALIDAD SENSORIAL DE CARNE BOVINA: EFECTO DEL BIOTIPO,
CATEGORA, EDAD Y MADURACIN

PEREYRA, A.M.
1
, PICALLO, A.B.
1
, COSSU, M.E.
1
, COSTE, E.B.
1
, GAMBETTI, P.C.
1
,
FERNNDEZ MADERO, J.
2
, ROZEN, F.B.
3
, ROCHA, V.M.
1
, BASSO, L.R .
1

1
Departamento de Produccin Animal, Facultad de Agronoma, UBA

2
Facultad de Ciencias Veterinarias, Universidad Catlica de Salta

3
Facultad de Ciencias Veterinarias, UBA.

anamariapereyra@yahoo.es

RESUMEN
Con el fin de analizar y comparar la calidad sensorial de carne de novillos y machos enteros
jvenes (MEJ), de tres biotipos diferentes, faenados a diferente edad y madurados hasta 14
das, se evaluaron 146 animales (92 novillos y 54 MEJ); de los biotipos: Criollos,
Acebuzados (brangus/braford) y Britnicos, faenados a 0, 2 y ms de 4 dientes criados
en condiciones de confinamiento en el Noroeste argentino (NOA). A las 96 h post-faena
(tiempo 0 de maduracin) se tomaron muestras del msculo Longissimus dorsi (9-13
costilla) y se maduraron 14 das (tiempo 1 de maduracin) envasadas bajo vaco en cmara
a 2,50,5C. Se evaluaron bifes de 2,5 cm de espesor cocidos en plancha doble contacto
hasta 711C en el centro de la muestra. Ocho evaluadores entrenados recibieron muestras
(cubos, 1x1x1 cm) en recipientes de vidrio cerrados, codificados con un nmero de tres
dgitos al azar y analizaron los descriptores sensoriales: color global, uniformidad de color,
intensidad y tipicidad olor/flavor, gustos dulce, cido y amargo, dureza, masticabilidad,
nmero de masticaciones, fibrosidad, untuosidad y residuo. Los datos se analizaron
utilizando un modelo de cuatro factores y sus interacciones, y las diferencias entre las
medias de tratamientos utilizando el test de Tukey-Kramer (p<0,05). La maduracin
demostr ser el factor ms influyente en los descriptores sensoriales de la carne de las
razas tpicas del noroeste de Argentina. La carne de los animales MEJ de los biotipos
analizados, fue ms dura que la correspondiente a novillos de iguales biotipos, asimismo la
dureza se incrementa a medida que aumenta el nmero de dientes, requiriendo mayores
tiempos de maduracin para obtener una terneza similar a la de sus pares castrados.

Palabras clave: modelo factorial, anlisis sensorial, biotipo, denticin, castracin,
maduracin.

Introduccin
En 2010, el Ministerio de Agricultura, Ganadera y Pesca de la Repblica Argentina dispuso
la creacin de una nueva categora comercial de bovinos para la faena, el macho entero
joven (MEJ) con un mximo de dos incisivos definitivos al momento de la faena. Esta nueva
categora puede aumentar la eficiencia de conversin de alimentos a travs de las tasas de
crecimiento ms rpidas y con acabados ms magros. La calidad de carne, incluyendo las
caractersticas sensoriales de carne bovina, se ve influenciada por una serie de factores,
tales como raza (Chambal et al., 2003), nutricin, tratamiento pre-faena de los animales,
tratamiento post mortem y maduracin de la carne (Campo et al., 1999; Monsn et al., 2005)
y mtodos de coccin. La terneza es un factor determinante de la calidad para el consumo y
aceptabilidad de la carne (Voges et al., 2007; Destefanis et al., 2008). Esto se confirma
fcilmente por la relacin positiva entre el precio de un corte de carne y su terneza relativa
(Miller et al., 2001). En condiciones naturales, la maduracin y las razas son componentes
importantes que influyen en la percepcin final del producto por parte del consumidor
(Campo et al., 1999). Gregory et al. (1994) estudiaron los efectos de la maduracin o de una
raza en el cruzamiento entre razas de carne Bos taurus y Bos indicus o Britnicos vs.


Continental. Franco et al. (2012) observaron diferencias en la terneza o el color de la carne
de novillos o enteros, mientras que otros estudios no mostraron diferencias entre las dos
categoras, probablemente debido a las diferencias en la edad de los animales al momento
de la comparacin (Morgan et al, 1993). El objetivo de este trabajo fue evaluar la calidad
sensorial de carne de novillos y machos enteros jvenes provenientes de animales criados
en el NOA, de tres biotipos diferentes, faenados a diferente edad y el efecto producido por la
maduracin a los 4 y 14 das.

Desarrollo
Se evaluaron 146 animales de dos categoras (categ.): 92 novillos (Nov) y 54 machos
enteros jvenes (MEJ); de tres biotipos: Criollos, Acebuados (brangus/braford) y
Britnicos, faenados a 0, 2 y 4-8 dientes y criados en condiciones de confinamiento en el
Noroeste argentino. A las 72 h post-faena se tomaron muestras del msculo Longissimus
dorsi (9-13 costilla), que se envasaron al vaco y maduraron (mad) durante 14 das en
cmara de refrigeracin a 2,50,5C. Al finalizar el tiempo de maduracin, las muestras se
congelaron a -18,00,5C. Veinticuatro horas antes del anlisis sensorial, las muestras se
descongelaron a 2,50,5C. Se cortaron bifes de 2,5 cm de espesor, que se cocinaron en
parrilla de doble contacto, hasta alcanzar una temperatura interna de 711C monitoreada
por termocuplas. Las muestras (1x1x1cm) presentadas en placas de Petri codificadas con
nmero de tres dgitos aleatorios) fueron analizadas por un panel analtico de 8 evaluadores
entrenados. Se evaluaron los siguientes descriptores: color global y uniformidad de color en
los atributos de apariencia; intensidad y tipicidad olor/flavor los gustos dulce, cido y
amargo; y para atributos texturales, dureza, masticabilidad, nmero de masticaciones,
fibrosidad, untuosidad y residuo, utilizando una escala lineal no estructurada de 0 a 10, sin
anclaje. Los extremos de las escalas corresponden a la intensidad del atributo: rosa claro,
uniforme, muy suave, muy tierno, poco untuosa (0) y rojo, no uniforme, muy fuerte
(intensos), muy duro, untuosa (10). Los datos se analizaron utilizando un modelo de cuatro
factores y sus interacciones y las diferencias entre las medias de tratamientos, utilizando el
test de Tukey-Kramer (p<0,05), SAS (2009).

El color global present diferencias (p<0,05) entre biotipos Acebuado y Britnico. Cuando
se estudia la interaccin categora*dientes, la categora MEJ con 4 dientes presenta un valor
muy superior al resto de los grupos mientras que Nov es menor que el resto con excepcin
MEJ de 0 dientes, que no difieren entre s. El descriptor uniformidad de color, presenta
diferencias (p<0,05) en la interaccin mad*dientes, donde se marca la diferencia con los
animales de 0 dientes, independientemente de los das de maduracin. Estos resultados
marcan una diferencia esencial de color ms oscuro en razas con sangre ceb, y con
respecto a la categora, el MEJ con ms dientes es ms oscuro que el resto, con menos
uniformidad en el color. La intensidad de olor se ve afectada (p<0,05) por la interaccin de
categ*dientes*mad, observando que los MEJ no se comportan como los Nov, ya que Nov,
se ve influenciado entre 0 y 2 dientes directamente por la maduracin, en cambio este
comportamiento en MEJ se observa con animales de ms de 4 dientes. En cambio, la
tipicidad de olor y la intensidad de flavor se ven exclusivamente ligados a la maduracin
como factor ms influyente. En cuanto a los gustos bsicos, presentaron diferencias
(p<0,05) en dulce y amargo, por maduracin, y en cido, por la interaccin mad*dientes.
Tanto en salado como metlico no se observaron diferencias (p>0,05). El flavor
caracterstico present diferencias (p<0,05) por efecto de la interaccin categ*dientes, donde
el Nov 4 dientes tiene un valor mayor de ms de una unidad con respecto al MEJ 4 dientes,
por lo cual est pesando ms la categora en la tipicidad del flavor. Campo et al (1999) no
encontraron diferencias en la intensidad del flavor global entre tipos de razas espaolas. En
el informe de Hankey y Kay (1988) se propuso que la grasa influy en el flavor de la carne,
ya que estaba en la fraccin lipdica, donde se encuentran los compuestos caractersticos y
especficos de la especie. Al analizar la dureza, se observan diferencias por maduracin; por
categ*dientes, donde MEJ 4 dientes es diferente del resto con mayor valor de dureza; y por


categ*biotipo, observando que el MEJ Acebuado es mucho ms duro que el resto de los
grupos. Al mirar desde el biotipo, el Criollo 4 dientes resulta la muestra con mayor dureza.
La masticabilidad y cantidad de masticaciones se comportan de igual manera, presentando
diferencias (p<0,05): por dientes entre 0 y 2 vs 4 dientes; por maduracin; y por la
interaccin categ*biotipo. Aqu el MEJ Criollo/Acebuado funcionan con la misma
tendencia, siendo los de mayor masticabilidad. Las diferencias en la terneza entre razas
podra deberse a la cantidad, la solubilidad y el espacio de la organizacin del colgeno, la
grasa y la actividad de la calpana y calpastatina. En general, los valores encontrados para
la dureza fueron ms bajos a medida que el tiempo de maduracin aument, de acuerdo
con Monson et al. (2005). La fibrosidad se ve afectada (p<0,05) por la maduracin y por la
interaccin categ*biotipo, donde el MEJ Criollo es diferente y mayor al resto a excepcin
de MEJ Acebuado. La untuosidad present diferencias exclusivamente por maduracin. El
residuo, vinculado directamente con el tejido conectivo presente, mostr diferencias en
categ*dientes*mad, donde MEJ 4 dientes a ambos tiempos de madurado difieren del resto,
presentando valores mayores.
La maduracin demostr ser el factor ms influyente en los principales descriptores
sensoriales de la carne bovina de animales criados en sistemas confinados del norte
argentino. El biotipo no demostr tener un impacto per se en las variables analizadas, pero
s tuvo presencia cuando se estudi la interaccin categ*biotipo. El nmero de dientes tuvo
influencia al interactuar con categora y la maduracin, en las tres interacciones posibles. En
conclusin, la cra de MEJ de los biotipos Criollo, Acebuados y Britnicos, en sistemas
confinados del norte de Argentina, mostr la carne ms dura que la correspondiente a
novillos de iguales biotipos, que se incrementaba a medida de aumentar el nmero de
dientes del animal y que requieren tiempos de maduracin mayores para llegar a una
terneza similar a la de sus pares castrados.

Bibliografa
Campo, M.; Saudo, C.; Panea, B.; Alberti, P.; Santolaria, P. (1999). Breed type and ageing
time effects on sensory characteristics of beef strip loin steaks. Meat Sci., 51, 383-390.
Chambal, A.; Scheeder, M.; Kreuzer, M.; Dufey, P. (2003). Meat quality of Angus,
Simmental, Charolais and Limousin steers compared at the same intramuscular fat content.
Meat Sci., 63, 491-500.
Destefanis, G.; Brugiapaglia, A.; Barge, M.; Molin, E. (2008). Relationship between beef
consumer tenderness perception and Warner-Bratzler shear force. Meat Sci., 78, 153-156.
Franco, J.; Feed, O.; Bianchi, G.; Garibotto, G.; Ballesteros, F.; Nan, F.; Percovich, M.; Piriz,
M.; Bentancur, O. (2008). Parmetros de calidad de carne en cinco msculos de novillos
Holando durante la maduracin post-mortem. Agrociencia, XII (1):6168.
Gregory, K.; Cundi, L.; Koch, R.; Dikeman, M.; Koohmaraie, M. (1994). Breed effects,
retained heterocyst and estimates of genetic and phenotypic parameters for carcass and
meat traits of beef cattle. J.Anim.Sci., 72, 1174-1183.
Hankey, C. y Kay, M. (1988). A note on the food conversion and meat quality of crossbred
Aberdeen Angus and Charolais heifers. Animal Production, 47:497500.
Miller, M.; Carr, M.; Ramsey, C.; Crockett, K.; Hoover, L. (2001). Consumer thresholds for
establishing the value of beef tenderness. J.Anim.Sci., 79, 3062-3068.
Monsn, F.; Saudo, C.; Sierra, I. (2005). Influence of breed and ageing time on the sensory
meat quality and consumer acceptability in intensively reared beef. Meat Sci., 71, 471-479.
Morgan, J.; Wheeler, T.; Koohmaraie, M.; Savel, J.; Crouset J. (1993). Meat tenderness and
the calpain proteolytic system in Longissimus muscle of young bulls and steers. J.Anim.Sci.
71:1471-1476.
SAS (2009). Stat UserS Guide: Statistics, 4th ed. Cary NC, USA: SAS Institute Inc
Voges, K.; Mason, C.; Brooks, J.; Delmore, R.; Griffin, D.; Hale, D. (2007). National beef
tenderness survey 2006: Assessment of WarnerBratzler shear and sensory panel ratings
for beef from US retail and foodservice establishments. Meat Sci., 77, 357-364.


COMPARACIN DE INCIDENCIAS DE CANCER EN BARRIOS DE
BAHIA BLANCA ENTRE 2003 Y 2007

SERRALUNGA, GABRIELA
1
, YEZ LORETO
1
, GONZALEZ SOLEDAD
2

1
Universidad Nacional del Sur, Departamento de Matemtica
2
Registro Regional de Tumores de Baha Blanca

mgserra@criba.edu.ar

RESUMEN
El objetivo de este trabajo es analizar si existe riesgo aumentado de cncer en dos barrios
cercanos al Polo Petroqumico de la ciudad de Baha Blanca, respecto al riesgo de los
habitantes de dicha ciudad ubicada a 10 km del rea industrial.
Para ello se estimaron y compararon las tasas de incidencia de cncer, crudas y ajustadas
por edad, para cada topografa (localizacin del tumor primario), en cada sexo y en cada
zona considerada (Ing. White IW, Villa Rosas VR y resto de Baha Blanca BB). Para cada
topografa y sexo se calcularon las tasas brutas y las tasa ajustadas por edad a la poblacin
estndar mundial, mediante el mtodo de estandarizacin directo; se calcularon los
respectivos intervalos de confianza mediante la aproximacin de Poisson. Se obtuvieron a
efectos de comparacin, las Razones de Tasas Estandarizadas con sus respectivos
intervalos de confianza.
Para las tres zonas de estudio, en hombres las tasas ms altas fueron cncer de prstata,
pulmn y colon-recto, mientras que en mujeres fueron mama y colon-recto.
En cuanto a la comparacin entre los barrios, para hombres se encontraron diferencias
significativas en prstata entre VR y BB, siendo mayor en esta ltima. Adems se
encontraron diferencias significativas, con mayores tasas para BB, en estmago y vejiga
urinaria. En el resto de las topografas no se detectaron diferencias.
En mujeres se encontraron diferencias significativas en mama entre BB y VR siendo menor
en esta ltima. No se encontraron diferencias entre zonas para las restantes topografas.
De este estudio no puede inferirse que los habitantes de zonas cercanas al Polo industrial
presenten un riesgo aumentado de cncer.

Palabras clave: ajuste de tasas, mtodo directo, tumores primarios, riesgo

Introduccin
Existe en las cercanas de Baha Blanca un importante Polo Petroqumico que produce urea,
amonaco, monmeros de vinilo, polivinilo y otros derivados del petrleo. Desde hace
tiempo, hay preocupacin tanto de las autoridades municipales como de la poblacin en
general, respecto a un aparente aumento de casos de cncer en habitantes que viven en
sus inmediaciones, especialmente en Ing. White, situado a escasos metros del asentamiento
industrial, y de Villa Rosas a 2 km del mismo.
El objetivo de este trabajo es analizar si existe riesgo aumentado de cncer en barrios
cercanos al Polo Petroqumico, respecto al riesgo de los habitantes de la ciudad de Baha
Blanca ubicada a 10 km del rea industrial.
Se estiman y comparan las tasas de incidencia de cncer crudas, y ajustadas por edad,
para cada topografa (localizacin del tumor primario), en cada sexo y en cada zona
considerada (Ing. White, IW; Villa Rosas, VR y resto de Baha Blanca, BB).

Desarrollo
Los datos provienen de casos diagnosticados durante el quinquenio 2003-2007; fueron
obtenidos del Registro Regional de Tumores de Baha Blanca, y corregidos utilizando el
Programa CanReg 4 Edicin, de la Internacional Agency for Cancer Research (OMS).


Para cada topografa y sexo se calcularon las tasas brutas (TB) y las tasas ajustadas (TA)
por edad (en grupos quinquenales) a la poblacin estndar mundial, mediante el mtodo de
estandarizacin directo; se calcularon los respectivos intervalos de confianza mediante la
aproximacin de Poisson (Armitage y Berry, 1994). Se obtuvieron a efectos de comparacin,
las Razones de Tasas Estandarizadas (RTE) con sus respectivos intervalos de confianza,
(Newman, 2001, Armitage et al., 2002).
Las poblaciones estimadas a mitad de perodo, para cada zona, fueron suministradas por el
Instituto Nacional de Estadsticas y Censo (INDEC,) y son las proyecciones intercensales
para el ao 2005, del censo 2001. Las tasas fueron expresadas como casos/100 000 aos-
persona. El software utilizado fue Epidat 4.

Resultados
En ese perodo fueron diagnosticados 5346 casos de cncer, en las tres reas: 177
pertenecientes a Ing. White, 373 a Villa Rosas y 4404 al resto del partido; hubo 392 casos
no ubicados geogrficamente.
En las tres zonas en estudio, los primeros lugares en hombres fueron: cncer de prstata
TA: 40.3, pulmn TA: 38.8 y colon-recto TA: 29.6 y en mujeres, mama TA: 65.3 y colon-recto
TA: 29.3.
Las principales tasas de incidencia ajustadas en hombres y para cada zona fueron: cncer
de prstata BB: 48.0; IW: 47.3 y VR: 25.6; pulmn BB: 34.0; IW: 56.4 y VR: 26.1; colon-recto
BB: 28.4; IW: 33.3 y VR: 27.1. En prstata se encontraron diferencias significativas entre BB
y VR (RTE=1.87), siendo mayor en BB. Adems se encontraron diferencias significativas,
con mayores tasas para BB, en estmago y vejiga urinaria. En el resto de las topografas no
se detectaron diferencias.
En mujeres las principales tasas ajustadas para cada zona fueron: mama BB: 78.9; IW: 66.2
y VR: 50.8; colon-recto BB: 18.1; IW: 14.9 y VR: 17.8. En mama se encontraron diferencias
significativas entre BB y VR (RTE=1.55), siendo menor en esta ltima. No se encontraron
diferencias entre zonas para las restantes topografas.
Conclusiones
En hombres, no se encontraron diferencias significativas entre zonas, en trece de las
diecisis topografas de mayor incidencia; se detectaron diferencias significativas en
estmago, vejiga urinaria, y prstata, siendo mayores en Baha Blanca que en los barrios
cercanos al Polo Industrial. En pulmn se realiz a posteriori una estandarizacin indirecta
que encontr diferencias, con mayor incidencia en IW. Sin embargo esta localidad tiene una
prevalencia de hbito tabquico en varones del 36.3%, superior al promedio nacional
informado por el Ministerio de Salud de la Nacin de 27.2% (Encuesta de Factores de
Riesgo Cardiovascular, 2009). Se ha estimado que el tabaco contribuye a la aparicin del 80
al 90% de los casos de cncer de pulmn en hombres y del 55% al 80% de los casos en
mujeres (Levi, 1999).
En las mujeres, sobre diecisis localizaciones estudiadas, en quince no se encontraron
diferencias significativas; slo en cncer de mama se encontraron diferencias, siendo ms
alto en Baha Blanca que en Villa Rosas.
De este estudio no puede inferirse que los habitantes de zonas cercanas al Polo industrial
presenten un riesgo aumentado de cncer; actualmente se estn comparando las
tendencias a partir de datos de quinquenios anteriores al aqu presentado, as como
analizando las incidencias del quinquenio 2008-2012; esto permitir contar con mayor
evidencia para dar una respuesta definitiva a esta problemtica.

Bibliografa
Armitage P, Berry G. (1994). Statistical Methods in Medical Research (3th edition). Blackwell
Science. Oxford.
Armitage P, Berry G, Matthews JNS. (2002). Statistical Methods in Medical Research (4th
edition). Blackwell Science. Oxford.


Levi F. (1999). Cancer prevention: epidemiology and perspectives. Eur J Cancer. 35(7):
1046-1058.
Newman SC. (2001). Biostatistical Methods in Epidemiology. Wiley. New York.
Segunda Encuesta Nacional de Factores de Riesgo Cardiovascular 2009. Ministerio de
Salud de la Nacin. (2011). Revista Argentina de Salud Pblica. 2 (6): 34-41.


APLICACIN DE MODELOS LINEALES MIXTOS PARA EL ANLISIS
DE LA VARIABILIDAD ESPACIO-TEMPORAL DE PROPIEDADES DE
SUELO INTRALOTE

MARIANO CRDOBA
1
, CECILIA BRUNO
1
, MNICA BALZARINI
1

1
Facultad de Ciencias Agropecuarias, Universidad Nacional de Crdoba, CONICET,
Crdoba-Argentina.


RESUMEN
Las propiedades de suelo que influyen sobre el desempeo de los cultivos varan en el
espacio y tiempo. El anlisis y cuantificacin de esta variabilidad es necesaria para la
aplicacin del manejo sitio-especfico de cultivos. En este trabajo se propone un mtodo de
anlisis basado en el uso de modelos lineales mixtos para estimar tendencia temporal de
variables edficas y construir mapas de variabilidad espacio-temporal. El mtodo se basa en
el anlisis de la tendencia interanual promedio de sitios, estimacin de la varianza temporal
por sitio para cada variable y delimitacin clases intralote. Para ilustrar su aplicacin, se
analiz la tendencia interanual promedio y la variabilidad temporal de MO, P, pH y CE en 12
lotes de la regin semirida, abarcado una superficie de 2.240 ha bajo agricultura intensiva.
Los resultados mostraron que la variacin espacial en las caractersticas de suelo no es
permanente, producindose significativos cambios a travs del tiempo.

Palabras clave: modelos lineales mixtos, varianza temporal, correlacin espacial

Introduccin
El manejo sitio-especfico de cultivos (MSE) tiene como objetivo la aplicacin diferencial de
insumos y prcticas agronmicas a las necesidades del suelo y cultivos en funcin de la
cuantificacin de su variacin espacio-temporal [1]. Las propiedades de suelo que influyen
sobre el desempeo de los cultivos agrcolas son relativamente estables (permanente) en el
tiempo an cuando presenten alta variabilidad espacial. Por lo tanto es esperable tener
cierta coherencia en la variacin intralote a travs del tiempo [2]. Sin embargo, an en
suelos manejados uniformemente, pueden existir considerables diferencias en los patrones
espaciales de una misma variable registrada en diferentes momentos de tiempo. La
tendencia promedio de los cambios de las variables medidas subsecuentemente en distintos
aos puede ser analizada con modelos estadsticos contemporneos como los Modelos
Lineales Mixtos (MLM) [3]. Estos modelos permiten contemplar las correlaciones esperadas
entre datos obtenidos en distintos sitios del mismo lote. Lark y Stafford (1996) [4], Blackmore
et al. (2003) [5] y Marques da Silva (2006) [6], entre otros, desarrollaron distintas
metodologas para el anlisis de la variabilidad temporal de datos georreferenciados. La
combinacin de modelos para datos longitudinales espaciales y tcnicas de estimacin de
variabilidad temporal podra ser usada para delimitar zonas dentro del lote que no solo
consideren la variabilidad espacial de las variables sino tambin su estabilidad temporal. El
objetivo de este trabajo fue proponer una metodologa de anlisis basada en el uso de MLM
para estimar tendencia promedio y variabilidad temporal por sitio en variables de suelo.

Desarrollo
Datos experimentales
Se analizaron datos de un estudio llevado a cabo en un campo ubicado en la provincia
Crdoba, Argentina. Se analiz la tendencia temporal en un periodo de 12 aos (con
mediciones cada tres aos: 2005, 2008 y 2011) de las variables MO (%), P (ppm), pH, y CE
(dS/m). Los datos experimentales fueron recolectados en 12 lotes de 160 a 220 has cada


uno, abarcado una superficie total de 2.240 ha bajo agricultura continua con rotaciones de
cultivos anuales (Soja, Maz y Trigo). Se obtuvieron entre 170 y 280 muestras de suelo en
cada ao; las muestras fueron georreferenciadas con un DGPS.

Procesamiento de datos
Para cada variable se evalu la tendencia interanual promedio del rea con un MLM con
efecto fijo de ao y de lote y estructura de correlacin espacial para los trminos de error
aleatorio. El modelo con correlacin espacial exponencial (con y sin efecto nugget) basada
en el clculo de distancias entre los sitios de muestreo georreferenciados fue comparado
con el modelo de errores independientes, mediante la prueba de cociente de verosimilitud
(LRT) basada en los estimadores REML (mxima verosimilitud restringida) de los
parmetros de varianza y covarianza [3]. Ajustado el modelo de correlacin espacial, se
evalu la reduccin del modelo (eliminacin de efecto lote) mediante prueba LRT basada en
estimadores ML (mxima verosimiltud). Las diferencias encontradas entre ao fueron
evaluadas con la prueba LSD de Fisher (=0.05) para las medias ajustadas por la estructura
de varianza y covarianza subyacente. Luego el mismo procedimiento fue realizado para
cada variable analizada y por ao de muetreo. En este caso, adems del modelo de
variacin exponencial, se probaron el modelo esfrico y gaussiano, para todos los casos,
con y sin efecto nugget. En el caso de que los modelos comparados presentaran la misma
cantidad de parmetros, se utilizaron los criterios AIC y BIC, para la seleccin de los
modelos ajustados. En las variables de suelo que presentaron estructura de correlacin
espacial en los tres aos evaluados, se realizaron predicciones en sitios no muestreados en
una grilla de 6060 m utilizando el mtodo de kriging ordinario. Para ello se utilizaron los
parmetros del semivariograma que fueran estimados con el MLM seleccionado. Para
calcular la variabilidad temporal de cada variable interpolada, en un determinado sitio o
punto muestral, se us la siguiente expresin sobre los valores predichos por el modelo:
11
2
,
2
05
( )
3
t
t i t
t
i
Y Y
o
=
=

=

(1)

donde
2
i
o es la varianza temporal del sitio i; t es el ao (2005, 2008 y 2011);
, t i
Y es el valor
de la variable de suelo predicho por el modelo para el ao t en el sitio i;
t
Y es la media de la
variable para todo el lote en el ao t. La ecuacin refleja la desviacin del dato de cada sitio
con respecto a la media temporal de la variable. Por definicin, la varianza temporal
presenta un valor bajo, si un determinado sitio del lote presenta un valor que est siempre
cerca de la media general de la variable [5]. Usando media temporal (MT) y la desviacin
estndar temporal (DET) se delimitaron cuatro clases que fueron representadas
grficamente en un mapa. El segundo cuartil de la DET fue utilizado con el objeto de
identificar los sitios ms inestables, i.e. DE temporal>P(50).
Las zonas delimitadas fueron las siguientes: (1) AE: valor de la variable en un punto dado >
MT y DET<P(50); (2) AI: valor de la variable >MT y DET>P(50); (3) BE: valor de la variable
<MT y DET<P(50); (4) BI: valor de la variable <MT y DET>P(50). Todos los anlisis fueron
realizados con el software InfoStat a travs de su interface con el software R [7].

El modelo de correlacin espacial ajust mejor que el modelo de errores independientes
para todas las variables (LRT, p<0.05). El efecto de lote fue tambin significativo para todas
ellas (LRT, p<0.05). La comparacin de los valores promedios, de cada variable, entre los
diferentes aos de estudio, indic decrecimientos significativos y progresivos en P y pH. La
cada de la MO fue significativa en el ao 2011 (p<0.05), mientras que los valores de CE
permanecieron sin cambios temporal significativos y fueron los de mayor variabilidad
espacial dentro de cada ao. En adelante se muestran los resultados de los anlisis slo
para la variable pH.


Los modelos ajustados con diferentes estructuras de covarianza se detallan a
continuacin:
(1).CEExp: efecto de Lote fijo, correlacin espacial exponencial.
(2).CEGau: efecto de Lote fijo, correlacin espacial Gaussiana.
(3).CEEsf: efecto de Lote fijo, correlacin espacial esfrica.
(4).CEExpN: efecto de Lote fijo, correlacin espacial exponencial con efecto nugget.
(5).CEGauN: efecto de Lote fijo, correlacin espacial Gaussiana con efecto nugget.
(6).CEEsfN: efecto de Lote fijo, correlacin espacial esfrica con efecto nugget.
(7).EI: efecto de Lote fijo, errores independientes.
(8).Modelo seleccionado entre 1-7 sin efecto fijo de Lote.
Los criterios de bondad de ajuste (AIC y BIC) indicaron que para los aos 2005 y 2008 el
modelo CEExpN provee el mejor ajuste, mientras que para el 2011 el modelo a seleccionar
sera CEExp. Sin embargo, para el 2008 y 2011, en la prueba del LRT no se rechaza la
hiptesis nula que favorece al modelo reducido (LRT, p>0.05). Por ello se concluye que para
estos aos ser conveniente seleccionar el modelo sin efecto nugget (CEExp). En todos los
aos la comparacin del modelo con estructura de correlacin espacial previamente
seleccionado vs. el modelo de errores independientes, fue favorable para el primero (LRT,
p<0.05). Seleccionado el modelo de correlacin espacial, la evaluacin de la reduccin del
modelo (eliminacin de efecto lote) mediante prueba LRT basada en estimadores ML indic
que slo para los aos 2005 y 2011 el efecto de lote fue significativo.

Fig. 1. Mapa con las zonas delimitadas segn media temporal (MT) y desviacin estndar
temporal (DET) del pH.
El mapa de la Figura 1, muestra las zonificaciones logradas a partir de la desviacin
estndar temporal y la media temporal del pH. Los resultados obtenidos mostraron que la
variacin espacial en el pH de suelo no fue permanente, producindose significativos
cambios a travs del tiempo.

Bibliografa
[1] Whelan, B.M., McBratney, A.B. (2000). The Null Hypothesis of Precision Agriculture
Management. Precis. Agric. 2: 265279.
[2] Joernsgaard, B., Halmoe S. (2003). Intra-field yield variation over crops and years. Eur.
J. Agron., 19: 2333.
[3] Pinheiro, J.C., Bates, D.M. (2004). Mixed-Effects Models in S and S-PLUS. Springer, New
York.
[4] Lark, R., Stafford, J. (1997). Classification as a first step in the interpretation of temporal
and spatial variation of crop yield. Ann. Appl. Biol. 130, 111121
[5] Blackmore, B.S., Godwin, R.J., Fountas, S.: The analysis of spatial and temporal trends in
yield map data over six years. Biosyst. Eng., 84(4), 455--466 (2003).
[6] Marques Da Silva, J.R. (2006). Analysis of the Spatial and Temporal Variability of
Irrigated Maize Yield. Biosyst. Eng., 94, 337349.
[7] Di Rienzo, J.A., Casanoves, F., Balzarini, M.G., Gonzalez, L., Tablada, M., Robledo, C.W.
URL http://www.infostat.com.ar.



RELACIN PESO-DIMETRO DE FRUTOS EN VARIEDADES DE
MANDARINA Y LIMN DE LA PROVINCIA DE CORRIENTES

BBEDA, G.R.R
1
.; GIMNEZ, L.I
1
.; GAIAD, J.E
1
, CHABBAL, M.
2
MONTOYA, A.N
1
.;
MAZZA, S.M
1
.

1
Clculo Estadstico y Biometra. FCA. Universidad Nacional del Nordeste
2
Ctedra de Fruticultura, FCA UNNE

griseldabobeda@gmail.com

RESUMEN
La estimacin del peso de un fruto en funcin del dimetro ecuatorial es frecuentemente
utilizada porque permite transformar el dimetro a la cosecha en peso. Existen diversas
funciones matemticas que explican esta relacin. El objetivo del trabajo fue estimar la
funcin que mejor ajuste la relacin entre el peso y el dimetro de frutos de mandarino y
limn. La experiencia se realiz en lotes comerciales de mandarino Tangor Murcot (Citrus
reticulata C. sinensis) injertados sobre Poncirus trifoliata (L.) Raf, Okitsu (Citrus unshiu
Marc.), injertados sobre Poncirus trifloliata (L.) Raf., y Limn Eureka (Citrus limon L. Burm)
injertados sobre Lima de Rangpur (Citrus limonia Osb), ubicados en la provincia de
Corrientes, Argentina. Las mediciones se realizaron entre los aos 2011/12. Se
seleccionaron entre un 3 y 5% de rboles (dependiendo de la variedad) y, en cada rbol, se
seleccion una muestra al azar de 50 frutos, mediante un muestreo bietpico. Al momento
de la cosecha se determin el peso de frutos (g) con balanza digital y el dimetro ecuatorial
(mm) con calibre digital. Se evaluaron los modelos: potencial, exponencial y lineal utilizando
el criterio de seleccin AIC (criterio de Akaike) y el CME; los datos fueron analizados con el
software InfoStat 2013. Para las tres variedades se seleccion el modelo potencial. Los
valores de los parmetros fueron a=0.0037, b=2.51 para Tangor Murcot; a=0.00089, b=2.83
para Okitsu y a=0.00018, b=2.72 para Limn Eureka. Los valores del parmetro b, fueron
similares en todas las variedades.

Palabras claves: prediccin de rendimiento, produccin de ctricos, criterios de
seleccin

Introduccin

La cuantificacin, por medio de un modelo, de la relacin de dimetro ecuatorial con el peso
de frutos permite transformar el dimetro a la cosecha en peso para categorizar cada
tamao de fruto en relacin al peso de los envases comerciales utilizados en el mercado
externo. Arzani et al. (1999) utilizaron diversas funciones matemticas para describir la
relacin entre diferentes atributos del fruto y su peso. Bramardi (1995) ajust modelos
potenciales a la relacin peso-dimetro de frutos de pera 'Williams' y 'Packham's Triumph',
con coeficientes de determinacin R
2
=0.99 Para frutos de mandarino 'Ponc' (Citrus
reticulata, Blanco), en Viosa Minas Gerais, Esposti et al. (2008) estimaron el peso a
cosecha en funcin al dimetro, aplicando una ecuacin de regresin lineal (R
2
=0,83).
Avanza (2011) ajust un modelo potencial a la relacin peso-dimetro en naranja 'Valencia
late', donde los parmetros estimados arrojaron bajos errores estndares de estimacin
(EE).
El objetivo del presente trabajo fue estimar la funcin que mejor ajuste la relacin entre el
peso y el dimetro de frutos de mandarino y limn.



Desarrollo
La mediciones se realizaron entre las campaas 2010/11 (Tangor Murcot), 2011/12 (Okitsu)
y 2010/11-2011/12 (Limn Eureka.). Para la variedad Tangor Murcott se cont con 815
plantas distribuidas en un marco de plantacin de 63 m, para la variedad Okitsu se cont
con 1738 plantas con una distancia de plantacin de 63 m y finalmente para la variedad de
Limn Eureka se cont con 403 plantas distribuidas en un marco de plantacin de 74 m.
Las tres variedades utilizan sistema de riego por goteo y el tipo de suelo es arenoso. Se
seleccionaron entre un 3 y 5% de rboles (dependiendo de la variedad) y en cada rbol se
seleccionaron, al azar, 50 frutos. Al momento de la cosecha se determin el peso de frutos
(g) con balanza digital y el dimetro ecuatorial (mm) con calibre digital. Los modelos
evaluados fueron: potencial (y=A*xB) lineal simple (y=A+Bx) y exponencial
(y=A*exp(B*x)donde: y= peso individual de frutos (g); x= dimetro ecuatorial de frutos (mm)
y
A, B= parmetros del modelo.Se utilizaron como criterio de seleccin el valor de AIC
(criterio de Akaike) y CME (cuadrado medio del error); los datos fueron analizados con el
software InfoStat 2013.

Resultados y conclusin
Para cada variedad se presentan los grficos de la funcin, los modelos, los parmetros
estimados entre la relacin peso-dimetro y los criterios de seleccin (Figuras 1,2 y 3).
47.44 56.11 64.78 73.45 82.12
DE
0
50
100
150
200
250
P
e
s
o

(
g
)

Modelo Parmetro EE CME AIC

Potencial

a=0.0037

0.0044

72.15

6594.02
b= 2.73 0.03

Exponencial

a= 12.84

0.37

73.34

6609.15
b=0.04 0.00040

Lineal

a= -231.05

4.38

75.08

6626.98.
b= 5.56 0.06
a. b.
Figura 1. Variedad Tangor Murcot, a. Funcin ajustada con modelo Potencial. b. parmetros
estimados, errores de estimacin y criterios de seleccin de cada modelo.
45.14 57.14 69.15 81.16 93.16
DE (mm)
0
50
100
150
200
250
P
e
s
o

(
g
)


Potencial

a=0.00089

0.00009

157,54

6685,33
b= 2.83 0.02

Exponencial

a= 9.80

0.24

171,81

6758,70
b=0.04 0.00033

Lineal

a=-264.53

4.09

212,77

6932,07
b=5.95 0.06
a. b.
Figura 2. Variedad Okitsu, a. Funcin ajustada con modelo Potencial. b. Parmetros


41.49 49.62 57.74 65.86 73.99
DE (mm)
0
50
100
150
200
250
P
e
s
o

(
g
)


Potencial

a=0.00018

10.64

51.11

4751.00
b= 2.72 0.02

Exponencial

a= 8.56

0.21

59.67

4859.57
b=0.56 0.0004

Lineal

a=-210.42

2.81

54.29 4788.75
b=5.77 0.05
a. b.
Figura 3. Variedad Limn Eureka, a. Funcin ajustada con modelo Potencial. b. Parmetros
Los valores del parmetro b, fueron similares y se encuentran entre 2.51 y 2.85 en todas las
variedades. Esto puede deberse al tamao (dimetro ecuatorial) con que los frutos llegan a
la cosecha, dependiendo de la campaa y caractersticas de los lotes comerciales.

Bibliografa
Bramardi, S.J. 1995. Modelos de prediccin de tamao de frutos a la cosecha en base a
mediciones sucesivas durante el perodo de crecimiento. Peras cvs. Williams y Packhmans
Triumph en la regin del Alto Valle de Ro Negro y Neuqun. Tesis para optar al grado de
Magister Scientiae- rea Biometra. UBA e Instituto Nacional de Tecnologa
Agropecuaria.169 p.
Arzani, K., Lawes, S., Wood, D. 1999. Estimation of Sundrop apricot fruit volume and fresh
weight from diameter. Acta Hoticulturae, 488:321-326.
Esposti, M.D.D, Lopez Squeira, D., Ceco, P.R. 2008. Crescimento de frutos de tangerineira
'Ponc'(Citrus reticulata, Blanco). Revista Brasileira de Fruticultura, 30 (3):657-661.
Avanza, M.M. 2011. Desarrollo de una propuesta metodolgica para la prediccin de
cosecha de naranjo dulce (Citrus sinensis L. Osbeck) var. Valencia Late en la provincia de
Corrientes, Argentina. Doctorado en el Area de Recursos Naturales. UNNE. 227 p.
URL http://www.infostat.com.ar


EFICACIA RELATIVA DE MODELOS DE MAPEO ASOCIATIVO PARA
VARIABLES NO GAUSSIANAS

AGUSTN GONZLEZ REYMNDEZ
1
, ARIEL CASTRO
2
, LUCA GUTIRREZ
1

1
Facultad de Agronoma, Departamento de Biometra, Estadstica y Computacin, Udelar,
Uruguay
2
Facultad de Agronoma, Departamento de Produccin Vegetal, Udelar, Uruguay

agugonrey@fagro.edu.uy

RESUMEN
El mapeo asociativo es el mtodo ms eficaz para detectar genes de efecto cuantitativo
(QTL, quatitative trait loci) necesarios para la seleccin asistida para el desarrollo de
variedades mejoradas. Muchas de la variables fenotpicas de inters con base gentica
cuantitativa (eg. respuesta a enfermedades, supervivencia, censos, fenologa) no siguen una
distribucin gaussiana. Dado que los modelos estadsticos convencionales para el mapeo
asociativo suponen distribucin normal de los errores, los desvos de la normalidad afectan
negativamente la validez de la inferencia a partir del ajuste de estos modelos. Si bien existen
mltiples aproximaciones para tratar con los desvos de la normalidad en la deteccin de
QTL (eg. transformaciones, modelos lineales generalizados, mtodos no paramtricos), no
est claro cul es su ganancia relativa en la deteccin y estimacin de efectos de QTL.
Para responder eso, en un contexto de datos simulados, comparamos distintos mtodos de
mapeo asociativo sobre variables no gaussianas para distintos escenarios poblacionales y
comparamos su eficacia relativa en trminos de su potencia estadstica y tasa de falsos
positivos en la deteccin de QTL. Obtuvimos que la eficacia de los mtodos comparados fue
la misma en la mayora de los escenarios

Palabras clave: mapeo asociativo, variables no gaussianas, comparacin de modelos

Introduccin
El mapeo asociativo es la identificacin de marcadores de herencia simple en desequilibrio
de ligamiento con factores genticos que afectan la expresin de variables fenotpicas
cuantitativas (Quantitative Trait Loci, QTL) en poblaciones naturales o bancos de
germoplasma [1] . En comparacin con los mtodos clsicos de mapeo de QTL, el mapeo
asociativo permite detectar genes sobre una mayor base gentica, con mayor resolucin y
con menores tiempos y costos que a partir de cruzamientos biparentales [1]. Si bien las
fuentes de desequilibrio no debido a la distancia fsica entre marcadores (originado por
estructura poblacional, seleccin natural y artificial, cuellos de botella, coancestra, etc.),
puede generar falsos positivos en la pruebas de asociacin, esto es tenido en cuenta por los
modelos convencionales de mapeo asociativo[24]. No obstante, muchas variables
fenotpicas de inters no se distribuyen normalmente, lo que afecta las suposiciones al
ajustar estos modelos, que son variaciones del modelo lineal mixto. La violacin de
supuestos distribucionales en la pruebas de asociacin puede afectar la calidad de la
inferencia sobre la posicin y efecto de los QTL [5] por lo que se han propuesto varias
aproximaciones para tratarla[57]. Si bien se conocen las ventajas tericas de estos
mtodos, no est claro cul es la ganancia relativa en la deteccin de QTL al compararse
empricamente con mtodos a priori ms sencillos, cuando no se conoce la exacta
distribucin de la variable de respuesta (ie. el modelo exacto que vincule la expresin
fenotpica con los efectos genticos) . Para responder esto se compararon, en un contexto
de simulaciones, varios modelos para el mapeo asociativo sobre variables no gaussianas,
en trminos de su eficacia relativa en la deteccin y estimacin de efectos de QTL.


Desarrollo
a) Simulaciones:
1-Datos genotpicos: Cada poblacin se represent por una combinacin de valores de
tamao poblacional (n), frecuencia de recombinacin (r), heredabilidad (h2), nmero de QTL
(q) y categoras en una escala ordinal (k). Para cada valor de k y r, se muestrearon
genotipos binarios de forma independiente para reducir el desequilibrio de ligamiento no
debido a la distancia fsica, en 7 grupos de ligamiento como en la cebada. Para cada valor
de r se defini el nmero de marcadores por grupo de ligamiento segn los largos en cM del
mapa en [10]. Los QTL se definieron muestreando q marcadores al azar sobre los cuales se
les impuso un efecto , muestreado de una Beta(1.6,5), para obtener un patrn
distribucional como en [11].
2-Datos fenotpicos: Los datos fenotpicos se generaron suponiendo una variable latente y*
para con distribuciones normal y binomial, para cada valor de h2. Una vez muestreados los
valores de y*, se gener la variable fenotpica y discretizando en base a k umbrales. Esto se
repiti 100 veces para cada poblacin
b) Modelos Estadsticos comparados y pruebas de asociacin:
Una vez generados los valores para la variable fenotpica, esta se consider en dos escalas:
como proporciones en una escala cuantitativa y en la escala ordinal original. Para la escala
cuantitativa se ajustaron modelos de regresin simple sin transformacin (Mod1), con
transformacin raz cuadrada (Mod2) y con transformacin logaritmo (Mod3). Para la escala
ordinal se ajustaron regresiones ordinales probit (Mod4) y logit (Mod5), respectivamente. Las
pruebas de asociacin consistieron en pruebas de Ward marcador a marcador.
c) Eficacia relativa de los mtodos comparados:
1-Mtricas de eficacia en la deteccin de QTL: se usaron potencia (P=VP/(VP+FN)) y tasa
de falsos positivos (F= FP/(FP + VN)). Los verdaderos positivos (VP) se definieron como
nmero de ventanas de 2cM en entorno a los QTL, en las cuales algn marcador resulta
positivo para la prueba de asociacin, los falsos negativos (FN) se definieron como el
nmero de estas ventanas dentro de las cuales ningn marcador resulta positivo, los falsos
positivos (FP), se definieron como nmero de ventanas de 2 cM dentro de las cuales no hay
QTL pero algunos marcadores resultan positivos y los verdaderos negativos (VN), se
definieron como el nmero de estas ventanas sin marcadores positivos para la prueba de
asociacin.
2-Comparaciones entre modelos: Para cada valor de k y cada modelo vnculo fenotipo-
genotipo se realiz la prueba de Friedman (suponiendo que estos son los nicos parmetros
que pueden introducir interaccin simulacin-prueba de asociacin) sobre las medianas de
cada mtrica a travs de las iteraciones, tomando como grupos los modelos de mapeo y
como bloques las simulaciones.

Para la potencia, las pruebas de Friedman no permitieron rechazar que los modelos de
mapeo fueran distintos. Para la tasa de falsos positivos, para k=2 y ambos modelos vnculo
fenotipo-genotipo, se rechaz que todos los modelos fueran iguales entre s, revelando que
el modelo 5 difiri del resto y present la menor tasa de falsos positivos. Para k=10 y el
modelo VFG normal, el nico modelo que difiri fue el 4 y es el que tiene mayor FPR. Para
k=10 y modelo VFG multinomial, los modelos 4, 3 y 2 no difirieron entre s, y los modelos
3,2,5 y 1, tampoco. Las diferencias se encontraron para los modelos 4,5 y 1 (Tabla1).


Tabla 1: Prueba de Tukey para la Tasa de Falsos Positivos promedio en la deteccin de
QTL para los modelos de mapeo asociativo comparados, para los modelos de vnculo
fenotipo-genotipo normal y binomial, respectivamente. k= nmero de categoras en la escala
ordinal
Norm Multi
Mod 4 0.169 Mod 4 0.266
a
Mod 1 0.169 Mod 1 0.266
k = 2 Mod 2 0.169 Mod 2 0.266
Mod 3 0.168 Mod 3 0.266
Mod 5 0.161
b
Mod 5 0.262
b

Mod 4 0.203 Mod 4 0.323
Mod 1 0.195
b
Mod 3 0.322
b

k=10 Mod 5 0.195
b
Mod 2 0.322
b

Mod 2 0.192
b
Mod 5 0.319
b

Mod 3 0.189
b
Mod 1 0.318
b

a,b: sin diferencias significativas con =0.05
Conclusiones: Si bien los modelos comparados difieren en algunos escenarios, en todos
ellos, alguno de los modelos generalizados no difiere de alguno de los modelos generales
utilizados, lo que sugiere que no necesariamente tengan una performance superior y que los
modelos sencillos comparados, son igualmente efectivos.

Bibliografa
[1] Abdurakhmonov, I. and A. Abdukarimov (2008), Application of Association Mapping to
Understanding the Genetic Diversity of Plant Germplasm Resources, International journal of
plant genomics, vol(1): 574927.
[2] Malosetti M., C. G. van der Linden, B. Vosman, and F. a van Eeuwijk (2007). A mixed-
model approach to association mapping using pedigree information with an illustration of
resistance to Phytophthora infestans in potato., Genetics, vol(175): 879889.
[3] Yu, J., G. Pressoir, W. H. Briggs, I. Vroh Bi, M. Yamasaki, J. F. Doebley, M. D. McMullen,
B. S. Gaut, D. M. Nielsen, J. B. Holland, S. Kresovich, and E. S. Buckler (2006). A unified
mixed-model method for association mapping that accounts for multiple levels of
relatedness. Nature Genetics, vol(38):203208.
[4] Pritchard, J., M. Stephens, and P. Donnelly (2000). Inference of population structure
using multilocus genotype data Genetics, vol(155): 945959.
[5] Coppieters, W., a Kvasz, F. Farnir, J. J. Arranz, B. Grisart, M. Mackinnon, and M.
Georges (1999). A rank-based nonparametric method for mapping quantitative trait loci in
outbred half-sib pedigrees: application to milk production in a granddaughter design
Genetics, vol(149): 15471555.
[6] Pinheiro, J., C. Liu, and Y. N. Wu (2001). Efficient Algorithms for Robust Estimation in
Linear Mixed-Effects Models Using the Multivariate t Distribution, Journal Of Computational
And Graphical Statistics, vol(10):249276.
[7] Yang, R., N. Yi, and S. Xu (2011). Box-Cox transformation for QTL mapping Genetica,
vol(128): 133143.
[8] Close, T., P. R. Bhat, S. Lonardi, Y. Wu, N. Rostoks, L. Ramsay, A. Druka, N. Stein, J. T.
Svensson, S. Wanamaker, S. Bozdag, M. L. Roose, M. J. Moscou, S. Chao, R. K. Varshney,
P. Szcs, K. Sato, P. M. Hayes, D. E. Matthews, A. Kleinhofs, G. J. Muehlbauer, J.
DeYoung, D. F. Marshall, K. Madishetty, R. D. Fenton, P. Condamine, A. Graner, and R.
Waugh (2009). Development and implementation of high-throughput SNP genotyping in
barley, BMC Genomics, vol(10): 582.
[9] Hayes, B. and M. E. Goddard (2001). The distribution of the effects of genes affecting
quantitative traits in livestock Genetics selection evolution GSE. vol(33): 209229.



AJUSTES DE VALORES-P POR MULTIPLICIDAD EN EL CONTEXTO
DE DATOS DEPENDIENTES Y MAPEO ASOCIATIVO

PEA MALAVERA ANDREA
1
, GUTIERREZ LUCIA
2
, BALZARINI MNICA
1

1
Facultad de Ciencias Agropecuarias, Universidad Nacional de Crdoba, CONICET
2
Facultad de Agronoma- Universidad de la Repblica Uruguay

andreapema@gmail.com

RESUMEN
En mapeo asociativo se utilizan modelos lineales mixtos para evaluar la asociacin entre los
efectos de mltiples genes y el fenotipo de un individuo. Estos modelos para datos
correlacionados han sido exitosamente utilizados ya que permiten contemplar informacin
de la estructura poblacional y parentesco subyacente entre las unidades de anlisis. El
mapeo asociativo en especies vegetales pretende reconocer QTLs (de su nombre en ingls
Quantitative Trait Loci) que codifican para variables de inters. Las pruebas de hiptesis
realizadas gen-por-gen, o marcador-por-marcador, son mltiples y tienden a estar altamente
correlacionadas cuando existe estructura gentica de poblacin, por lo que es necesario
identificar una correccin apropiada para los valores p usados para declarar la significancia
de la asociacin. La correccin por multiplicidad propuesta por Bonferroni, la tasa de
descubrimiento de falsos positivos y la estimacin del nmero efectivo de pruebas
independientes propuesto por Li y Ji (2005) son herramientas usadas para la correccin de
los valores-p en el contexto del anlisis de QTL clsico, donde los individuos se suponen
igualmente emparentados. El objetivo de este trabajo es evaluar una nueva propuesta de
correccin de valores p para el contexto de MA, que toma la idea del nmero efectivo de
pruebas independientes pero ste es deducido luego de ajustar la estructura gentica
subyacente en las lneas de mapeo bajo diferentes modelos lineales mixtos para datos
genticamente correlaconados.

Palabras clave: Estructura gentica, pruebas de hiptesis correlacionadas, modelos
mixtos, nmero efectivo de pruebas de hiptesis.

Introduccin
En estudios de mapeo asociativo (MA), se realizan mltiples pruebas de hiptesis
simultneamente con el fin de reconocer QTLs (de su nombre en ingls Quantitative Trait
Loci) asociados a caractersticas fenotpicas de inters. Los estudios de MA con alta
densidad de datos de marcadores moleculares del tipo SNP son cada vez ms populares
debido a la disponibilidad de las nuevas tecnologas de genotipado (e.g., Affymetrix e
Illumina) con costos relativamente bajos para la produccin de datos de marcadores. A su
vez, los estudios de MA tambin son cada vez ms frecuente en el mejoramiento gentico
vegetal porque con ellos es posible mejorar la potencia de las pruebas de asociacin sin
aumentar el costo de desarrollo de poblaciones especficas de mapeo. Cuando en el anlisis
de la asociacin entre los SNP y el fenotipo no se tiene en cuenta la estructura gentica
subyacente, se incrementa la cantidad de falsos positivos entre los QTLs identificados. Se
han propuesto varios procedimientos para ajustar las pruebas de asociacin por la
estructura gentica subyacente. Un mtodo comnmente utilizado para identificar dicha
estructura es el mtodo bayesiano disponible en el software STRUCTURE [1]. Los modelos
lineales mixtos han sido exitosa y ampliamente usados en mapeo asociativo para introducir
factores como parentesco y estructura poblacional en el contexto de pruebas de asociacin
entre marcadores moleculares y el fenotipo [2-4].
Para declarar QTLs, es necesario realizar pruebas de hiptesis entre mltiples loci situados
a travs del genoma y el mismo fenotipo. Cuando muchas pruebas de hiptesis son


realizadas desde los datos, hay dos tipos de tasas de error relacionadas tanto a error tipo I
como a error tipo II. La tasa de error tipo I por comparacin es la probabilidad de error tipo I
para cada prueba de hiptesis. La tasa de error tipo I por experimento es la probabilidad de
tener al menos un error de tipo I (falso descubrimiento) al realizar el conjunto de pruebas de
hiptesis. Una solucin divulgada para controlar la tasa de error tipo I por experimento es la
aproximacin de Bonferroni [5]. Sin embargo, sta es demasiado conservadora cuando se
aplica a MA dado que pueden requerirse ms de 1000 pruebas de hiptesis. Se han
propuesto otros mtodos para eludir el problema, por ejemplo, mtodos que controlan la
probabilidad de falso positivo, la que requiere consideracin explcita de la probabilidad
especificada a priori para cada hiptesis que se contrasta. Para pruebas independientes,
Benjamini y Hochberg (1995) [6] propusieron un procedimiento para el control de la tasa de
falsos descubrimientos (FDR). El mtodo de control FDR se extendi a los casos de pruebas
correlacionadas o dependientes bajo ciertas condiciones, por ejemplo, asumiendo que las
pruebas estadsticas son igualmente correlacionadas positiva y normalmente distribuidas.
Para pruebas correlacionadas, Benjamini y Yekutieli (2001) [7] propusieron un procedimiento
simple pero altamente conservador. En 2001, Cheverud [8] propuso la idea de ajustar
pruebas correlacionadas como si fueran independientes de acuerdo con un nmero efectivo
(Meff) de pruebas independientes. Li y Ji (2005) [9] propusieron una estimacin ms precisa
del nmero Meff, y el diseo basado en procedimientos Meff para controlar la tasa de error
tipo I por experimento. La propuesta parte de la matriz de desequilibrio de ligamiento entre
los marcadores para identificar redundancias. Sin embargo, esa propuesta se desarroll en
el contexto del anlisis de QTL y no en el contexto de MA donde intervienen poblaciones
estructuradas y por tanto no considera la correlacin entre las pruebas de hiptesis
ocasionadas por la presencia de estructura gentica entre la lneas de mapeo. En este
trabajo, proponemos una estimacin del nmero efectivo de test basada en el uso de
modelos lineales mixtos para el ajuste previo de las estructura de correlacin subyacente. El
nuevo mtodo toma la idea propuesta por Li y Ji (2005), pero modifica la matriz de
desequilibrio de ligamiento para los loci por una matriz dada por las pendientes resultante de
regresiones lineales realizadas entre pares de marcadores que corrigen por la estructura
gentica subyacente, luego se estima el nmero efectivo de pruebas independientes
realizando la descomposicin de valores propios de esa matriz de coeficientes de regresin.
El objetivo del trabajo es evaluar el desempeo del procedimiento propuesto para la
seleccin de QTLs candidatos.

Materiales y Mtodos
Se simularon datos de marcadores moleculares con el programa QMSim [10] para
poblaciones algamas y con el programa Easypop [11] para poblaciones autgamas.
Datos simulados poblaciones algamas
Para datos de poblaciones algamas los datos se simularon asumiendo poblaciones de
polinizacin cruzada y caracterizadas por un genoma de 3000 marcadores biallicos, otros
parmetros de simulacin fueron: 3 poblaciones, diseo de seleccin aleatoria,
apareamiento aleatorio, dos niveles de diversidad gentica entre poblaciones, uno y dos
QTLs por cromosoma, tres niveles de heredabilidad (0.3, 0.5 y 0.8). En total se definieron 12
escenarios biolgicos. Cada escenario fue replicado 100 veces y para cada uno de ellos se
dispone de informacin sobre la posicin verdadera de cada uno de los QTLs simulados.
Datos simulados poblaciones autgamas
Para datos de poblaciones autgamas los datos se simularon asumiendo 2100 marcadores,
3 poblaciones sin cruzamientos aleatorios, proporcin clonal igual a cero, autofecundacin
caracterizada por 1, un modelo de migracin de islas jerrquico, dos valores de proporcin
de migracin dentro de grupos: 0.2 y 0.1, proporcin de migracin entre grupos de 0.1, 0.2 y
0.3, tasa de recombinacin entre loci de 0.03, y tasa de mutacin igual a cero. Sobre los
datos simulados en Easypop se seleccionaron aleatoriamente 10 marcadores de la matriz


gentica, en base a estas posiciones se generaron fenotipos distribuidos normalmente, este
proceso nos permite saber la ubicacin de los marcadores que afectan a la realizacin del
fenotipo e identificar posteriormente los falsos positivos
Mapeo Asociativo
Se corrieron cinco modelos lineales mixtos propuestos en el contexto de mapeo asociativo
para encontrar el efecto del marcador sobre el fenotipo de inters corrigiendo por
relacionamiento gentico en las siguientes formas: 1) utilizando covariables de efectos fijo o
aleatorio (Q= los scores de los ejes significativos de un anlisis de componentes principales
y factores indicando perteneca a grupos dados por la simulacin); 2) incluyendo una matriz
de parentesco con coeficientes de coancestra entre genotipos utilizando un modelo mixto
con efecto aleatorio de genotipo (Z); 3) utilizando tanto una covariable de estructura gentica
como una matriz de parentesco Tambin se hizo un anlisis sin considerar correcciones por
estructura o parentesco (modelo naive).
Comparacin de Mtodos de deteccin de QTls
Se aplicaron a los resultados de los cinco modelos las correcciones de Bonferroni, Benjamini
y Hochberg, Li y Ji y nuestra propuesta. Se calcularon las tasas de falsos positivos, falsos
negativos, verdaderos positivos y verdaderos negativos para cada correccin implementada.

Se espera que el mtodo de Li and Ji modificado propuesto en este trabajo permita disminuir
la tasa de falsos positivos (FDR) y que sea menos conservador que los mtodos de
Bonferroni o Benjamini y Yekutielli. Tambin se espera que el procedimiento sea ms
apropiado para poblaciones de MA, ya que tiene en cuenta la posible estructura poblacional
que se encuentra en los genotipos objeto de anlisis.

Bibliografa
1. Pritchard, J., M. Stephens, y P. Donnelly, "Inference of population structure using
multilocus genotype data". Genetics, 2000. 155: p. 945-959.
2. Malosetti, M., et al., "A Mixed-Model Approach to Association Mapping Using Pedigree
Information With an Illustration of Resistance to Phytophthora infestans in Potato." Genetics,
2007. 175(2): p. 879-889.
3. Stich, B., Mhring J., Piepho H., Heckenberger M., Buckler E.S. y Melchinger A.E. ,
"Comparison of mixed-model approaches for association mapping". Genetics, 2008. 178: p.
9.
4. Yu, J., et al., "A unified mixed-model method for association mapping that accounts for
multiple levels of relatedness". Nat Genet, 2006. 38(2): p. 203-208.
5. Bonferroni, C.E., "Il calcolo delle assicurazioni su gruppi di teste". Studi in Onore del
Professore Salvatore Ortu Carboni. , 1935: p. 13-60.
6. Benjamini, Y. y Y. Hochberg., "Controlling the False Discovery Rate: A Practical and
Powerful Approach to Multiple Testing." Journal of the Royal Statistical Society., 1995. 57(1):
p. 11.
7. Benjamini, Y. y D. Yekutieli., "The Control of the False Discovery Rate in Multiple Testing
under Dependency." The Annals of Statistics 2001. 29(4): p. 23.
8. Cheverud, J.M., "A simple correction for multiple comparisons in interval mapping genome
scans." Heredity, 2001. 87(Pt 1): p. 52-58.
9. Li, J. y L. Ji, "Adjusting multiple testing in multilocus analyses using the eigenvalues of a
correlation matrix." Heredity, 2005. 95(3): p. 221-227.
10. Sargolzaei, M. y F. Schenkel, "QMSim: a large-scale genome simulator for livestock."
. Bioinformatics 2009. 25: p. 680-681.
11. Balloux, F., "Easypop (version 1.7): a computer program for population genetics
simulations." Journal of Heredity, 2001. 92: p. 301-302.


MODELO PARA LA DETERMINACIN DEL AREA FOLIAR DE
Ipomoea nil. Roth. USANDO MEDIDAS DE LAS HOJAS

RAA, E.
1
, OCHOA, M.DEL C.
2
, SOBRERO, M.T.
2,
, CHAILA, S. y LERANOZ, E.
2

1
Ctedra de Estadstica
2
Ctedra de Matologa.
Facultad de Agronoma y Agroindustrias, Universidad Nacional de Santiago del Estero.

eriran@unse.edu.ar

RESUMEN
El gnero Ipomoea comprende aproximadamente 500 especies, de las cuales alrededor de
200 se encuentran en Amrica tropical y subtropical. De stas, 50 crecen en Argentina
(O'Donell, 1959; Das et al., 1995). En Santiago del Estero, en el rea de riego del Ro Dulce,
es comn encontrarlas como ruderales, como ornamentales o invadiendo cultivos.
I.grandifolia; I. nil e I. purpurea son malezas en los cultivos de algodn, soja y maz. (Carrizo,
y Sobrero, 2001)
El presente trabajo se realiz para obtener un modelo que permitiera estimar el rea foliar
de Ipomoea nil Roth. a partir de muestreo no destructivo. Se seleccionaron hojas de plantas
elegidas al azar creciendo en lotes de algodn. Se determinaron el largo (L) y ancho (A) de
las hojas y se midi el rea foliar (AF) en un Laser Area Meter CI-203, CID,Inc. Se ajustaron
modelos lineales y no lineales con diferentes regresoras. El modelo seleccionado fue el
lineal simple que considera como variable regresora el producto del ancho por el largo de la
hoja (AxL). La ecuacin propuesta es AF
estimada
= 1.231 + 0.651 (LxA), R
2
= 0.936

Introduccin
Las malezas, en general, poseen diversos y complejos mecanismos de adaptacin, que les
permiten, sobrevivir y reproducirse en condiciones adversas, debido a la capacidad de
modificar su fenotipo, como respuesta a las variaciones del medio en el que crecen. Los
estudios ecofisiolgicos bsicos son fundamentales para entender las respuestas a
diferentes condiciones ambientales y predecir su xito como maleza (Duarte et al, 2008). La
evaluacin del crecimiento y desarrollo del rea foliar (AF) es uno de los parmetros ms
importantes (Bianco et al., 2007), en la mayora de los estudios agrcolas y fisiolgicos
involucrados en el crecimiento vegetal, captacin de luz, eficiencia fotosinttica, respiracin
y transpiracin (Casierra-Posada, F. et al, 2008).
La determinacin del AF puede realizarse por mtodos directos o indirectos. Los mtodos
directos consisten en medir el rea de las hojas recolectadas mediante un equipo
electrnico. Este procedimiento est limitado a la disponibilidad del equipo. Uno de los
mtodos indirectos no destructivos ms frecuentemente usados es estimar el AF a partir de
una ecuacin matemtica que involucra medidas lineales de las hojas tales como el largo (L)
y el ancho (A) (Blanco y Folegatti, 2003).
Bianco,S. et al. (2007) proponen una ecuacin para determinar el rea foliar de Ipomoea nil
a partir de las dimensiones de la hoja (ancho y largo). Segn dicha expresin, el rea foliar
ser: AF = 0,6122 x (A x L).
El presente trabajo tiene como objetivo verificar si la ecuacin mencionada es vlida para
ser aplicada al clculo del AF de Ipomoea nil (IPONI) en el rea de riego del Ro Dulce,
Santiago del Estero, ya que las dimensiones de las hojas recolectadas resultaron de un
tamao en promedio menor al de las referidas en el trabajo de Bianco, S. (2007) o bien
encontrar una ecuacin que permita la prediccin del AF en funcin de esas mismas
dimensiones, para los tamaos de las hojas que se presentan en estos ambientes.


IPONI es una maleza que modifica su crecimiento segn la distancia entre lneas de cultivo,
el momento de emergencia durante el ciclo y las condiciones ambientales, al modificar la
asignacin de recursos a tallos u hojas, segn la densidad del cultivo (siembras
convencionales o en surcos estrechos). Ello implica una gran variacin en nmero y tamao
de hojas (Ochoa et. al.,com. Pers.).

Desarrollo
En el mes de enero de 2004, se recolectaron 86 hojas de IPONI provenientes de plantas
ubicadas en los bordes de lotes de algodn (Gossypium hirsutum), en el Campo
Experimental La Mara INTA, Santiago del Estero (28 03LS; 6415LW; 109 m.s.n.m). Las
mismas fueron llevadas al laboratorio para determinar las medidas de largo (L) ancho (A).
Las dimensiones de las hojas de IPONI recogidas se describen a continuacin:

Dimensin cantidad de hojas Media Desvo .Estndar. Mn Mx
Largo (cm) 86 3,92 1,59 0,80 7,50
Ancho (cm) 86 4,46 1,90 1,00 9,00
LxA (cm
2
) 86 20,20 15,09 0,80 67,50

Posteriormente, se midieron las reas foliares respectivas usando un equipo Laser Area
Meter CI-203, CID,Inc.. Se seleccionaron los siguientes modelos para realizar el anlisis de
regresin y elegir la ecuacin adecuada.
Modelo
1. AF = o + | A 3. AF = o + | (AxL) 5. AF = o |Â 7. AF = o A^|
2. AF = o + | L 4. AF = | (AxL) 6. AF = o |^L 8. AF = o L^|

Se prob el cumplimiento de los supuestos de la regresin y la validez de los coeficientes
estimados. Se seleccion el modelo de menor cuadrado medio del error, y de bajo error
estndar de estimacin de los coeficientes.
Se realiz una prueba de t para muestras pareadas a fin de verificar si la diferencia entre
los valores de AF estimados y los medidos con el escner resultaba significativa.

En la Tabla se presentan las ecuaciones obtenidas y los valores del cuadrado medio del
error.
Modelo CM error Ecuacin
1. AF = o + | A 12,021 -8.060 + 5.028 A
2. AF = o + | L 10,926 -9.282 + 6.038 L
3. AF = o + | (AxL) 6,691 1.231 + 0.651 (LxA)
4. AF = | (AxL) 7,158 0.690 (LxA)
5. AF = o |Â 14,857 3.238*1.353Â
6. AF = o |^L 12,205 2.883*1.450^L
7. AF = o A^| 10,801 1.090A^1.660
8. AF = o L^| 8,830 1.120 L^1.790

Todos los modelos resultaron adecuados para estimar el AF, ya que sus trminos realizan
una contribucin significativa. Los modelos lineales que usan como regresora el producto
(AxL) son los que presentan menor cuadrado medio del error (menor dispersin de las
observaciones en torno a la recta de regresin). Entre stos dos modelos se seleccion
como mejor al que tiene ordenada al origen por ser el que presenta menor cuadrado medio
residual, menor error cuadrtico medio de prediccin (7.123 y 7.516 para los modelos con y
sin ordenada al origen) y menor valor de AIC (411.503 y 416.318 respectivamente). A
continuacin se presentan los valores de los coeficientes estimados, el error estndar de la


estimacin (EE), los lmites del intervalo de 95% de confianza y los resultados de la prueba
de t para probar la significacin de los coeficientes.

Coeficiente Estimacin E.E. LI(95%) LS(95%) T p-valor
Ord. origen 1,231 0,468 0,301 2,162 2,632 0,0101
LxA 0,651 0,019 0,614 0,688 34,994 <0,0001

La ecuacin resultante es: AF = 1.231 + 0.651 (LxA). El coeficiente de determinacin para el
modelo elegido es R
2
= 0.936.
La comparacin entre las reas estimadas por la ecuacin de regresin y las medidas por el
medidor de AF result no significativa ( p = 0.9753), lo cual indica que en promedio, no hay
diferencia entre las estimaciones y las mediciones.
Como conclusin, la ecuacin AF = 1.231 + 0.651 (LxA) permite la estimacin adecuada del
AF de IPONI cuando el producto del A x L de las hojas se encuentra comprendido entre 0.80
y 67.5 cm
2
. Debido a la amplitud del rango de la regresora, la expresin se podr aplicar a
hojas de tamaos muy diversos.

0,00 13,50 27,00 40,50 54,00 67,50
LxA
0,00
11,83
23,66
35,49
47,31
A
F
AF =1.231 +0.651 (LxA)

Grfico que representa los valores de AF observadas y la recta de regresin estimada

Bibliografa
Bianco, S., Bianco, M.S., Pavani, M.C.M.D. y Duarte, D.J. 2007. Estimativa da rea foliar de
Ipomoea heredifolia e Ipomoea nil Roth. Usando dimenses lineares do limbo foliar. Planta
Daninha, Viosa-MG,v.25, n.2, p.325-329.
Blanco, F. y Folegatti, M. 2003. A new method for estimating the leaf area index of
cucumber and tomato plants. Horticultura Brsileira 21(4):666-669
Casierra-Posada, Fnor; Pea Z., Germn Ricardo y Pea-Olmos, Jaime E. 2008.
Estimacin Indirecta del rea Foliar en Fragaria vesca L., Physalis peruviana L., Acca
sellowiana (Berg.) Burret, Rubus glaucus L., Passiflora mollissima (Kunth) L. H. Bailey Y
Ficus carica L.. 2008. Revista de la Universidad de Ciencias Aplicadas y Ambientales,
vol.11, n.1, pp. 95-102.
Duarte, D.J., Bianco, S., Melo M.N. e Carvalho, L.B. 2008. Crescimento e nutrio mineral
de Ipomoea nil Roth. Viosa-MG,v.26, n.3, p.577-583.
O'Donell, C.A. Las especies americanas de Ipomoea L. Sect. Quamoclit (Moench) Griseb.
1959.Lilloa v.29, p.19-86,
Das, S., Mitra, S.K., Mukherjee, K.K. Sem studies on seed coat of some species of Ipomoea
(Convolvulaceae). 1995. Phytomorphology, v.45, n.1/2, p.113-125.


Carrizo, E. del V. y Sobrero,.M.T. 2001 Descripcin de las especies del gnero Ipomoea
presentes en el area de riego del ro Dulce, Santiago del Estero, Argentina. Planta daninha,
vol.19, n.2, pp. 155-161.


APLICACION DE LA ESTRUCTURA FACTOR ANALYTIC EN EL
ANALISIS DE ENSAYOS MULTI-AMBIENTALES

MARIA VALERIA PACCAPELO
1

1
Investigacin Maz, Monsanto Argentina

mpacc@monsanto.com

RESUMEN
En el rea de mejoramiento gentico, la evaluacin de los genotipos se realiza por medio de
una red de ensayos en diversos ambientes que se conoce como ensayos multi-ambientales
(MET). Los mismos son capaces de captar no slo el efecto de los ambientes (E) y los
genotipos (G) sino tambin de la interaccin genotipo-ambiente (GE). Un efecto de
interaccin GE significativo puede resultar en cambios de la diferencia absoluta que existe
entre dos genotipos y/o diferencias en el ranking que los genotipos presenten en las
ambientes. Cambios en el ranking de los genotipos al pasar de una localidad a otra causa
dificultades en la seleccin de aqullos genotipos con mejor desempeo a travs de varias
ambientes. El ajuste de modelos mixtos con estructura de covarianza factor analytic (FA) por
medio de la librera asreml-R ofrece una gran flexibilidad para analizar METs ya que permite
modelar los efectos genticos y su interaccin con el ambiente adems de efectos no
genticos como por ejemplo la heterogeneidad de varianzas de los ambientes. Adems,
permite la realizacin de un biplot que ayuda a interpretar el desempeo de los genotipos y
su interaccin con los ambientes. Este trabajo tuvo como objetivo ilustrar la aplicacin de un
modelo mixto que considera la estructura FA para analizar un conjunto de datos simulados
de estructura similar a los obtenidos en los MET.

Palabras clave: MET, genotipo, ambiente, factor analytic, asreml.

Introduccin
En el rea de mejoramiento gentico, la evaluacin de los genotipos se realiza por medio de
una red de ensayos en diversos ambientes que se conoce como ensayos multi-ambientales
(MET). Los mismos son capaces de captar no slo el efecto de los ambientes (E) y los
genotipos (G) sino tambin de la interaccin genotipo-ambiente (GE). Un efecto de
interaccin GE significativo puede resultar en cambios de la diferencia absoluta que existe
entre dos genotipos y/o diferencias en el ranking que los genotipos presenten en las
ambientes. Cambios en el ranking de los genotipos al pasar de una localidad a otra causa
dificultades en la seleccin de los genotipos que tengan mejor desempeo a travs de varias
ambientes. Ambientes relativamente homogneas pueden ser agrupadas en lo que se
denomina mega-ambientes (ME) para incrementar la respuesta a la seleccin.
El ajuste de modelos mixtos ofrece una gran flexibilidad para analizar METs ya que permite
modelar los efectos genticos y su interaccin con el ambiente as como tambin efectos no
genticos como por ejemplo la heterogeneidad de varianzas de los ambientes.
Asreml-R [1] es una librera del paquete estadstico R [2] que permite el ajuste de modelos
mixtos a travs de la mxima verosimilitud residual [3]. Entre las estructuras de covarianzas
que pueden emplearse, se encuentra la denominada Factor Analytic (FA) que permite
modelar covarianzas de manera flexible con un nmero de parmetros muy inferior al caso
sin estructura.
La estructura FA se implementa en el modelado de la interaccin GE, dando lugar a la
estimacin de correlaciones genticas entre ambientes. Adems, si se utiliza una estructura
FA de orden 2 o superior, se puede lograr una representacin grfica por medio de un biplot


que ayuda a interpretar el desempeo de los genotipos y sus interacciones con los
ambientes.
El presente trabajo tuvo como objetivo ilustrar la aplicacin de un modelo mixto con una
estructura de covariancia FA de orden 2 a un conjunto de datos simulado de estructura
similar a cualquier conjunto de datos proveniente de un MET, que contiene efectos de
interaccin genotipo-ambiente.

Desarrollo
Con el objetivo de investigar la aplicabilidad de la estructura factor analytic en MET, se
simul un conjunto de datos que considera 16 genotipos en 20 ambientes con dos
repeticiones. Los datos se generaron de manera que presenten efectos de genotipos,
ambientes e interaccin GE.
Para el anlisis se consider un modelo mixto de la forma , siendo el
vector de observaciones, el vector de efectos fijos de localidad, el vector de efectos
aleatorios (genotipo e interaccin GE), el vector de residuales y matrices de diseo.
Los vectores aleatorios y se suponen con distribucin normal, independientes y con
matrices de varianza y respectivamente. En particular la estructura de la matriz
modela la interaccin GE de manera que los genotipos son independientes entre ellos
mientras que permitiremos posible correlacin gentica entre ambientes. En este trabajo,
esto se abordo suponiendo que es el resultado del producto directo entre una matriz de
estructura factor analytic de orden 2 para los ambientes y una matriz identidad para los
genotipos, es decir, , siendo la matriz con estructura factor analytic
de orden 2 que utiliza 2*20+20=60 parmetros contra 20*21/2=210 parmetros que se
utilizaran en el caso de no suponer estructura (no-estructurada). es la matriz de cargas de
tamao 20x2 mientras que es una matriz diagonal 20x20 de pesos especficos de cada
ambiente.
Esta estructura es contemplada dentro de la librera asreml-R disponible en el programa
estadstico R, por lo tanto se aplica su correspondiente funcin asreml para estimar el
modelo mixto.
La interpretacin grfica de la matriz a travs de un biplot permiti estudiar
tanto la interaccin de los genotipos con los ambientes como tambin la conformacin de
mega-ambientes. Para favorecer a la visualizacin de grupos de ambientes se realiz un
grfico conocido con el nombre de heatmap que agrupa las ambientes presentando el
dendrograma correspondiente. Dicho grfico se puede obtener aplicando la funcin heatmap
de la librera stats de R.

De la estimacin del modelo se obtuvo la matriz estimada de correlaciones genticas entre
ambientes. La misma se utiliz como dato de entrada para los grficos de la Fig. 1. En la
parte (a), se muestra el heatmap con el fin de agrupar ambientes similares. A simple vista se
pueden observar dos grandes grupos con ambientes muy correlacionados positivamente
dentro de cada uno de los grupos: por un lado el grupo representado por E1-E5 y por otro
E16-E20.
En la parte (b) se representa el biplot que permite ver una aproximacin de la asociacin
entre los ambientes (vectores) simultneamente con el comportamiento de los genotipos.
Por ejemplo, se puede ver que los genotipos G1-G5 tendran un desempeo por encima del
promedio en las ambientes del grupo E1-E5 contrario al desempeo inferior para las
ambientes del grupo E16-E20.
Todos estos resultados se condicen con el proceso con que se simularon los datos,
confirmando la utilidad de la tcnica para analizar e interpretar los datos provenientes de
ensayos MET.


Fig. 1 Representaciones grficas de la matriz estimada de correlaciones genticas entre
ambientes. (a) Heatmap para agrupar ambientes con patrones similares de GE; (b) biplot de
los genotipos (G1-G16) y los ambientes (E1-E20)

En futuros estudios resulta de inters evaluar la aplicabilidad de metodologa a datos con
caractersticas an ms similares a los datos reales de aplicacin, como por ejemplo, que
tengan mayor dimensin (tanto en trminos de ambientes como de genotipos) y desbalance.

Bibliografa
[1] Butler, D.; Cullis, B. R.; Gilmour, A. R. and Gogel, B. J. (2007). ASREML-R,
reference manual. The State of Queensland, Department of Primary Industries and
Fisheries, Australia.
[2] R Development Core Team (2010). R: A language and environment for statistical
computing. R Foundation for Statistical Computing, Vienna, Austria.
[3] Gilmour, A. R., Thompson, R. and Cullis, B. R. (1995). AI, an efficient algorithm for REML
estimation in linear mixed models, Biometrics, 51, 1440-1450.
[4] Smith, A. B., Cullis, B. R., Gilmour, A.R. and Thompson, R. (1998). Multiplicative models
for interaction in spatial mixed model analyses of Multi-Environment trial data, Proceedings
of the International Biometrics Conference, Capetown.
(a) (b)


INTEPRETACIN DE LA INTERACCIN GENOTIPO X AMBIENTE EN
QUINOA MEDIANTE EL USO DE REGRESIN POR MNIMOS
CUADRADOS PARCIALES

RAMIRO N. CURTI
1
, SILVIA SHRING
2
, SERGIO J. BRAMARDI
3,4
, ALBERTO J.
ANDRADE
5
, ABELARDO J. DE LA VEGA
6
, BERTA VELZQUEZ
7
, SABRINA COSTA
TRTARA
8
, H. DANIEL BERTERO
9

1
Ctedra de Diseo Experimental, Fac. de Cs. Naturales-Sede Regional Sur, UNSalta
2
Ctedras de Clculo Estadstico y Diseo Experimental, Fac. Cs. Naturales, UNSalta
3
Fac. Cs. Agrarias y Forestales UNLP,
4
Fac. Cs. Agrarias UNComahue
5
Instituto Nacional de Tecnologa Agropecuaria, EEA Abra Pampa
6
Pioneer Hi-Bred, Hungra
7
Ctedra de Fisiologa Vegetal, UNJujuy
8
Departamento de Produccin Vegetal, UNLujn
9
Departamento de Produccin Vegetal, UBA

rcurti@agro.uba.ar

RESUMEN
El mtodo de Regresin por Mnimos Cuadrados Parciales (PLS) relaciona en un solo
procedimiento los efectos de interaccin genotipo x ambiente (GxA) como variable
dependiente con respecto a variables externas ambientales como variables explicativas. En
este trabajo se aplic PLS a los datos obtenidos de ensayos multi-ambientales comparativos
de rendimiento de 12 genotipos de qunoa evaluados en seis ambientes en el Noroeste
Argentino con el objetivo de determinar que variables ambientales explican la interaccin
GxA para rendimiento. Previo al anlisis de PLS se estimaron los BLUPs de los efectos
genotpicos y de interaccin GxA. La matriz de BLUPs de los efectos de interaccin GxA fue
descompuesta por un modelo AMMI y sobre esa matriz se condujo el anlisis de PLS para
relacionar siete covariables ambientales (temperatura mxima, mnima, precipitacin pre y
post-floracin ms humedad relativa total) a las variaciones de rendimiento en grano
debidas a la interaccin GxA. El procedimiento de validacin cruzada indica que los dos
primeros factores (vectores latentes) fueron significativos para la prediccin, explicando en
conjunto el 78,5% de la interaccin GxA. La temperatura mxima post-floracin, la
precipitacin prefloracin y la temperatura mnima post-floracin fueron las covariables que
explicaron la interaccin GxA para el primer factor que discrimin entre ambientes y
genotipos de altiplano y valles interandinos. Esto indica que las condiciones trmicas post-
floracin son importantes para explicar el desempeo relativo diferencial de los genotipos
entre ambientes de altiplano y valles interandinos. Sobre el segundo factor se diferenciaron
ambientes de valles interandinos con respecto a un gradiente de humedad, temperatura
mxima prefloracin y precipitacin post-floracin, en ambientes ms hmedos y fros de los
ms ridos y clidos, pero sin discriminar entre genotipos de valles secos y hmedos. El
PLS fue efectivo en detectar las variables ambientales asociadas con los factores que
explicaron la interaccin GxA para rendimiento.

Palabras clave: AMMI, BLUPs, validacin cruzada, condiciones ambientales pre y post
floracin, ensayos multi-ambientales, noroeste argentino

Introduccin
Las interacciones genotipo x ambiente (GA) se observan como un cambio en el
comportamiento relativo de los genotipos entre ambientes y se deben a la expresin
condicional de los genes
[1]
. Las diferencias de comportamiento relativo entre los genotipos
se detectan realizando ensayos multi-ambientales que consisten en evaluar genotipos en un
conjunto de ambientes
[2]
. Un aspecto esencial que determina el uso eficiente de las
interacciones GxA es la capacidad de cuantificar los principales factores que son


responsables de las diferencias genotpicas en los ambientes
[1,3]
. Recientemente se ha
enfatizado el uso de mtodos predictivos para interpretar las interacciones GxA cuando ms
de un atributo ya sea relacionado con los genotipos evaluados (i.e. biomasa area, ndice de
cosecha, nmero de granos, etc.) o los ambientes de evaluacin (i.e. temperatura,
precipitacin, etc.) se registra en una serie de ensayos multi-ambientales comparativos de
rendimiento
[4,5]
. En este sentido, cuando el objetivo de inters es interpretar la variacin de
la interaccin GxA para rendimiento en grano en base a la variacin de covariables
ambientales, el estudio de las relaciones entre el rendimiento y las condiciones ambientales
puede ser realizado mediante un anlisis de Regresin por Mnimos Cuadrados Parciales o
PLS (Partial Least Squares)
[6]
. PLS es una tcnica estadstica multivariada relativamente
nueva para el anlisis de ensayos multi-ambientales
[4,5,6]
. Esta tcnica generaliza y combina
el Anlisis de Componentes Principales (ACP) y el anlisis de Regresin Lineal y es
particularmente til cuando el objetivo es predecir un conjunto de variables dependientes
desde un conjunto de variables predictoras
[6]
. En este trabajo se utiliz la tcnica de PLS
para interpretar el efecto de las condiciones ambientales pre y posfloracin sobre la
interaccin GxA para rendimiento en grano de un conjunto de genotipos de qunoa
(Chenopodium quinoa Willd.) evaluados en una red de ensayos multi-ambientales
comparativos de rendimiento llevado a cabo en el Noroeste Argentino.

Desarrollo
Un conjunto de 12 genotipos fueron evaluados para rendimiento en grano en un total de seis
ambientes determinados por la combinacin de tres localidades (Abra Pampa, Colanzul y
Calete) y dos campaas agrcolas (2008/2009 y 2009/2010). Los genotipos evaluados
proceden de la coleccin de germoplasma de la Facultad de Agronoma de la Universidad
de Buenos Aires. En cada ambiente se realiz un experimento bajo un diseo en bloques
completos aleatorizados con tres repeticiones.
Previo al anlisis de PLS se estimaron los BLUPs (mejores predictores lineales insesgados)
de los efectos genotpicos y de interaccin GxA mediante un modelo lineal mixto utilizando
el procedimiento REML implementado en GenStat 8.2.
[7]
. La matriz de BLUPs de los efectos
de interaccin GxA fue luego descompuesta por el procedimiento de descomposicin de
valores singulares sobre un modelo AMMI (Additive Main Effects and Multiplicative
Interaction) implementado en InfoGen
[8]
. Sobre esa matriz resultante se condujo
posteriormente un anlisis de PLS para relacionar covariables ambientales a las variaciones
de rendimiento en grano debidas a la interaccin GxA. Las covariables ambientales fueron:
temperatura mnima y mxima diaria y precipitacin acumulada para el periodo pre y post-
floracin, definida la floracin cuando el 50% de la plantas en las parcelas presentaron al
menos una flor abierta, y la humedad relativa total desde emergencia hasta cosecha. Las
variables climticas se tomaron de estaciones experimentales prximas (Abra Pampa y
Colanzul) o de sensores de temperatura y un pluvimetro respectivamente, ubicado dentro
de cada parcela experimental (Calete).
El anlisis de PLS se condujo usando la matriz Y (variaciones de rendimiento en grano
debidas a la interaccin GxA) resultante del modelo AMMI y la matriz X de representada por
los valores promedios de las condiciones ambientales para cada ambiente respectivamente.
Dado que el procedimiento de PLS es sensible a las variaciones de escala, la matriz de
datos fue centrada (media cero) y escalada (unidad de varianza) previo al anlisis. El
algoritmo de PLS y el procedimiento de validacin cruzada fueron aplicados con el paquete
GENSTAT 8.2
[7]
, mientras que el grfico de Tri-plot se realiz con el paquete estadstico
InfoGen
[8]
.

El procedimiento de validacin cruzada indica que los dos primeros factores (vectores
latentes) fueron estadsticamente significativos (P < 0,001) para la prediccin. La suma de
cuadrados residuales de prediccin (PRESS) para el tercer factor en adelante result no
significativa. El primer y segundo factor del PLS explic el 43,6 y 34,9%, mientras que en
conjunto el 78,5% de la interaccin GxA para rendimiento en grano. Al correlacionar la


matriz de residuos del modelo AMMI de los BLUPs de interaccin GxA para rendimiento con
las covariables ambientales, las covariables de mayor inercia (varianza) sobre el factor 1 del
Tri-plot resultaron ser la temperatura mxima post-floracin (98%), la precipitacin
acumulada prefloracin (93%) y temperatura mnima post-floracin (89%). Las covariables
temperatura mxima y mnima post-floracin presentaron cargas negativas (-0,47 y -0,44
respectivamente), mientras que la precipitacin prefloracin carga positiva (0,55) y todas
estuvieron relacionadas con el factor que hace la mayor contribucin a la interaccin GxA
para rendimiento (i.e. presentaron elevada correlacin con el rendimiento en grano). Por lo
tanto, las interacciones detectadas para dicho factor son atribuidas principalmente a estas
tres covariables. Las covariables de mayor inercia sobre el factor 2 del Tri-plot resultaron ser
la temperatura mxima prefloracin (99%), la humedad relativa total (98%) y la precipitacin
post-floracin (78%). Las covariables humedad relativa y precipitacin post-floracin
presentaron cargas positivas (0,62 y 0,38 respectivamente), mientras que la temperatura
mxima prefloracin carga negativa (-0,43). La nica covariable que no ajust al modelo
(temperatura mnima prefloracin) present un valor cercano a cero para ambos factores del
Tri-plot. El Tri-plot resultante del anlisis de PLS mostr los patrones generales de
interaccin GxA con respecto a los ambientes, genotipos y las covariables ambientales.
Sobre el primer factor se diferenciaron los ambientes de Abra Pampa (altiplano) de los de
valles interandinos (Colanzul y Calete). Los ambientes de altiplano presentaron valores
elevados de precipitacin prefloracin pero bajos de temperatura mxima y mnima post-
floracin. Sobre este componente se diferenciaron en desempeo relativo los genotipos de
origen altiplnico ms dos de valles interandinos del resto (otros genotipos de valles
interandinos). Estos resultados indican que las condiciones trmicas post-floracin son
importantes para explicar el desempeo relativo diferencial de los genotipos entre ambientes
de altiplano y valles interandinos. Sobre el segundo factor se diferenciaron los ambientes de
valles interandinos con respecto a un gradiente de humedad, temperatura mxima
prefloracin y precipitacin post-floracin, en ambientes ms hmedos y fros (Colanzu) de
los ms ridos y clidos (Calete). Sobre este componente no hubo una diferenciacin clara
en desempeo relativo entre genotipos de valles secos y hmedos. Estos resultados indican
que tanto las condiciones trmicas prefloracin como las de humedad durante el ciclo de
cultivo y la precipitacin post-floracin son importantes para explicar el desempeo
diferencial de los genotipos de valles en ambientes de valles interandinos.

Bibliografa
[1] Basford, K. Cooper, M. (1998). Genotype x environment interactions and some
considerations of their implications for wheat breeding in Australia. Australian Journal of
Agricultural Research, 49(2), 153-174.
[2] Crossa, J. (1990). Statistical analyses of multilocation trials. Advances in Agronomy,
44(1), 55-85.
[3] Bidinger, F. R., Hammer, G. L., Muchow, G. H. R. (1996). The Physiological Basis of
genotype by environment interaction in crop adaptation. Cooper, M y Hammer, G.L. (eds)
Plant adaptation and crop improvement. International Rice Research Institute. Pp: 329-347.
[4] Ortiz, R., Crossa, J., Vargas, M., Izquierdo, J. (2007). Studying the effect of environmental
variables on the genotype environment interaction of tomato. Euphytica, 153(1-2), 119-134.
[5] Joshi, A. K., Crossa, J., Arun, B., Chand, R., Trethowan, R., Vargas, M., Ortiz-Monasterio,
I. (2010). Genotype environment interaction for zinc and iron concentration of wheat grain in
eastern Gangetic plains of India. Field Crops Research, 116(3), 268-277.
[6] Vargas, M., Crossa, J., Sayre, K., Reynolds, M., Ramrez, M. E., Talbot, M. (1998).
Interpreting Genotype x Environment Interaction in Wheat by Partial Least Squares
Regression. Crop science, 38(3), 679-689.
[7] Genstat 5 Committee. (2005). GenStat for Windows Release 8.2. VSN International,
Wilkinson House.
[8] Balzarini, M., & Di Rienzo, J. (2003). Info-Gen: Software para anlisis estadstico de
datos genticos. Facultad de Ciencias Agropecuarias. Universidad Nacional de Crdoba.
Argentina.


ANALISIS DE AGRUPAMIENTO JERARQUICO PARA MUESTRAS
DE SECUENCIACION DE ARN

PABLO D. REEB
1,3
, JUAN P. STEIBEL
1,2
, SERGIO J. BRAMARDI
3,4

1
Dept. Fisheries and Wildlife,
2
Dept. Animal Science, Michigan State University, USA
3
Dpto. de Estadstica, Fac. Cs. Agrarias, Univ. Nac. del Comahue, Argentina
4
Ct. Clculo Estadstico, Fac. Cs. Agrarias y Forestales, Univ. Nac. de La Plata, Argentina

reebpabl@msu.edu

RESUMEN
La secuenciacin de ARN (RNA-seq) ha tenido un auge sin precedentes en los ltimos aos
en particular para los estudios de expresin gnica. Las tcnicas de anlisis bioinformtico y
estadstico utilizadas en estudios similares como los de micromatrices de ADN no pueden
aplicarse en forma directa debido a diferencias en la tecnologa base. La variable respuesta
en RNA-seq es de naturaleza discreta y representa el nmero de lecturas de trozos de
ARN que estn asociadas al transcriptoma para cada una de las muestras analizadas.
Numerosas adaptaciones de tcnicas tradicionales y nuevas metodologas estn siendo
propuestas para analizar los datos de RNA-seq. La validacin de estas propuestas es un
tema complejo y generalmente se realiza a travs de simulaciones. Sin embargo, las
simulaciones slo pueden rescatar algn aspecto y difcilmente puedan representar la
compleja estructura de este tipo de datos. Otra alternativa es el uso de plasmodios, que son
conjuntos de datos generados a partir de datos experimentales en los que algn aspecto es
conocido a priori posibilitando as su uso con fines de validacin. En este trabajo, se
propone el uso de plasmodios para validar medidas de distancias usadas en el anlisis de
agrupamiento jerrquico de muestras. Se evalan la distancia eucldea calculada sobre los
datos originales y transformados, disimilaridades basadas en correlacin de Pearson y
Spearman, y Poisson. En todos los conjuntos analizados, el anlisis de cluster jerrquico
utilizando la disimilaridad Poisson reconstruy la estructura de bloques y tratamientos del
experimento analizado.

Palabras clave: RNA-seq, anlisis de cluster, plasmodios, validacin

Introduccin
La tecnologa de secuenciacin de ARN (RNA-seq) ha tenido un crecimiento sin
precedentes en los ltimos aos y est desplazando a la tecnologa de micromatrices de
ADN en estudios de expresin gnica. En experimentos de micromatrices se obtienen
medidas de la intensidad de expresin de un gen mientras que con RNA-seq se obtienen
medidas directas de la cantidad de trozos de ARN mensajero asociados al transcriptoma.
Desde el punto de vista estadstico, se tienen variables de conteo que expresan el nmero
de lecturas asociadas a un determinado gen en cada muestra. Los datos se pueden ordenar
en una matriz de conteos constituida por n filas de genes y p columnas de muestras, donde
n >> p.
La naturaleza discreta de la variable respuesta hace que las tcnicas estadsticas utilizadas
en micromatrices no sean de aplicacin directa. En cambio, modelos con distribuciones
Poisson u otros que incorporan superdispersin como binomial negativa son utilizados para
estudiar este tipo de datos.
El desarrollo de nuevas o la adaptacin de tcnicas tradicionales requieren validacin previa
para poder extender su uso. En un contexto de alta dimensionalidad con un nmero
reducido de muestras y uno muy grande de variables (genes) con estructura de
correlaciones desconocida, la validacin no es un tema de fcil resolucin.
Tradicionalmente se ha recurrido a la simulacin pero la complejidad de los datos hace muy


difcil crear conjuntos que imiten satisfactoriamente esa realidad. Otra opcin es generar
plasmodios [1] que tienen la caracterstica de provenir de condiciones reales donde el
estado de naturaleza de algn aspecto de los datos se conoce a priori tal como sucede con
las simulaciones. Esta tcnica ha sido utilizada recientemente en estudios de RNA-seq para
comparar modelos de anlisis diferencial de genes [2]. En este trabajo, se aplican
plasmodios con el fin de comparar estrategias de anlisis de cluster jerrquico para agrupar
muestras. Una rutina de anlisis multivariado con enfoque exploratorio que puede contribuir
en el control de calidad de laboratorio y a indagar en la estructura de las unidades
experimentales.

Desarrollo
La generacin de los plasmodios se bas en datos experimentales [3] de 21 muestras de
dos lneas consanguneas (B6/D2) de ratn secuenciadas en 3 celdas de flujo con Illumina
GAIIx. Las 21 muestras (n
B6
=10, n
D2
=11) se clasificaron en funcin de lnea consangunea
(tratamiento) y celda de flujo (bloque), y se realiz un anlisis de expresin diferencial con el
programa edgeR, seleccionando los genes con q-valor < 0.05. Posteriormente se apartaron
las 10 muestras correspondientes a la lnea B6 y se dividieron en forma aleatoria en dos
grupos respetando la estructura de bloques. A continuacin se seleccionaron al azar de
entre los genes expresados diferencialmente un nmero equivalente al 10% del total y su
efecto se adicion a las muestras del grupo B. Se obtuvieron as dos grupos (A y B) en los
que las diferencias entre grupos se deben al efecto lnea consangunea de los genes
adicionados y a la variacin biolgica, mientras que las diferencias dentro de cada grupo se
deben a los efectos de las celdas de flujo.
Dado que se conoce la pertenencia de cada muestra a su grupo natural y el estado de
expresin diferencial real (si o no) de cada gen, se utilizaron los plasmodios para evaluar las
tcnicas de agrupamiento en tres escenarios que varan la relacin de trancripts expresados
diferencialmente (ED) y no expresados diferencialmente (noED). Los conjuntos empleados
fueron: i) slo genes con expresin diferencial (soloED, n=952), ii) transcrips con (n=952) y
sin expresin diferencial (n=3808) (20% ED), y iii) transcrips con (n=952) y sin expresin
diferencial (n=8567) (10% ED), equivalente al anlisis de todos los genes del plasmodio
(n=9519).
Las medidas de distancia comparadas fueron 8 e incluyeron distancia eucldea a partir de: a)
datos originales, b) datos originales normalizados, c) datos regularizados con transformacin
logaritmo, y d) datos transformados por funcin de estabilizacin de variancia (b, c y d segn
funciones del programa DESeq2). Tambin se incluyeron disimilaridades calculadas con: e)
1correlacin de Pearson y f) 1-correlacin de Spearman; y medidas propuestas
recientemente para datos de RNA-seq: g) disimilaridad Poisson [4] y h) distancia eucldea de
las observaciones luego de aplicar reduccin de la dimensin con descomposicin en
valores singulares Poisson [5]. En todos los casos se aplic la tcnica de cluster jerrquico
con mtodo de encadenamiento completo utilizando la funcin hclust del lenguaje R v.3.0.0.
Para comparar los dendrogramas se calcul la correlacin entre matrices cofenticas.

Los dendrogramas generados a partir de la disimilaridad Poisson representaron fielmente en
todos los conjuntos de datos la estructura de la muestras. En el conjunto integrado slo por
los genes con expresin diferencial, el dendrograma present dos grandes grupos
correspondiente a los tratamientos A y B, cada uno con subgrupos correspondientes a los
bloques (4, 6 y 7) (Fig. 1a). Al aumentar el nmero de genes no diferenciados, el
agrupamiento fue inverso, prevaleci la diferencia entre bloques y luego el subagrupamiento
por tratamientos (Fig. 1b). En el otro extremo, se encuentran los dendrogramas generados
a partir de los datos originales con o sin normalizacin dado que no representaron la
estructura de la muestras en ninguno de los conjuntos analizados (Fig. 1c-d). En la Figura 2
se resumen las correlaciones entre matrices cofenticas referenciadas al dendrograma
obtenido con disimilaridad Poisson en cada conjunto de datos. Para el conjunto soloED, las


transformaciones logaritmo, estabilizacin de varianza y la distancia utilizando correlacin de
Spearman tambin reflejaron la estructura natural de las muestras.

Figura 1. Dendrogramas generados a partir del conjunto con solo genes expresados
diferencialmente (izquierda) o del conjunto de todos los genes (derecha), y utilizando
disimilaridad Poisson (a y b) o distancia eucldea a partir de los datos originales
normalizados (c y d). Tratamiento: A o B; Bloque: celda de flujo nmero 4 (verde), 6 (azul) o
7 (roja).

Bibliografa
[1] Gadbury, G. L., Xiang, Q., et al. (2008). Evaluating statistical methods using plasmode
data sets in the age of massive public databases: an illustration using false discovery rates.
PLoS genetics, 4(6)
[2] Reeb, P.D., Steibel J.P. (2013) Using plasmode datasets to compare statistical methods
for RNA-seq analysis International Plant and Animal Genome XXI. San Diego, Ca.
Figura 2. Heatmap de
correlaciones entre matrices
cofenticas (referenciadas a la
matriz cofentica del
dendrograma generado con
disimilaridad Poisson) para
cada conjunto de datos (solo
ED, 20% ED y 10% ED).
Distancias: spe=1-spearman,
rlg=eucldea con
regularizacin logaritmo,
vsd=eucldea con
estabilizacin de varianza,
poi=Poisson, rnr=eucldea con
datos originales normalizados,
psv=eucldea con
descomposicin en valores
singulares Poisson, pea=1-
pearson, raw=eucldea con
datos originales


[3] Bottomly, D., Walter, N. A. R., et al. (2011). Evaluating Gene Expression in C57BL/6J
and DBA/2J Mouse Striatum Using RNA-Seq and Microarrays. PLoS ONE, 6(3)
[4] Witten, D. M. (2011). Classification and clustering of sequencing data using a Poisson
model. The Annals of Applied Statistics, 5(4), 24932518
[5] Lee, S., Chugh, P. E., et al.. (2013).Poisson factor models with applications to non-
normalized microRNA profiling. Bioinformatics (Oxford, England), 29(9), 11051111


EFECTO DE LA AUTOCORRELACIN SOBRE EL TAMAO
EFECTIVO DE MUESTREO EN OBSERVACIONES ESPACIALES

BOCA ROSA TERESA
1, 2

1
Instituto de Clima y Agua INTA Castelar
2
Ctedra de Mtodos Cuantitativos FAUBA
tboca@cnia.inta.gov.ar

RESUMEN
El trabajo de muestro a campo en grandes reas suele ser costoso en esfuerzo, tiempo y
dinero, por lo tanto es importante considerar todos los factores que influyen sobre el mismo
para asegurarnos lograr el objetivo perseguido y poder obtener una buena estimacin del
parmetro deseado. Con datos posiblemente autocorrelacionados es necesario calcular el
tamao de muestreo efectivo (n*), que representa esencialmente el nmero de observaciones
equivalentes a la informacin obtenida de muestras no correlacionadas (n). Sin considerar la
autocorrelacin, el valor de n solo depende de la exactitud deseada en la estimacin, del
cuantil de la distribucin asumida para un nivel de confianza establecido y de varianza del
estimador. Sin embargo si las observaciones no son independientes entre en juego el valor de
la autocorrelacin entre ellos. Una aproximacin al clculo apropiado del tamao efectivo de
muestra puede obtenerse en funcin de un particular modelo de variograma. Otro enfoque
para determinar el tamao efectivo de muestreo es en base a la varianza de los predictores,
tomando como criterios para seleccionar el tamao ptimo de muestreo, el nmero de
observaciones que minimizaba dicha varianza. Se generaron algoritmos de simulacin para
distintos modelos y niveles de autocorrelacin para un rango de tamao de muestra de 0.01 al
0.1 % de intensidad aplicando estos criterios. El clculo del tamao efectivo a travs de los
estimadores del variograma verific una tendencia entre los niveles de autocorrelacin y el
tamao efectivo de muestra. El clculo de la varianza del predictor kriging mostr un aumento
en el tamao efectivo en rangos similares a los obtenidos al estimar dicho valor utilizando
solamente los valores del variograma. Los mismos podra proporcionar informacin muestreo
para entender cul es la estrategia de muestreo se debe utilizar en la evaluacin de la
precisin en el estudio correspondiente.

Introduccin
El trabajo de recoleccin suele ser costoso en esfuerzo, tiempo y dinero, por lo tanto es
importante considerar todos los factores que influyen sobre el mismo para asegurarnos lograr
el objetivo perseguido y poder obtener una buena estimacin. Segn Stehman & Czaplewski
(1998) si existe autocorrelacin espacial y no se la considera, no habr certeza de que todas
las observaciones posibles tengan igual probabilidad, ni que los estimadores obtenidos sean
insesgados y de mnima varianza, ni tampoco se contempla la distribucin espacial. En estas
condiciones es necesario calcular el tamao de muestreo efectivo (n*), que representa
esencialmente el nmero de observaciones equivalentes a la informacin obtenida de
muestras no correlacionadas (n). Sin considerar la autocorrelacin, el valor de n depende de
la exactitud deseada en la estimacin, del cuantil de la distribucin asumida para un nivel de
confianza establecido y de varianza del estimador. Sin embargo si las observaciones no son
independientes una de las aproximaciones al clculo apropiado del tamao efectivo de
muestra puede obtenerse segn la ecuacin
( ) { } 1 1
*
+
=
n
n
n
(Gruijter, 2005). Donde la
estimacin del coeficiente de correlacin correspondiente al modelo de autocorrelacin de
los datos. Dado que la estimacin de dicho coeficiente no es trivial, puede utilizarse la
aproximacin propuesta por Griffith (2005) expresada en la ecuacin


( )
( ) ( )
n
r d f C C C n
C C n
n
n
i
n
i j
j
ij
=
=
=
+
+
=
1 1
1 1 0
1 0
,
*
[1], Donde ( ) r d f
ij
, denota un particular modelo de variograma,
con rango=r, nugget=C
0
y pendiente= C
1
(sill-nugget). La misma se basa en V , matriz que
contiene la estructura de covarianza espacial de las observaciones. Otro enfoque para
determinar el tamao efectivo de muestreo es el propuesto por Stein & Ettema (2003),
quienes en base al variograma obtuvieron los valores predichos de las mismas y calcularon la
varianza de los predictores, tomando como criterios para seleccionar el tamao ptimo de
muestreo el nmero de observaciones que minimizaba dicha varianza. Este enfoque est
tambin descripto en Cressie (1993). En este trabajo se analiza a travs de procesos
simulados los distintos enfoques para el clculo del tamao de muestra efectivo bajo distintos
modelos de autocorrelacin espacial y se analiza cmo los diferentes niveles de muestreo,
grados de autocorrelacin y modelos de correlacin espacial podran afectar.

Desarrollo
Simulacin imgenes con distintos modelos de autocorrelacin. La simulacin como un
proceso estocstico espacial consisti en la obtencin de una coleccin de variables
aleatorias ( ) { } T t t Z e / indexadas por un conjunto T. Se simul un proceso estocstico
estacionario bajo translacin, ya que si la distribucin no se modific al trasladar el origen del
ndice. Para realizar las simulaciones se utiliz un entorno R paquetes de estadstica espacial
como el paquete GeoR y las funciones RandomFields. Los modelos de autocorrelacin
simulados fueron: Circular, Cubico, Gaussiano, Exponencial, Mater y Esfrico. Para
especificar el modelo de autocorrelacin se utiliz el variograma. Estos estadsticos permiten
analizar el comportamiento espacial de una variable sobre una zona dada identificando
distancias a partir de las cuales se considera que los valores de las variables aleatorias
regionalizadas son independientes. Esta distancia es conocida como phi y se interpreta como
la zona de influencia de la variable bajo estudio. El modelo de correlacin espacial tambin se
define a travs de otro parmetro el sill que estima el valor del variograma que corresponde
a la distancia mxima donde las observaciones comienzan a ser independientes.
Clculo del tamao efectivo para las situaciones simuladas basadas en los estimadores
del variograma. Se utiliz la ecuacin [2] para el clculo del tamao efectivo en funcin de
los valores de a para un determinado conjunto de valores de n, se trabaj con diferentes
niveles bajo (0.001% de las muestras posibles) ; medio (0.005%, 0.01%), alto (0.05% ) y
muy alto (0.1 %). Esta simulacin se repiti 1000 veces para cada modelo de autocorrelacin
estudiado.
Estimacin de la precisin a travs del desvo estndar de los predictores bajo
estructura de varianza espacial. Dado que valor de esta varianza depende del nmero de
puntos observados para resolver el sistema de ecuaciones necesarias para obtener los
valores predictores BLUP (Best Lineal Unbalanced Predictor) pero no depende de los valores
actuales de dichas observaciones, lo hace una herramienta til en los planes de diseo de
muestreo espacial. De esta forma el criterio para seleccionar el mejor diseo de muestreo es
aplicar aquel que minimice su varianza. Dicho valor depende del nmero de puntos
observados, pero no depende de los valores actuales de dichas observaciones, lo que lo hace
una herramienta til en los planes de diseo de muestreo espacial. Como se mencion en un
prrafo anterior, el valor de la varianza del predictor kriging puede usarse como un criterio
para determinar el tamao de muestra efectivo, si tomamos este valor como un indicador del
nivel de exactitud deseado, y definimos a la precisin como la mxima incertidumbre que
ocurre en un mapa interpolado podemos determinar el tamao efectivo de muestra en funcin
de la exactitud deseada en el parmetro a estimar.



Resultados y Discusin
El clculo del tamao efectivo a travs de los estimadores del variograma verific una
tendencia entre los niveles de autocorrelacin y el tamao efectivo de muestra. Para valores
de n bajos (entre 10 y 50) valor del tamao efectivo (n*) con respecto tamao de muestra
considerando los datos independientes (n) vari en ms de un 100 %, para valores de n de
entre 100 y 500 la variacin se encontr entre el 10 y el 50 % y cuando se consideraron
valores de n mayores a 500 las variacin fue de menos de 15 %. El comportamiento fue
similar para los modelos de autocorrelacin estudiados.
Se calcul la varianza del predictor kriging como un criterio para determinar el tamao de
muestra efectivo, tomando este valor como un indicador del nivel de exactitud deseado, y
definimos a la precisin como la mxima incertidumbre que ocurre en un mapa interpolado.
Dado que no se encontraron diferencia en el clculo del tamao efectivo para los distintos
modelos de autocorrelacin analizados se realizaron estudios sobre el modelo exponencial.
Se verific el aumento en el tamao efectivo en rangos similares a los obtenidos al estimar
dicho valor utilizando solamente los valores del variograma
Tabla 1 : tamao efectivo de muestra en datos espacialmente correlacionados bajo modelo
exponencial
niveles de autocorrelacin
n 1 2 3 4
10 6 6 3 12
50 55 65 70 70
100 107 114 118 110
500 504 513 517 519
1000 1005 1010 1013 1020

La construccin de estos mapas temticos simulados con diferentes niveles de
autocorrelacin espacial es til para probar cmo pueden verse afectadas el tamao efectivo
de muestra en funcin de la autocorrelacin entre las observaciones. Los mismos podra
proporcionar informacin muestreo para entender cul es la estrategia de muestreo se debe
utilizar en la evaluacin de la precisin en el estudio correspondiente.

Bibliografa
Cressie, N. A. C. (1993). Statistics for spatial data. N.A.C. New York: John Wiley & Sons.
Griffith D. A. (2005). Effective geographic sample size in the presence of spatial
autocorrelation. Annals of the Association of American Geographers, 95(4):740760.
Gruijter J.; M. Bierkens, D. Brus, M. Knotters. (2006). Sampling for Natural Resource
Monitoring: Statistics and Methodology of Sampling and Data Analysis. Springer. p352.
Stehman S. V., R. L. Czaplewski (1998). Design and analysis for Thematic Map Accuracy
Assessment: Fundamental Principles. Remote Sensing Environment. 64:331-344.
Stein A. Christien E. (2003). An overview of spatial sampling procedures and experimental
design of spatial studies for ecosystem comparisons. Agriculture, Ecosystems and
Environment. 94, 3147.


FUNCIN DISCRIMINANTE SOBRE COMPONENTES PRINCIPALES
EN VARIABLES HEMORREOLGICAS DE PACIENTES DIABTICOS

VAIRA, S. M
1, 2
; CONTINI, L. E
1, 2
; CARRERA, L.I
3
.; ETCHEPARE, R.
3
; CARRERA, L.N.
3, 4

1
Departamento de Matemtica Facultad de Bioqumica y Ciencias Biolgicas UNL
2
LISEB Laboratorio de Investigaciones y Servicios en Bioestadstica
3
Facultad de Ciencias Mdicas UNL
4
Hospital de Nios Orlando Alassia

svaira@fbcb.unl.edu.ar

RESUMEN
La retinopata diabtica es una de las complicaciones crnicas de la Diabetes Mellitus
(DBT), que constituye la principal causa de ceguera en Occidente y se halla relacionada con
cambios microcirculatorios. En su fisiopatogenia se propone la intervencin de parmetros
hemorreolgicos claves como la fibrinogenemia, determinada con el mtodo de Claus, y/o la
agregacin eritrocitaria, cuantificado por un parmetro de forma (ASP - Aggregate Shape
Parameter). Durante su evolucin, quienes padecen (DBT) se hallan expuestos a una serie
de complicaciones crnicas entre las que se cuentan la retinopata, la nefropata y la
neuropata.
Se estudiaron pacientes diabticos tipo 2 (n=101) con el objetivo de analizar si las variables
hemorreolgicas mencionadas influyen en la aparicin de retinopata y otras lesiones
oculares. Se clasificaron los pacientes diabticos en dos grupos segn presentaran o no
lesiones oculares y se agreg un tercer grupo de individuos sanos.
Se aplica un anlisis discriminante lineal (ADL) sobre las componentes principales, pues el
problema tena alta dimensionalidad (18 variables) y se pudieron reducir a 2 componentes
cuyos valores caractersticos son
1
=10,97 y
2
=2,81, con un porcentaje acumulado de
varianza explicada del 75%. La reduccin de la dimensin se deriv del hecho de que las
variables involucradas en el ADL estaban fuertemente relacionadas entre s. Se identificaron
las variables hemorreolgicas con mayor correlacin con las componentes principales, en
orden decreciente resultaron (de un valor de 0,928 a 0,761): viscosidad plasmtica a
velocidad 2.30, 4.60, 11.5, 23, 46 y 115 (seg
-1
), viscosidad de sangre entera a 4.60, 11.5,
23.0 (seg
-1
) y ASP.
Se corrobor la Hiptesis de Esfericidad, para justificar reduccin de dimensin a travs del
estadstico Kaiser-Meyer-Olkin (KMO) que result significativo (valor p < 10
-3
). Al realizar el
ADL el estadstico Lambda de Wilks result altamente significativo, el porcentaje de varianza
explicada de 95% y una correlacin cannica de 0,80; este valor alto indicara que las
variables discriminantes permitieron diferenciar entre los grupos con un porcentaje de
clasificacin correcta del 84%.

Palabras claves: componentes principales, dimensin, discriminante, clasificacin,
diabetes, lesiones oculares

Introduccin
Para resolver la situacin de identificar pacientes en distintas categoras o grupos de una
misma patologa, el anlisis discriminante, se presenta como la tcnica adecuada, pues su
objetivo es encontrar la combinacin lineal ms adecuada, basada en un conjunto de
variables independientes que permitir discriminar grupos, en especial, permitir clasificar
un individuo como posible enfermo aunque an no haya sido declarado como tal y en
particular hacer previsiones acerca de la factibilidad de lesiones posteriores.


La pertenencia a los grupos est definida por una variable dependiente o categrica y las
variables de clasificacin o discriminantes deben ser todas cuantitativas, para nuestra
investigacin son caractersticas hemorreolgicas medidas en los pacientes estudiados.
Al ser numeroso el grupo inicial de variables involucradas, alta dimensionalidad del
problema, se redujo la misma a travs del Anlisis de Componentes Principales (ACP),
previa comprobacin de una alta correlacin entre las variables involucradas para justificar
la factorizacin de la matriz de coeficientes de correlacin. Esta comprobacin pudo hacerse
mediante el test de Bartlett (1950), que parte de la hiptesis nula de que la matriz de
coeficientes de correlacin no es significativamente distinta de la matriz identidad. Bartlett
calcula un estadstico basado en el valor del determinante de la matriz de coeficientes de
correlacin.
Luego en una segunda etapa con las componentes principales calculadas, se realiz un
Anlisis Discriminante Lineal con el objetivo de construir un modelo de clasificacin. Se
adjunta al modelo estadsticos globales de calidad para una buena discriminacin.
La combinacin lineal para el anlisis discriminante, tambin llamada, funcin
discriminante deriva de una ecuacin con la siguiente forma:
pk p k 3 3 k 2 2 k 1 1 jk
X W ... X W X W X W a z + + + + + =
Donde:
jk
z = Funcin discriminante j para el objeto k. a = Constante.
i
W = Ponderacin
discriminante para la variable independiente i.
ik
X = Variable independiente i para el objeto k.
Se construyen las combinaciones lineales referidas a un grupo particular, se calculan todas
las puntuaciones z para todos los individuos k de ese grupo y luego se promedia, de esa
manera se obtiene el valor de los centroides.

Desarrollo
En el presente trabajo se utilizaron datos provenientes de pacientes diabticos tipo 2, en los
cuales se distinguen tres grupos: con y sin lesiones en ojos (n = 81) y un grupo de individuos
sanos (o grupo control), a los cuales se les han medido variables hemorreolgicas para
elaborar una clasificacin y caracterizar los grupos en base a los mencionados indicadores.
Variables Hemorreolgicas: Fibringeno: la concentracin de fibringeno plasmtico fue
determinada por el mtodo de Clauss, su estudio es de inters por el papel que juega en la
viscosidad plasmtica y la agregacin eritrocitaria. ASP (Aggregate Shape Parameter) o
parmetro de forma que evala la agregacin eritrocitaria. Viscosidad de Sangre Entera y
Plasma fueron medidos a 8 velocidades de corte comprendidas entre 1.15 seg
-1
y 230 seg
-1
.
Software estadstico usado SPSS versin 18.0.

Se aplica un anlisis discriminante sobre las componentes principales. Inicialmente las 18
variables se pudieron reducir a 2 componentes, los autovalores resultaron:
1
=10,97 y
2
=2,81 con un porcentaje acumulado de varianza explicada del 75%, la reduccin de la
dimensin se deriv del hecho de que las variables involucradas en el Anlisis Discriminante
Lineal estaban fuertemente relacionadas entre si y, por tanto, tienen informacin comn, la
informacin comn a todas ellas se extrajo en los factores. Se identificaron las variables
hemorreolgicas con mayor correlacin con las componentes principales, en orden
decreciente resultaron (de un valor de 0,928 a 0,761): viscosidad plasmtica a velocidad
2.30, 4.60, 11.5, 23, 46 y 115 (seg
-1
) y viscosidad de sangre entera a 4.60, 11.5, 23.0 (seg
-1
)
y ASP.
Se corrobor la Hiptesis de Esfericidad a travs del estadstico Kaiser-Meyer-Olkin (KMO)
que result significativo (p < 10
-3
), contribuy este estadstico a la decisin de la reduccin
de la dimensin.
Al realizar el Anlisis Discriminante Lineal, el estadstico Lambda de Wilks (0,334; p = 0,001)
fue tenido en cuenta, as como los autovalores (Funcin 1 = 1,74; porcentaje de varianza
explicada 95%) y una correlacin cannica de 0,80; este valor alto indicara que las
variables discriminantes permiten diferenciar entre los grupos.


Estructura de la matriz de correlaciones entre la componentes principales 1 y 2 con las
funciones discriminantes result: Corre(CP1, FD1) = 0,976; Corre(CP2; FD2) = 0,996.
Nuevamente estos valores apoyan la hiptesis de un buen modelo global de clasificacin.
Los centroides para la funcin discriminante 1 (FD1): Diabticos Sin Lesiones Oculares = -
0,515; Diabticos Con Lesiones Oculares = 1,052; Grupo Control = -1,727. (Grfico)
El 83,6% de los casos son clasificados correctamente en los tres grupos.

Con las variables medidas y el anlisis estadstico propuesto es posible identificar pacientes
que se clasifiquen en los tres grupos con un buen poder discriminatorio.
El Anlisis de Componentes Principales puede ser utilizado como herramienta al momento
de disminuir la cantidad inicial de variables y comenzar con un grupo menor de ellas que
surgen despus de realizar la extraccin de factores, a sabiendas que posiblemente se hace
ms difcil la interpretacin de los resultados. El trabajo con las componentes principales
tiene importancia desde el punto de vista clnico ya que permite considerar todos los
parmetros del perfil hemorreolgico, puesto que son considerados como los de mayor
importancia para el seguimiento de pacientes a fines de evitar lesiones posteriores.

Bibliografa
Chao-Ton, S; Chien-Hsin, Y; Kuang-Hung, H.; Wen-Ko, C. (2006). Data Mining for the
Diagnosis of Type II Diabetes from Three-Dimensional Body Surface Anthropometrical
Scanning Data. ELSEVIER. An International Joumal. Computers and Mathematics with
Applications. 51: 1075-1092
Rodriguez Rostan, L; Contini, L; Gionotti, M; Carrera, L; Carrera, L. (2012). Variables
hemorreolgicas en el desarrollo de lesiones oculares en pacientes diabticos tipo 2.
Eguilar Idez. Creatividad, descubrimiento y futuro. I Congreso Nacional de Investigacin
de Grado (INVESGRADO). Cuenca. Publicaciones UCLM. 892-899.
Pires, A; Branco, J. (2010). Projection-pursuit approach to robust linear discriminant
analysis. Journal of Multivariate Analysis. 101, 10, 2464-2485.
Johnson, R.; Wichern, D. (1998). Applied Multivariate Statistical Analysis. Fourth Edition.
Prentice Hall. New Jersey.
Manjunath, B; Frick, M; Reiss, R. (2011). Some notes on extremal discriminant analysis.
Journal of Multivariate Analysis. 103, 1, 107-115.
Marks, S. and Dunn, O.J. (1974). Discriminant functions when covariance matrices are
unequal. J. Amer. Statist. Assoc. 69, 555-559.


RBOLES CONSENSO Y SU APLICACIN EN LA DETERMINACIN
DE LA ESTABILIDAD DE LOS GRUPOS OBTENIDOS EN UN
ANALISIS CLUSTER

SOTO BECERRA RODRIGO
1
, VICENTE VILLARDON JOSE LUIS
2

1,2
Universidad de Salamanca

rodrigosoto@usal.es

RESUMEN
El anlisis de conglomerados o cluster son un conjunto de tcnicas multivariantes, que
pretenden clasificar una muestra de sujetos (u objetos) sobre la base de un conjunto de
variables medidas en un nmero de diferentes grupos tales que los sujetos similares se
colocan en el mismo grupo. Estas tcnicas han sido objeto de una amplia investigacin ya
que se plantean en muchas reas de aplicacin; en la biologa, ingeniera, los negocios, las
ciencias sociales, etc. El anlisis cluster consta de varias etapas desde la seleccin de
variables a utilizar, la medida de disimilaridad, el criterio de agrupacin y su representacin
mediante el dendrograma. Se sabe que diferentes mtodos de anlisis de conglomerados
pueden (y muy probablemente) producir soluciones diferentes cuando se aplican al mismo
conjunto de datos. En este presente trabajo se ilustra la tcnica de rboles Consenso para
la valoracin de la estabilidad de la clasificacin jerrquica aglomerativa, por medio de dos
enfoques que estn implementados en el software estadstico R-Project; consensus del
paquete Agricolae[1] y el paquete Pvclust[2].

Palabras clave: anlisis cluster, validacin, rboles consenso.

Introduccin
Es conocido que el anlisis de Cluster[1] proporciona resultados muy diferentes
dependiendo del mtodo y la distancia que se utiliza para la agrupacin con lo que no es
posible la valoracin directa de la estabilidad de los grupos obtenidos. Una forma de evitar
el problema sera la obtencin de ndices de validez de las agrupaciones. La validacin de
los clusters puede ser de 3 tipos interna (basada en la informacin intrseca de los datos por
si solos), externa (en base a los conocimientos previo sobre los datos) o relativa (basada en
en la comparacin de distintos esquemas de clustering). En este trabajo se estudia una
validacin interna, un nivel de confianza para cada nodo del rbol. En la prctica no es
posible calcular distribuciones de probabilidad asociadas a los nodos mediante tcnicas
analticas por lo que es necesario recurrir a mtodos de remuestreo para obtener rplicas
del rbol inicial en las que se han realizado perturbaciones en los datos. En el contexto de la
clasificacin de seres vivos, normalmente mediante marcadores moleculares o incluso con
caracteres fentipicos observados, el procedimiento consiste en remuestrear las variables
para obtener distintas rplicas de los dendrogramas que despus se integran en uno slo
denominado rbol consenso.

Desarrollo
Aqu se ilustran dos tcnicas de rboles Consenso basadas en remuestreos de tipo
Bootstrap[3] que estn implementadas en el software estadstico R-project. La primera se
denomina consensus que esta incluida en el paquete Agricolae (Mendiburu, 2006) y la
segunda es el paquete Pvclust de Suzuki y Shimodaira (2006).
La primer tcnica consensus corresponde a la frecuencia o probabilidad con que los
grupos se mantiene durante un proceso de remuestreo bootstrap. En un inicio se construye
una clasificacin jerrquica, mediante el clculo de la distancia entre individuos y el mtodo


de agrupamiento. Para estos procedimiento iniciales, R dispone de dos procedimientos dist()
y hclust(), el primero construye la matriz de distancia de disimilaridad y el segundo con esta
matriz realiza segn el mtodo en agrupamiento jerrquico, que se muestra por lo general
en un dendrograma.
El proceso de boostrap se aplica a las variables y no a los individuos. Cada individuo
dispone del mismo tipo y nmero de variables que permitirn construir siempre un
dendrograma cada vez, permitiendo la contabilidad de grupos previamente obtenidos en un
principio.
La segunda tcnica Pvclust al igual que la tcnica anterior produce n rboles por medio de
bootstrap para los cuales genera dos p-value el BP y el AU; BP al igual que en consensus
calcula la frecuencia relativa con los miembros de los cluster, mientras que AU es calculado
por un bootstrap multiescala, la tcnica genera K conjuntos de rplicas de bootstrap con
tamaos de muestras N1, N2, , Nk y B1, B2, , Bk nmero de rplicas. El k-simo
conjunto de rplicas es obtenido por remuestreo bootstrap no-paramtrico usual, pero Nk
puede diferir del tamao N de los datos originales. Despus se cuentan las veces que el
rbol es seleccionado en cada conjunto de rplicas. El AU tiene un sesgo menor que el valor
de BP.
En trminos generales en ambas tcnicas, los valores en los nodos mayores a 95 indican
que la hiptesis de que "el grupo no existe" es rechazada con un nivel de significacin de
0,05.

Aqu se presentan las representaciones grficas de los rboles Consenso, donde se puede
apreciar como el ndice de estabilidad de los grupos nos ayuda a encontrar conglomerados
naturales.
En el primer caso se tienen datos de una variedad de patata silvestre con 43 observaciones
y 107 variables, en filas el cdigo y nombre de genotipo y en columnas los marcadores
moleculares donde se agrupan a los distintos genotipos en 5 grupos.
En el segundo rbol en cuestin los datos son de 14 atributos (variables) de la
infraestructura de viviendas, donde se agruparon a las variables teniendo como distancia a
la correlacin de Pearson y criterio de agrupacin average (promedio); en el cual se
identificaron 2 clusters.
A manera de conclusin esta metodologa tiene ciertas ventajas, como ya mencionamos
elegimos los grupos naturales y es una alternativa para la decisin de cuantos cluster
deben de ser, asimismo es un concepto de fcil interpretacin.

hclust (*, "complete")
702445 705951
0.0
0.2
0.4
0.6
0.8
Cluster Dendrogram
distancia
Height
702650
704229 704815
704232
71908
3
706776
702615 707132
705750
702619 703258
706260
701014 703973
706268 706777
704231
706272
702305 702443
704880
702078 702631
59
59 52 79
68 43
83
94
100
46 84
100
70
36
99 99
99
94
64
46
96
45
77
100


Figura 1. rbol Consenso de consensus
para individuos.

Figura 2. rbol Consenso de Pvclust para
variables.

Bibliografa
[1] Everitt, B. S., Landau, S., & Leese, M. (2001). Cluster Analysis Arnold. A member of the
Hodder Headline Group, London.
[2] De Mendiburu, F. (2009). Agricolae: statistical procedures for agricultural research. R
package version, 1-0
[3] Suzuki, R., & Shimodaira, H. (2006). Pvclust: an R package for assessing the uncertainty
in hierarchical clustering. Bioinformatics, 22(12), 1540-1542.
[4] Efron, B., & Tibshirani, R. (1993). An introduction to the bootstrap (Vol. 57). Chapman &
Hall/CRC.
p
t
r
a
t
i
o
c
r
i
m
r
a
d
t
a
x
l
s
t
a
t
a
g
e
i
n
d
u
s
n
o
x
c
h
a
s
b
l
a
c
k
r
m
m
e
d
v
z
n
d
i
s
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
1
.
2
1
.
4
Cluster dendrogram with AU/BP values (%)
Cluster method: average
Distance: correlation
H
e
i
g
h
t
100
90
100
94
100
75 81
100
100
96
87
87
au
100
93
100
91
100
68 75
100
100
89
99
79
bp
1
2
3 4
5
6 7
8
9
10
11
12
edge #


EFECTO DE LA AUTOCORRELACIN ESPACIAL SOBRE LA
ESTIMACIN DE LOS PARMETROS EN LOS MODELOS DE
PRESENCIA/AUSENCIA DE ESPECIES

ALEXIS CEREZO BLANDN
1
, SUSANA PERELMAN
1,2

1
Departamento de Mtodos Cuantitativos y Sistemas de Informacin, Facultad de
Agronoma, Universidad de Buenos Aires
2
Instituto de Investigaciones Fisiolgicas y Ecolgicas Vinculadas a la Agricultura (IFEVA)
Facultad de Agronoma, Universidad de Buenos Aires-CONICET

acerezo@agro.uba.ar

RESUMEN
La autocorrelacin espacial en los residuos de un modelo lineal puede tener un fuerte
impacto negativo en las estimaciones de los parmetros y sus errores estndar, y
consecuentemente en las pruebas de hiptesis asociadas al modelo. En este estudio,
evaluamos el efecto de la autocorrelacin espacial de los residuos en las estimaciones de
los coeficientes de modelos de regresin logstica y sus errores estndar. Los modelos
estudian el impacto de la modificacin del hbitat a escala de paisaje sobre la
presencia/ausencia de 10 aves de bosque tropical en el oeste de Guatemala. Para cada
especie, construimos 4 modelos logsticos sin estructura de autocorrelacin espacial en los
errores, a partir de combinaciones de dos variables predictoras: la cantidad y grado de
fragmentacin de bosque tropical y su interaccin. Las variables se registraron a 3 radios
alrededor de cada punto de muestreo (200, 500 y 1000 m) para 112 puntos de relevamiento
de aves. Posteriormente reconstruimos los mismos modelos con estructura de
autocorrelacin espacial, y comparamos los coeficientes entre los dos tipos de modelos
mediante una prueba t para muestras apareadas. Adems, exploramos grficamente las
estimaciones con respecto al peso de Akaike, como medida de ajuste de cada modelo.
Concluimos que: 1) las diferencias entre las estimaciones puntuales de los parmetros
fueron pequeas y no significativas entre los modelos con y sin estructura de
autocorrelacin espacial, particularmente para los modelos de mejor ajuste (modelos de la
escala de 1000 m) ; 2) Tal como indica la literatura, los errores estndar de los coeficientes
estimados s mostraron diferencias significativas y en general fueron subestimados por el
modelo sin estructura espacial, y 3) el efecto de la autocorrelacin espacial dependi
fuertemente de la magnitud de la relacin entre la variable respuesta y cada predictora, y del
ajuste del modelo en general.

Palabras clave: autocorrelacin espacial, regresin logstica, modelos ecolgicos de
presencia/ausencia de especies.

Introduccin
La autocorrelacin espacial en los datos debida a la mayor similitud de las muestras ms
cercanas es un fenmeno comn en ecologa (Fortn y Dale 2005). Recientemente se ha
empezado a considerar la autocorrelacin espacial en los modelos de distribucin de
especies (Dormann 2007, Dormann et al. 2007). La presencia de la autocorrelacin espacial
en un conjunto de datos puede tener consecuencias negativas porque incumple el supuesto
de errores independientes e idnticamente distribuidos y por lo tanto causa un aumento en
las tasas el error de tipo I (Dormann et al. 2007), generando un tipo de pseudorreplicacin al
sobreestimar los grados de libertad efectivos (Dutilleuil et al. 1993, Carl y Khn 2007). La
autocorrelacin espacial en la variancia residual, por lo tanto, es particularmente
problemtica en las pruebas de hiptesis, dado que los trminos de error o variancia son
utilizados para calcular los estadsticos de prueba. Consecuentemente, es importante


evaluar el efecto de la autocorrelacin espacial en los residuos sobre las estimaciones de
los parmetros y sus errores estndar de los modelos lineales (Betts et al. 2006, Dormann et
al. 2007).

Desarrollo
Estudiamos el efecto de la autocorrelacin espacial en las estimaciones de los coeficientes
de modelos de regresin logstica y sus errores estndar. Los modelos evaluaron la
asociacin entre la presencia/ausencia de 10 aves de bosque tropical y la modificacin de
su hbitat a escala de paisaje en Guatemala y en general mostraron algn grado de
autocorrelacin espacial en los residuos, evaluada mediante el ndice de autocorrelacin
espacial I de Moran (Fortin y Dale 2005). Para cada especie, construimos 4 tipos de
modelos logsticos sin ninguna estructura de autocorrelacin espacial en los residuos, a
partir de combinaciones de dos variables predictoras (y su interaccin), la cantidad y grado
de fragmentacin de bosque tropical, a 3 radios distintos alrededor de cada punto de
muestreo (200, 500 y 1000m, 112 puntos de relevamiento de las aves). Posteriormente, re-
ajustamos estos modelos con estructura de autocorrelacin espacial, con el mtodo de las
ecuaciones estimadoras generalizadas (GEE, Carl y Khn 2007, Dormann et al. 2007).
Cuando se miden respuestas en el tiempo o espacio, el mtodo GEE toma en cuenta las
correlaciones dentro de grupos de unidades muestrales por medio de una matriz de
correlacin parametrizada, mientras que se supone que las correlaciones entre los grupos
son iguales a cero (Dormann et al. 2007). Por ltimo, comparamos mediante una prueba t
de muestras independientes los valores de las estimaciones de los parmetros y sus errores
estndar entre los modelos sin estructura de autocorrelacin y con estructura de
autocorrelacin en los residuos. Adicionalmente, exploramos las diferencias en las
estimaciones puntuales de los parmetros y sus errores estndar con respecto al ajuste
general de los modelos, utilizando a los valores promedio del peso de Akaike y el estadstico
Z como medidas de ajuste.

Con respecto a las estimaciones puntuales de los parmetros, en general no hubo
diferencias significativas entre los modelos con y sin autocorrelacin espacial, y las
diferencias significativas para los modelos de la escala de 1000 m, que fueron los modelos
de mejor ajuste, fueron entre 5 y 7 %. Con respecto a los errores estndar, hubo mayores
tasas de diferencias significativas, principalmente para el intercepto. Para las estimaciones
de los errores estndar de los parmetros, las diferencias fueron mayores y en una mayor
proporcin significativas, particularmente para los modelos de las escalas de 200 y 500 m,
que a su vez fueron los que tuvieron peor ajuste. Hubo pocas diferencias significativas para
la escala de 1000 m, y hubo una tendencia de los modelos que no tomaron en cuenta la
dependencia espacial de las observaciones a subestimar los errores estndar del intercepto
y la cobertura. Al evaluar las diferencias en las estimaciones puntuales de los parmetros y
sus errores estndar en funcin de los valores promedio del peso de Akaike y el estadstico
Z (como medidas de ajuste de los modelos y sus variables predictoras, respectivamente),
stas disminuyeron a medida que la estimacin perteneca a un modelo de mejor ajuste, o
que el valor Z fue de mayor magnitud. Puede concluirse que: 1) las diferencias entre las
estimaciones puntuales de los parmetros fueron pequeas y no significativas entre los
modelos con y sin estructura de autocorrelacin espacial, particularmente para los modelos
de mejor ajuste; 2) Tal como indica la literatura, los errores s mostraron diferencias
significativas y en general fueron subestimados, y significativamente, 3) el efecto de la
autocorrelacin espacial depende fuertemente de la magnitud de la relacin entre la variable
respuesta y cada predictora y del ajuste del modelo general.


Bibliografa
Betts, M. G., Diamond, A. W., Forbes, G. J., Villard, M. A., Gunn, J. S. (2006). The
importance of spatial autocorrelation, extent and resolution in predicting forest bird
occurrence. Ecological Modelling, 191: 197-224.
Carl, G., Khn, I. (2007). Analyzing spatial autocorrelation in species distributions using
gaussian and logit models. Ecological Modelling, 207: 159-170.
Dormann, C.F. (2007). Effects of incorporating spatial autocorrelation into the analysis of
species distribution data. Global Ecology and Biogeography, 16: 129-138.
Dormann, C. F., McPherson, J. M., Arajo, M. B., Bivand, R., Bolliger, J., Carl, G., Davies, R.
G., Hirzel, A., Jetz, W., Kissling, W. D., Khn, I., Ohlemller, R., Peres-Neto, P. R.,
Reineking, B., Schrder, B., Schurr, F. M., Wilson, R. (2007). Methods to account for spatial
autocorrelation in the analysis of species distributional data: a review. Ecography, 30: 609
628.
Dutilleul, P., Clifford, P., Richardson, S., Hemon, D. (1993). Modifying the t test for assessing
the correlation between two spatial processes. Biometrics, 49: 305-314.
Fortin, M.J., Dale, M. (2005). Spatial analysis: A Guide for Ecologists. Cambridge University
Press, Cambridge, Reino Unido.


EVALUACIN DE LA VARIABILIDAD GENTICA EN LNEAS DE
MAZ MEDIANTE ANLISIS DE CONGLOMERADOS

KANDUS, M.V
1
; CORCUERA, V.R.
1-2
; SALERNO, J.C.
1

1
Instituto de Gentica Ewald A. Favret CICVyA INTA Castelar
2
Comisin de Investigaciones Cientficas de la Prov. de Buenos Aires

mkandus@cnia.inta.gov.ar

RESUMEN
El objetivo de este trabajo fue caracterizar y diferenciar lneas de maz mediante tcnicas de
anlisis multivariado. Se realiz la caracterizacin fenotpica a campo de las lneas en base
al Legajo para el Registro Nacional de la Propiedad de Cultivares propuesto por el INASE.
Se realizaron dos anlisis de conglomerados jerrquico: (i) con variables de tipo cuantitativo,
utilizando la distancia Eucldea y (ii) con variables de tipo cualitativo, utilizando la distancia
de Dice. En ambos anlisis se utiliz el mtodo de encadenamiento promedio (Average
linkage). El anlisis de agrupamiento utilizando variables cuantitativas coincidi en gran
medida con el parentesco de las lneas, mientras que en el que se utilizaron variables
cualitativas ocurri lo contrario. El uso de marcadores moleculares, o de una combinacin de
marcadores moleculares y datos fenotpicos permitira redefinir la composicin y/o
caracterizacin de los recursos genticos utilizados.

Palabras clave: maz; caracterizacin fenotpica; anlisis multivariado; variabilidad
gentica

Introduccin
El uso del anlisis multivariado es una estrategia de gran importancia para clasificar
germoplasma, ordenar variabilidad para un gran nmero de accesiones o analizar relaciones
genticas entre individuos. El anlisis de conglomerados tiene como propsito agrupar
individuos u objetos basndose en todas las variables involucradas, por lo tanto, individuos
con descripciones similares son matemticamente reunidos en el mismo grupo (Hair et al.,
1995). En el Instituto de Gentica del INTA Castelar se desarrollan lneas flint provenientes de
distintas poblaciones. La caracterizacin morfolgica y el registro de dichas lneas permiten su
utilizacin en programas de mejoramiento del cultivo, tanto en el mbito pblico como privado.

Desarrollo
Se utilizaron 10 lneas de maz (9 del Instituto de Gentica del INTA Castelar BLS y 1 del
INTA Pergamino: LP521). Se realiz la caracterizacin fenotpica a campo de las lneas
segn el Legajo para el Registro Nacional de la Propiedad de Cultivares propuesto por el
INASE.
Se evaluaron 19 caracteres de tipo cuantitativo y 12 de tipo cualitativo. Entre los
cuantitativos se evaluaron: ancho y longitud de la hoja (AH y LH), nmero total de hojas
(Nho), longitud del pednculo de la panoja, del eje central y del eje central que posee
ramificaciones (PedP, ECP y RP), nmero de ramificaciones primarias de la panoja (NRP),
longitud, dimetro y peso individual de la espiga principal (LE, DE y PE), nmero de hileras
(Nhi), porcentaje de marlo (% marlo), longitud del pednculo de la espiga principal (PedE),
peso de mil granos (Pmil), longitud, ancho y espesor del grano (LG, AG y EG) y altura de
planta y de insercin de la espiga principal (HP e IE). Se realiz la prueba de normalidad de
las variables con el test de Shapiro-Wilks modificado. Tambin se efectuaron
transformaciones con log10 en aquellas variables que no cumplieron con este supuesto.
Con las variables que mostraron diferencias significativas entre las distintas lneas se realiz
un anlisis de conglomerados jerrquico utilizando la distancia Eucldea. En cuanto a los


caracteres cualitativos se evalu: pubescencia en vainas y en lminas, presencia de
antociana en vainas, ondulacin marginal de las hojas, color de las lminas, posicin de las
hojas, porte de las ramificaciones de la panoja, color de anteras, presencia de antociana en
glumas, color de estigmas, color del endosperma y color de glumelas. Los distintos
caracteres se codificaron en tres clases (0 - 1 - 2) para construir la matriz de datos. Se
realiz un anlisis de conglomerados jerrquico utilizando la distancia de Dice (1945). En
ambos anlisis se utiliz el mtodo de encadenamiento promedio (Average linkage), ya que
con el mismo se obtuvieron los mayores coeficientes de correlacin cofentica. El anlisis
estadstico se realiz con el programa Infostat Profesional.

Las lneas presentaron diferencias muy altamente significativas en 10 variables cuantitativas:
Nho, PedP, NRP, LE, DE, logPE, PedE, EG, HP e IE, las cuales fueron tenidas en cuenta para
el anlisis de conglomerados. El anlisis de agrupamiento con las variables cuantitativas
present una correlacin cofentica de 0,722 y las distancias entre las lneas variaron entre
2,51 y 5,30 (Grfico 1). Este anlisis separ a la lnea LP521 del resto de las lneas BLS a
una distancia de 5,30. El anlisis de agrupamiento coincidi en gran medida con el parentesco
de las lneas, ya que las lneas BLS fueron ms parecidas entre s respecto a la lnea testigo
LP521, y la lnea BLS14 (que se agrup con la BLS101) formaba parte de la poblacin de
origen de esa lnea. A su vez, las lneas BLS96 y BLS76, que formaron un mismo grupo,
provenan de la misma poblacin, y la lnea BLS91, que se distingui del resto de las lneas,
tena un origen distinto al resto de las BLS. Contrariamente, las lneas BLS1 y BLS104 que
formaban un mismo grupo, no estaban emparentadas.
El anlisis de agrupamiento con las variables cualitativas present una correlacin cofentica
de 0,94 y las distancias entre las lneas estuvieron entre 0,30 y 0,89 (Grfico 2). Este
agrupamiento no coincidi con el origen comn de las lneas, excepto en el caso del grupo
formado por las lneas BLS14 y BLS16, que se obtuvieron de la misma poblacin y en la
diferenciacin de la lnea BLS91, la cual no estaba emparentada con el resto de las lneas.
El anlisis de conglomerados permiti estimar diferencias y similitudes entre las lneas
evaluadas en base a sus caracteres morfolgicos. En este sentido, Alfaro y Segovia (2000)
evaluaron 44 entradas de maz de diferentes razas en base a caracteres cuantitativos de
planta y de mazorca segn los descriptores del IBPGR (International Board for Plant Genetic
Resources), mediante anlisis de componentes principales y anlisis de conglomerados.
El anlisis a travs de caracteres cuantitativos coincidi ms con el parentesco de las lneas
que el anlisis mediante atributos cualitativos. En este sentido, Louette y Smale (1996)
encontraron una alta diversidad fenotpica al evaluar distintos caracteres cuantitativos (tanto
vegetativos como reproductivos) en 14 variedades de maz, mediante anlisis de
conglomerados y anlisis factorial discriminante.
La caracterizacin morfolgica y la diferenciacin de lneas obtenida en el presente trabajo
presenta una gran utilidad. Si bien actualmente muchos marcadores morfolgicos son
importantes descriptores en la inscripcin de variedades, el uso de marcadores moleculares, o
de una combinacin de marcadores moleculares y datos fenotpicos (Franco et al., 2001;
Rebourg et al., 2001) permitira redefinir la composicin y/o caracterizacin de los recursos
genticos utilizados.


Grfico 1: Dendrograma que muestra el agrupamiento de lneas obtenido segn
caractersticas cuantitativas. Correlacin cofentica = 0,722.

Grfico 2: Dendrograma que muestra el agrupamiento de lneas obtenido segn
caractersticas cualitativas (0-1-2). Correlacin cofentica=0,94.

Bibliografa
Alfaro, Y. y V. Segovia. 2000. Maces del sur de Venezuela clasificados por taxonoma
numrica. II. Caracteres de la planta y de la mazorca. Agronoma Tropical 50: 435-460.
Dice, L.R. 1945. Measures of the amount of ecologic association between species. Ecology
26: 297-302.
Franco, J.; J. Crossa, J.M. Ribaut, J. Betrn, M.L. Warburton, and M. Khairallah. 2001. A
method for combining molecular markers and phenotypic attributes for classifying plant
genotypes. Theor. Appl. Genet. 103: 944952.
Hair, J.F.; R.E. Anderson, R.L. Tatham and W.C. Black. 1995. Multivariate data analysis. 4ta.
Ed. Prentice Hall - Upper Saddle River, New Jersey.
INFOSTAT. 2007. Software Estadstico. Versin 2. Grupo Infostat. Facultad de Ciencias
Agropecuarias, Universidad Nacional de Crdoba, Argentina.
Louette D. and M. Smale. 1996. Genetic diversity and maize seed management in a traditional
Mexican community: Implications for in situ conservation of maize. NRG Paper 96-03.
CIMMYT, Mexico. 22 pp.


Rebourg, C.; B. Gouesnard and A. Charcosset. 2001. Large scale molecular analysis of
traditional European maize populations. Relationships with morphological variation. Heredity
86: 574-587.


DISEO Y VALIDACIN DE UN INSTRUMENTO PARA MEDIR LA
INTELIGENCIA EMOCIONAL EN LOS ESTUDIANTES DE LA
ESCUELA DE EDUCACIN DE LA UNIVERSIDAD DE LOS ANDES
(VENEZUELA)
VILORIA HERMES
1
, RANGEL ILKA
2
, GALINDO PURIFICACION
3

1
Departamento de Medicin y Evaluacin, Universidad de Los Andes-Venezuela
2
Maestra en Evaluacin Educativa, Universidad de Los Andes-Venezuela
3
Departamento de Estadstica, Universidad de Salamanca-Espaa

hviloria@ula.ve

RESUMEN
En el presente trabajo se pretende disear y validar un Instrumento para medir la
Inteligencia Emocional (IE) en los estudiantes de la Escuela de Educacin de la Universidad
de los Andes (Venezuela). Si bien este trabajo no pretende abordar la modificacin o
desarrollo de las habilidades de la Inteligencia Emocional, s tiene como objetivo presentar
una manera novedosa de evaluar la Inteligencia Emocional integrando varios aspectos que
se consideran deben incluirse al momento de estudiarla, as como cumplir con los criterios
tanto de validez como de confiabilidad, esto dando como producto una Escala
Autoinformada de Inteligencia Emocional (EAIE).
El Diseo y validacin de un instrumento para medir percepcin de la Inteligencia Emocional
en los estudiantes universitarios, es una herramienta prctica que permitir aportar de
manera innovadora mtodos y tcnicas para evaluar la misma en el colectivo de inters,
ente ste, que eventualmente juega un rol trascendental en el diario vivir.
Se mostrar la metodologa usada para la elaboracin de la escala final, los resultados que
se deriven de las diferentes etapas de la investigacin y lo que se concluya de estos
resultados.

Palabras clave: inteligencia emocional, memoria emocional, instrumento para medir la
inteligencia emocional.

Introduccin
Durante aos en el mbito educativo y en los diferentes sistemas y subsistemas se trabaja
de manera amplia la creacin de planes y proyectos que satisfagan necesidades planteadas
por parte del estudiantado y del mismo docente, abordndose la adquisicin de
conocimientos y aprendizajes mediante diversos planes de accin y/o planificaciones,
proyectos de aula, entre otros; que se estructuran con base en reas de desarrollo, ejes
curriculares y aspectos que abordan el aprendizaje y la enseanza de manera integral y
holstica, dndole cada da mayor importancia al desarrollo cognitivo, donde el aspecto
emocional en ocasiones es dejado de lado por parte de los adultos significativos, guas y/o
mediadores.
Durante la Cumbre de Educacin auspiciada por la UNESCO (1996) se promueven
lineamientos dirigidos al desarrollo humano para enfrentar los retos del mundo cambiante,
donde se incorporan cuatro (4) ejes fundamentales a incorporar en los programas
educativos, en los diversos niveles: aprender a conocer, a ser, a hacer y a convivir,
incidiendo as en la importancia de tomar en cuenta a cada uno de los actores no slo como
un ente receptor y emisor de aprendizajes y enseanzas sino tambin como un ser
biopsicosial caracterizado por ser parte de un entorno social y cultural.
Partiendo de la concepcin de un aprendizaje integral y holstico, debemos considerar la
Inteligencia emocional, como un tema innovador y cautivador para abordar la temtica de la
investigacin, ya que en innumerables aulas de los diversos sistemas y subsistemas


educativos se carece de docentes con formacin integral que logren atender a estudiantes
con diversas necesidades no slo a nivel cognitivo sino tambin emocional y social.
El Diseo y validacin de un instrumento para medir el conocimiento de la Inteligencia
Emocional en los estudiantes de la Escuela de Educacin de la Facultad de Humanidades y
Educacin de la Universidad de los Andes, es una herramienta prctica que permitir
aportar de manera innovadora mtodos y tcnicas para evaluar la misma en el colectivo de
inters, ente ste, que eventualmente juega un rol trascendental en el diario vivir.
Si partimos del hecho de descubrir e indagar sobre el nivel de conocimiento que poseen los
estudiantes de la Facultad de Humanidades y Educacin, basndonos en los resultados
arrojados acerca de la Inteligencia Emocional, podremos lograr no slo que ellos/as
manifiesten inters por la bsqueda de nuevos conocimientos sino que tambin se
sensibilicen en las aulas de clase con talleres y cursos, donde el factor emocional, cognitivo
y social sean la base del aprendizaje que llevarn a los diversos espacios educativos.

Desarrollo
Objetivo general: Disear y validar un instrumento para medir el nivel de conocimiento de
Inteligencia Emocional en estudiantes de Educacin de la Universidad de los Andes de la
Facultad de Humanidades y Educacin. Mrida- Venezuela
Objetivos especficos:
- Indagar acerca de los diversos instrumentos existentes para medir el nivel de
conocimiento de la Inteligencia Emocional en estudiantes de Educacin.
- Diagnosticar el nivel de conocimiento de la inteligencia emocional de los estudiantes
de Educacin de la Facultad de Humanidades y Educacin.
- Aplicar el instrumento para determinar la confiabilidad y validez del mismo.
- Valorar el nivel de conocimiento de los estudiantes de Educacin de la Facultad de
Humanidades y Educacin.
- Proponer un instrumento para medir el nivel de conocimiento de Inteligencia
Emocional en estudiantes de Educacin de la Universidad de los Andes de la
Facultad de Humanidades y Educacin. Mrida- Venezuela.

Hiptesis
-Ha1. El instrumento diseado presenta una confiabilidad significativa para la medicin del
conocimiento acerca de la Inteligencia Emocional.
-Ha2. El instrumento diseado presenta una validez interna significativa de acuerdo con el
modelo terico planteado.
-Ha3. El instrumento diseado presenta una validez externa significativa de acuerdo a las
correlaciones con el TMMS 24 (Trait Meta Mood Scale)
-Ha4. Existen diferencias significativas en los niveles de Inteligencia Emocional de acuerdo
con el sexo de los participantes.
-Ha5. Existen diferencias significativas en los niveles de Inteligencia Emocional de acuerdo
con la edad de los participantes.

En el desarrollo del trabajo se diseara el instrumento a proponer, siguiendo la metodologa
especfica para tal fin, se partir de un pool de tems validados previamente, se usar el
anlisis factorial exploratorio para seleccionar aquellos tems que tengan mayor peso
(variabilidad) en cada una de las dimensiones arrojadas y se proceder a una nueva
validacin de contenido a travs de expertos (jueces). Finalmente se aplicar a una muestra
representativa de estudiantes de la carrera de educacin de la Universidad de Los Andes de
manera que se estudie la confiabilidad del instrumento final. Tambin se representar la
agrupacin de tems a travs de un anlisis cluster.

Bibliografa:


Cantero, M., Peres, N. y Prez, M. (2008). Diferencias en el perfil de competencias
personales y socioemocionales en estudiantes universitarios de ciencias y educacin.
Espaa: SUMMA Psicologa UST. vol.5 (1), 33-34.
Gardner, H. (1983). Frames of mind: The Theory of multiple intelligences. Nueva York: Basic
Books.
Goleman, D. (2007). La Inteligencia Emocional en la Empresa. Ediciones Argentina S. A.
para el sello Zeta Bolsillo. Argentina.
Lpez, M. (2008). La Inteligencia Emocional en el Divorcio. Mxico: Editorial Trillas.
Martin, D. y Boeck, K. (2004): Qu es la inteligencia emocional (3era ed). Buenos Aires:
Argentina: EDAF.
Mayer, J., Caruso, D. y Salovey, P. (2000). Emotional intelligence meets traditional
standards for an intelligence. Intelligence 24, pp. 267-298.
Rodriguez, D. (2007). Las tres Inteligencias: intelectual, emocional y moral: Una gua para el
desarrollo integral de nuestros hijos. Mxico: Editorial Trillas.
Salovey, P. y Mayer, J. (1990). Emotional Intelligence. Imagination, Cognition and
Personality, 9, 185-211.


PROBABILIDAD DE OCURRENCIA DE PRECIPITACIONES
PLUVIALES MXIMAS EN SAN LORENZO - PARAGUAY

GUIDO GUSTAVO HUMADA GONZLEZ, GILBERTO RODRIGUES LISKA, LDER
AYALA AGUILERA, AUGUSTO RAMALHO DE MORAIS

Departamento de Ciencias Exactas, Universidad Federal de Lavras, Minas Gerais, Brasil
Departamento de Produccin Agrcola, Facultad de Ciencias Agrarias, San Lorenzo,
Paraguay


RESUMEN
Una de las principales preocupaciones en cuanto a lluvias es la intensidad y frecuencia con
la que ocurren, por sus efectos altamente dainos, ya sea por escasez o por exceso.
Conocer las probabilidades de ocurrencia de lluvias es de gran importancia en el
planeamiento agropecuario para as efectuar labores agrcolas en pocas adecuadas tales
como: siembra, fertilizacin y/o cosecha, entre otras labores importantes. La Teora de
Valores Extremos ha sido aplicada con xito en el tratamiento estadstico de datos
meteorolgicos, tales como precipitaciones pluviales mximas, temperaturas mnimas,
vientos mximos, entre otros. Siendo as, se objetivo en este trabajo aplicar las
distribuciones Generalizada de Valores Extremos (GVE) y Gumbel para obtener as
probabilidades de ocurrencia de niveles extremos de precipitacin del municipio de San
Lorenzo Paraguay. La prueba de Kolmogorov Smirnov fue utilizado para verificar la
adecuabilidad de los modelos y los resultados de la prueba muestran que las distribuciones
GVE y Gumbel se ajustaron a los datos, pudiendo por tanto ser empleados en el clculo de
probabilidades. Las mayores probabilidades de ocurrencia de precipitacin fueron
observadas en los meses de octubre a enero y las menores en los meses de junio a
setiembre, siendo esta informacin de suma importancia para el planeamiento urbano y
agrcola de la ciudad de San Lorenzo Paraguay.

Palabra-claves: probabilidad de ocurrencia, precipitacin mxima, distribucin gumbel.

Introduccin
Una de las principales preocupaciones en cuanto a lluvias es la intensidad y frecuencia con
la que ocurren, por sus efectos altamente dainos, ya sea por escasez o por exceso.
Conocer las probabilidades de ocurrencia de lluvias es de gran importancia en el
planeamiento agropecuario para as efectuar labores agrcolas en pocas adecuadas tales
como: siembra, fertilizacin y/o cosecha, entre otras labores importantes. Mediante la Agro
meteorologa operacional se puede obtener las estimativas que permitirn la toma correcta
de decisiones para efectuar los trabajos que sean necesarios. La acumulacin de aguas
pluviales en poca de lluvias intensas, en San Lorenzo y regin, ha perjudicado
sensiblemente la economa local, debido a las inundaciones causadas en el rea urbana y a
las perdidas en los cultivos en la zona rural. Por tanto, el estudio de la precipitacin extrema
en la regin es de gran importancia para la elaboracin de proyectos agrcolas e de obras
destinadas a controlar posibles inundaciones.
La Teora de Valores Extremos (TVE) desempea un papel fundamental en estudios
relacionados a mediciones fsicas en que es aplicada con la finalidad de describir el
comportamiento de eventos raros y ha sido aplicada con xito en el tratamiento de datos
meteorolgicos, como precipitaciones mximas, temperaturas mnimas, vientos mximos,
entre otros (BEIJO & AVELAR, 2010).
As, teniendo en vista la importancia del conocimiento de posibles precipitaciones
mensuales mximas, este trabajo tuvo como objetivo proporcionar estimativas de


probabilidades de precipitacin pluvial mxima, en diferentes niveles, en el municipio de San
Lorenzo-Paraguay, a fin de viabilizar mayores informaciones sobre el problema. Para ello
fueron utilizadas las distribuciones Gumbel y GVE.

Desarrollo
Los datos de precipitacin pluviomtrica utilizados en la investigacin fueron obtenidos de la
estacin meteorolgica automtica de la facultad de Politcnica situada dentro del campus
universitario de la Universidad Nacional de Asuncin, en San Lorenzo Paraguay, los datos
corresponden a un periodo de 9 aos, de enero del 2003 a diciembre del 2011.
Los dados fueron agrupados en perodos mensuales y anuales, extrayndose el nivel
mximo de precipitacin observado en cada serie, formando as, vectores de valores
mximos de cada perodo para cada mes y ao estudiado.
La distribucin generalizada de valores extremos (GVE) fue desarrollada por Jenkinson
(1955), y presenta como casos particulares los tres tipos de distribuciones de valores
extremos: la distribucin Weibull, Gumbel y Frchet. La funcin de distribucin acumulada
de probabilidad de la distribucin GVE es dada por:
1
( ; , , ) exp 1
x
F x

|
| o
o
| |
|
\ .

( | |
= +
`
| (
\ .

)
(1)
definida en, x | o < < para 0 < , x < < para tendiendo a cero,
x | o < < para 0 > , siendo , y | o los parmetros de posicin, escala y de forma
respectivamente con 0 o > .
La funcin de densidad de probabilidad de la distribucin Gumbel, de la variable aleatoria X,
asociada a valores extremos, es obtenida tomndose el lmite de la funcin en (1) con el
parmetro de forma tendiendo a cero.
De acuerdo con Beijo et al. (2005), las estimativas de los parmetros en el modelo (1) y de
la distribucin Gumbel son obtenidas por el mtodo de la mxima vero semejanza. El ajuste
de las distribuciones a los datos fue verificado por la prueba de Kolmogorov-Smirnov a un
nivel de 5% de significancia, de acuerdo con Campos (1979).
Para la realizacin de los anlisis fue utilizado el paquete estadstico EVD del Sistema
Computacional Estadstico R, conforme R Development Core Team (2011).

Resultados y discusin
Adoptando un nivel de significancia de 5% como adecuado, se puede verificar que las
distribuciones Gumbel y GVE se ajustaron bien al conjunto de datos mensual y anual de
precipitacin mxima, excepto el mes de marzo para la distribucin GVE, una vez que la
hiptesis nula de adecuabilidad de ajuste de esa distribucin a los datos no fue aceptada por
la prueba de Kolmogorov-Smirnov. Em general, el estudio de precipitacin por las
distribuciones Gumbel y GVE se muestran adecuadas para el clculo de probabilidades de
esa variable.
Analisando la Tabla 1, se observa que la probabilidad de que por menos una vez en el mes
de diciembre ocurra un nivel de lluvia superior a 50 mm

es de 64,42% va distribucin GVE
y va distribucin Gumbel la probabilidad es de 55,91%.

Tabla 1: Probabilidad de ocurrencia de niveles mximos de precipitacin en series mensual
y anual en varios niveles de lluvia
Mes
GVE Gumbel
50 80 100 50 80 100
Enero 0,5030 0,0854 0,0399 0,5912 0,0442 0,0061
Febrero 0,2387 0,0565 0,0188 0,2360 0,0644 0,0259
Marzo NA NA NA 0,3755 0,1547 0,0810
Abril 0,4275 0,0000 0,0000 0,2707 0,0771 0,0317


Mayo 0,4378 0,1960 0,1115 0,4498 0,1940 0,1036
Junio 0,1047 0,0701 0,0577 0,0150 0,0008 0,0001
Julio 0,4154 0,0000 0,0000 0,2035 0,0506 0,0192
Agosto 0,1662 0,1352 0,1224 0,0089 0,0003 0,0000
Setiembre 0,0903 0,0000 0,0000 0,1238 0,0182 0,0049
Octubre 0,6706 0,1420 0,0000 0,5716 0,1586 0,0580
Noviembre 0,5640 0,1977 0,0212 0,4415 0,1816 0,0937
Diciembre 0,6442 0,2788 0,0864 0,5591 0,2408 0,1248
Ano 0,8974 0,6097 0,3599 0,8925 0,5528 0,3350
NA: No evaluado

Conclusin
Las distribuciones Gumbel e GVE se ajustaron a los datos de niveles mximos de
precipitacin

en San Lorenzo - Paraguay y se muestran adecuadas para clculo de
probabilidades de esta variable. Las mayores probabilidades de ocurrencia de precipitacin
fueron observadas en los meses de octubre a enero y las menores en los meses de junio a
setiembre, siendo esta informacin de suma importancia para el planeamiento urbano y
agrcola de la ciudad de San Lorenzo Paraguay.

Bibliografa
BEIJO, L. A.; MUNIZ, J. A.; CASTRO NETO, P. 2005.Estudo do Tempo de Retorno das
Precipitaes Mximas em Lavras (MG) pela Distribuio de Valores Extremos do Tipo I.
Cincia e Agrotecnologia, Lavras, v. 29, n. 3, p. 657-667, maio/jun.
BEIJO, L. A.; AVELAR, F. G. 2010. Distribuio Generalizada de Valores Extremos no
estudo de dados climticos: uma breve reviso e aplicao. Revista da Estatstica UFOP, v.
1, X Semana da Matemtica e II Semana da Estatstica, 2010.
CAMPOS, H. 1979. Estatstica experimental no-paramtrica. 3
a
ed. Piracicaba: ESALQ,
343p.
JENKINSON, A. F. 1955. The frequency distribution of the annual maximum (or minimum)
values of meteorological elements. Q. J. Meteorol. Soc., Brackneel, v.81, p.158-71.
R DEVELOPMENT CORE TEAM (2011) R: A language and environment for statistical
computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0,
URL http://www.R-project.org/.



USO DE LA REGRESIN CUANTIL PARA ESTABLECER FACTORES
ASOCIADOS AL INCREMENTO DEL NDICE DE MASA CORPORAL EN
NIOS PREESCOLARES
ANGARITA-FONSECA ADRIANA
1, 2
, HENRQUEZ-ROLDN CARLOS FELIPE
3
, PRADA
GMEZ GLORIA ESPERANZA
4
, GUTIRREZ ANGARITA MNICA PATRICIA
5

1
Est. Magster Estadstica, Departamento de Estadstica/ Universidad de Valparaso. Chile

2
Profesora Adjunta, Programa de Fisioterapia/ Universidad de Santander, Colombia

3
Profesor Titular, Departamento de Estadstica, Universidad de Valparaso de Chile

4
Profesora Titular, Escuela de Nutricin y Diettica, Universidad Industrial de Santander.
Colombia

5
Profesional Especializado, Regional Santander /Instituto Colombiano de Bienestar Familiar.
Colombia

adriangarita@udes.edu.co

RESUMEN
La distribucin sesgada del ndice de masa corporal (IMC) limita los resultados obtenidos por la
modelizacin estadstica comn de enfoques tales como la regresin lineal o logstica, por lo
que es ms apropiado usar la regresin cuantlica. El objetivo de este trabajo fue determinar
cules factores se encuentran asociados con el incremento de la puntuacin Z estandarizada
del IMC para la edad y sexo de los escolares usuarios del programa de Hogares Infantiles (HI)
del Instituto Colombiano de Bienestar Familiar (ICBF) de Floridablanca, Colombia, mediante la
regresin cuantil. Se realiz un estudio de corte transversal. La muestra estuvo conformada por
207 preescolares (45,9% de sexo femenino, 52,89,7 meses). El modelo final, en el cuantil 50,
se encontr una relacin negativa entre el puntaje Z del IMC y la percepcin del dficit de peso
del nio segn la madre y comer poco, y positiva con exceso de peso de la madre, percepcin
de sobrepeso u obesidad segn la madre, alimentacin por parte de la abuela el domingo,
comer en el tiempo adecuado y comer rpido. Se concluye que la regresin cuantil provee
informacin del efecto de las variables independientes sobre la dependiente a travs de todo su
espectro an cuando los datos sean heterogneos.

Palabras clave: Regresin Cuantlica, ndice de masa corporal, nios.

Introduccin
La obesidad es un problema de salud pblica considerado como una epidemia, prevenirlo
desde la edad preescolar es la mejor manera de combatirlo. En 2002, en los Estados Unidos y
Canad un 64% y 50% de los adultos tenan exceso de peso, en Latinoamrica y el Caribe el
50% y 60% de los adultos y entre el 7% y 12% de los menores de cinco aos [1]. En Chile,
Mxico y Per, uno de cada cuatro nios de 4 a 10 aos lo presentaba [1,2]. En Colombia se
increment entre el 2005 y 2010, menores de cuatro aos de 4.9% a 5.2%, en el grupo de 5 a
17 aos de 13.9% a 17.5% y en poblacin de 18 a 64 aos de 45.9% a 51.2% [3]. A pesar de
estas cifras, pocos estudios han establecido cules factores estn asociados al exceso de peso
en preescolares colombianos.
En la literatura, la mayora de los estudios han usado regresin lineal o logstica para establecer
asociacin entre diversos factores y el ndice de masa corporal (IMC). La regresin lineal se


enfoca en la media condicional de una variable de respuesta sin tener en cuenta todas las
propiedades de la distribucin condicional de esa variable, en el caso ms simple se tiene un
promedio de la variable y explicada por un variable x ms un trmino del error distribuido
idntica, independiente y normalmente, con media cero y varianza desconocida
2
, que se
asume constante para todas las covariables. El supuesto de normalidad de las variables en
regresin lineal asegura que los mnimos cuadrados ordinarios proveen el mejor ajuste de los
datos, y con base en este supuesto se prueban hiptesis. En general se asume que la regresin
lineal es apropiada para todos los datos. No obstante, por lo general el IMC no se distribuye
normal con outliers influyentes o no que pueden ser de inters para los investigadores y por otro
lado, el IMC generalmente no es constante para todas las covariables.
Siendo el IMC una variable con distribucin sesgada y heterocedstica, es ms apropiado usar
la regresin cuantlica propuesta por Koenker y Bassett [4], la cual estima el efecto potencial de
las covariables sobre varios cuantiles en la distribucin condicional, por ejemplo en los cuantiles
0,25; 0,50 y 0,75. Con la mediana (cuantil 0,50) y los dems cuantiles, la regresin logra estimar
el efecto diferencial de las covariables en toda la distribucin independientemente de la
heterocedasticidad. Por lo anterior, el objetivo de este trabajo fue establecer la asociacin entre
algunos factores evaluados y el ndice de masa corporal en nios y nias de 3 a 6 aos de
Floridablanca, Colombia, aplicando la regresin cuantlica.

Desarrollo
Estudio de corte transversal. El universo lo conform la poblacin de tres a seis aos, usuaria
del programa de hogares infantiles (HI) del Instituto Colombiano de Bienestar Familiar, ubicados
en el rea urbana del municipio de Floridablanca que asciende a 665 menores. La muestra
estuvo conformada por 207 preescolares (45,9% de sexo femenino, 52,89,7 meses) inscritos y
con asistencia regular al programa, que contaron con un informante (representante legal o
persona a cargo del menor); los que fueron seleccionados aleatoriamente de manera
proporcional segn HI.
Con los datos de peso, talla, edad y sexo se construy utilizando el programa ANTHRO [5] la
puntuacin Z estandarizada del IMC para la edad y sexo, que se consider la variable
dependiente. En el anlisis estadstico se tuvo en cuenta la regresin cuantil simultnea simple
y mltiple, cuya ecuacin es de la forma:
y
i
=
0
( p)
+
1
( p)
x
i
+
1
( p)
, donde 0<p<1 indica la
proporcin de la poblacin que tiene valores por debajo del cuantil p -simo. El ajuste del
modelo se evalo mediante la prueba linktest. El software usado fue Stata 12.0. La investigacin
fue aprobada por el comit de tica de la Universidad Industrial de Santander.

Resultados
En la Tabla 1 se presenta el anlisis de regresin cuantil simple. El modelo final qued
conformado por las variables edad, percepcin de dficit de peso segn la madre, consumo de
verdura cocida, comer en un tiempo adecuado y exceso de peso de la madre (Figura 1),
existiendo una relacin inversa entre la percepcin de dficit de peso del nio segn la madre
( -0,72, -0,92 y -1,11 para los cuantiles 0,25; 0,50 y 0,75 respectivamente). En el cuantil 0,50,
se encontr asociacin con comer verduras ( -0,84, p=0.002), comer en un tiempo adecuado
( 0,44, p=0,004 ) y exceso de peso de la madre ( 0,33, p=0,023).



Tabla 1. Regresin cuantil simple entre los factores estudiados y la puntuacin Z estandarizada
del IMC.
Variable
Cuantil .25 Cuantil .50 Cuantil .75
Beta (IC95%) Valor p Beta (IC95%)
Valor
p
Beta (IC95%)
Valor
p
Mayores de 60 meses 0,55(-0,07;1,16) 0.080 0,26 (-0,19;0,71) 0,260 0,71 (-0,11;1,53) 0,089
Sexo Masculino 0,14 (-0,21;0,49) 0,434 0,19 (-0,12;0,50) 0,233 0,34 (-0,27;0,95) 0,273
Peso al nacer
0,0002
(-0,0002;-0,0006)
0,383
0,0002
(-2.38e-07;0,0009)
0,050
0,0006
(0,0002;0,0010)
0,003
Exceso de peso de la
madre
0,4 (0,03;0,77) 0,033 0,43 (0,06;0,80) 0,023 0,73 (0,23;1,22) 0,004
Percepcin del peso del nio segn la madre
Dficit de peso -0,87 (-1,19;0,54) 0,000 -1,04 (-1,39;-0,69) 0,000 -1,2 (-1,6 ;-0,85) 0,000
Sobrepeso/Obesidad 1,12 (0,10;2,13) 0,032 1,34 (0,15;2,53) 0,028 1,75 (0,51;2,98) 0,006
Persona que alimenta los domingos
Abuela 0,37 (-0,24;0,98) 0,236 0,57 (0,04;1,09) 0,033 0,25 (-0,25;0,75) 0,329
Otro 0,05 (-0,84;0,94) 0,912 0,44 (-0,22;1,10) 0,193 -0,22;1,82) 0,125
Apetito del nio
Come demasiado 0,77 (0,28;1,26) 0,002 0,41 (-0,19-1,00) 0,178 0,63 (-0,99;2,25) 0,444
Come poco -0,32 (-0,89;0,25) 0,273 -0,43 (-0,83;-0,03) 0,034 -0,86 (-1,39;-0,32) 0,002
Tiempo en la alimentacin
Come en el tiempo
adecuado
0,48 (0,03;0,93) 0,035 0,65 (0,32;0,98) 0,000 1,26 (0,50;2,01 0,001
Come rpido 0,93 (-0,23;2,09) 0,116 0,65 (0,03;1,27) 0,040 0,66 (-0,34;1,66) 0,193
Come verduras -0,5 (-1,17;0,17) 0,147 -0,72 (-1,67;0,23) 0,137 -0,72 (-1.29;-.14) 0,014

Figura 1. Factores asociados al incremento de la puntuacin Z estandarizada del IMC. Modelo
final Regresin Cuantil Mltiple. n=163. Linktest: p=0.776

Conclusiones
Los hallazgos aportarn elementos claves para el diseo de la poltica pblica. La regresin
cuantil provee informacin del efecto de las variables independientes sobre la dependiente a
travs de todo su espectro an cuando los datos sean heterogneos.


Bibliografa
[1]. Eberwine, D. (2003). Globesity: the crisis of growing proportions. Diabetes voice;48(1):30-33
[2] Olivares, S.; Bustos, N.; Moreno, X.; Lera, L. y Cortez, S. (2006) Actitudes y prcticas sobre
alimentacin y actividad fsica en nios obesos y sus madres en Santiago, Chile. Rev Chil Nutr,
33(2): 170-179.
[3] Instituto Colombiano de Bienestar Familiar (2010). Encuesta Nacional de la Situacin
Nutricional en Colombia ENSIN 2010. Versin obtenida el 10/02/2013. Disponible en:
http://www.icbf.gov.co.
[4] Koenker, R. and Bassett, G., J r. (1978). Regression quantile. Econometrica. 46: 3350.
[5] Organizacin Mundial de la Salud (2010). Software ANTHRO, v 3.1.Ginebra, Suiza.


EXPLORANDO LA ESTIMACIN DE EFECTOS PRINCIPALES A
PARTIR DE UN CBC SOBRE EL CONSUMO DE PAPA FRESCA
PRODUCIDA CON BAJO IMPACTO AMBIENTAL
BEATRIZ LUPN, J ULIA GONZLEZ, ELSA M. RODRGUEZ

Grupo de Investigacin Economa Agraria, FCEyS-UNMdP

beatrizlupin@gmail.com; juliagonzalez_mdp@yahoo.com.ar; emrodri@mdp.edu.ar

RESUMEN
A fin de precisar la importancia cuantitativa de los niveles de atributos percibidos como
fundamentales por potenciales consumidores de una papa fresca producida mediante una
prctica agrcola respetuosa del medio ambiente
1
, se desarroll un Conjoint Analysis Basado en
Elecciones (CBC).
En este trabajo, se presentan los primeros resultados obtenidos al estimar los efectos
principales de un Modelo Logstico Condicional (CLM) que considera las elecciones de los
participantes de la experiencia. De los atributos analizados, el CONTENIDO DE
AGROQUMICOS, la APTITUD CULINARIA y el PRECIO son los de mayor relevancia en la
utilidad de los consumidores.

Palabras clave: experimentos de eleccin, atributos, efectos principales, papa fresca

Introduccin
El Conjoint Analysis (CA) es una tcnica que posibilita valorar los niveles de los atributos de
calidad de un producto, considerando la informacin provista directamente por los individuos -
preferencias declaradas- (Green & Srinivasan, 1990). Su marco conceptual es la teora de la
demanda de Lancaster (1966), la que establece que la utilidad es funcin del conjunto de
atributos. Conforme esta base, el CA permite estimar las utilidades parciales, que vinculan los
niveles de los atributos con las preferencias de los consumidores.
Dado que reproduce de forma realista situaciones de eleccin de bienes con escasa o nula
participacin en el mercado, se decidi implementar un CBC a fin de identificar las variables que
influyen en las preferencias de compra de potenciales consumidores de una papa producida
con bajo impacto ambiental -an no disponible a nivel domstico- como as tambin estimar la
disposicin a pagar por la misma.
El CBC se implement utilizando como soporte una encuesta sobre consumo de papa. Se
entrevistaron a 402 individuos mayores de 18 aos, captados en super/hipermercados y en
verduleras de Mar del Plata-Argentina, durante el mes de octubre del ao 2012.
Debido al carcter no aleatorio del muestreo, el relevamiento fue diseado considerando
lugares de venta de papa situados en distintos barrios, logrndose la representatividad socio-
econmica y geogrfica. Por su parte, a fin de asegurar la representatividad demogrfica, se
fijaron cuotas de sexo y edad para el encuestado, de acuerdo a datos locales provenientes del
ltimo Censo Nacional de Poblacin, Hogares y Vivienda (INDEC, octubre 2010).
En este trabajo, se presentan los primeros avances en cuanto a la estimacin de los efectos

1
Por ejemplo, la producida mediante la prctica integrada.


principales de un CLM, referido a los atributos de calidad de la papa mencionada.

Desarrollo
De acuerdo a estudios previos realizados por el grupo de investigacin al que pertenecen las
autoras del trabajo, referidos al consumo de papa fresca
2
, se seleccionaron para el experimento
CBC, por su relevancia en el estudio emprendido, los siguientes atributos -y sus niveles-:
CONTENIDO DE AGROQUMICOS -mucho, poco-, APTITUD CULINARIA -muy buena,
mala-, TRATAMIENTO -cepillada/lavada, sucia- y PRECIO -$6, $8, $10-.
Luego, se determinaron 3 bloques de eleccin, con 3 alternativas de producto cada uno. Para
establecer qu combinacin de niveles de los atributos defina a cada producto, se tuvo en
cuenta todas las posibles combinaciones de los niveles considerados: 2
3
x3
1
=24 -diseo
factorial completo-. Dado que este nmero de alternativas poda dificultar la evaluacin de los
participantes, se procedi a reducirlo mediante la aplicacin del algoritmo orthoplan/Software
SPSS -diseo factorial fraccionado-. Quedaron, as, definidos 9 perfiles de papa, que se
agruparon de a 3 para armar cada bloque. Tambin se agreg en cada bloque, la alternativa no
comprara ninguna de las opciones presentadas (opt-out). A ttulo ilustrativo, se expone uno de
los bloques:

Producto Contenido de agroqumi cos Aptitud culi nari a Tratamiento Precio
x Poco Mala Sucia $8/kg
y Mucho Mala Sucia $6/kg
z Mucho Muy buena Cepillada / Lavada $8/kg
Ni nguno

Las alternativas fueron denominadas con una letra a fin de evitar cualquier tipo de influencia en
los individuos (unlabeled design). Adems, el orden de presentacin de los bloques fue rotado
aleatoriamente con el objeto de evitar el sesgo relacionado con el inters prestado al momento
de hacer las elecciones. Los participantes deban, en cada uno de los 3 bloques, elegir 2
alternativas, ordenndolas en 1
ero.
y en 2
do.
lugar, conforme sus preferencias. Recin cuando los
mismos elegan la primera alternativa, se les solicitaba que eligieran la segunda.
La teora econmica subyacente a un CBC es el Modelo de Utilidad Aleatoria de Eleccin
Discreta (Marschak, 1960). Considerando, por ejemplo, que el individuo n enfrenta la eleccin
entre 2 papas (x e y), la utilidad brindada por las mismas est dada por Uxn y Uyn,
respectivamente. Dichas utilidades, estn conformadas por un componente sistemtico que
depende de las elecciones de los atributos y de las caractersticas personales del consumidor
(V) y por un trmino de error aleatorio que comprende todos los factores no identificados que
impactan en las elecciones (). Cada sujeto elegir x si y slo si Uxn>Uyn. Ya que es
estocstica, la eleccin no es determinstica; por ende, la probabilidad de que se elija x est
dada por: Prob.(Uxn=Vxn+xn>Uyn=Vyn+yn)=Prob.(yn-xn<Vxn-Vyn). Si se asume que los
trminos de error son iid
3
, con una distribucin Gumbell y un factor de escala igual a 1, la
probabilidad de eleccin de x est dada por Pxn=exp(Vxn) /
yYn
exp(Vyn), expresin del MCL
propuesto por McFadden (1973) y que puede extenderse para el resto de los perfiles de papa
bajo anlisis. ste se estima, comnmente, mediante Mxima Verosimilitud y cumple con la
propiedad IIA -lo que puede constituir una limitacin pues no siempre refleja situaciones
realistas-. (Camarena & Sanjun, 2005; Hasan-Basri & Abd Karim, 2013; Train,
2003)

2
En los mismos, se cont con el asesoramiento y la colaboracin de investigadores de la EEA Balcarce-INTA.
3
Los unlabeled designs son ms robustos en cuanto a la no violacin de este supuesto. (Hensher et al.,
2005)


A continuacin, se presentan resultados preliminares, obtenidos a partir de la aplicacin de un
CLM, en el que la utilidad se modela slo en funcin de los atributos de los productos.
Existen diversas posturas en la literatura especializada acerca de la manera de codificar los
niveles de los atributos cualitativos -dummies o efectos- como as tambin respecto a la
incorporacin de intercepto o constantes especficas por alternativa (ASC)
4
(Haaijer et al., 2001;
Hasan-Basri & Abd Karim, op.cit.; Louviere et al., 2000; Molin & Timmermans, 2010). En el
presente trabajo, se opt por un modelo de efectos principales sin ASCs; las variables
explicativas fueron codificadas como dummies, a excepcin del precio que fue tomado como
variable continua. Como en todos los modelos de esta clase, la variable dependiente es el
producto que elige el individuo entre todos los disponibles -incluyendo la opt-out-, es decir,
aqul que maximiza su utilidad. El modelo fue estimado con el Software Stata 11.1 utilizando el
cdigo asclogit, que permite la estimacin de modelos logsticos en los que las variables
independientes cambian de valor entre alternativas.
Seguidamente, se detallan las variables independientes y los resultados obtenidos:

Vari ables i ndependi ent es Coef ici ent es Error estndar
AGRO*** Contenido de agroqumicos
1 =poco; 0 =caso contrario

3,091044

0,1177029
CUL*** Aptitud culinaria
1 =muy buena; 0 =caso contrario

1,623663

0,1195466
TRAT Tratamiento
1 =cepillada/lavada; 0 =caso contrario

0,041060

0,0949331
PR *** -$6, $8, $10- Precio -0,144284 0,0180248

Los signos de las variables son los esperados desde la teora econmica. Un bajo contenido de
agroqumicos y una buena calidad culinaria favorecen la eleccin de una papa con cada uno de
estos atributos y son los que ms contribuyen a la utilidad del consumidor. A su vez, a medida
que el precio de la papa disminuye, aumenta la utilidad de los individuos. Finalmente, el hecho
de que la papa se encuentre cepillada/lavada o sucia no es relevante.
Es de destacar que se abord a resultados similares con otras especificaciones ensayadas;
particularmente, los coeficientes estimados de AGRO y CUL resultaron siempre con signo
positivo y estadsticamente significativos y el valor de LL no se altera demasiado.
A fin de mejorar el ajuste del modelo, en las etapas siguientes de la investigacin, se tiene
previsto profundizar el estudio acerca de las formas de codificacin de las variables
independientes y del tratamiento de la opt-out como as tambin la incorporacin de trminos
de interaccin entre atributos y caractersticas socio-demogrficas de los consumidores.

Bibliografa -seleccionada-
Camarena, D.M. & Sanjun, A.I. (2005): Heterogeneidad de preferencias y experimentos de
eleccin: aplicacin de un logit con parmetros aleatorios a la demanda de nueces. Economa
Agraria y Recursos Naturales, Vol. 3, 8, pp. 105-119.
Faustin, V.; Adegbidi, A.A.; Garnett, S.T.; Koudand, D.O.; Agbo, V. & Zander, K.K. (2010):
Peace, health or fortune? Preference for chicken traits in rural Benin. Ecological Economics,

4
Dado que se trata de un unlabeled design, parte de la bibliografa consultada seala que no sera necesario
introducir un intercepto en el modelo porque carece de sentido en trminos de interpretacin (Hensher, op. cit.).
Sin embargo, en el MNL, la opt-out puede producir estimaciones insesgadas. Es por ello que varios autores
recomiendan aadir ASCs aunque es posible que los consumidores que eligieron la opt-out tengan preferencias
diferentes de los que eligieron una alternativa especificada, lo que puede invalidar el supuesto IIA.
(Faustin et al., 2010; Haaijer, op.cit.; Scarpa et al., 2005)
Observaciones =4.824
Casos =402
Wald _
2
(4) =1.030,01
Prob. >_
2
=0,0000
LL =-1.435,6811
***Significacin al 1%


69, pp. 1848-57.
Green, P. E. & Srinivasan, V. (1990): Conjoint Analysis in the Marketing: New developments
with implications for research and practice. J ournal of Marketing 54(4): 3-19.
Greene, W.H. (2008): Econometric analysis, 6
th.
ed., Pearson Education, New J ersey.
Haaijer, R.; Kamakura, W. & Wedel, M. (2001): The no-choicealternative in conjoint choice
experiments. International J ournal of Market Research, Vol. 43, Quarter 1, pp. 93-106.
Hassan-Basri, B. & Abd Karim, M.Z. (2013): The Effects of Coding on the Analysis of Consumer
Choice of Public Parks. World Applied Sciences J ournal 22(4), pp. 500-505.
Hensher, D.A.; Rose, J .M. & Greene, W.H. (2005): Applied choice analysis: A Primer.
Cambridge, Cambridge University Press.
Kontoleon, A. & Yabe, M. (2003): Assessing the Impacts of Alternative 'opt-out' Formats in
Choice Experiment Studies: Consumer Preferences for Genetically Modified Content and
Production Information in Food. J ournal of Agricultural Policy Research, 5, pp. 1-43.
Louviere, J .J .; Hensher, D.A. & Swait, J .D. (2000): Stated Choice Methods. Analysis and
Applications. Cambridge, Cambridge University Press.
Train, K.E. (2003): Discrete Choice Methods with Simulations. Cambridge, Cambridge
University Press.
Molin, E.J .E. & Timmermans, H.J .P. (2010): Context Dependent Stated Choice Experiments:
The Case of Train Egress Mode Choice. J ournal of Choice Modelling, 3(3), pp. 39-56.
Scarpa, R.; Ruto, E.S.K.; Kristjanson, P.; Radeny, M.; Drucker, A.G. & Rege, J .E.O. (2003):
Valuing indigenous cattle breeds in Kenya: an empirical comparison of stated and revealed
preference value estimates. Ecological Economics, 45, pp.409-426.


COMPONENTES PRINCIPALES RESTRINGIDAS Y NO RESTRINGIDAS
ESPACIALMENTE EN EL ESTUDIO DE ESTRUCTURA GENTICA DE
UN ENJAMBRE HBRIDO DE PROSOPIS SP.
INGRID TEICH
1
, MNICA BALZARINI
1

1
Estadstica y Biometra, Facultad de Ciencias Agropecuarias, Universidad Nacional de Crdoba

ingridteich@gmail.com

RESUMEN
El anlisis de la estructura gentica espacial (EGE) permite inferir sobre procesos ecolgico-
evolutivos y derivar pautas de manejo-conservacin de especies silvestres y cultivadas. La
mayora de los mtodos de estadstica espacial se aplican en datos univariados, dificultando el
anlisis espacial de la informacin gentica, cuya naturaleza es multivariada. Si bien el Anlisis
de Componentes Principales (ACP) se ha utilizado para estudiar estructura gentica, la
informacin espacial se incorpora a posteriori del anlisis. Por el contrario, el ACP
especialmente restringido (ACPe) incluye la informacin espacial explcitamente. Ambos anlisis
permiten estudiar la variabilidad gentica entre entidades biolgicas y la identificacin de los
alelos que ms contribuyen a la (co) variabilidad. En este trabajo se comparan los resultados
obtenidos del ACP y el eACP en el estudio de la estructura espacial gentica de un enjambre
hbrido de Prosopis flexuosa y P. chilensis. Se utiliz la caracterizacin gentica mediante seis
microsatlites de 87 rboles. Las variables sintticas del ACP explicaron ms varianza que los
componentes del eACP, pero tuvieron menor autocorrelacin espacial. El mapa obtenido
mediante la interpolacin de la primer componente espacial permiti una mejor visualizacin de
un patrn espacial de la variabilidad gentica en parches.

Palabras clave: Anlisis de Componentes Principales Espacial, Marcadores moleculares,
gentica espacial, bosque.

Introduccin
En poblaciones de plantas, y especialmente a escalas espaciales finas, es muy probable que la
variabilidad gentica est espacialmente estructurada (Vekemans y Hardy, 2004). En este
contexto se espera que la similitud entre individuos sea mayor cuando stos son vecinos que
cuando estn alejados en el espacio. Muchos mtodos para el anlisis de EGE fueron
desarrollados para anlisis locus x locus y el ndice de Moran (Moran 1950), ha sido utilizado
frecuentemente para probar la autocorrelacin espacial de los alelos, en un contexto univariado.
Para trabajar con datos de marcadores moleculares, que involucran muchos locus y alelos, las
tcnicas de reduccin de la dimensin han probado ser muy tiles (Cavalli-Sforza1966, Balzarini
et al. 2011). Por ejemplo, el Anlisis de Componentes Principales (ACP), permite resumir la
informacin de los perfiles moleculares en unos pocos componentes, los cuales, a su vez,
pueden ser graficados en un mapa. Esta manera de explorar la estructura espacial de la
variabilidad gentica fue propuesta por Cavalli-Sforza (1966). Sin embargo, el ACP no fue
diseado para investigar patrones espaciales y el uso de las primeras componentes puede no
detectar patrones espaciales si stos no estn asociados con la mayor diferenciacin gentica.
Para una mejor caracterizacin de las estructuras espaciales en datos genticos, el ACP debe


focalizarse en la parte de la la varianza multidimensional que est espacialmente estructurada.
En ste sentido, J ombart et al. (2008) desarroll el Anlisis de Componentes Espacial (ACPe),
en el cual no slo la varianza de las variables sintticas es maximizada sino tambin su
autocorrelacin espacial.
Particularmente en los bosques nativos, es crtico el conocimiento de la cantidad de diversidad
gentica y su distribucin espacial de manera de realizar un diagnstico correcto del estado, las
amenazas y la viabilidad de las poblaciones remanentes. En Argentina las especies de Prosopis
(Fabaceae, Mimosoideae) constituyen un recurso natural importante en zonas ridas debido al
potencial que tienen para proveer productos y su habilidad de crecer en suelos pobres, donde
pocas especies pueden sobrevivir. Sin embargo, Prosopis es un complejo taxonmico que se
muestra prcticamente como un continuo desde el punto de vista morfolgico y adaptativo, lo
cual dificulta la diferenciacin de grupos de individuos con identidad morfolgica y gentica
(Verga 2000). Por esta razn se espera encontrar patrones crpticos de EGE en enjambres
hbridos de Prosopis, an a escalas finas. El objetivo de ste trabajo es comparar los resultados
de la aplicacin del ACP y el ACPe en el estudio de la EGE de un enjambre hbrido entre
Prosopis chilensis y P. flexuosa.

Desarrollo
Se utilizaron datos correspondientes a la caracterizacin gentica mediante 6 microsatlites de
87 rboles pertenecientes a un enjambre hbrido entre P. chilensis y P. flexuosa (Mottura 2006),
ubicado en una parcela de 4700 m
2
de la Reserva Provincial Chancan de la provincia de
Crdoba. Se calcularon las frecuencias allicas de los 72 alelos registrados, las cuales fueron
centradas para realizar los anlisis multivariados. En primer lugar se realiz un anlisis
univariado, en el que se calcul la varianza y la autocorrelacin espacial de cada alelo
utilizando dos redes de conexin (Grfico de Gabriel y Triangulacin de Delaunay) mediante la
funcin moran.test de la librera spdep. Se identificaron los cuatro alelos con mayor
autocorrrelacin y mayor varianza y se compararon las redes de conexin en funcin de la
distribucin del nmero de vecinos por individuo.
Tanto el ACP como el ACPe se realizaron sobre la matriz de frecuencias allicas de 8772
utilizando el software R. Para el ACP se us la funcin dudi.pca de la librera ade4 y para el
ACPe se aplic la funcin spca de la librera adegenet utilizando la red de conexin de Gabriel.
Con los resultados de ambos anlisis se realizaron biplots utilizando el software InfoStat. En
primer lugar se compar la varianza y la autocorrelacin espacial de las variables sintticas
obtenidas con el ACP y el ACPe. Para esto se calcul la autocorrelacin de los CP y de los CPe
utilizando la red de conexin de Gabriel y se graficaron los valores del ndice de Moran en
funcin de las varianzas de cada variable sinttica. En segundo lugar, se compararon los mapas
de variabilidad gentica obtenidos con ambos anlisis. Para esto se graficaron los valores de la
CP1 y la CPe1 de cada rbol, posicionado segn sus coordenadas espaciales (funcin s.value
de ade4). Asimismo se interpolaron los valores de las primeras variables sintticas y se
realizaron mapas de superficie en los cuales se graficaron tambin las lneas de contorno
(funcin s.image de la librera ade4).

Respecto a las redes de conexin, con la triangulacin de Delaunay el nmero total de
conexiones fue de 492, mientras que con el Grfico de Gabriel fue de 310. La distribucin de
frecuencias del tamao de los vecindarios sugiere que con la red de Delaunay se usa un mayor
nmero de vecinos por individuo para calcular la autocorrelacin espacial. Esta red incluye
conexiones perifricas y probablemente se conecten individuos que no son vecinos reales. Por
esta razn se eligi la red de Gabriel para los anlisis multivariados. De los 72 alelos los cuatro
alelos con mayor varianza fueron L1.3, L5.10, L1.2 y L4.03, los cuales explican en su conjunto
un 25% de la varianza total. La autocorrelacin espacial fue en general mayor cuando se


calcul con la red de conexin de Gabriel, si bien los cuatro alelos con mayor autocorrelacin
coincidieron con ambas redes. El alelo L5.04 fue de mayor autocorrelacin con un ndice de
Moran de 0.25 o 0.1, dependiendo de la red de conexin utilizada. Los alelos L6.05, L5.05 y
L3.04 tambin presentaron autocorrelaciones relativamente altas.
En el biplot del ACP se observa que los alelos con mayor peso en los dos primeros CP
corresponden a los cuatro alelos de mayor varianza. En el biplot del ACPe, por el contrario, se
observa que en el CPe1, los dos alelos con mayor peso son el L4.03 (el alelo con mayor
autocorrelacin de los 4 alelos con mayor varianza) y el L6.05 (el alelo con mayor varianza de
los cuatro alelos con mayor autocorrelacin). En ambos biplots se observa que la primer
componente permite diferenciar a P. flexuosa de P. chilensis y los hbridos. Los CP explicaron
en general mayor varianza entre observaciones pero tuvieron menor autocorrelacin espacial
que los CPe (Figura 1). Los primeros dos CP, que explican 16 y 14% de la varianza gentica
total no presentaron autocorrelacin espacial (I1
ACP
= 0.05, I2
ACP
= -0.07, p>0.05). Por el
contrario, la varianza de los dos primeros CPe fue mucho menor (10% y 3.8%) pero sus ndices
de Moran fueron ms altos y estadsticamente significativos (I1
ACPe
= 0.29, I2
ACPe
= -0.39,
p<0.05). Estos resultados indican que los los CPs pueden no captar estructuras espaciales
relevantes en el enjambre hbrido estudiado, a diferencia del ACPe. Respecto a los mapas
sintticos se observa que la variabilidad gentica se encuentra espacialmente estructurada en
dos parches, uno asociado a P. flexuosa y otro asociado a P. chilensis e hbridos. Las lneas de
contorno se encuentran ms cercanas entre s en el mapa de la CPe1, indicando un mayor
gradiente espacial de la diferenciacin gentica entre individuos cuando se utiliza la variable
sinttica obtenida mediante el ACPe.

Figura 1: Autocorrelacin espacial y varianza de las componentes principales obtenidas mediante
ACP y ACP espacialmente restringido (ACPe).

Bibliografa
Balzarini, M.; Teich, I.; Bruno, C. y Pea, A. (2011). "Making genetic biodiversity measurable: a
review of statistical multivariate methods to study variability at gene level." Rev. FCA UNCUYO
43(1): 261-275.
Cavalli-Sforza, L. L. (1966). "Population Structure and Human Evolution." Proceedings of the
Royal Society of London. Series B, Biological Sciences 164(995): 362-379.
J ombart, T.; Devillard, S.; Dufour, A. B. y Pontier, D. (2008). "Revealing cryptic spatial patterns in


genetic variability by a new multivariate method." Heredity 101(1): 92-103.
Moran, P. (1950). "Notes on Continuous Stochastic Phenomena" Biometrika 37(1/2): 17-23.
Mottura, M. C. (2006). Development of microsatellites in Prosopis spp. and their application to
study the reproduction system. Gttingen, Library of Lower Saxony State and Georg-August
University of Gttingen.
Vekemans, X. y Hardy, O. J . (2004). "New insights from fine-scale spatial genetic structure
analyses in plant populations." Mol Ecol 13(4): 921-935.
Verga, A. (2000). "Clave para la identificacin de hbridos entre Prosopis chilensis y P. flexuosa
sobre la base de carcateres cuantitativos." MULTEQUINA 9: 17-22.


MODELOS DE RESPUESTA ORDINAL BASADO EN VARIABLES
METEOROLGICAS PARA ESTIMAR NIVELES DE FUMONISINA B
TOTAL (FBT) EN GRANO DE MAZ QUE INGRESA A LAS TERMINALES
PORTUARIAS DE LA REGIN PAMPEANA

SANCHO
1
, A.M.; ROJ AS
1
, D.; MOSCHINI
2
, R.; FILIPPINI
3
, S.O. Y RICCA
1
, A.P.

1
INTA CIA ITA. De los Reseros y Udaondo Hurlingham, Bs. As. Argentina

2
Instituto Nacional de Tecnologa Agropecuaria Instituto Clima y Agua

3
Universidad Nacional de Lujan

asancho@cnia.inta.gov.ar

RESUMEN
Tcnicas de regresin de respuesta ordinal fueron utilizadas para estudiar las variables
meteorolgicas asociadas al contenido de fumonisina total (FBT=FB1+FB2) en muestras de
grano de maz extradas de camiones provenientes de distintas zonas maiceras de la regin
pampeana al ingresar a terminales portuarias. El contenido de FBT fue categorizado
ordinalmente (umbrales: percentiles 40% 403 g/kg y 60% 816 g/kg). De un total de 300
observaciones se calcul la mediana de todos los sitios prximos a cada estacin
meteorolgica, de esta forma se dispusieron para el anlisis 52 valores de contenido de FBT
desde 2004/05 a 2006/07. Las variables meteorolgicas fueron procesadas en dos perodos,
uno temprano (16/12 al 15/1) alrededor de la aparicin de estigmas y otro tardo (15/2 al 2/4)
iniciado aproximadamente con la madurez fisiolgica hacia la cosecha. El mejor modelo
logstico de respuesta ordinal calculado temprano incluy a la interaccin (producto) entre Np1
(rk=0,604) y DsPr (das sin preciptacin, con rk=0,066) y a la variable tarda DPr (das con
precipitacin y rango trmico: 13,3-25C; con rk=0,594). La precisin de prediccin (porcentaje
de casos clasificados correctamente) del modelo logsticos fue de 86,5% respectivamente.
Estos resultados podran ser tiles para el manejo racional de la micotoxina.

Palabras clave: micotoxinas, modelos de regresin de respuesta ordinal, variables
meteorolgicas.

Introduccin
El desarrollo del modelo ordinal [1] se realiz en funcin de valores umbrales, ordenados en
forma ascendente los 52 valores de contenido de FBT para las 3 campaas, los percentiles
20%, 50% y 60% alcanzaron los valores de 403, 595 y 816 g/kg respectivamente. Estos
umbrales fueron utilizados para categorizar las observaciones de FBT en la categorizacin
ordinal: severa (S): FBT816 g/kg; moderada (M): FBT<816 y FBT403 g/kg y ligera a nula
(L): <403 g/kg. La variable dependiente obtenida probabilidad de ocurrencia de niveles
categorizados de FBT expresados en g/Kg. Las variables meteorolgicas regresoras se
obtuvieron a partir de informacin diaria de temperatura mxima (TxC) y mnima (TnC),
precipitacin (Pr, mm) y HR% registrada por los observatorios meteorolgicos alrededor de los
cuales se realizaron los agrupamientos de los sitios origen del camin, se construyeron
mltiples variables meteorolgicas calculadas en un perodo temprano que integra a la fecha de
aparicin de estigmas (fin de diciembre mediados de enero), y otro tardo (15 de febrero al 2 de
abril) que concentra el lapso madurez fisiolgica cosecha. En el perodo temprano, las
variables simples se expresan como: GDTx: se acumulan diariamente las diferencias positivas


entre Tx y el umbral 32,9C; GDTn: se acumulan diariamente las diferencias positivas entre el
umbral 18C y Tn; DT: nmero de das con Tn>18 C y Tx<32,9C, Txm: temperatura mxima
media; Tnm: temperatura mnima media; DPr: nmero de das con Tn>18 C y Tx<32,9C, y
registro de Pr>0,2 mm; PrAc: total de precipitacin acumulada en los das con Pr>0,2mm y
Tn>18C y Tx<32.9C; DSPr: das sin precipitacin (Pr<=0,2); Np1: nmero de das con Tn>18
C y Tx<32,9C, y simultneamente registros de Pr>0,2mm y HR70%, Np2: nmero de
perodos de dos das con Tn>18 C y Tx<32,9C, y registros de Pr>0,2mm y HR70% en el da
1 y HR>65% en el segundo da; Tot: Np1+Np2; DHR: das con registros de HR70 %. Adems
se tuvieron en cuenta las interacciones (Producto): I1: DSPr*DPr; I2: DSPr*GDTx; I3:
Np2*DSPr; I4: Np2*GDTx; I5:DPr*DT; I6: DHR*DT; I7:Np2*DT. En el caso del perodo tardo,
las variables simples se expresan como DT: nmero de das con Tn>12C y Tx<28C, Txm:
temperatura mxima media; Tnm: temperatura mnima media; DPr: nmero de das con
Tn>12C y Tx<28C, y registro de Pr>1mm; PrAc: total de precipitacin acumulada en los das
con Pr>1mm y Tn>12C y Tx<28C; Np1: nmero de das con Tn>12C y Tx<28C, y
simultneamente registros de Pr>0,2mm y HR81%, Np2: nmero de perodos de dos das con
Tn>12C y Tx<28C, y registros de Pr>0,2mm y HR81% en el da 1 y HR>70% en el segundo
da. Adems, GDTx: se acumulan diariamente las diferencias positivas entre Tx y el umbral
28,5C; GDTn: se acumulan diariamente las diferencias positivas entre el umbral 20C y Tn; DT:
nmero de das con Tn>13,3C y Tx<25C, Txm: temperatura mxima media; Tnm:
temperatura mnima media; DPr: nmero de das con Tn>13,3C y Tx<25C, y registro de
Pr>1mm; PrAc: total de precipitacin acumulada en los das con Pr>1mm y Tn>13,3C y
Tx<25C; DSPr: das sin precipitacin (Pr0,2); Np1: nmero de das con Tn>13,3C y Tx<25C,
y simultneamente registros de Pr (>0,2mm) y HR81%, Np2: nmero de perodos de dos das
con Tn>13,3C y Tx<25C, y registros de Pr>0,2 mm y HR81% en el da 1 y HR>70% en el
segundo da; Tot: Np1+Np2; DHR: das con registros de HR81% y las interacciones, como las
obtenidas en fecha temprana.

Desarrollo
Se realiz el clculo de coeficientes de correlacin (rk) no-paramtrica de Kendall Tau-b entre
los niveles ordinales del contenido de FBT y las variables meteorolgicas simples e
interacciones analizadas. Se aplic regresin logstica ([2]; [3]), el procedimiento Logistic del
SAS ajusta modelos de regresin a datos de respuesta ordinal por medio del mtodo de
mxima verosimilitud. La respuesta ordinal, el procedimiento de regresin logstica da la
ecuacin por la cual se puede derivar la probabilidad acumulada de ocurrencia de un nivel igual
o mayor al moderado (PrMac), siendo PrM=PrMac-PrS. Se confeccionaron tablas de
contingencia para calcular el nmero de casos en los cuales coincide el nivel de FBT observado
(S, M o L) con el predicho. La precisin de prediccin (Prec%) representa el porcentaje de
casos analizados (N=52) correctamente clasificados con tasa epidmica S, M o L. El mtodo de
seleccin de variables, Stepwise, se us para obtener dicho modelo, haciendo jugar las
variables simples e interacciones descriptas, fijando niveles de significancia de 0,05 para entrar
(NSE) y permanecer (NSP) en el modelo. Tanto el coeficiente de correlacin de Kendal Tau-b
como la precisin de prediccin del modelo logstico desarrollado fueron tomados en cuenta
para la seleccin final de las ventanas temporales en las que se calculan las variables
meteorolgicas, de los umbrales de los valores de los percentiles utilizados como umbrales en
la categorizacin de la variable respuesta (no se detalla todo este trabajo preliminar).

Se evaluaron los contenidos medios y medianos de FBT por estacin meteorolgica para las
tres campaas analizadas (2004/05, 2005/06 y 2006/07). Las correlaciones ms altas (rk) entre
los contenidos de FBT en grano y las variables meteorolgicas analizadas se encontraron
cuando dichas variables se calcularon en perodo temprano y tardo. El perodo temprano, R1


segn escala [4] y el tardo la madurez fisiolgica hacia cosecha (Tabla 1). Los modelos
logsticos desarrollados para estimar la probabilidad de ocurrencia de cada uno de los niveles
epidmicos: S, M o L con las variables meteorolgicas simples e interactivas. En este trabajo
las ms altas correlaciones entre los contenidos de fumonisina en grano y las variables
meteorolgicas se encontraron cuando estas ltimas se procesaron en un periodo aproximado
de 17 das alrededor de la aparicin de estigmas (7 das antes hasta 10 das despus de la
salida de los mismos). Similar ventana fue explorada por [4] para explicar la concentracin de
fumonisina a cosecha, donde analizaron un periodo que abarca 24 das alrededor de la
aparicin de estigmas, inicindose 10 das antes y finalizando 14 das despus de la misma. Un
modelo dinmico para evaluar la sntesis de fumonisina en maz con datos provenientes del
norte de Italia fue evaluado por [5]. Estos resultados podran ser tiles para el manejo racional
de la micotoxina en cuanto a los cambios producidos por el clima [6].
Tabla 1. Coeficientes de correlacin de Kendall (rK) de variables meteorolgicas calculadas en
el perodo temprano (Dj:351-15) y tardo (Dj:46-92) en relacin con los niveles de FBT.

Variable
Perodo
Temprano
Tardo
GDTx
GDTn
DT
Txm
Tnm
DPr
PrAc
DSPr
Np1
Np2
Tot
DHR
I1
I2
I3
I4
I5
I6
I7
0,031
-0,42
0,449
-0,039
0,411
0,58
0,446
0,066
0,604
0,533
0,574
0,236
0,58
0,033
0,539
0,371
0,525
0,331
0,515
-0,139
-0,429
0,586
-0,049
0,422
0,63
0,546
-0,435
0,573
0,57
0,56
0,44
0,587
-0,191
0,526
0,315
0,628
0,532
0,567



Tabla 2. Modelos logsticos basados en variables meteorolgicas para estimar la probabilidad
de ocurrencia de cada categora de nivel de FBT en grano de maz (S, M y L)

Modelo Ecuaciones del Modelo (Prec. %)
I
Ln(PrS/1-PrS)=-12,2619+1,3776*DPrte +0,9909*DPrta
Ln(PrMac/1-PrMac)=-9,4219+1,3776*DPrte +0,9909*DPrta
82,7
(43/52)
II Ln(PrS/1-PrS)=-13,4558+1,3776*It1te +1,0291*DPrta
Ln(PrMac/1-PrMac)=-10,292+1,3776*I1te +1,0291*DPrta
90,4
(47/52)

Resolviendo la expresin Exp(ln(PrS/1-PrS)/(1+Exp(ln(PrS/1-PrS)) se obtiene PrS (probabilidad de ocurrencia de nivel de FBT S).
Ln es el logaritmo natural.Resolviendo Exp(ln(PrMac/1-PrMac) / (1+Exp (ln(PrMac/1-PrMac)) se obtiene PrMac de un nivel de FBT
=>M). PrM=PrMac-PrS.PrL=1-(PrS+PrM) siendo PrL la probabilidad de ocurrencia de un nivel de FBT (L).

Bibliografa
[1]Battilani, P., Pietri,

A., Barbano, C., Scandolara, A., Bertuzzi, T. and Marocco, A. Logistic
Regression Modeling of Cropping Systems To Predict Fumonisin Contamination in Maize.
J ournal of agricultural and food chemistry 56: 1043310438. 2008.
[2] De Wolf, E.D., Madden, L.V. and Lipps, P.E. Risk assessment models for Fusarium Head
Blight epidemics based on within-season weather data. Phytopathology 93: 428435. 2003.
[3] Moschini, R. and Fortugno, C. Predicting wheat head blight incidence using models based
on meteorological factors in Pergamino. Argentina. European J ournal of Plant Pathology
102:211-218.1996.
[4] De La Campa, R., Hooker, D.C, Miller, J .D., Schaafsma, A.W, and Hammond, B.G. (2005)
Modeling effects of environment, insect damage, and Bt genotypes on fumonisin accumulation in
maize in Argentina and the Philippines. Mycopathologia 159:539-552.
[5] Maiorano, A., Reyneri, A., Sacco, D., Magni, A., and Ramponi, C. A dynamic risk assessment
model (FUMAgrain) of fumonisina synthesis by Fusarium verticillioides in maize grain in Italy.
Crop Protection 28: 243 256. 2008.
[6] Paterson, R.R.M. and Lima, N. How will climate change affect mycotoxins in food? Food
Research International (2009), doi:10.1016/j.foodres.2009.07.010.


ANLISIS DEL PATRN DE RIQUEZA DE ESPECIES DE LAS
CACTCEAS DE ARGENTINA
SILVIA SHRING
12
, J ESS SAJ AMA
2
, ANDREA BARRIONUEVO
2
, CECILIA SOSA
2
, MARIANA
ALONSO PEDANO
2
, PABLO GOROSTIGUE
2
, DIEGO VINANTE
12
, PABLO ORTEGA BAES
2

1
Ctedras de Estadstica y Diseo Experimental, Fac. de Cs. Naturales, UNSalta

2
Laboratorio de Investigaciones Botnicas (LABIBO)-CONICET, Facultad de Cs. Naturales,
UNSalta

suhring@unsa.edu.ar

RESUMEN
Los estudios sobre los patrones de riqueza de especies, han producido hiptesis que explican
los potenciales mecanismos que los determinan y que exploran sus implicancias. La regla de
Rapoport predice que los gradientes ambientales produciran presiones selectivas, que
resultaran en una menor riqueza de especies (S) conforme aumenta la latitud/altitud. Si se
superpone una cuadrcula sobre la superficie terrestre, la distribucin del nmero de especies
por celda no tendr una distribucin aleatoria. Las celdas cercanas son ms similares entre s
en valores de S y de factores ambientales que las alejadas, es decir que presentan
autocorrelacin espacial. Esto viola la suposicin de independencia de datos requerida para
realizar inferencias, subestimando errores estndar y aumentando los errores de tipo I. En este
estudio se deseaba establecer si existe correlacin significativa entre la riqueza de especies de
cactceas de Argentina y la latitud, longitud, altitud, temperatura y precipitacin, utilizando datos
de 2833 celdas. Se evalu si la autocorrelacin espacial de los datos incide en el resultado del
anlisis. Se calcul el coeficiente de Pearson (r) entre las variables y se evalu su significancia.
Se generaron 1000 muestras bootstrap de 250 celdas, para obtener muestras de celdas no
contiguas y no correlacionadas espacialmente, calculando para cada una el coeficiente de
correlacin (rb) entre las variables y los percentiles 2,5 y 97,5. Si el valor r obtenido se
encontraba dentro de estos lmites, puede decirse que la autocorrelacin no produjo desvos
significativos en ese parmetro. Adems, estos percentiles pueden utilizarse para comprobar si
existe correlacin. La S de cactceas present correlacin significativa con la latitud, la altitud y
la temperatura y precipitacin media anual (r = -0,61; 0,29; 0,30 y -0,09 respectivamente,
P<0,0001), y no significativa con la longitud (r =-0,02, P =0,21). La autocorrelacin espacial no
incidi en el resultado del anlisis de correlacin, los intervalos bootstrap incluyeron al valor de r
y expresaron los mismos resultados respecto de la significancia de r. Como predice la regla de
Rapoport, S disminuye hacia latitudes y altitudes mayores. Adems S aumenta hacia sitios con
mayores temperaturas y precipitaciones menores.

Palabras clave: autocorrelacin espacial, regla de Rapoport, muestras bootstrap.

Introduccin
Existe cada vez mayor inters en conocer el actual estado de la biodiversidad, para poder
predecir las consecuencias del cambio global, as como proponer estrategias para su
conservacin. En las ltimas dcadas se han generado una gran cantidad de trabajos que
documentan el patrn espacial de la biodiversidad, buscando explicar estos patrones y


explorando sus implicancias
[1]
. Los estudios sobre los patrones de distribucin de la riqueza de
especies emparentadas han producido varias hiptesis que explican los potenciales
mecanismos que operan en la determinacin de estos patrones a macro-escala, entre las que
las ms importantes son: disponibilidad energtica, tiempo evolutivo, heterogeneidad ambiental,
rea y restricciones geomtricas
[2]
. La regla de Rapoport predice que los gradientes
ambientales pueden producir presiones selectivas, lo que resulta en una disminucin de la
riqueza de las especies hacia los polos y hacia zonas de mayor altitud, ya que slo los
organismos con tolerancias climticas generales sern favorecidos por la seleccin natural en
estas zonas
[3,4,5,6]
. Si se superpone una cuadrcula cartesiana sobre la superficie de la Tierra, la
distribucin de los recuentos de riqueza de especies dentro de cada celda de la cuadrcula no
ser uniforme ni tendr una distribucin al azar en el espacio. Las celdas cercanas son
similares en la riqueza de especies ya que comparten la mayor parte de las especies (puede ser
una simple consecuencia de la extensin de mbito geogrfico ms all de los lmites de una
sola celda de la cuadrcula). Adems, las celdas adyacentes son similares en cuanto a los
factores ambientales que determinan que especies estn presentes, aunque no necesariamente
tendrn la misma composicin de especies. En cualquiera de los casos, existe autocorrelacin
espacial, es decir, celdas cercanas en el espacio tienen valores de la variable ms semejantes
entre s que celdas ms alejadas. La dependencia espacial de los datos viola la suposicin de
independencia de las observaciones requeridas por la mayora de los mtodos estadsticos,
subestimando errores estndar, lo que resulta en un aumento de errores de tipo I. En el caso
del coeficiente de correlacin, el problema radica en el hecho de que, cuando ambas variables
estn positivamente autocorrelacionadas, el intervalo de confianza estimado por el
procedimiento clsico en torno a un coeficiente de correlacin de Pearson (r) es ms estrecho
de lo que sera cuando se calcula correctamente, por lo que se declara muy a menudo que r es
significativamente diferente de cero (aumento de probabilidad de error de tipo I). En el presente
estudio se deseaba establecer si existe una correlacin significativa entre la riqueza de
especies de las cactceas de Argentina y la latitud, la longitud y tres variables ambientales, a
partir de datos que presentaban autocorrelacin espacial, por lo que se evalu si esta
autocorrelacin incide en el resultado del anlisis. En particular, los objetivos fueron para poner
a prueba la regla de Rapoport y explorar si la temperatura y la precipitacin son variables
explicativas de la riqueza de especies de cactceas.

Desarrollo
Los datos corresponden a la riqueza de especies de cactceas presentes en cada cuadrante de
0,5x0,5 grados de latitud y longitud (2833 celdas, 172 especies). Se calcul la correlacin de
Pearson entre la riqueza de cactceas y la latitud, longitud, altitud, temperatura media anual y
precipitacin media anual. Se generaron 1000 muestras bootstrap (n =250) de celdas a partir
de la matriz completa para obtener muestras de datos independientes, es decir, sin
autocorrelacin espacial. Se supuso que cada muestra al azar est compuesta por celdas no
contiguas y, por lo tanto, no correlacionadas espacialmente. Para cada muestra se calcul el
coeficiente de correlacin de Pearson entre la riqueza de especies y cada una de las variables.
Con los valores de coeficiente de correlacin de las muestras bootstrap (rb) se construy la
distribucin emprica y se calcularon los percentiles 2.5 y 97.5. Si el valor r obtenido
originalmente (con todos los datos) se encontraba dentro de estos lmites, puede decirse que la
presencia de autocorrelacin espacial no produjo desvos significativos en ese parmetro y ste
puede evaluarse de manera tradicional. Por otro lado, si el valor de r se ubicaba fuera de estos
lmites, esto puede interpretarse de manera unvoca como un desvo generado por la
autocorrelacin presente en esos datos. Adems, los percentiles de los valores rb pueden
tomarse como vlidos para comprobar si existe o no correlacin entre riqueza de especies y las
dems variables
[7]
. Las simulaciones se realizaron con el programa R versin 2.13.0 (Copyright
2011, The R Foundation for Statistical Computing).


La riqueza de especies de cactceas result estar correlacionada significativamente con la
latitud, la altitud, la temperatura media anual, y las precipitacin media anual (r =-0.61; 0,29,
0,30 y -0.09 respectivamente, P< 0,0001). No se registr correlacin significativa entre el
nmero de especies y la longitud (r = -0,02, P = 0,21). De acuerdo la simulacin, la
autocorrelacin espacial no incide en el resultado del anlisis de correlacin realizado, ya que
en todos los casos los lmites de los intervalos bootstrap para el coeficiente de correlacin
incluyeron al valor de r obtenido para la matriz completa. Adems, estos intervalos expresan los
mismos resultados al evaluar la significancia de las correlaciones, excepto en la relacin entre
la precipitacin media anual y la riqueza. En este ltimo caso, si bien el intervalo de confianza
bootstrap incluye al valor cero, su lmite superior (0,01) es muy cercano a ese valor, por lo que
puede considerarse que existe una relacin negativa entre la riqueza y el rgimen de lluvias. El
patrn de distribucin de las especies de cactceas de Argentina apoya la regla de Rapoport, ya
que la riqueza de especies disminuye hacia latitudes mayores y hacia altitudes mayores. (r)Este
patrn pude asociarse adems a caractersticas climticas, mostrando un aumento de la
riqueza de especies hacia sitios con temperaturas ms altas y precipitaciones anuales menores.

Bibliografa
[1] Gaston, K. J . (2000). Global patterns in biodiversity. Nature 405: 220-227.
[2] Rahbek, C. y Graves, G. R. (2001). Multiscale assessment of patterns of avian species
richness. Proc. Nati Acad. Sei. USA 98, 4534-4539.
[3] Rapoport, E.C. (1979). Aerografa: estrategias geogrficas de las especies. Fondo de la
Cultura Econmica, Mxico.
[4] Willig, M.R., Kaufman, D.M. y Stevens, R.D. (2003). Latitudinal gradients in biodiversity:
pattern, process, scale, and synthesis. Annual Review of Ecology, Evolution, and Systematics,
34, 273-309.
[5] McCain, C. (2009). Vertebrate range sizes indicate that mountains may be higher in
the tropics. Ecology letters 12, 550e560.
[6] Guerrero P.C., Durn A.P. y Walter H.E. 2011. Latitudinal and altitudinal patterns of
the endemic cacti from the Atacama desert to Mediterranean Chile. Journal of Arid
Environments 75: 991-997.
[7] Manly, B. F. J . (1997). Randomization, Bootstrap and Monte Carlo Methods in Biology.
Chapman & Hall.


ELASTICIDADES GASTO EN ALIMENTOS: ESTIMACION DE UN
SISTEMA CENSURADO DE DEMANDA

GUSTAVO ROSSINI
1
, EDITH DEPETRIS DE GUIGUET
2
, RODRIGO GARCA ARANCIBIA
3

1
IECAL, Facultad de Ciencias Econmicas, Universidad Nacional del Litoral

2

2

grossini@fce.unl.edu.ar

RESUMEN
Mediante el uso de datos de encuestas de gastos de hogares, se calculan elasticidades gasto
para un grupo de alimentos. Un sistema de demanda AIDS se estima teniendo en cuenta los
consumos cero de los hogares. La metodologa empleada para la estimacin del sistema es la
de Quasi-Maxima Versimilitud. Las elasticidades revelan que los alimentos considerados son
bienes normales, teniendo una mayor respuesta al gasto los lcteos y carnes que el rubro pan y
cereales y frutas y verduras.

Palabras Claves: Sistema de Demanda. Elasticidad Gasto. Quasi-Maxima Versimilitud

Introduccin
El uso de datos de encuestas de gastos de hogares en los anlisis de demanda han sido
empleado en muchos trabajos empricos en los ltimos aos. A diferencia de los datos de series
de tiempo, stos ofrecen mejores condiciones para estimar elasticidades (Yen et al., 2003), ya
que cuentan con caractersticas socioeconmicas y demogrficas de los hogares y, adems,
las encuestas estn compuesta por una cantidad de observaciones relativamente grandes lo
que permite la estimacin de sistemas de demanda complejos para varios de los productos
consumidos por los hogares.
Sin embargo, la estimacin con datos de encuesta de gastos es complicado por la presencia de
consumo nulo en los hogares. Este tipo de consumo cero es altamente probable que
aparezcan, debido a que el hogar no consume el producto regularmente o no lo ha comprado la
semana de la encuesta. Procedimientos de estimacin que no consideran la presencia de ceros
en la variable dependiente produce sesgo e inconsistencia en los parmetros (Yen et al., 2004).
Distintas trabajos han resuelto este problema de censura mediante estimaciones en dos etapas,
como el procedimiento de Heien y Wessells (1990) o el de Sonkwiler y Yen (1999). Estos
enfoques producen estimadores consistentes, aunque no eficientes (Yen at al., 2003).
Recientes desarrollos en tcnicas de simulacin han facilitado la evaluacin de mltiples
integrales de probabilidad, dando impulso a mtodos de estimacin por mxima verosimilitud.
Por ejemplo, Yen et al. (2003) utiliza el enfoque de mxima verosimilitud simulado y de Quasi-
Mxima Verosimilitud para estimar un sistema de demanda.
El objetivo del trabajo es estimar un sistema de demanda para alimentos consumidos por los
hogares y estimar las elasticidades gasto para determinar la respuesta de dichos hogares sobre
su consumo utilizando en enfoque de Quasi-Mxima Verosimilitud.

Desarrollo
El mtodo propuesto de anlisis es el de Quasi-Mxima Verosimilitud (QMV). Este es un
enfoque prctico para el problema de mltiples integrales consistente en aproximar la funcin
multivariada de verosimilitud con una secuencia de especificaciones bivariadas. Dicho


procedimiento se ha usado inicialmente en el contexto de modelos Probit Multivariados (Avery
at al., 1983) y en sistemas de demanda lineales y no lineales (Yen y Lin, 2002, Yen et al.,
2003). Para aplicar el enfoque de QMV a un Tobit Multivariado, la funcin de verosimilitud se
especifica sobre la base de una secuencia de verosimilitiudes de Tobit bivariados.
Las ecuaciones a estimar consisten en un sistema de Demanda Casi Ideal (AIDS) propuesto
por Deaton y Muellbauer (1980),

w
i
=
i
+
ij
ln p
j
+
i
ln
(
X
P
)
(1)

Donde wi es la proporcin del gasto del bien i
simo
, pj es el precio del bien j, X es el gasto total
de todos los productos considerados y P es el ndice de precio definido por

lnP=
0
+
j
ln p
j
+o.5
ij
ln p
i
ln p
j
(2)

Restricciones de homogeneidad y simetra son impuestas en el sistema sobre los parmetros
estimados. De los parmetros estimados en el sistema, se estiman las elasticidades de acuerdo
a Green y Alston (1990).

Los resultados de las estimaciones de las elasticidades gasto se presentan en la Tabla 1.
Las Elasticidades se calculan a los valores promedios de las variables explicativas y los errores
estndares por el mtodo Delta. Como se evidencia, todas las elasticidades son significativas al
5%. Dado el nivel de agregacin de los productos, es esperable que todas las elasticidades
calculadas sean positivas, por lo tanto bienes normales. Pan y cereales tiene la menor
elasticidad gasto, comparado con los otros grupos de alimentos. Esto pone de manifiesto la
menor respuesta ante el aumento del gasto en los hogares. En general los otros productos
tienen elasticidades gasto cercanas a la unidad. Frutas y verduras tiene una elasticidad muy
cercana a la unidad lo mismo que carnes y derivados. Un poco ms alta que uno es la
elasticidad de los productos lcteos, sugiriendo una respuesta ms que proporcional ante un
aumento en el gasto.
Las elasticidades estimadas son consistentes con algunos otros trabajos realizados en
Argentina. Por ejemplo, Rossini, et al. (2008) encuentra que las elasticidades gasto son
positivas y cercanas a la unidad, aunque algo ms bajas para verduras y frutas y ms alta para
lcteos. Sin embargo son ms altas que las encontradas por Berges et al. (2007).



Tabla 1. Elasticidades Gasto
Elasticidad Gasto
Pan y Cereales 0,790**
(0.003)
Carnes y Derivados 1.032**
(0.002)
Lcteos 1.184**
(0.003)
Frutas y verduras 0,982**
(0.003)
Otros 1.283**
(0.004)

Bibliografa
Avery, R., Hansen, L., Hotz, (1983). Multi-Period Probit Models and Orthogonality
Condition Estimation. International Economic Review, 24:21-35.
Berges, M., Casella, C. y Fernandez, S.(2007). Sistemas de Demanda: Comparacin y
Discusin de Metodologas utilizando LES y LINQUAD en Encuestas de Hogares,
XXXVIII Congreso de la Asociacin Argentina de Economa Agraria, Mendoza, Octubre.
Deaton, A.- y Muellbauer, J . An Almost Ideal Demand System. The American
Economic Review, 70 (3):312-326.
Green, R. y Alston, J . (1990). Elasticities in AIDS. American Journal of Agricultural
Economics: 72 (2): 442-445.
Heien, D. y Wessells, C. (1990). Demand Systems Estimation with Microdata: A
Censored Regression Approach. Journal of Business and Economic Statistics: 8: 365-
371.
Rossini, G., Depetris de Guiguet, E. y Garca, R. (2008). La Demanda de Alimentos en
Argentina. Una Estimacin de un Modelo LA-AIDS con Datos de Encuesta de Gastos de
Hogares. XLIII Reunin Anual de la Asociacin Argentina de Economa Poltica,
Crdoba.
Shonkwiler, J y Yen, S. (1999). Two-Step Estimation of a Censored System of
Equations. American Journal of Agricultural Economics: 81: 972-982.
Yen, S., Fang, C., y Shew-J iuan, S. (2004). Household Food Demand in Urban China: A
Censored System Approach. Journal of Comparative Economics: 32: 564-585.
Yen, S. , Biing-Hwan, L. , Smallwood, D. (2003). Quasi- and Simulated-Likelihood
Approaches to Censored Demand System: Food Consumption by Food Stamp
recipients in the United States. Americam Journal of Agricultural Economics: 85 (2):
458-478.
Yen, S., y Lin, B. (2002). Beverages Consumption among US Children and Adolescents: Full-
Information and Quasi Maximum-Likelihood Estimation of Censored System. European Review
of Agricultural Economics: 29:85-103.


MAPEO DE ASOCIACION CON VARIANZAS HETEROGENEAS EN EL
EFECTO FENOTPICO

BRUNO C
1y2
y BALZARINI M
1y2

1
Estadstica y Biometra. Facultad de Ciencias Agropecuarias. Universidad Nacional de
Crdoba.

2
CONICET.


RESUMEN
La mayora de los caracteres agronmicos de inters son controlados por mltiples genes,
conocidos como caracteres cuantitativos o complejos. Se espera que las expresiones
fenotpicas de estos caracteres, como el rendimiento o respuesta a ciertas enfermedades, estn
gobernadas por loci asociados a dichos caracteres cuantitativos. La asociacin no aleatoria
entre loci del genoma y la variacin de un carcter fenotpico en una poblacin se estudia a
travs del mapeo asociativo (MA). Los perfiles genticos de los individuos de la poblacin
caracterizados por el genotipo molecular en mltiples loci, es observado a travs de marcadores
moleculares (MM). La heterogeneidad de varianza de los datos fenotpicos para las diferentes
clases o estados de cada MM, podra modificar la tasa de error en la deteccin/no-deteccin de
asociaciones marcador-fenotipo. Los modelos lineales mixtos (MLM) permiten contemplar
heterocedasticidades en la respuesta (fenotipo) entre los grupos de datos que se comparan
(genotipos moleculares). En este trabajo comparamos el desempeo de un ANOVA clsico vs.
un MLM de ANOVA heterocedstico, ambos usados para evaluar diferencias fenotpicas entre
clases de MM, los modelos se aplican marcador a marcador. Los datos se obtuvieron desde una
simulacin de genotipos moleculares caracterizados por 300 MM dominantes. Se compararon
los resultados obtenidos desde los diferentes modelos a travs de la cantidad de errores en la
deteccin de los QTL simulados. La tasa de falsos positivos fue menor con el uso de MLM
heterocedsticos.

Palabras clave: QTLs, falsos positivos, verdaderos positivos, modelos lineales mixtos.

Introduccin
Las regiones del genoma que contienen genes asociados a un carcter cuantitativo particular,
son denominados loci de caracteres cuantitativos (QTLs). La identificacin de los QTLs por
evaluacin fenotpica, a travs de los programas de mejoramiento gentico vegetal tradicional,
es imposible (Collard et al., 2005). Las nuevas biotecnologas asociadas a los marcadores
moleculares han permitido aumentar la informacin concerniente al genoma en diversas
especies vegetales de inters agrcola y construir mapas de ligamientos que identifican regiones
del cromosoma con genes controlados por caracteres simples (Paterson, 1996). Los
marcadores moleculares (MM) revelan el perfil gentico de los individuos de una poblacin a
travs de la caracterizacin de su genotipo molecular en mltiples sitios del genoma. El mapeo
de asociacin es el anlisis que busca detectar las regiones genmicas asociadas con
caracteres complejos y su relacin con la variacin del carcter morfolgico (fenotipo) en una
poblacin. Generalmente, los modelos de anlisis utilizados para la bsqueda de asociacin


fenotipo-genotipo no contemplan la falta de homogeneidad de varianza en la informacin
fenotpica. La heterogeneidad de varianza de los datos fenotpicos para las diferentes clases o
estados de cada MM, podra modificar la tasa de error en la deteccin/no-deteccin de
asociaciones fenotipo-genotipo. El objetivo del presente trabajo es evaluar el desempeo de
una modelo lineal (ANOVA) homocedstico respecto a un modelo lineal mixto de componentes
de varianza en la identificacin de los verdaderos QTLs y en la deteccin de los falsos positivos.

Desarrollo
Se simularon datos de marcadores moleculares con el programa QMSim [3] para poblaciones
algamas asumiendo poblaciones de polinizacin cruzada y caracterizadas por un genoma de
300 marcadores biallicos (10 cromosomas, 30 MM/cromosoma). La simulacin fue fundada
sobre 200 individuos y se realizaron 70 generaciones de cruzamientos aleatorios. Sobre esta
poblacin se obtuvieron mediante muestreos aleatorios, 30 repeticiones de 200 individuos cada
una, donde los datos genotpicos y fenotpicos estaban asociados va 30 loci de caracteres
cuantitativos (QTL). Los efectos de los QTLs as como el valor fenotpico
(QTLs+Poligen+Residual) fueron simulados bajo dos distribuciones normales: normal estndar
y normal de media cero con varianzas heterogneas segn el genotipo molecular. Se
compararon los resultados obtenidos desde los diferentes modelos a travs de la cantidad de
errores en la deteccin de los QTLs simulados.

La verificacin del supuesto de heterogeneidad de varianza para algunos MM fue confirmada
mediante la prueba de Levene aplicada marcador a marcador. El 75% de los marcadores
presentaron varianza heterognea en su genotipo. Para los marcadores con heterogeneidad de
varianza y que se encontraban a una posicin mayor a 10 cM del QTL ms cercano, se calcul
la frecuencia de pruebas significativas en cada cromosoma. El nivel de significacin (=0.05)
fue corregido por multiplicidad usando Bonferroni. Luego, la frecuencia de MM significativos
sobre el total de QTLs simulados para ese cromosoma a una distancia superior a 10cm, fue
usada como un indicador de la tasa de falsos positivos. Cuando no se explicit en el modelo la
heterocedasticidad, se registr mayor cantidad de MM falsos positivos. Tambin se estim la
tasa de verdaderos positivos, es decir, la capacidad del modelo de detectar los QTLs simulados.
La diferencia entre ambos modelos, respecto a la potencia para detectar los MM asociados a
QTLs fue no significativa.

Bibliografa
[1] Collard, B., J aufer, J ., Brouwer J . y Pang, E. (2005). An introduction to markers, quantitative
trait loci (QTL) mapping and marker-assisted selection for crop improvement: The basic
concepts. Euphytica, 142:169-196.
[2] Paterson, A. (1996). Mapping genes responsable for differences in phenotype, In: A.
Paterson (Ed.), Genome Mapping in Plants, pp. 41-54. R. G. Landes Company, San Diego,
California; Academic Press; Austin, Texas.
[3] Sargolzaei, M. y F. Schenkel, "QMSim: a large-scale genome simulator for livestock."
Bioinformatics 2009. 25: p. 680-681.


ANALISIS MULTIVARIADO PARA PREDICCION EN CALIDAD DE
LECHES BOVINAS

SANCHO
12
, A.M.; ROSSETTI
1
,L; RIZZO
12
, S. Y DESCALZO
12
, A.M.

1
INTA CIA ITA. De los Reseros y Udaondo Hurlingham, Bs. As. Argentina

2
Universidad de Morn Facultad de Agronoma y Ciencias Agroalimentarias

asancho@cnia.inta.gov.ar

RESUMEN
Se utiliz anlisis multivariado aplicado a la descripcin de antioxidantes naturales presentes en
leche cruda (LC) bovina asociadas a sus dietas. Estos compuestos naturales son percibidos
positivamente por los consumidores e importantes para el cuidado de la salud. El objetivo de
este trabajo fue comparar la capacidad de discriminacin en la prediccin de la calidad de la
leche en polvo (LP) derivada de las caractersticas de LC obtenida en primavera (P) y otoo (O),
atribuible al consumo de cantidades crecientes de alfalfa (0, 35 y 70%) en cuanto al contenido
de antioxidantes naturales, seleccionando las variables con mayor poder de clasificacin. En
LC, se encontraron diferencias significativas en las concentraciones de compuestos
antioxidantes segn la estacin del ao en que se producen. Los valores de alfatocoferol fueron
0.3478, 0.7458, 0.8691 para P0, P35 y P70 respectivamente mientras que en otoo no tuvieron
diferencias entre tratamientos (1.0639, 1.0644 y 1.1309 para O0, O35 y O70 respectivamente).
En el caso del betacaroteno s se encontraron diferencias por tratamiento independientemente
de la estacin (0.0226, 0.186, 0.2168, 0.1026, 0.2486, 0.2743 para P0, P35, P70, O0, O35 y
O70 respectivamente) y retinol tambin se diferenci segn el tratamiento, obtenindose
mayores concentraciones en primavera que en otoo (0.5541 P0, 1.4688 P35, 1.5675 P70,
0.2662 O0, 0.4169 O35 y 0.4620 O70). Las variables elegidas por el anlisis discriminante
fueron: el valor a* y L* del color objetivo, el betacaroteno y vitamina A (retinol) y TBA. Este
mtodo separ las muestras de LC en cuatro grupos de acuerdo a la estacin y proporcin de
alfalfa en la dieta (P0, P35+P70, O0 y O35+70). El perfil de LC se observ reflejado en el perfil
de LP, discriminando tambin los cuatro grupos como en LC, indicando una prediccin exitosa
de los parmetros de calidad importantes para la industria y exportacin de la misma.

Palabras claves: leche bovina, antioxidantes, vitaminas, color, anlisis discriminante

Introduccin
El anlisis multivariado [1] se aplic a LC y LP bovinas, obtenidas en primavera (P) y otoo (O),
proveniente de vacas lecheras alimentadas con cantidades crecientes de alfalfa (0, 35 y 70%)
en cuanto al contenido de antioxidantes naturales.
La incorporacin de estos antioxidantes a la leche bovina est relacionada con la dieta y la
caracterizacin qumica de la misma provee la posibilidad de modular la presencia de estos
compuestos biolgicamente activos. Las dietas pastoriles favorecen una mayor concentracin
de alfa tocoferol, beta caroteno y retinol en la leche cruda [2]. Estos compuestos de origen
natural son percibidos positivamente por los consumidores preocupados por el cuidado de la
salud [3].
La demanda de lcteos y derivados tiende a crecer a nivel mundial y para mantener la
competitividad en el sector, se requiere la profundizacin del concepto de calidad con un
componente muy fuerte basado en investigacin y desarrollo tecnolgico.


La leche podra considerarse en s mismo un alimento funcional que tiene un lugar de gran
importancia en las dietas tradicionales.
El objetivo de este trabajo fue evaluar estadsticamente los cambios producidos en la leche,
atribuibles al consumo de cantidades crecientes de alfalfa (0, 35 y 70%), en dos estaciones del
ao (primavera y otoo) en cuanto al contenido de antioxidantes naturales y seleccionar las
variables con mayor poder de clasificacin para diferenciar los tratamientos en LC. Adems,
detectar la presencia de dichos parmetros de calidad en LP, ya que esta asociacin podra
constituir una base cientfica para productos de calidad especfica importantes para la industria
y exportacin.

Desarrollo
El estudio comprendi dos ensayos iguales realizados en primavera (P) y otoo (O) en la
estacin experimental de INTA Rafaela. Se conformaron 3 grupos de 8 vacas Holando Argentino
(HA), asignados al azar a los tratamientos: 0% (A0), 35% (A35) y 70% alfalfa (A70). La dieta
ofrecida fue similar entre tratamientos y ajustada en energa metabolizable (EM) y protena bruta
(PB) (22,8 KgMS/v/da, 2,6 Mcal EM/kg y 18%PB). Ambos ensayos se desarrollaron en tres
perodos sucesivos: a) Covariable (7 das), b) Acostumbramiento a la dieta (21 das) y c)
Experimental (28 das). Con la produccin diaria de leche se formaron pooles para cada uno de
los tratamientos. Fueron extradas 2 muestras por semana (n=8) de cada tratamiento,
realizndose los anlisis de macronutrientes, minerales, vitaminas liposolubles, compuestos
voltiles, terpenos y nariz electrnica indicados en la Tabla 1.
Los parmetros lactolgicos de calidad de leche fueron realizados con un Milkoscan Minor
(grasa, protena, lactosa, cenizas y slidos totales). Las vitaminas se determinaron por
cromatografa HPLC previa extraccin con hexano y un paso de saponificacin. Se utiliz y un
equipo TSP (USA) con bomba cuaternaria, automuestreador y detectores de arreglo de diodos:
265nm para vitamina D3, 325nm para retinol y 445nm para beta caroteno y detector de
fluorescencia (296-330nm) para los tocoferoles. La oxidacin se determin por la tcnica de
TBARs y la actividad antioxidante total por el mtodo de FRAP [4]. Para determinar el olor
objetivo se utiliz un equipo NE-MS Alpha Prometheus (Alpha MOS, Francia), el cual consta
de tres compartimentos: Automuestreador HS 100, NE Alpha Fox 4000 con un arreglo de 18
sensores semiselectivos.

Anlisis univariado: Los datos fueron analizados estadsticamente por anlisis de varianza
(ANOVA) y la prueba de Tukey (Tabla 1) [5].
Anlisis multivariado: Los datos fueron analizados usando Anlisis de Conglomerados
J errquicos (mtodo de Ward) [6] y aplicando un anlisis discriminante como procedimiento de
clasificacin, este mtodo maximiza la varianza entre y dentro de tratamientos. Para la
seleccin de variables, se utiliz la seleccin del mtodo por pasos de lambda de Wilks. Se
prosigui a realizar el anlisis discriminante con todas las variables que demostraron ser
significativamente distintas, con el criterio que usa el mtodo (F de significancia con un mximo
de 0.05 para entrar y un mnimo de 0.10 para salir). Primero las variables xi fueron
transformadas en valores estandarizados zi donde:
2
x x
z
i
i
=
. Se us SPSS Advanced
Statistics 12 software (SPSS Inc., Chicago, IL).
Este mtodo indic que tres funciones fueron estadsticamente significativas (p<0.001), por lo
tanto, no es necesario medir todas las variables ya que las funciones lineales de Fisher para
cada tratamiento en LC fueron:
P0: -55.618 -13.766a*+5.782L* -12.687betacaroteno +0.148retinol +48.633TBA
P35 y 70: -25.49-1.893a*+1.949L*-3.426betacaroteno+10.261retinol+31.12TBA


O0: -14.288 -5.338a*+4.162L* -2.765betacaroteno -0.493retinol -16.886TBA
O35 y70: -21.388+8.519a*-5.308L*+7.895betacaroteno-6.643retinol-28.515TBA
Las de mayor peso elegidas por el programa fueron el valor a* y L* del color objetivo, el
betacaroteno, vitamina A (retinol) y TBA. A su vez, los datos clasifican correctamente el 100,0%
de los casos agrupados originales y el 96,7% de los casos agrupados validados mediante
validacin cruzada.
Para LP se seleccionaron las variables elegidas para LC y se obtuvieron:
P0: -13,239 -7,757a*-7,697L* -10,110betacaroteno +5,362retinol +0,857TBA
P35 y 70: -24,416-6,479a*-6,254L*-8,659betacaroteno+32,145retinol+1,598TBA
O0: -13,919 +5,160a*+4,88L* +1,976betacaroteno -22,306retinol -1,971TBA
O35 y70: -20,058+7,778a*+7,662L*+12,726betacaroteno-23,673retinol-1,041TBA
A su vez, los datos clasifican correctamente el 100,0% de los casos agrupados originales y el
91,7% de los casos agrupados validados mediante validacin cruzada.
Tanto en LC como en LP se observan cuatro grupos separados claramente, definidos dos de
ellos por 0% de alfalfa, tanto en primavera como otoo y otros dos grupos, separados en
primavera y otoo nuevamente pero dentro de estos ltimos grupos vemos que entre 35 y 70%
de alfalfa no se diferencia.
Independientemente de la estacin en la cual se producen la leche cruda y en polvo, las
herramientas estadsticas hicieron posible la correcta separacin en cuanto a porcentajes altos
(35 y 70) y 0 de alfalfa en la dieta. Midiendo unas pocas variables se puede inferir a qu grupo
de tratamiento corresponde. A raz de estos ensayos, se est determinando que con
aproximadamente un 50% de pastura fresca de alfalfa en la dieta, se puede obtener leche con
un alto valor de antioxidantes y con caractersticas diferenciales respecto a la obtenida por
alimentacin exclusiva en corrales.

Tabla 1: Medias, nivel de significancia obtenidos en Primavera y Otoo para cada variable analizada
mediante ANOVA.

Parmetros P0 P35 P70

O0 O35 O70

Alfatocoferol
0,3478 b 0,7458 a 0,8691 a
1,0639 1,0644 1,1309
Gamatocoferol
0,0579 0,0405 0,0606
0,0681 a 0,0235 b 0,0157b
Betacaroteno
0,0226 b 0,1861 a 0,2168 a
0,1026 b 0,2486 a 0,2743a
Retinol
0,5541 b 1,4688 a 1,5675 a
0,2662 b 0,4169 a 0,462a
D3
0,1123 0,1162 0,1132
0,0124 b 0,0164 a 0,0249a
Valor L*
89,488 89,235 89,124
90,296 a 89,322 b 89,582b
Valor a*
-2,09 b -0,8496 a -1,01 a
-1,449 b -0,6579 a -0,4942a
Valor b*
8,845 b 11,563 a 11,476 a
10,196 c 12,362 a 13,292a
FRAP
308,36 b 391,4 b 542,35 a
374,7 374,59 355,14
TBA
214,75 198,37 206,95
41,65 29,67 44,00
Riboflavina
1,7242 1,4465 1,5152
1,5293 b 1,5547 b 1,7993a
LY2AA
-0,027 -0,0265 -0,0357
-0,0342 a -0,0368 a -0,0443b
LY2G
-0,0418 -0,0394 -0,0542
-0,0475 ab -0,0507 ab -0,059b
LY2Gh
-0,0263 -0,0252 -0,0333
-0,0287 a -0,0305 a -0,0362b
GB
3,1175 b 3,8375 a 3,35 b
3,7218 3,6832 3,719
LACT
4,975 a 4,945 a 4,835 b
5,0535 4,9537 4,9637
PR
3,2375 a 3,05 b 3,07 b
3,3253 3,2453 3,188
SNG
8,9075 a 8,65 b 8,5625 b
9,0055 8,898 8,8428
ST
12,037 b 12,492 a 11,912 b
12,788 12,637 10,957

Letras diferentes en distintas columnas indican efecto de Tratamiento p<0.0001 (****), p<0.001 (***), P<0.01 (**) y p<0.05 (*) y
prueba de Tukey.


Bibliografa
[1] Pea, D. Anlisis de datos Multivariantes. Mc. Graw Hill (2002)13:391-426
[2] Rossetti, L., Langman, L., Grigioni, G.M., Biolatto, A., Sancho, A.M., Comern, E. and
Descalzo. Antioxidant status and odor profile in milk from silage or alfalfa-fed cows. Australian
J ournal of Dairy Technology. (2010) 65 (1):3-9.
[3] Havemose, M.S., Weisbjerg, M.R., Bredie, W.L.P. and Nielsen J .H. Influence of feeding
different types of roughage on the oxidative stability of milk. Int. Dairy J . (2004) 14:563-570.
[4] Benzie, I. F. F., and Strain, J . J . (1999). Ferric reducing/Antioxidant power assay: direct
measure of total antioxidant activity of biological fluids and modified version for simultaneous
measurement of total antioxidant power and ascorbic acid concentration. Methods in
Enzymology, 299, 1527.
[5] Hoel, P.G. Estatstica Elemental. Anlisis de Varianza (1977 )11:297-310
[6] Pea, D. Anlisis de datos Multivariantes. Mc. Graw Hill (2002).8:219-243.


ESTUDIO TEMPORAL DEL NMERO DE ADMISIONES DE
EMPLEADOS EN EL BRASIL

EDMILSON AKIYOSHI NAKAMURA
1
, LUIZ RICARDO NAKAMURA
2
, EZEQUIEL ABRAHAM
LPEZ BAUTISTA
2 3
, EDILAN DE SANT'ANA QUARESMA
2 4
, TACIANA VILLELA SAVIAN
5

1
Programa de Ps-Graduao em Finanas Corporativas, Departamento de Administrao e
Negcios, Faculdade de So Bernardo do Campo

2
Programa de Ps-Graduao em Estatstica e Experimentao Agronmica, Departamento de
Cincia Exatas, Escola Superior de Agricultura Luiz de Queirz - Universidade de So Paulo

3
Profesor, Facultad de Agronoma, Universidad de San Carlos de Guatemala

4
Profesor, Instituto de Cincias da Educao, Universidade Federal do Oeste do Par

5
Profesora, Departamento de Cincias Exatas, Escola Superior de Agricultura Luiz de Queirz
- Universidade de So Paulo

ealbautis@usp.br

RESUMEN
En este trabajo fueron propuestos tres modelos SARIMA diferentes, con el objetivo de ajustar
una serie temporal referida al nmero total de admisiones de empleados, bajo el rgimen de la
Consolidacin de las Leyes del Trabajo (CLT) en el Brasil, durante el perodo de enero de 2002
a diciembre de 2012. Para realizar las previsiones, como forma de medir la precisin de las
mismas, los seis ltimos meses fueron retirados del ajuste de los modelos propuestos. Los tres
modelos ajustados fueron comparados de acuerdo con criterios de evaluacin estadstica; las
previsiones de los prximos meses fueron realizadas y, como producto final, se presenta la
tabla con previsiones utilizando el modelo mejor ajustado dentro de los propuestos.

Palabras clave: modelo SARIMA, previsin, serie temporal.

Introduccin
El anlisis de series temporales es una importante herramienta que auxilia en las previsiones de
una determinada serie a lo largo del tiempo, pudiendo modelar un gran nmero de
observaciones y comprender la estacionalidad en los datos. Dentro de los modelos de series
temporales existentes, el modelo SARIMA (BOX et al., 1994) es uno de los ms utilizados, pues
adems de poseer los componentes autorregresivos y medias mviles, considera tambin el
efecto estacional.
Siguiendo este concepto, fueron utilizados tres modelos SARIMA con diferentes nmeros de
parmetros en una serie temporal mensual relativa al nmero total de admisiones de
empleados, bajo el rgimen de la Consolidacin de las Leyes del Trabajo (CLT), en el Brasil,
durante el perodo de enero de 2002 a diciembre de 2012. Luego del ajuste de los modelos
propuestos, criterios de bondad de ajuste fueron utilizados para la seleccin del modelo ms
adecuado y fueron realizadas las previsiones.

Desarrollo
Los datos utilizados en esta investigacin son referentes al nmero total de admisiones de
empleados, bajo el rgimen de la Consolidacin de las Leyes del Trabajo (CLT), en el Brasil,


durante el perodo de enero de 2002 a diciembre de 2012 totalizando 132 perodos - obtenida
en el sitio web del Instituto de Pesquisa Econmica Aplicada (IPEA).
Uno de los modelos ms utilizados que consideran la estacionalidad de una determinada serie
temporal, es el modelo ARIMA estacional, o SARIMA (MORETTIN; TOLOI, 2004). Estos
modelos son importantes pues consideran la estacionalidad estocstica de los datos. Cuando el
perodo
s=12
, el modelo denominado SARIMA de orden
( p , d , q) ( P , D , Q)
12
, es dado por
la siguiente expresin (MORETTIN, TOLOI, 2004):
( X ) ( X
12
)
d
12
D
Z
t
=( X )( X
12
) a
t (1)
siendo
( X )
el operador autorregressivo (AR) de orden p;
( X )
es el operador de medias
mviles (MA) de orden q;
( X )
es el operador AR-estacional de orden P;
( X
12
)
es el
operador MA-estacional de orden Q;
es el operador de la diferencia;
12
D
es el operador de
diferencia estacional y
a
t es un ruido blanco.

Inicialmente se construy el grfico de la serie temporal mensual del nmero de admisiones de
empleados (Figura 1 (a)) y fue constatado que la serie no era estacionaria. De esta forma, luego
de algunas transformaciones realizadas, se observ al utilizar la prueba de Dickey-Fuller que la
1 diferencia del logaritmo de la serie (Figura 1(b)) era estacionaria (valor-p<0.01)

(a)

(b)

Figura 1: (a) Serie temporal del nmero de admisiones de empleados; (b) Primera diferencia
del logaritmo de la serie.

Luego de la verificacin de la estacionalidad de la serie fueron calculadas las funciones de
autocorrelacin y autocorrelacin parcial muestrales (Figuras 2 (a) e (b), respectivamente), con
la finalidad de identificar posibles modelos para la serie en estudio.

(a)

(b)

Figura 2: (a) Funcin de autocorrelacin muestral; (b) Funcin de autocorrelacin parcial
muestral.



Analizando las Figuras 2 (a) y (b), se opt por ajustar los modelos sin constante: i)
SARIMA
(3,1,2)(1,0,1)
12 ; ii) SARIMA
(2,1,1)(1,0,2)
12 ; e iii) SARIMA
(1,1,2)(1,0,2)
12 . Con la
seleccin de los modelos, se estimaron sus parmetros y realiz el anlisis de residuos. En la
Tabla 1 se presentan los valores estimados de los parmetros de los tres modelos utilizados.
Adems se muestran las estadsticas de calidad de ajuste: AIC, AICC e BIC.

Tabla 1: Parmetros estimados de los tres modelos propuestos y estadsticas de calidad de
ajuste.
Modelos SARIMA AR1 AR2 AR3 MA1 MA2
SAR
1
SMA1 SMA2 AIC AICC BIC
(3,1,2)(1,0,1)
12

0,11 -0,23 0,03 -0,51 0,08 1,00 -0,94 - -354,24 -353,00 -331,61
(2,1,1)(1,0,2)
12

-0,09 -0,22 - -0,31 - 1,00 -0,91 -0,04 -356,34 -355,39 -336,55
(1,1,2)(1,0,2)
12

-0,31 - - -0,08 -0,30 0,99 -0,89 -0,02 -355,68 -354,72 -335,88

Todos los valores estimados de los parmetros fueron significativos a un nivel de 5% de
significancia. En la Tabla 1 se observa que el modelo SARIMA
(2,1,1)(1,0,2)
12 es el ms
adecuado de acuerdo con los tres criterios de evaluacin de los modelos pre-establecidos.
Posterior al ajuste y a la seleccin del modelo arriba citado, fue realizado el anlisis de los
residuos (Figura 3).

Figura 3: Autocorrelacin residual, densidad y grfico de dispersin de los residuos.

En la Figura 3 se observa que los residuos son aleatorios, homocedsticos, blancos y tiene
distribucin normal (valor-p>0,05 de la prueba de Shapiro-Wilk). La Tabla 2 presenta los valores
predichos y los lmites inferior e superior de 95% de confianza de acuerdo con el ajuste del
modelo SARIMA
(2,1,1)(1,0,2)
12 que fue el mejor ajustado. En la Figura 4, se presenta el
grfico referente a esas previsiones con intervalos de 80 y 95% de confianza.

Tabla 2: Intervalo de 95% de confianza y previsiones del modelo SARIMA
(2,1,1)(1,0,2)
12
Perodo Valor real Lmite inferior Previsin Lmite superior
J ul/12 1753241 1579231 1731808 1899125
Ago/12 1819767 1625799 1810628 2016468
Sep/12 1664747 1601273 1795114 2012421
Oct/12 1710580 1523740 1724745 1952266
Nov/12 1624306 1441421 1648054 1884309
Dic/12 1211216 1098762 1267015 1461032

En la Tabla 2 se observa que todos los valores reales estn dentro del intervalo de 95% de
confianza y las previsiones estn muy prximas a esos valores.



Figura 4: Serie temporal del nmero de admisiones de empleados en el Brasil, acompaada
de la previsin de seis meses y de sus respectivos intervalos de 80% y 95% de
confianza.

Al analizar la Tabla 2 y la Figura 4, se puede afirmar que el ajuste del modelo
SARIMA
(2,1,1)(1,0,2)
12 de hecho fue el adecuado a la serie temporal mensual referente al
nmero de admisiones de empleados en el Brasil.

Bibliografa
[1] BRASIL. (2013). Instituto de Pesquisa Econmica Aplicada (IPEA). Brasil. Versin obtenida
el 08/06/2013. http://www.ipeadata.gov.br
[2] Box, G.E.P. et al. (1994). Time series analysis, forecasting and control. 3
rd
edition, EUA.
[3] Morettin, P.A.; Toloi, C.M.C. (2004). Anlise de sries temporais. 2 edio. Brasil.


IDENTIFICACIN DE FACTORES RELACIONADOS CON LA DIABETES
E HIPERTENSIN ARTERIAL EN LA POBLACIN DE SANTARM,
PAR (BRASIL)

EDILAN DE SANT'ANA QUARESMA
1 2
, EZEQUIEL ABRAHAM LPEZ BAUTISTA
1 3
,

LUIZ
RICARDO NAKAMURA
1
, MARCELLO NEIVA DE MELLO
1
, CARLOS TADEU DOS S. DIAS
4

1
Cincia Exatas, Escola Superior de Agricultura Luiz de Queirz - USP

2

3

4
Profesor, Departamento de Cincias Exatas, Escola Superior de Agricultura Luiz de Queirz -
Universidade de So Paulo

edilan@usp.br

RESUMEN
Este trabajo se trata de un estudio retrospectivo que tuvo como objetivo analizar variables
medidas en pacientes atendidos por el Programa de Diabticos e Hipertensos de la Fundacin
Esperana en la ciudad de Santarm-Par, durante el perodo de 2002 a 2006, y utilizar
tcnicas multivariadas para la identificacin de factores relacionados a las patologas. La
poblacin investigada fue dividida en dos grupos (Diabticos y Diabticos +Hipertensos) y el
coeficiente de correlacin de Pearson fue calculado, mostrando la presencia de dependencia
significativa entre las variables. Utilizando el Anlisis de Varianza Multivariada (MANOVA), se
observ la existencia de diferencia entre los vectores de medias de los dos grupos analizados.
El Anlisis de Factores por medio de Componentes Principales con Rotacin Varimax fue
utilizado, generando los tres factores que, al ser interpretados, justifican los resultados de
investigaciones mdicas.

Palabras clave: Diabetes, Hipertensin, MANOVA, Anlisis de Factores.

Introduccin
De acuerdo con publicaciones recientes de la Organizacin Mundial de la Salud (OMS),
International Diabetes Federation y de la Asociacin Latinoamericana de Diabetes, se ha
demostrado exhaustivamente el aumento evidente de la prevalencia e incidencia de diabetes
mellitus en diversos pases. Tales estudios sealan la asociacin directa de la diabetes con la
ocurrencia de obesidad, del sedentarismo, de la dislipidemia y de la hipertensin arterial,
aumentando el riesgo de morbilidad y mortalidad por enfermedades cardiovasculares en
diferentes grupos tnicos. Tanto la diabetes como la hipertensin son patologas resultantes de
un conjunto de condiciones (variables), que no deben ser estudiadas de manera aislada, dado
el grado de correlacin existente entre las mismas. Siendo por ello necesaria la aplicacin
tcnicas estadsticas multivariadas, para analizar simultneamente las variables medidas. Este
trabajo fue desarrollado con la finalidad de analizar variables relacionadas con los casos de
diabetes e hipertensin registrados en el Programa Diabtico e Hipertenso de la Fundacin
Esperana, municipio de Santarm, Estado de Par, interior de la Amazonia, durante el perodo
de 2002 a 2006, por medio de tcnicas multivariadas, como: MANOVA, Componentes
Principales y Anlisis de Factores.



Desarrollo
En este estudio, de tipo retrospectivo, fueron recolectados datos de registros de consulta del
departamento de enfermera, relativos al ltimo atendimiento del paciente, en el perodo de
2002 a 2006, y las variables cuantitativas: edad, peso, presin sistlica, presin diastlica, nivel
de glicemia y tipo de diabetes, fueron registradas. Dos grupos distintos fueron considerados
para el anlisis: Grupo 1 (Diabticos, exclusivamente) y Grupo 2 (Diabticos e Hipertensos).
Inicialmente fue generada la matriz de correlacin entre las variables, con la utilizacin del
software SAS v. 9.3, constatando la significancia de las correlaciones entre variables y
justificando el uso de mtodos multivariados. Para verificar si los dos grupos analizados
presentaban o no diferencias significativas, se utiliz el Anlisis de Varianza Multivariada. Para
el uso del Anlisis Factorial, fue utilizado el mtodo de Componentes Principales, para
estimacin de las cargas factoriales y de las varianzas especficas, especificando en trminos
de los autovalores y autovectores.
De esta forma, el anlisis de componentes principales fue inicialmente realizado para
posteriormente construir los factores. Fueron realizadas comparaciones de los factores
obtenidos con estudios realizados por diferentes grupos de investigadores, generando
interpretaciones que justifican los resultados de investigaciones publicadas en la literatura
mdica, pero con la innovacin de considerarse todas las variables conjuntamente en el
proceso de anlisis.

La diabetes y la hipertensin son patologas fuertemente asociadas al estilo de vida del
paciente, por lo que no pueden ser analizadas de forma aislada del ambiente, del tipo de
alimentacin, herencias genticas, del peso y de la edad, entre otras variables. Esto sugiere
fuertemente que las variables involucradas con las patologas estn correlacionadas de alguna
forma, lo que fue confirmado por medio del clculo de los coeficientes de correlacin de
Pearson (Tabla 1), que indica a existencia de correlaciones significativas entre algunas de las
variables analizadas.

Tabla 1. Matriz de correlacin (Coeficiente de Correlacin de Pearson) para las variables
tasa de glucosa (G), peso, edad, presin sistlica (PS), presin diastlica (PD) y tipo
de diabetes (TD)
Variables Edad Peso OS PD G TD
Idade 1.000
Peso 0.024 1.000
OS 0.284 0.064 1.000
PD -0.033 0.239 0.429 1.000
G -0.263 -0.048 -0.025 -0.043 1.000
TD 0.036 0.024 0.011 -0.010 -0.182 1.000
Nota: Los coeficientes de correlacin (p <0,05) se presentan en negrito.

Considerando que el grupo 1 fue formado por pacientes con diabetes, en tanto que el grupo 2
por pacientes aquejados de diabetes y por la hipertensin, para las cuatro estadsticas usuales
empleadas en el MANOVA (Wilks, Pillai, Hotteling-Lawley y Roy), la hiptesis de igualdad de
medias multivariadas entre los dos grupos fue rechazada (Tabla 2), enfatizando las diferencias
significativas (p<0,001) entre los dos grupos de patologas.

Tabla 2. Estadsticas multivariadas para evaluar la hiptesis sobre los vectores de medias
(grupo 1 y grupo 2) y sus equivalencias aproximadas con la estadstica de F



Critrios Estadsticas Estadstica de F 1 2 Valores-p
Wilks Lambda 0.690 15.37 6 205 <0.0001
Pillais Trace 0.310 15.37 6 205 <0.0001
Hotelling-Lawley Trace 0.450 15.37 6 205 <0.0001
Roys Greatest Root 0.450 15.37 6 205 <0.0001
1 : Grados de libertad asociados a las variables 2 : Grados de libertad total

El mtodo de componentes principales para identificar los factores iniciales en el anlisis
factorial, gener los resultados mostrados en la Tabla 3.

Tabla 3. Varianzas estimadas (autovalores) y proporciones acumuladas de la varianza total
explicada, obtenidas por medio del anlisis de componentes principales

Autovalor Diferencia Proporcin Propocin acumulada
1.616 0.334 0.269 0.269
1.282 0.237 0.214 0.483
1.045 0.150 0.174 0.657
0.895 0.157 0.149 0.806
0.738 0.314 0.123 0.929
0.424 0.071 1.0000

En la Tabla 3 se observa la presencia de tres autovalores mayores que la unidad, esto sugiere
que tres factores deberan ser considerados en el anlisis posterior.

Tabla 4. Autovectores analizados con base en las variables tasa de glucosa (G), peso, edad,
presin sistlica (PS), presin diastlica (PD) y tipo de diabetes (TD), usando la
rotacin Varimax.

Variables Factor 1 Factor 2 Factor 3
Edad -0.108 0.825 0.196
Peso 0.658 -0.222 0.276
PS 0.532 0.647 -0.195
PD 0.832 0.151 -0.103
G 0.033 -0.373 -0.685
TD 0.061 -0.087 0.753

Utilizando, inicialmente un ponto de corte de 60% para las cargas factoriales, se identific que
las variables Peso y Presin Diastlica (PD) definen el primer factor, pues presentan cargas
altas para el factor 1. Estas variables han sido utilizadas en estudios realizados por POMPEU
(sd), reforzando el agrupamiento de tales variables en el factor 1, que en este trabajo fue
denominada factor peso. Esto equivale a decir que el aumento (o disminucin) del peso est
asociado con el aumento (o disminucin) de la presin diastlica.
Estudios realizados por ROGERS et al (1999) sealan la asociacin de la presin sistlica con
la edad, como un fuerte indicador de riesgo de mortalidad. El presente estudio confirm los
resultados de los investigadores, a partir del momento en que clasifica a la edad y a la presin
sistlica (PS) dentro del factor 2, aqu tambin denominado como riesgo de mortalidad. De esa
forma, para pacientes ms ancianos, el aumento de la presin sistlica se caracteriza como un
mayor riesgo de mortalidad. La literatura mdica seala la existencia de dos tipos de diabetes,
la melitus (caracterizada por altas tasas de glucemia - hiperglicemia) y la insipidus
(caracterizada por bajas tasas de glicemia - hipoglicemia). En el presente estudio se seal el
contraste entre la tasa de glicemia y el tipo de diabetes como factor 3, aqu denominado factor
de riesgo para el tipo de diabetes. Este contraste est caracterizado por la siguiente afirmacin:


a mayores niveles de glucosa en la sangre, mayor es el riesgo de diabetes tipo melitus y,
anlogamente, a menores niveles de glucosa en la sangre, mayor riesgo de diabetes insipidus.

Bibliografa
[1] BRASIL. SUS. Manual de Hipertenso Arterial e Diabetes Mellitus. Braslia, 2002.
[2] POMPEU, F. R. Tratamento no-farmacolgico da hipertenso arterial. UFMG Faculdade
de Medicina. http://www.medicina.ufmg.br/edump/clm/imphipert.htm (consultado el 17.08.10)
[3] ROGERS, J ; TAMIRISA, P; KOVACS, A; WEINHEIMER, C; BLUMER, KJ ; KELLY, DJ ;
MUSLIN, AJ . RGS4 causes increased mortality and reduced cardiac hypertrophy in response to
pressure overload. J . Clin. Investig. 104: 567-576. 1999.


GRFICO DE CONTROL DE REGRESIN APLICADO AL MONITOREO
DE NOTIFICACIONES DE CASOS DE SIDA EN EL ESTADO DE PAR
(BRASIL)
MARCELLO NEIVA DE MELLO
1
, CARLOS TADEU DOS SANTOS DIAS
4

EZEQUIEL ABRAHAM LPEZ BAUTISTA
1 3
, EDILAN DE SANTANA QUARESMA
1 2

1
Cincia Exatas, Escola Superior de Agricultura Luiz de Queiroz - USP

2

3

4
Profesor, Departamento de Cincias Exatas, Escola Superior de Agricultura Luiz de Queiroz -
Universidade de So Paulo

neivamarcello@usp.br

RESUMEN
El monitoreo del nmero de casos de Sndrome de Inmunodeficiencia Adquirida (SIDA) en el
Estado de Par, especficamente su capital, Belm, se torna importante por hecho de conocer y
evaluar su comportamiento a travs del tiempo. En este monitoreo, se utiliza el grfico de
control de regresin, una herramienta estadstica que tiene como objetivo controlar la variacin
media, en que la lnea central es obtenida a partir del modelo de regresin clsica, resumiendo
la relacin linear entre las dos variables, nmero de casos de SIDA en el municipio de Belm y
el ao de su ocurrencia. A partir de la construccin del grfico de control de regresin, con k=2,
se constat que el ao 2005 presenta un valor arriba del esperado, debido probablemente al
surgimiento de un brote de la enfermedad. Adems se observ que en los aos 2000 y 2004 se
presentaron valores muy prximos a los lmites de control, por lo que es necesario un estudio
ms profundo para la identificacin de las causas.

Palabras clave: monitoreo del SIDA, grfico de control de regresin, Belm.

Introduccin
El Sndrome de Inmunodeficiencia Adquirida (SIDA) fue descrito por primera vez en 1981. Dos
aos despus, fue descubierto su agente etiolgico, el virus de inmunodeficiencia humana
(HIV). Este virus ataca las clulas de defensa del organismo humano, comprometiendo el
sistema inmunolgico. Mann et al. (1992) estim que hasta enero de 1992, haba ocurrido 2.5
millones de decesos por causa del SIDA. En Brasil, desde comienzos de la dcada de 1980
hasta junio de 2006 fueron registrados por el Ministerio de Salud, 433,067 casos de SIDA. De
estos, 10,846 fueron nios infectados por transmisin vertical. Este tipo de infeccin es de todas
las formas de contagio del HIV, la que tiene ms posibilidad de ser eliminada. Aun as, cada ao
centenas de nuevos casos surgen en el pas. Factores como desinformacin y falta de acceso a
los servicios de salud estn entre los principales responsables por los altos ndices de esta
infeccin. Ante esta situacin, son de gran importancia estudios que muestren el
comportamiento y evolucin del SIDA para la toma de decisiones por entidades competentes


para el combate y prevencin de esta enfermedad.

Desarrollo
El grfico de control de regresin es til para monitorear un proceso donde existe la actuacin
conjunta de variables correlacionadas. En este caso, el objetivo es controlar la relacin entre
ellas. La relacin lineal entre las variables es representada por la recta de regresin y alrededor
de ella, es establecido un intervalo de confianza, dentro del cual se espera que el valor real de
la variable dependiente est contenido con cierta probabilidad. Mitra (1988) destaca que el valor
central del grfico de control de regresin es una recta inclinada y las lneas de los lmites de
control son paralelas a la lnea de regresin, y los clculos de sus lmites son un poco ms
complejos y lentos que los de los grficos de control convencionales.
Mandel (1969) aborda con mayor detalle la combinacin de la herramienta estadstica del
grfico de control con la tcnica de anlisis de regresin. Y muestra, adems, algunos procesos
apropiados para tal herramienta. Para la construccin del grfico de control, se utilizan las
siguientes ecuaciones:

,
i i
X Y LC + = =
(1)

,
k Y LSC
i
+ =
(2)
y

,
k Y LIC
i
=
(3)
en que y son obtenidos a partir del mtodo de mnimos cuadrados y es el error estndar
que es estimado por:

.
2
)
(
1
2
=

=
n
Y Y
S
n
i
i i
e

(4)
Las variables utilizadas en este estudio se refieren a la cantidad de notificaciones de casos de
SIDA en los aos de 1990 a 2008, en el municipio de Belm, capital del Estado de Par, Brasil.
Entre las variables en estudio, se pudo verificar que poseen valores altos de correlacin
(coeficiente de Pearson igual a 0.908), indicando que es posible aplicar un modelo de regresin
lineal. Dado que la variable dependiente, nmero de notificaciones de casos, es una variable
aleatoria, una prueba de adherencia fue aplicada a la misma. As, la prueba de Shapiro-Wilk
(ROYSTON, 1995) fue aplicada, en la cual se obtuvo un nivel descriptivo de p =0.5552 para la
estadstica W =0.9591, concluyendo que la variable sigue una distribucin Normal.

De esta forma, un modelo de regresin lineal puede ser utilizado para describir la relacin
existente entre las dos variables. La ecuacin de regresin estimada es dada por:

i i
X Y 554 , 15 639 , 30926
+ =
,
(5)
Para la utilizacin del modelo (5) se hace necesario validarlo. Esta validacin es posible a partir
del anlisis de residuos (BUSSAB, 1988), en el cual se verifican las suposiciones de normalidad
y varianza constante de los residuos. La prueba de adherencia de Shapiro-Wilk (ROYSTON,
1995) nuevamente fue aplicada, sin embargo ahora a los residuos estudentizados, en el cual se
obtuvo un nivel descriptivo de p =0.401 para la estadstica W =0.9504, por lo tanto la variable


sigue una distribucin normal. El grfico Q-Q Plot y el histograma evidencian esta situacin de
normalidad. Para verificar la homogeneidad de varianzas, el grfico de los residuos
estudentizados y los valores ajustados muestran que existen dos puntos fuera del intervalo de -
2 a 2, indicando un posible punto discrepante, lo que puede ser constatado con el box plot, sin
embargo la homogeneidad de varianza puede ser verificada con la prueba de J i-cuadrada de
homogeneidad al 1% de significancia, en la cual se obtuvo un nivel descriptivo de p =0.0632
para la estadstica
2
=3.4495 con un grado de libertad.

Figura 1. Residuos estudentizados contra Valores Ajustados, Q-Q Plot, Histograma y Box Plot
para los residuos obtenidos por el Modelo (5) Notificaciones de casos de SIDA en el municipio
de Belm, Estado de Par, Brasil.

Luego de validar el modelo, se procedi a construir el grfico de control de regresin.
Verificando a partir de la construccin del grfico de control de regresin, con k=2, que los
registros de casos en el ao de 2005 presentan valor arriba de lo esperado, identificando que
hubo un probable brote de la enfermedad. Adems se puede observar que en los aos 2000 y
2004 se presentaron valores muy prximos a los lmites de control, por lo que es necesario un
estudio ms profundo para la identificacin de las causas.

Figura 2. Grfico de Control de Regresin de las variables Notificaciones de SIDA en el
municipio de Belm y ao de ocurrencia, en el Estado de Par, Brasil.

De esta manera, el objetivo de monitorear el nmero de notificaciones de casos de SIDA fue
satisfactorio, resaltando que en los aos 2000 y 2004 se presentaron valores prximos a los
lmites de control, pudiendo destacar el ao 2005 en el cual se super el lmite superior de
control, indicando nmero de notificaciones arriba de lo esperado para el respectivo ao,
probablemente debido a un brote de la enfermedad, siendo necesario un estudio ms profundo.

LS
LIC
LC


Bibliografa
[1] Bussab, W. O. (1988). Anlise de Varincia e Regresso: Uma introduo. So Paulo: Atual.
[2] Mandel, B. J . (1969). The regression control chart. Jounal of Quality Technology, vol(1): 1-9.
[3] Mann, J .; Tarantola, D. J . M.; Netter, T.W. (1992). AIDS in the world. Cambridge: Havard
University Press.
[4] Mitra, A. (1988). Quality Control and Improvement. 2. ed. New Jersey: Prentice Hall.
[5] Royston, P. (1995). A remark on Algorithm AS 181: The W test for normality. Applied
Statistics, 44: 547-551.


RESPUESTA DEL ARROZ (Oryza sati va L.) A LA APLICACIN DE 3
DOSIS DE FSFORO, 2 FUENTES Y 4 NIVELES DE CALCIO
EZEQUIEL ABRAHAM LPEZ BAUTISTA
1 2
, EDILAN DE SANTANA QUARESMA
1 3
, LUIZ
RICARDO NAKAMURA
1
, MARCELLO NEIVA DE MELLO
1
, SNIA MARIA DE STEFANO
PIEDADE
4

1
Cincia Exatas, Escola Superior de Agricultura Luiz de Queiroz USP

2

3

4
Profesora, Departamento de Cincias Exatas, Escola Superior de Agricultura Luiz de Queiroz
- Universidade de So Paulo

ealbautis@usp.br

RESUMEN
Considerando que los suelos cidos generalmente tienen problemas de disponibilidad de
nutrientes, se realiz este estudio, en el que se evalu la respuesta del cultivo del arroz a las
aplicaciones de cal en suelos cidos. Para ello se instal un experimento en bloques al azar,
con 4 repeticiones y esquema en parcelas subdivididas, siendo los factores evaluados: a)
fuentes de calcio: cal hidratada y cal dolomtica; b) niveles de calcio: 0, 500, 1000 y 2000 kg.ha
-
1
; c) dosis de fsforo: 30, 60 y 90 kg.ha
-1
de P2O5. La variable rendimiento de arroz en granza
fue medida y analizada por medio de un ANOVA, previa verificacin de los supuestos del
modelo estadstico-matemtico. Posteriormente, los grados de libertad de la interaccin triple
fueron desdoblados y construidos contrastes ortogonales para cada nivel de Ca, por cada
fuente de Ca; en estos contrastes fue evaluada la aplicacin de 90 kg.ha
-1
de P2O5, contra las
dosis restantes (30 y 60 kg.ha
-1
). Los resultados mostraron que no existe diferencia significativa
entre fuentes de Ca. Efectos diferenciados se observaron en las aplicaciones de los niveles de
Ca y de las dosis de fsforo.

Palabras clave: Experimentos en parcelas subdivididas, contrastes ortogonales, suelos.

Introduccin
El arroz es uno de los principales granos bsicos de consumo en Guatemala, segn cifras del
Ministerio de Agricultura, Ganadera y Alimentacin (MAGA), para el ao agrcola 2010/2011 la
produccin de arroz en granza (con cscara) fue de 25,088 toneladas mtricas, en un rea
cosechada de 8,540 hectreas y rendimiento promedio de 2.94 tm.ha
-1
. Uno de los principales
departamentos productores en el pas es Izabal (especficamente en los valles de los ros
Polochic y Motagua), donde se concentra el 17% del rea nacional cosechada. Dentro de los
problemas que presentan los suelos de estos valles sobresalen el alto ndice de acidez y baja
fertilidad natural, lo que ocasiona bajos rendimientos de los cultivos. Una de las posibles
estrategias a seguir para solucionar esa situacin, es neutralizar la acidez de los suelos por
medio de la adicin de bases intercambiables como calcio y/o magnesio, que permitan
establecer condiciones adecuadas para el desarrollo de los cultivos. Con la finalidad de
encontrar una solucin al problema planteado se realiz un ensayo experimental en la aldea


Cristina, municipio de Los Amates, departamento de Izabal. El experimento consisti en la
evaluacin de la respuesta del cultivo de arroz a la aplicacin de enmiendas a base de calcio y
magnesio para neutralizar la acidez del suelo, al mismo tiempo se hicieron aplicaciones de
elementos nutritivos, especialmente de fsforo.

Desarrollo
El experimento fue instalado en la Estacin Experimental Cristina del Instituto de Ciencia y
Tecnologa Agrcola (ICTA), jurisdiccin de la aldea Cristina, municipio de Los Amates,
departamento de Izabal, en la zona ecolgica tropical hmeda (costa Atlntica). La Estacin
Experimental se encuentra localizada entre las coordenadas geogrficas 15 latitud norte y 89
longitud oeste, a una altitud de 69 metros sobre el nivel del mar, la precipitacin pluvial anual es
de 3500 mm, temperatura media de 28 C. Los suelos son poco profundos (0.40 m), textura
franco arcillosa, mal drenados, con pH variando entre 4.5 a 5.5 y contenido de materia orgnica
de 2.9%. Los factores evaluados fueron: a) fuentes de calcio: cal hidratada y cal dolomtica; b)
niveles de calcio: 0, 500, 1000 y 2000 kg.ha
-1
; c) dosis de fsforo: 30, 60 y 90 kg.ha
-1
de P2O5.
El diseo experimental utilizado fue bloques completos al azar (con 4 repeticiones), con
esquema en parcelas subdivididas. En las parcelas grandes se aleatorizaron las fuentes de
calcio, en las medianas los niveles de calcio y en las pequeas las dosis de fsforo. El tamao
de la parcela bruta fue de 3.0 5.0 m (15 m
2
), con 10 surcos de 5 m de largo y separados 0.3 m
entre s. El rea til para la toma de datos fue de 1.8 5.0 m (9 m
2
) correspondiente a los 6
surcos centrales. Fue utilizada la variedad de arroz ICTA Virginia. La variable de respuesta
medida fue el rendimiento (kg de grano de arroz con 14% de humedad, por unidad
experimental). Fue aplicado un anlisis de varianza (5% de significancia), anlisis de los
residuos para verificar el cumplimiento de los supuestos del modelo estadstico-matemtico y
desdoblamiento de los grados de libertad de la interaccin triple para estudiar el
comportamiento de la interaccin entre niveles de calcio y dosis de fsforo, para cada fuente de
calcio.

El resumen de los resultados del anlisis de varianza aplicado a los datos de rendimiento de
arroz en granza por unidad experimental son presentados en el Cuadro 1.

Cuadro 1. Resumen del Anlisis de Varianza
Fuentes de Variacin Cuadrados Medios Valor de F valor-p
Bloques 0.153
Fuente de Ca 0.005 0.03 0.86921
ns

Error asociado a la parcela grande 0.146
Niveles de Ca 1.828 13.96 <0.0001 *
Fuente x Niveles de Ca 1.173 8.96 0.00076 *
Error asociado a la parcela mediana 0.131
Dosis de P 5.826 55.05 <0.0001 *
Dosis de P x Niveles de Ca 0.330 3.12 0.01158 *
Fuente de Ca x Dosis de P 0.559 5.29 0.00842 *
Fuente x Niveles de Ca x Dosis de P 0.327 3.09 0.01217 *
Error asociado a la parcela pequea 0.106
CV =5.47%

Del Cuadro 1, se puede concluir que la fuente de calcio no present diferencias significativas en


cuanto al rendimiento de arroz. Caso contrario sucedi con los efectos principales niveles de
calcio y dosis de fsforo, as como las interacciones dobles y la triple, que mostraron diferencias
significativas. Con relacin a la verificacin de los supuestos del modelo, por medio del QQ-Plot,
se constat que los residuos siguen una distribucin normal, lo que fue confirmado con la
prueba de Shapiro-Wilk (valor-p=0.0622), y en el grfico de predichos y residuos, se observ
una distribucin aleatoria de los residuos, concluyendo en el no rechazo de la hiptesis de
homogeneidad de las varianzas. En funcin de estos resultados, se procedi a realizar el
desdoblamiento de los grados de libertad de la interaccin triple, por tipo de fuente de calcio.
Cuadro 2. Resumen del ANOVA para el desdoblamiento de los grados de libertad de la
interaccin triple, por tipo de fuente de calcio.

Para cada
una de las
fuentes de
calcio fue
aplicada una prueba de comparacin mltiple de medias, de acuerdo con el criterio propuesto
por Tukey. En el caso de la cal dolomtica, los mejores rendimientos fueron obtenidos con la
aplicacin de 2000, 1000 y 500 kg.ha
-1
de Ca, en tanto que para cal hidratada, se observ el
mayor rendimiento al aplicar 2000 kg.ha
-1
de Ca.

Figura 2. Rendimientos medios de arroz obtenidos con la aplicacin de niveles de Ca, por cada fuente
de Ca, y resumen de los resultados de la prueba de Tukey.

Cuadro 3. Resumen de la prueba de contrastes ortogonales (90 contra 30+60 kg.ha
-1
de P2O5) para
cada nivel de calcio, por tipo de fuente de calcio.
Valor del contraste
Fuente de Ca Niveles de Ca 90 vs 30+60 kg.ha
-1
P2O5 Valor de F valor p
Cal Dolomtica
0 0.69 2.98
NS
0.0972
500 3.26 67.46* <0.0001
1000 1.42 12.8* 0.0015
2000 0.99 6.22* 0.0199
Cal Hidratada
0 0.79 3.90
NS
0.0598
500 1.03 0.60* 0.0168
1000 0.96 5.79* 0.0242
2000 0.54 1.82
NS
0.1895
Fuente de calcio Cuadrados medios Valor de F valor-p
Cal Dolomtica 1.594 15.07 <.0001*
Cal Hidratada 0.743 7.03 <.0001*


Para el caso de la cal dolomtica, en los niveles 500, 1000 y 2000 kg.ha
-1
de Ca se observ
diferencias significativas en la aplicacin de fsforo, siendo la dosis de 90 kg.ha
-1
de P2O5 la que
present los mejores resultados. Por otra parte, para el caso de la cal hidratada, diferencias
significativas fueron observadas nicamente al aplicar 500 y 1000 kg.ha
-1
de Ca, siendo tambin
la dosis de 90 kg.ha
-1
de P2O5 la que present los mejores resultados.

Bibliografa
[1]Gomes, FP. (2009). Curso de Estatstica Experimental. 15 ed. Piracicaba: FEALQ. 451p.
[2]Martnez, A. (1988). Diseos Experimentales. Mxico, D.F.: Trillas. 756 p.
[3]Ministerio de Agricultura, Ganadera y Alimentacin. (2011). El Agro en cifras, Guatemala.
Versin obtenida el 20/06/20013.
http://www2.maga.gob.gt/portal.maga.gob.gt/portal/page/portal/2010/el_agro_en_cifras_2011.pd
f


ESTIMACION MXIMO-VEROSIMIL DE MODELOS DE DISPOSICION A
PAGAR DE TIPO DOUBLE-BOUNDED

VICTOR BRESCIA
1
, KARINA CASELLAS
1
, DANIEL LEMA
1

1
Instituto Nacional de Tecnologa Agropecuaria, Instituto de Economa y Sociologa.

vbrescia@correo.inta.gov.ar

RESUMEN
Las innovaciones vinculadas con la incorporacin de resistencia a herbicidas en arroz ofrecen
relevantes ventajas econmicas y de produccin, ms si se considera que es el principal cultivo
comestible del mundo. En Argentina se vienen desarrollado variedades de arroz con resistencia
a herbicidas (HR). El trabajo analiza los determinantes de la disposicin a pagar (DAP) por la
nueva variedad de arroz Gur INTA CL, y donde la decisin de los productores de usarla o no
fue modelada usando un marco de utilidad aleatoria.
La DAP por la nueva variedad (se comercializa desde la campaa 2011/12) se estim por
mxima verosimilitud implementando la log-likelihood function derivada del modelo double-
bounded adaptado para las tres categoras (SI-SI SI-NO; NO-NO; NO-SI) que resultan de la
secuencia indagatoria diseada en la encuesta de valoracin contingente aplicada a
productores arroceros de Entre Ros (Argentina). Se ofrece el cdigo Shazam para estimar por
mxima verosimilitud los coeficientes del modelo. Permite adems calcular la DAP y su error
estndar, representando una ventaja con respecto al comando doubleb de STATA.
La DAP media por arroz HR es de 2.1 kg. de arroz cscara por kg. de semilla HR, en tanto el
precio de mercado es de 2.5 kg. Este diferencial es relativamente bajo comparando con otros
casos en el mercado de semillas y sugiere que una adecuada estrategia de precios y
comercializacin es clave para facilitar la diseminacin de semilla de buena calidad.

Palabras clave: ML estimation, SHAZAM, disposicin a pagar, double-bounded model.

Introduccin
El enfoque de las Preferencias Declaradas (SP) estudia el comportamiento potencial de un
comprador de un bien enfrentado a variaciones del precio u otras variables exgenas. Utiliza
datos hipotticos para estimar ex-ante la disposicin a pagar por ciertos atributos no disponibles
en el mercado. El mtodo de valoracin contingente (VC) es uno de los ms utilizados en la
estimacin de SP. El formato de pregunta binaria en las encuestas de VC, introducido por
Bishop y Heberlein (1979) se recomienda sobre las preguntas abiertas. El encuestado debe
responder si/no ante un determinado monto A requerido, y no un valor exacto de cuanto
pagara. La encuesta incluye una segunda pregunta (follow up) que indaga, para los individuos
que rechazan la propuesta original, si est dispuesto a pagar algo por el producto, con el
propsito de detectar a los individuos con valoracin nula.
La variable dependiente toma el valor 1 si el individuo est dispuesto a pagar la cantidad A
sugerida en la encuesta y 0 en caso contrario. La estimacin economtrica sigue criterios de
mxima verosimilitud, asumiendo errores con distribucin normal o logstica y dando lugar a
modelos probit o logit. Si el productor de arroz declara no usar la variedad Gur -no la adopt al
precio de mercado- se le administra el mdulo de VC sobre su disposicin a pagar por la
variedad un precio hipotticamente ms bajo, en el rango de 5% a 30% de descuento sobre el
precio de mercado. Si slo se usa la informacin sobre la disposicin a pagar de los no
adoptantes se ignora informacin potencialmente til proveniente de los adoptantes al precio de


mercado. Combinando la informacin sobre preferencias declaradas (no adoptantes) y
preferencias reveladas (adoptantes) se reproducen datos similares a los obtenidos en
encuestas de VC acotadas superior e inferiormente (Hanemann et al., 1991). El mtodo que
combina PR y SP es una adaptacin del double bounded propuesta por Cooper (1997). El
desafo es implementar la estimacin economtrica del modelo resultante cuando existen, como
en este caso, tres tipos de respuestas: Y1=SI-SI SI-NO; Y2=NO-NO ; Y4=NO-SI.

Desarrollo
Un productor de arroz adopta la variedad cuando la utilidad derivada del uso de la tecnologa
es, al menos, tan grande como la utilidad sin ella, esto es, si
(1)
donde 1 indica la variedad Gur y 0 cualquier otra variedad. P es el precio de la tecnologa, y1 e
y0 representan las ganancias esperadas con Gur y convencional, respectivamente, y x un
vector de caractersticas contextuales, familiares y de la explotacin que pueden afectar las
percepciones del productor acerca de la tecnologa y por ende su disposicin a pagar.
La funcin de utilidad slo puede observarse parcialmente, lo que implica que

donde es la porcin observable de la funcin de utilidad asociada con la tecnologa i
y es una variable aleatoria.
La disposicin a adoptar la tecnologa al precio P se puede expresar como:
(2)
donde V es la parte determinstica de la funcin de utilidad, y c1 y c0 son variables aleatorias
idnticas e independientemente distribuidas (i.i.d.) con media cero. Como es comn en estudios
de VC, se supone que V(.) es lineal, esto es:
(3)
o es la utilidad marginal de ingreso y toma el valor 1 cuando i=1 y cero cuando i=0.
Entonces la ecuacin (2) puede escribirse como:
(4)
donde = - , = y
Como no es posible observar los cambios esperados en los beneficios atribuibles a la
tecnologa, suponemos que puede ser explicada por otras caractersticas de la explotacin.
Entonces, est implcitamente incluida en el vector x.
Si est distribuida N(0,
2
) la probabilidad de la decisin de usar la variedad HR Gur INTA CL
al precio P es igual a:
(5)
De esta manera se estima la DAP para los no adoptantes, en base a las respuestas obtenidas
sobre los precios hipotticos (P*). Sin embargo, la respuesta al precio hipottico est
condicionada por una contestacin negativa al precio de mercado (Pm). Por lo tanto si se
incluye la informacin sobre los adoptantes actuales es decir, los que estn usando la variedad
Gur y pagan el precio de mercado, existen tres grupos de respuestas posibles:
)
(6)

Bajo estos supuestos, el logaritmo de la funcin de verosimilitud (log-likelihood function) del
modelo double bounded adaptado para tres categoras es:



ln (7)
Donde Isi, Ins y Inn son indicadores binarios para cada tipo de respuesta. Los coeficientes de la
ecuacin (7) pueden interpretarse aqu como los efectos marginales de las variables x sobre la
DAP (expresados en equivalente kilos de arroz cscara), lo que constituye una diferencia
sustancial con la estimacin mximo verosmil de un modelo probit comn que genera
parmetros estimados solo hasta un factor de proporcionalidad, es decir /.

La disposicin a pagar por la variedad Gur INTA CL se estim implementando con cdigo
SHAZAM la log-likelihood function del modelo double bounded adaptado para tres categoras,
dada en (7). La especificacin incluye la variable precio junto a cinco covariables que controlan
por distintas caractersticas cualitativas y cuantitativas: superficie explotada en propiedad
(HAPROP), superficie arrendada (HAARREND), proporcin de hectreas dedicadas a arroz
(PR_ARROZ), el uso previo de semillas certificadas (SEM_CERT) y la variable (PERC_NEG)
que incorpora las apreciaciones negativas del productor sobre el entorno del negocio (altos
costos, falta de combustible, dudas sobre la actividad, etc).

Tabla 1. Resultados del modelo economtrico de disposicin pagar (n=238)
VARIABLES Constant HAPROP HAARREND PR_ARROZ SEM_CERT PERC_NEG
COEF. 0.3797***
(12.9)
0,0000406
(1,37)
0,0000889**
(2.25)
0,1443
(1,40)
0.4133***
(6.34)
-0,8028***
(-5,32)
LogL -205,6940
DAP en kilos de
arroz cscara
1

2.067***
(59.61)

Los coeficientes del modelo pueden ser interpretados directamente como efectos marginales sobre la DAP evaluados en los valores
medios de las variables independientes.
Estadsticos z entre parntesis. (*) (**) (***) significativo al 10%, 5% y 1% respectivamente.

El precio a agosto de 2012 es de 22 centavos de dlar por kilo. La cotizacin del arroz permanece 10% encima de la media
histrica desde hace tres campaas.

Tanto la cantidad de hectreas en propiedad como arrendadas tienen un efecto positivo sobre la
DAP aunque la significatividad de las hectreas en propiedad es menor. Tambin vale para el
uso previo de semillas certificadas, lo que sugiere que la experiencia previa en el uso de semilla
legal es un factor importante para facilitar la decisin de compra de la nueva variedad. Al mismo
tiempo, el impacto negativo de la percepcin acerca de la actividad arrocera es considerable, ya
que reduce significativamente la disposicin a pagar.
La tabla presenta la estimacin de la DAP media. Se expresa en kilos de arroz cscara por kilo
de semilla y si se tiene en cuenta que el precio de mercado de la variedad Gur es de 2.5 kg de
arroz cscara por kilo de semilla, los resultados muestran que la DAP media por arroz HR
estara ligeramente por debajo del precio de mercado, sugiriendo que la demanda potencial
podra estar limitada parcialmente por el precio inicial de la semilla de arroz HR.
Debe tenerse en cuenta que la encuesta se realiz solo un ao despus que la variedad fuera
liberada al mercado y que los productores pueden no haber percibido totalmente los beneficios
asociados. Tambin la estrategia de precios por parte de la oferta, con ms informacin de
mercado, puede que se ajuste para converger a valores que induzcan una mayor probabilidad
de compra. Los resultados para los primeros aos de difusin del algodn Bt en Argentina
(Quaim y Cap 2002) muestran una DAP estimada menor que la mitad del precio vigente. Este
desajuste de precio inducira potencialmente la aparicin de un mercado de semilla ilegal,
cuestin que hoy parece verificarse. En el caso del arroz HR la estrategia de precios est
mucho ms cerca de la DAP de los productores, situacin que hace pensar que una estrategia
de ajuste y aproximacin sucesiva a un precio que induzca la adopcin de la tecnologa


desarrollando un mercado de semilla legal sea probable.

Bibliografa
Bishop, R and Heberlein, T. (1979). Measuring Values of Extra-Market Goods; Are Indirect
Measures Biased? American J ournal of Agricultural Economics 61:926-30.
Cooper J oseph. (1997). Combining Actual and Contingent Behavior Data to Model Farmer
Adoption of Water Quality Protection Practices. J ournal of Agricultural and Resource Economics
22(1):30-43
Hanemann, W. M and Kanninen, B. (1998). The Statistical Analysis of Discrete-Response CV
Data. Working Paper N 798, Department of Agricultural and Resourse Economics and Policy.
Division of Agricultural and Natural Resources. University of California at Berkeley.


USANDO EL SOFTWARE R PARA LA CALIBRACIN: UNA
COMPARATIVA
ANTONIO ARCOS
1
, MARA DEL MAR RUEDA
1
, DAVID MOLINA
1

1
Departamento de Estadstica e Investigacin Operativa, Universidad de Granada

arcos@ugr.es, mrueda@ugr.es, dmolinam@ugr.es

RESUMEN
En este trabajo se hace una revisin de diversas funciones de R implementadas en diversos
paquetes que permiten el clculo de estimadores de calibracin y sus varianzas estimadas. Se
describen algunas utilidades de estos paquetes y se discuten sus requerimientos y
capacidades. Finalmente se hace un estudio comparativo del tiempo de ejecucin

Palabras clave: muestreo, informacin auxiliar, paquetes de R, reponderacin

Introduccin
En la sociedad actual hay una gran demanda de encuestas que proporcionen estimaciones de
calidad. El procedimiento para obtener estas encuestas de calidad es caro y necesita de tiempo
para su realizacin as como de una metodologa compleja en la estimacin que tenga en
cuenta tanto el diseo muestral como la informacin auxiliar de la poblacin objeto de estudio
que pueda estar disponible a partir de censos o encuestas anteriores.
La informacin auxiliar puede ser usada tanto en la fase del diseo de la encuesta como en la
fase de estimacin mediante la modificacin de los pesos muestrales. Uno de los
procedimientos ms usados de reponderacin es la calibracin introducida por Deville y Sarndal
(1992).
El punto de partida de la calibracin es modificar los pesos del diseo obteniendo unos nuevos
pesos que verifiquen dos condiciones: a) los pesos calibrados deben estar prximos (segn una
cierta distancia) a los pesos del diseo y b) los pesos calibrados den estimaciones perfectas en
las variables auxiliares.
Los estimadores de calibracin dependen tanto de la distancia usada como de las variables
auxiliares consideradas. Deville y Srndal (1992) demuestran que el problema de minimizacin
puede ser resuelto mediante el mtodo de Lagrange, obtienen una expresin explcita para la
distancia chi-cuadrado y demuestran que asintticamente los estimadores obtenidos con
diferentes distancias son asintticamente equivalentes.

Desarrollo
En los ltimos aos ha proliferado una gran cantidad de software informtico para el anlisis de
datos. Dentro de este grupo se encuadra R. R es un programa de carcter libre para el anlisis
estadstico de datos. Pero es algo ms que eso: R constituye un poderoso entorno de
programacin que permite al usuario la creacin de nuevas funciones que satisfagan sus
necesidades especficas ante un determinado problema. Precisamente esta flexibilidad junto a
su gratuidad han hecho que la popularidad de R aumente enormemente entre la comunidad


cientfica, convirtindolo en uno de los programas estadsticos ms utilizados, en detrimento de
la mayora del software comercial. Otra de las ventajas que R proporciona a sus usuarios es la
posibilidad de extender su configuracin bsica mediante la instalacin de paquetes. Un
paquete no es ms que un conjunto de funciones, desarrolladas habitualmente por
investigadores y especialistas en el mbito de la estadstica, relativas a una temtica comn.
En este trabajo se hace una revisin de diversas funciones de R implementadas en diversos
paquetes que permiten el clculo de estimadores de calibracin y sus varianzas estimadas. Los
paquetes considerados son: Laeken (Alfons y otros 2013), Sampling (Till y Matei, 2012),
Survey (Lumley) y Teaching Sampling (Gutierrez). Se describen algunas utilidades de estos
paquetes y se discuten sus requerimientos y capacidades.
Las funciones que obtienen los pesos de calibracin en estos 4 paquetes son:
- Laeken: calibWeights,
- Sampling: calib,
- Survey: calibrate y
- Teaching sampling: Wk
Estas funciones tienen implementadas las 3 distancias clsicas salvo la function Wk de
Teaching Sampling que es muy reciente y est todava en desarrollo. Los mtodos lineal
truncado o logit no estn implementados en algunos paquetes. Todos los mtodos usan el
algoritmo de Newton-Raphson descrito por Deville et al (1993).
Todas las funciones dan un vector numrico que contiene los g-pesos salvo la funcin Wk que
da los pesos de calibracin. Los pesos muestrales finales se computan multiplicando los g-
pesos por los pesos iniciales del diseo. Todos los diseos muestrales pueden usarse sin ms
que dar las probabilidades de inclusin de cada unidad muestral.

Finalmente se hace un estudio comparativo del tiempo de ejecucin con cada funcin.
Hemos usado un ordenador con las siguientes caractersticas: Intel(R)Core(TM) i7-3770
CPU@3.40 GHz, 8GB, 64 bits. Hemos usado el commando proc.time que determina la
cantidad de tiempo real y CPU (en segundos) que tarda en ejecutarse el proceso. Algunos
resultados pueden verse en la siguiente figura.

Fi gura 1: Tiempos totales y de CPU de los procedimientos de R comparados para diversos tamaos muestrales y
diversos nmeros de variables auxiliares en el proceso de calibracin.


Se observa que las funciones de los paquetes Sampling, Survey y Laeken funcionan muy bien
con 300000 registros y 200 variables auxiliares y la diferencia en tiempo no es grande. Como
conclusin de nuestro estudio tenemos que el uso de cualquiera de los paquetes Laeken,
Sampling y Survey es adecuado y preferible al Teaching Sampling en cuanto a su uso para la
calibracin.

Bibliografa
[1] Alfons, A., Holzer, J . and Templ, M. (2013). Laeken: Estimation of indicators on social
exclusion and poverty. R package version 0.4.4.
http://cran.r-project.org/web/packages/laeken/index.html
[2] Deville, J . C. and Srndal, C. E. (1992). Calibration estimators in survey sampling. J ournal of
the American Statistical Association 87, 376382.
[3] Gutierrez Rojas, H. A. TeachingSampling: Sampling designs and parameter
estimation in finite population. R package version 2.0.1
http://cran.rproject.org/web/packages/TeachingSampling/index.html
[4] Lumley, T. Survey: analysis of complex survey samples. R package version 3.29
[5] Till, Y. and Matei, A. (2012). Sampling: Survey Sampling. R package version 2.5.
http://cran.rproject.org/web/packages/sampling/index.html


ESTIMACIN EN ENCUESTAS CON TELFONOS FIJOS Y MVILES:
UNA APLICACIN PRCTICA
ANTONIO ARCOS
1
, MARA DEL MAR RUEDA
1
, MANUEL TRUJ ILLO
2

1
Departamento de Estadstica e Investigacin Operativa, Universidad de Granada

2
Instituto de Estudios Sociales Avanzados, CSIC

arcos@ugr.es, mrueda@ugr.es, mtrujillo@iesa.csic.es

RESUMEN
En este trabajo se exponen los procedimientos de estimacin de parmetros lineales en el caso
de que los datos de una encuesta se obtengan mediante dos marcos distintos, (p.e. un marco
de telfonos fijos y un marco de telfonos mviles) proponindose un nuevo estimador basado
en la metodologa de pseudo-verosimilitud emprica. Los mtodos son evaluados en una
encuesta real obtenida combinando entrevistas con telfonos fijos y mviles, mostrando una
gran diferencia en las estimaciones segn el procedimiento y la informacin auxiliar usada.

Palabras clave: marcos mltiples, estimador de Hartley, pseudo verosimilitud emprica.

Introduccin
En los ltimos aos la realizacin de encuestas mediante distintos procedimientos de entrevista
ha alcanzado una gran difusin. El uso de muestras que combinan telfonos fijos y telfonos
mviles permite aumentar la cobertura real de la poblacin, as como abaratar costes en la
realizacin.
Sin embargo la forma de integrar los datos de cada una de las muestras obtenidas mediante los
distintos procedimientos de entrevista no es una tarea inmediata. En la teora clsica de
muestreo en poblaciones finitas, la muestra es seleccionada utilizando un diseo muestral
probabilstico a partir de un marco muestral nico que contiene todas las unidades de la
poblacin. Sin embargo hay muchas situaciones reales en las que las encuestas utilizan varios
marcos (Lohr 2009). Ello puede deberse a diversas circunstancias: hay veces que no se
dispone de ningn marco que cubra por completo a la poblacin, y hay que acudir a varios
marcos que cubren una proporcin aproximadamente conocida (o incluso desconocida de la
poblacin) para tener localizada a toda la poblacin de estudio (y no tener as sesgos). En otras
ocasiones hay un marco completo pero puede ser muy caro de muestrear, mientras que existe
otro marco incompleto pero mucho ms barato de muestrear. Hartley (1962) estudi las
ventajas de muestrear ambos marcos en estas circunstancias para llegar a estimadores ms
eficientes comparados con los obtenidos al muestrear nicamente un marco.
En este trabajo se hace primero una revisin de los mtodos de estimacin con marcos
mltiples desde las dos perspectivas usuales: el enfoque de marco nico (single frame) y el
enfoque de marco dual (dual frame). Despus se propone un nuevo estimador de marco nico
siguiendo la idea de los estimadores de pseudo-verosimilitud emprica propuestos por Wu y Rao
(2006).
El comportamiento de todos estos estimadores es evaluado en la prctica con los datos de una
encuesta que combina muestras de telfonos fijos y mviles.



Desarrollo
El procedimiento de estimacin a partir de datos de marcos mltiples depende del nmero de
marcos as como del solapamiento de stos. Los mayor parte de los trabajos estn
desarrollados al caso de 2 nicos marcos y al caso de que los marcos no sean disjuntos y no
estn contenidos uno en otro.
El caso de que los dos marcos sean disjuntos es simple de tratar ya que los estimadores del
total poblacional se estima fcilmente sumando los estimadores de totales de cada marco, es
decir puede verse como una aplicacin del muestreo estratificado (ver Lohr, 2009).
Sin embargo el caso ms considerado en los trabajos es el caso de tener 2 marcos que no son
disjuntos y no estn embebidos el uno en el otro. El primer trabajo importante en esta situacin
fue el de Hartley (1962), quien considerando un muestreo aleatorio simple independiente en los
dos marcos, proponen los estimadores de los totales y medias poblacionales. La idea principal
de este trabajo consiste en dividir la poblacin en tres dominios disjuntos y estimar
separadamente los totales en cada dominio. Puesto que en el dominio formado por unidades
que pertenecen a los dos marcos simultneamente, se pueden utilizar dos estimadores (los
basados en la muestra del marco 1 y los de la muestra del marco 2), la idea original de Hartley
fue construir un estimador ponderado del total de la parte comn a partir estos dos estimadores
de forma que se minimice la varianza del estimador del total poblacional. Dado que los pesos
dependen de las varianzas y covarianzas entre los estimadores, que son desconocidos, hay
que estimarlos a partir de los datos muestrales.
Fuller y Burmeister (1972) propusieron una modificacin del estimador de Hartley que
incorporaba informacin adicional relativa a la estimacin del nmero de unidades comunes a
los dos marcos. Dicho estimador es asintticamente ms eficiente que el estimador de Hartley
(aunque tambin ms complejo de calcular). Como suceda con el estimador ptimo de Hartley,
en el estimador de Fuller y Burmeister (FB) los pesos de cada estimador dependen de
varianzas y covarianzas que deben ser estimadas a partir de los datos muestrales lo cual puede
dar lugar a incoherencias entre las estimaciones. Adems estos pesos dependen de la variable
de inters lo que conlleva el utilizar un conjunto de pesos diferente para cada variable
respuesta, lo cual es poco operativo en la prctica para los organismos estadsticos que
realizan encuestas con numerosas variables. Otro aspecto importante es que estos pesos no
aseguran la consistencia de los valores cuando se incorporan a las variables, a diferencia de un
nico conjunto de pesos que se calcule y se use para todas las variables.
Una alternativa a estos dos estimadores es la construccin de estimadores de marco nico
(Bankier, 1986, y Kalton y Anderson 1986) que combinan las observaciones de las dos
muestras en un nico conjunto de datos muestrales, cuyos pesos son ajustados para las
unidades muestrales comunes a ambos marcos, con objeto de no sobreestimar el total en la
parte comn. A diferencia de los estimadores de Hartley y de Fuller-Burmeister, el estimador de
marco nico no depende de las covarianzas estimadas para la variable respuesta y utiliza el
mismo conjunto de pesos para cada respuesta que se considere.
Skinner y Rao (1996) y Lohr y Rao (2000) realizan modificaciones de este estimador cuando los
tamaos poblacionales de los marcos son conocidos, mediante la inclusin de esta informacin
en el proceso de reponderacin utilizando procedimientos de razn y regresin.

Recientemente, Rao y Wu (2010) extienden la metodologa Pseudo-Empirical-Likelihood (PEL)
propuesta por Wu y Rao (2006) para un marco al caso de encuestas con dos marcos. Los
autores se basan en una post-estratificacin del total y construyen un estimador dual-frame con
buenas propiedades que permite la incorporacin de la informacin proporcionada por variables
auxiliares relacionadas con la variable de estudio.


La idea del nuevo estimador que se propone es modificar los pesos de cada unidad muestral de
la parte solapada obteniendo unos nuevos pesos que tengan en cuenta las probabilidades de
inclusin de las unidades en los dos diseos muestrales usados. A partir de estos pesos
modificados se obtienen unos nuevos pesos que maximizan una funcin de pseudo
verosimilitud emprica sujeta a unas restricciones derivadas de la pertenencia o no de la unidad
a los distintos marcos, as como que los pesos proporcionen las mismas estimaciones en cada
marco para las variables auxiliares. El estimador obtenido puede verse como el correspondiente
estimador single frame del estimador de Rao y Wu (2010).
Para determinar el comportamiento en la prctica de los distintos estimadores analizados se
han aplicado stos a una encuesta real realizada por el Instituto de Estudios Sociales
Avanzados (IESA). Dicha encuesta se ha realizado a travs de entrevistas mediante una
muestra de 641 entrevistas con telfonos fijos (con un muestreo estratificado por provincias) y
mediante una muestra de 177 entrevistas con telfonos mviles (con muestreo aleatorio
simple).
Con cada estimador antes considerado se construyen intervalos de confianza para el total y
proporciones. La tabla siguiente muestra los resultados de la estimacin de la proporcin de
personas que suelen informarse en general de actividades culturales mediante internet.

Tabla 1. Estimacin puntual y por intervalos mediante los distintos mtodos para una
proporcin (en %)

Estimador linear Estimacin LI LS Longitud
HARTLEY 59.06 53.42 64.71 11.29
KALTON-HEN 61.44 55.35 67.53 12.18
SKINNER-RAO 50.54 46.89 54.19 7.30
RAO-WU 51.65 47.63 55.67 8.04
PROPUESTO 50.26 46.76 53.77 7.01

Se observa que los estimadores single frame tienen un buen comportamiento en cuanto a
longitud media y cobertura, y destacando entre ellos el estimador propuesto.

Bibliografa
[1] Bankier, M. D. (1986). Estimators based on several strati_ed samples with applications to
multiple frame surveys. J ournal of the American Statistical Association, 81:1074-1079.
[2] Fuller, W. A. and Burmeister, L. F. (1972). Estimators for samples selected from two
overlapping frames. Proceedings of social science section of The American Statistical
Asociation.
[3] Hartley, H. O. (1962). Multiple frame surveys. In Proceedings of the Social Statistics Section,
American Statistical Association, pages 203-206.
[4] Kalton, G. and Anderson, D. W. (1986). Sampling rare populations. J ournal of the Royal
Statistical Society. Series A (General), 149:65-82.
[5] Lohr, S. L. (2009). Multiple-frame surveys. Handbook of Statistics, 29:71-88.
[6] Lohr, S. L. and Rao, J . N. K. (2000). Inference from dual frame surveys. J ournal of the
American Statistical Association, 95:271-280.
[7] Skinner, C. J . and Rao, J . N. K. (1996). Estimation in dual frame surveys with complex
designs. J ournal of the American Statistical Association, 91:349-356.
[8] Wu, C. and Rao, J . N. K. (2006). Pseudo-empirical likelihood ratio confidence intervals for
complex surveys. Canadian J ournal of Statistics, 34(3):359-375.


DETERMINACIN DE META-QTLS DE RESISTENCIA A LOS
PRINCIPALES PATGENOS DEL TOMATE (Sol anum l ycopersi cum L.)
MEDIANTE ANLISIS IN SILICO
LEANDRO BALZANO-NOGUEIRA
1
, MARA ANGLICA SANTANA
2
,
EMILIO CARBONELL
3
, J . R. DEMEY
1

1
Laboratorio de Biometra y Estadstica, Instituto de Estudios Avanzados IDEA, Caracas,
Venezuela.

2
Departamento de Biologa Celular, Universidad Simn Bolvar, Caracas, Venezuela.

3
Unidad de Biometra, Instituto Valenciano de Investigaciones Agrarias (IVIA). Valencia, Espaa.

jdemey@idea.gob.ve

RESUMEN
El tomate (Solanum lycopersicum L), es un cultivo de gran importancia econmica a nivel
mundial con una produccin anual para el 2011 que super las 159 millones de toneladas. Una
de las limitantes en el aumento de la produccin del cultivo son las enfermedades, siendo
susceptible a ms de 200 patgenos entre los que se incluyen principalmente hongos,
bacterias, virus y nematodos. Uno de los mtodos ms efectivos y perdurables para la
proteccin de un cultivo, es el uso de los mecanismos naturales de defensa desarrollados por la
planta. La seleccin de plantas resistentes se realiza a travs del estudio y deteccin de loci de
rasgos cuantitativos (QTL) para una determinada caracterstica. No obstante, la deteccin de
estos caracteres depender entre otros, de los mtodos de deteccin, las poblaciones utilizadas
y las condiciones ambientales. El meta-anlisis es una herramienta que permite integrar
informacin recopilada de QTL de diferentes estudios para generar mapas consenso de la
ubicacin cromosmica de dichos QTLs. El presente trabajo tuvo como objetivo generar un
mapa consenso de QTLs de resistencia a diversos patgenos, obtenidos a travs del meta-
anlisis. Se utilizaron nueve (9) estudios que reportaron noventa (90) QTL de resistencia a
diversos patgenos, y que permitieron generar un mapa consenso de 24 meta-QTLs de
resistencia. Se encontr que estos meta-QTLs estn distribuidos en todo el genoma del tomate,
y estn relacionados a la resistencia contra Phytophtora infestans (92%), Alternaria solani
(50%), Botrytis cinerea (13%), el Virus del rizado amarillo del tomate (TYLCV) (8%),
Xanthomonas perforans (8%) y Xanthomonas campestris pv. vesicatoria (4%). Los resultados
obtenidos pueden usarse para distinguir plantas con genomas resistentes y contribuir en la
seleccin recurrente de plantas.

Palabras clave: Meta-anlisis, Solanum lycopersicum, QTL, Meta-QTLs, Resistencia.

Introduccin
El tomate (Solanum lycopersicum L.), es un cultivo de gran importancia econmica a nivel
mundial con una produccin anual para el 2011 que super las 159 millones de toneladas
(FAOSTAT, 2013), siendo una de las hortalizas frescas con mayor demanda en el mundo, de ah
la importancia de proteger su produccin del ataque de patgenos. El tomate es susceptible a
ms de 200 patgenos entre los que se incluyen principalmente hongos, bacterias, virus y
nematodos (Foolad, 2007). A pesar de que diferentes estrategias de control de enfermedades


son aplicadas en la prctica como el uso de agroqumicos y plntulas libres de patgenos, la
tcnica con mayor xito es la que involucra los mecanismos de defensa propios de la planta
mantenidos por seleccin recurrente. Estos mtodos de mejoramiento se basan en la obtencin
de resistencia horizontal o polignica que es gobernada por regiones dentro del genoma que
contienen genes asociados con un rasgo cuantitativo en particular, o lo que se conoce como loci
de rasgos cuantitativos (QTL). Los QTLs se pueden detectar por anlisis conjunto de
segregacin genotpica de marcadores genticos y valores fenotpicos de las plantas. La
disponibilidad y versatilidad de marcadores de ADN y mtodos de clculo han generado un
progreso considerable en el mapeo de QTLs en plantas. Pero estos avances tambin han
producido una gran variabilidad en la deteccin del tamao de estas regiones cromosmicas,
asociada entre otras, a: la seleccin y el cruzamiento de lneas parentales que difieren en uno o
ms caracteres cuantitativos; el anlisis de la segregacin de la descendencia para relacionar
cada QTL con un marcador de ADN conocido, o intervalo de marcadores, as como los mtodos
de anlisis (Carbonell et al., 1992; Asns, 2002). En otras palabras, el tamao de la regin
detectada depender no solo de la robustez del anlisis, sino tambin de donde se obtuvo la
informacin. Esta consideracin es importante ya que uno de los objetivos ms relevantes en la
deteccin de QTL es que incluyan la menor cantidad de marcos abiertos de lectura (ORF) para
eliminar el efecto de caractersticas no deseadas. La construccin de mapas consenso de la
ubicacin cromosmica de meta-QTLs obtenidos de la integracin de la informacin recopilada
de diferentes QTLs de distintos estudios para diferentes rasgos, permite la obtencin de
regiones lo suficientemente fiables que puedan ser utilizadas en programas de mejoramiento
integrados o en el estudio de la interacciones entre distintas protenas participantes en los
mecanismos de resistencias a varios patgenos. Por otra parte el meta-anlisis es una
poderosa herramienta para integrar muchos resultados de diferentes trabajos, para obtener
informacin que quizs no sea visible analizando cada trabajo por separado, y permite
normalizar todos los datos de una forma fcilmente comprensible (Goffinet y Gerber, 2000;
Rosenberg et al, 2004; Lanaud et al., 2009). En este trabajo se presenta un mapa consenso por
cromosoma de meta-QTLs relacionados a la resistencia a patgenos de importancia econmica
en el cultivo de Solanum lycopersicum, generado del meta-anlisis de nueve estudios que
reportan la deteccin de QTL individuales asociados a la resistencia del cultivo a Phytophtora
infestans, Alternaria solani, Botrytis cinerea, Virus del rizado amarillo del tomate (TYLCV),
Xanthomonas perforans y Xanthomonas campestris pv. vesicatoria.

Metodologa
Utilizando la base de datos del Science Citation Index Expandex se realiz una bsqueda
hasta septiembre de 2012 de los estudios que reportaban la deteccin de QTL asociados a la
resistencia de S. lycopersicum a: P. infestans; A. solani; B. cinerea; Virus del rizado amarillo del
tomate (TYLCV), X. perforans y X. campestris pv. vesicatoria, respectivamente (Brouwer et al.,
2004; Chaerani et al., 2007; Finkers et al., 2007; Hutton et al., 2010; J i et al., 2009; Robbins et
al., 2009; Smart et al., 2007; Yang et al., 2005; Zhang et al., 2003). Datos de marcadores
genticos, ubicacin del QTL, valores LOD, aditividad, tipo y tamao del cruce, fueron usados
para el meta-anlisis. Para obtener la localizacin exacta de todos los QTLs, se superpuso la
informacin extrada de cada estudio con los mapas de marcadores cromosmicos de las
especies de tomate utilizadas en los cruces empleando como fuente de informacin la base de
datos Solgenomics (http://solgenomics.net/) (Mueller, et al., 2005). El meta-anlisis se realiz en
tres pasos, a saber: (i) se cre el mapa consenso de todos los marcadores genticos; (ii) se
proyectaron todos los QTLs reportados en el mapa consenso utilizando los valores LOD, la
aditividad, el intervalo de confianza y la varianza explicada por el QTL; y (iii) se determin el
valor del meta-QTLs utilizando el mtodo desarrollado por Goffinet y Gerber (2000). El meta-
anlisis fue realizado utilizando el programa BioMercator v3.0 (Sosnowski et al., 2012).



De los nueve estudios se extrajo informacin de noventa (90) QTLs que fueron utilizados para el
meta-anlisis y generaron 24 meta-QTLs distribuidos de la siguiente forma: 4, 2, 1, 2, 1, 3, 1, 1,
2, 2, 3 y 2, para los cromosomas del 1-12, respectivamente. La proporcin de meta-QTLs
relacionados con la resistencia a: P. infestans; A. solani; B. cinerea; Virus del rizado amarillo del
tomate (TYLCV); X. perforans y X. campestris pv. vesicatoria fue de 92%, 50%, 13%, 8%, 8% y
4%, respectivamente. Los resultados obtenidos pueden ser utilizados para distinguir otras lneas
resistentes de S. lycopersicum, contra las patognesis estudiadas, a travs de la deteccin de
estas regiones en sus genomas. La amplitud de los marcos abiertos de lectura dentro de estos
meta-QTLs lejos de ser una desventaja en trminos de precisin, puede estar ofreciendo
informacin integral en el estudio de las interacciones entre distintas protenas participantes en
los mecanismos de resistencia a varios patgenos, utilizando herramientas bioinformticas. Sin
duda, el meta-anlisis es un poderoso mtodo de integracin de datos, sin embargo la mayor
dificultad se encuentra en la unificacin de criterios ya que en todos los estudios no existe
homogeneidad a la hora de reportar la informacin.

Bibliografa
Asns, M. J . (2002). Present and future of quantitative trait locus analysis in plant breeding.
Plant Breeding, 121(4):281-291.
Brouwer, D. J .; Elizabeth S.; J ones, E. S.; Dina A.; St. Clair, D. A. (2004). QTL analysis of
quantitative resistance to Phytophthora infestans (late blight) in tomato and comparisons with
potato. Genome, 47(3):475-492.
Carbonell, E. A.; Gerig, T. M., Balansard, E.; Asns, M. J . (1992). Interval mapping in the
analysis of nonadditive quantitative trait loci. Biometrics, 48:305-315.
Chaerani, R.; Smulders, M. J . M.; van der Linden, C. G.; Vosman, B.: Stam, P.; Voorrips, R. E.
(2007). QTL identification for early blight resistance (Alternaria solani) in a S. lycopersicum x S.
arcanum cross. Theoretical Applied Genetics, 114(3):439-450.
FAOSTAT (2013) Consultada el 22/01/2013 http://faostat3.fao.org/home/index.html.
Finkers, R.; van den Berg, P.; van Berloo, R.; ten Have, A.: van Heusden, A. W.; van Kan, J . A.
L.; Lindhout, P. (2007). Three QTLs for Botrytis cinerea resistance in tomato. Theoretical
Applied Genetics, 114(4):585-593.
Foolad, M. R. (2007). Genome Mapping and Molecular Breeding of Tomato. International
Journal of Plant Genomics, 2007:1-52.
Goffinet, B.; Gerber, S. (2000). Quantitative trait loci: a meta-analysis. Genetics, 155(1):463-
473.
Hutton, S. F.; Scott, J . W.; Yang, W.; Sim, S. C.; Francis, D. M.; J ones, J . B. (2010).
Identification of QTL associated with resistance to bacterial spot race T4 in tomato. Theoretical
Applied Genetics, 121(7):1275-1287.
J i, Y.; Scott, J . W; Schuster, D. J . (2009). Molecular mapping of Ty-4, a new tomato yellow leaf
curl virus resistance locus on chromosome 3 of tomato. J. Amer. Soc. Hort. Sci, 134(2): 281-
288.
Lanaud, C.; Fouet, O.; Clment, D.; Boccara, M.; Risterucci, A. M.; Surujdeo-Maharaj, S.;
Legavre, T,; Argout, X. (2009). "A meta-QTL analysis of disease resistance traits of Theobroma
cacao L". Molecular Breeding, 24:361-374.
Mueller, L. A.; Solow, T. H.; Taylor, N.; Skwarecki, B.; Buels, R.; Binns, J .; Lin, C.; Wright, M. H.;
Ahrens, R.; Wang, Y.; Herbst, E. V.; Keyder, E. R.; Menda, N.; Zamir, D.; Tanksley, S. D. (2005).
The SOL Genomics Network. A Comparative Resource for Solanaceae Biology and Beyond.
Plant Physiol, 138(3):1310-1317.
Robbins, M. D.; Darriques, A.; Sim, S. C.; Masud, M. A. T.; Francis, D. M. (2009).
Characterization of hypersensitive resistance to bacterial spot race T3 (Xanthomonas
perforans) from tomato accession PI 128216. Phytopathology, 99(9):1037-1044.


Rosenberg, M. S.; Garrett, K. A.; Su, Z.; Bowden, R. L. (2004). Meta-Analysis in Plant
Pathology: Synthesizing Research Results. Phytopathology, 94(9):1013-1017.
Smart, C. D.; Tanksley, S. D.; Mayton, H.; Fry, W. E. (2007). Resistance to Phytophthora
infestans in Lycopersicon pennellii. Plant Disease, 91(8):1045-1049.
Sosnowski, O.; Charcosset, A.; J oets, J . (2012). BioMercator V3: an upgrade of genetic map
compilation and QTL meta-analysis algorithms. Bioinformatics, 28(15):2082-2083.
Sol genomics network. Disponible en http://solgenomics.net/. Bsqueda: Septiembre 2012-
Enero 2013.
Yang, W.; Miller, S. A.; Scott, J . W.; J ones, J . B.; Francis, D. M. (2005). Mining tomato genome
sequence databases for molecular markers: Application to bacterial resistance and marker
assisted selection. Acta Horticulturae, 695: 241-250.
Zhang, L. P.; Lin, G. Y.; Nio-Liu, D.; Foolad, M. R. (2003). Mapping QTLs conferring early blight
(Alternaria solani) resistance in a Lycopersicon esculentum L. hirsutum cross by selective
genotyping. Molecular Breeding, 12:3-19.


SELECCIN DE PROTENAS RELACIONADAS A LA RESISTENCIA A
PATGENOS: UN ENFOQUE BIPLOT APLICADO A LA PROTEMICA
COMPARATIVA
LEANDRO BALZANO-NOGUEIRA
1
, MARA ANGLICA SANTANA
2
,
NARDY DIEZ
3
, M. PURIFICACION GALINDO-VILLARDN
4
,
J OS LUIS VICENTE-VILLARDN
4
, J . R. DEMEY
1

1
Laboratorio de Biometra y Estadstica, Instituto de Estudios Avanzados (IDEA). Caracas,
Venezuela.

2
Departamento de Biologa Celular, Universidad Simn Bolvar. Caracas, Venezuela.
3
Laboratorio de Genmica y Protemica, Instituto de Estudios Avanzados (IDEA). Caracas,
Venezuela.

4
Departamento de Estadstica, Universidad de Salamanca. Salamanca, Espaa.

jdemey@idea.gob.ve

RESUMEN
Entre las aplicaciones de la Protemica comparativa esta estudiar la correlacin entre el patrn
de expresin de las protenas y su relacin con la resistencia de los individuos a patgenos. En
los programas de mejoramiento gentico este enfoque ha tenido un gran auge en los aos
recientes, ya que permite la seleccin de individuos resistentes a patgenos usando los
mecanismos de defensa propios de la planta mediante seleccin recurrente. A pesar de la
importancia que implica detectar de un pool de protenas aquellas que estarn asociadas
significativamente a los individuos, o configuracin de estos, que expresan mecanismos de
resistencia a patgenos de inters comercial, en la mayora de las publicaciones relacionadas
con estudios de Protemica comparativa, se siguen utilizando mtodos estadsticos de
modelaje clsico que ataviados a valores de probabilidad seleccionan los individuos lites sin
tener en cuenta la naturaleza de los datos. El presente trabajo propone el uso combinado del
Anlisis de Coordenadas Principales (ACoP), Anlisis de Conglomerados (AC) y el ajuste de un
Biplot Logstico Externo (BLE) para detectar el pool de protenas asociadas a resistencia a
patgenos. Se ilustra la metodologa propuesta a travs de la determinacin de las protenas
relacionadas a la resistencia de granos de Zea mays L. contra el hongo Aspergillus flavus.

Palabras clave: Anlisis de Coordenadas Principales, Anlisis de Conglomerados, Biplot
Logstico Externo, Protemica comparativa, Resistencia a patgenos.

Introduccin
Una de las estrategias de control de enfermedades involucra el estudio de las relaciones entre
las protenas y la resistencia en diversos materiales, permitiendo la seleccin de individuos
lites con mecanismos de defensa propios mantenidos por seleccin recurrente (Dekkers y
Hospital, 2002). Algunos estudios han relacionado la presencia de ciertas protenas con una
actividad insecticida en diferentes rubros agrcolas. La Protemica comparativa es una
herramienta que permite la identificacin masiva de protenas cuya expresin puede ser
relacionada a un fenmeno biolgico (J ames, 1997; Anderson y Anderson, 1998). Pero como en
cualquier problema de modelaje no todas las variables protenas - estarn asociadas
significativamente a la configuracin -efecto deletreo sobre los patgenos de inters. A pesar


de las ventajas de la tcnica, hay aspectos en el anlisis de datos y la seleccin de protenas
relacionadas a resistencia que consideramos incongruentes. Por ejemplo, un error frecuente es
seleccionar todas las protenas con expresin diferencial mayor a dos veces, como relacionadas
a resistencia. Una estrategia que permitir una seleccin adecuada de las protenas es convertir
la respuesta diferencial obtenidas en los geles 2D como una matriz
X
que proviene de la
observacin de
p
atributos o caracteres cualitativos que se asocian a variables binarias que
toman el valor 0 si la protena est ausente y el valor 1 si est presente. Bajo esta premisa en el
presente trabajo se propone el uso combinado del Anlisis de Coordenadas Principales (ACoP),
Anlisis de Conglomerados (AC) y el ajuste de un Biplot Logstico Externo (BLE) sobre las
coordenadas principales (Demey et al., 2008) como mejor va para identificar las protenas que
son responsables de la clasificacin de los hospedadores genotipos- en susceptibles o
resistentes y cuya expresin le brindan algn tipo de ventaja para enfrentar al patgeno. Se
ilustra la metodologa propuesta a travs del anlisis de los patrones de expresin diferencial
entre granos de Zea mays L. inoculados con esporas de Aspergillus flavus, de plantas
consideradas resistentes contra plantas susceptibles.

Metodologa
Utilizando un ensayo KSA (Kernel screening assay), tres rplicas de cuatro proteomas
de lneas lite de maz dos amarillos y dos blancos- fueron inoculadas con Aspergillus
flavus durante 20 horas. Las protenas de los granos fueron extradas empleando dos
tampones de extraccin diferentes, uno cido (pH 2.8) y uno bsico (pH 7.5) (Campo et
al., 2004). Una vez evaluada la integridad de las protenas y conociendo su
concentracin se realizaron los perfiles de expresin de protenas de cada lnea de
maz mediante electroforesis bidimensional. El anlisis del patrn de expresin basado
en el punto isoelctrico y masa molecular permiti la identificacin de 184 y 300 spots
para la extraccin en medio cido y bsico y respectivamente, generando dos matrices
binarias por rplica que toman el valor 0 si el spot est ausente y el valor 1 si el spot
est presente. Las relaciones entre los cuatro proteomas fueron estudiadas usando el
Anlisis de Coordenadas Principales (ACoP), Anlisis de Conglomerados (AC) y el
ajuste de un Biplot Logstico Externo (BLE) sobre datos de disimilitud utilizando los
coeficientes de J accard, Emparejamiento simple, Dice y Rogers y Tanimoto. El
coeficiente de disimilitud que mejor define la estructura de los datos, las medidas de la
calidad, bondad de ajuste y los criterios para la seleccin de variables spots- fueron
calculados utilizando los procedimientos descritos por Demey et al. (2008).

Los valores de correlacin entre las matrices de distancia observada y esperada para diferentes
coeficientes de disimilitud luego de aplicar el Anlisis de Coordenadas Principales (ACoP),
muestran que para las dos primeras dimensiones los valores ms altos fueron de r=0.9970 y
r=0.9974 para la extraccin en medio cido y bsico respectivamente y se obtienen utilizando el
coeficiente de disimilitud de Dice. Este coeficiente indica el mejor agrupamiento de los 4
patrones de expresin de protenas de las lneas infectadas. As, dos lneas con posiciones ms
cercanas en la representacin bidimensional, tendrn patrones ms similares basados en el
punto isoelctrico y masa molecular de los spot identificados. Para los dos mtodos de
extraccin el espacio bidimensional obtenido por ACoP explica ms del 90% de la variabilidad
total. El ajuste del Biplot Logstico Externo (BLE), luego de aplicar acumulativamente los
criterios de correccin descritos por Demey et al. (2008), permiti la seleccin de 40 y 25 spots
para extraccin cida y bsica, respectivamente. La Figura muestra la capacidad discriminatoria
de las primeras dos dimensiones permitiendo la formacin de 4 grupos principales. La distancia


entre grupos describe la desigualdad entre las lneas de maz y los 65 spots corresponden a
protenas candidatas que contribuyen en mayor medida con la capacidad de resistencia de los
granos de maz contra Aspergillus flavus. La bondad de ajuste global -como un porcentaje de
correcta clasificacin- despus de ajustar el BLE fue mayor al 99% en ambos mtodos de
extraccin. La metodologa propuesta permite la seleccin de protenas candidatas a ser
marcadores de resistencia, favorece el estudio simultneo de las relaciones entre individuos
lneas-, individuos-variables spots- y variables-variables, incrementando la cantidad y calidad
de la informacin sobre los mtodos clsicos utilizados para clasificar individuos usando
Protemica comparativa. Adicionalmente, representa una disminucin considerable de los
costos operativos de la tcnica ya que solo debern identificarse por anlisis de sus relaciones
masa/carga, obtenidas a travs de la espectrometra de masas, aquellos spots que han sido
seleccionados del anlisis. En este caso, del total de 484 spots identificados, solo debern
estudiarse por espectrometra de masas 65 de los spots, que representan menos del 15% del
total.

Bibliografa
[1]. Anderson, N. L.; Anderson, N. G. (1998). Proteome and proteomics: new technologies, new
concepts, and new words. Electrophoresis, 19(11):1853-1861.
[2]. Campo, S.; Carrascal, M.; Coca, M.; Abin, J .; San Segundo, B. (2004). The defense
response of germinating maize embryos against fungal infection: A proteomics approach.
Proteomics, 4:383-396.
[3]. Dekkers, J . C. M.; Hospital, F. (2002). The use of molecular genetics in the improvement of
agricultural populations. Nature reviews genetics, 3(1):22-32.
[4]. Demey, J . R.; Vicente-Villardn, J . L.; Galindo-Villardn, M. P.; Zambrano, A. Y. (2008).
Identifying molecular markers associated with classification of genotypes by External
Logistic Biplots. Bioinformatics, 24(24):2832-2838.
[5]. J ames, P. (1997). Protein identification in the post-genome era: the rapid rise of
proteomics. Q. Rev. Biophys, 30(4):279-331.


CONSTRUCCION DE ENVELOPES PARA EVALUAR EL AJUSTE DE
MODELOS DE CONTEOS INFLADOS EN CEROS Y SU APLICACIN AL
CONTEO DE UNA ESPECIE DE AVE ANTRTICA
ALDERETE, M.
1
, LENCINA, V.B.
2
, DEMETRIO, C.
3
, SINGER, J .
4
Y ORGEIRA J .L
1,5

1
Facultad de Ciencias Naturales e IML, UNT, Argentina

2
Facultad de Ciencias Econmicas, UNT/CONICET, Argentina

3
Departamento de Estatstica, ESALQ, USP, Brasil

4
Departamento de Estatstica, IME, USP, Brasil

5
Instituto Antrtico Argentino, Argentina

almariela@yahoo.com.ar

RESUMEN
Un paso importante en el anlisis de cualquier tipo de regresin es la comprobacin de posibles
desviaciones de los supuestos para el modelo ajustado. La construccin de envelopes se
origin con el objetivo de estudiar la distribucin de los residuos de la regresin en el modelo
lineal normal y en los lineales generalizados (MLGs). Los envelopes tambin permiten evaluar
grficamente si el modelo se ajusta bien a los datos aunque la distribucin de los residuos diste
de la distribucin normal, como sucede en algunos MLGs. El objetivo del trabajo es la
construccin de envelopes para los residuos en modelos de regresin inflados en ceros,
obtenidos mediante la simulacin de residuos generados a partir del modelo ajustado. Estos
envelopes permiten comparar los residuos observados con aquellos que se obtendran si el
modelo ajustado es vlido. La tcnica propuesta se aplica para evaluar el ajuste de un modelo
regresin binomial negativo inflado en ceros para el conteo de la especie Petrel de las
tormentas (Oceanites oceanicus) en funcin de variables ambientales.

Palabras clave: envelopes, binomial negativa, inflado en cero, modelos de conteo.

Introduccin
Al realizar el ajuste de cualquier tipo de regresin es importante la comprobacin de posibles
desviaciones de los supuestos para el modelo, tanto para el componente aleatorio como para su
componente sistemtica. Esta etapa debe realizarse cada vez que se ajusta un modelo puesto
que permite identificar situaciones que pueden afectar notablemente la inferencia.
Atkinson (1981) propone la construccin, mediante simulacin de Monte Carlo, de una banda de
confianza para los residuos de una regresin normal estndar lo que permite una mejor
comparacin entre los residuos y los percentiles de la distribucin normal estndar. Williams
(1987) extiende la construccin de estas bandas a modelos lineales generalizados (MLGs).
Paula (1995) proporciona una forma estandarizada para la componente del desvo en MLGs
con restricciones en los parmetros y verifica a travs de estudios de simulacin una alta
concordancia entre la distribucin emprica del residuo estandarizado de los modelos
propuestos y la distribucin normal estndar.
Los modelos de regresin Poisson y binomial negativa son empleados tradicionalmente cuando
la variable respuesta es de conteo; siendo que particularmente se recurre a la binomial negativa
en presencia de sobredispersin. Con el trabajo de Ridout, Demtrio y Hinde (1998) se ha
ampliado el uso de estos modelos a situaciones donde la presencia de ceros es mayor a la


esperada por el modelo de conteo (Poisson o binomial negativo) mediante la suposicin de que
la muestra en realidad es una mezcla de dos grupos de individuos, un grupo cuyo conteo
proviene de una distribucin Poisson o Binomial negativa, y otro grupo (llamado el grupo del
cero absoluto) cuya probabilidad de presentar conteos superiores a cero es nula.
La presencia de demasiados ceros ha sido una caracterstica comn en el conteo a borde de
buques de diversas aves marinas en la Antrtida. Resulta de inters el estudiar estas aves
debido su sensibilidad ante cambios ambientales como el calentamiento de los ocanos
antrticos y la consecuente reduccin de hielo. Los incrementos de temperatura registrados en
el norte de Antrtida se encuentran entre los mayores de todo el planeta y se ha demostrado
que desde la dcada de 1950 estos incrementos han sido sostenidos (Zazulie et al. 2010). Ello
tiene consecuencias directas sobre la disponibilidad y abundancias de plancton, en particular el
krill antrtico (Euphausia superba); alimento principal de varias especies de aves antrticas
consideradas predadores tope. El Petrel de las tormentas (OOCE) presenta una distribucin en
el mar fuertemente condicionada por la presencia de hielo, ya que se alimenta en las interfases
hielo-agua las cuales albergan una importante comunidad planctnica (Orgeira 2002). Por lo
tanto, cambios en las variables ambientales pueden influenciar en las abundancias de esta
especie. As, los estudios de monitoreos de esta ave marina a largo plazo representan una
forma directa e indirecta de evaluar los cambios en dicho ecosistema.

Desarrollo
En la construccin de los envelopes para los residuos de MLG desarrollada en Paula (2012) se
simulan muestras obtenidas a partir del modelo ajustado. En este trabajo se utiliz la misma
idea, simulando muestras de la binomial negativa inflada en cero. La distribucin de
probabilidad en trminos de funciones de probabilidad (f) para un modelo ZINB es:
>
=
|
|
.
|
\
|
+
+
=
0 ) ( ) 1 (
0 ) 1 (
) (
i i NB i
i
k
i
i i
i
y si y f
y si
k
k
y f

donde fNB(y) corresponde a la funcin de distribucin de probabilidad de la binomial negativa. El
nmero de respuestas nulas ajenas al conteo (falsos ceros) sigue una distribucin binomial con
probabilidad i, La respuesta resultado del conteo sigue una distribucin binomial negativa con
media i y parmetro de sobredispersin k. En el modelo ZINB se modelan de forma lineal las
siguientes funciones de i, y i:
i q
X
q
i
X
e
i
+ + +
=

......
1 1
y
i q
Z
q
i
Z
e
i q
Z
q
i
Z
e
i
+ +
+
+ +
=

........
1 1
1
..........
1 1

Con X y Z se pretende destacar que las covariables involucradas en el modelado de ambos
parmetros no necesariamente deben coincidir.
En la construccin de los envelopes se trabaj con los residuos Pearson ya que los modelos
inflados en ceros presentan distribuciones mixtas por lo que es difcil obtener otro tipo de
residuo. Los residuos de Pearson (ri) se obtienen como ri =
) var(
) 1 (
i
i i i
Y
Y

Los envelopes se aplicaron a la regresin binomial negativa inflada en cero para explicar la
abundancia del Petrel de las tormentas. Los datos fueron obtenidos por medio de censos de
aves a bordo del buque Puerto Deseado (enero a marzo de 2011, n =249) en el Mar de Scotia
(Anttida, cuadrante geogrfico: 59 a 63 S y l 40 a 49 W). La metodologa de censos de
aves es una adaptacin de la propuesta por Tasker et al. (1984), que consiste de censos de 10


min de duracin seguidos de un intervalo de otros 10 min descanso. Los conteos fueron
realizados por un solo observador. Para cada conteo se registr: velocidad de buque (VB,
nudos), temperatura superficial del mar (TSM, C), estado fsico de la superficie del mar (escala
Beaufort), distancia a tierra (DTIE, millas nuticas), visibilidad (categrica ordinal), % de hielo en
superficie de mar, tipo de hielo: a) tabulares/tmpanos (masas de hielo de origen continental) y
b) escombros (restos de hielo de no mayores a 2 m de largo aproximadamente). Los envelopes
fueron construidos usando el software R y funciones adicionales construidas para tal fin (R
Development Core Team, 2005).

Se aplic la metodologa antes descripta para la construccin de envelopes donde el Grfico 1
muestra que un modelo binomial negativo inflado en ceros ajusta mejor que uno sin inflado en
ceros para medir los cambios de la abundancia de Petrel de las tormentas, OOCE, durante la
temporada 2011 en Mar de Scotia.
Se trabaj con el modelo binomial negativo y binomial negativo inflado en cero. Ambos modelos
fueron considerados con las mismas covariables seleccionadas (temperatura del mar, distancia
a tierra, estado del mar). Pero en la parte logit del modelo inflado en ceros se colocaron
temperatura del mar y visibilidad. La significancia de los coeficientes vara en cada modelo,
incluido su interpretacin. Por lo tanto, observando los envelopes, se selecciona aquel modelo
que presente el mejor ajuste a los datos observados tenindose en cuenta la interpretacin
biolgica del mismo y en este caso, corresponde a un modelo ZINB.

a ) b) b)

Grfico 1: Bandas del 95% de confianza para los residuos Pearson estandarizados de los ajustes de los modelos (a)
binomial negativa y (b) Binomial Negativa inflada en ceros para la abundancia de OOCE (2011).
La construccin de envelopes propuesta en este trabajo es una herramienta de diagnstico til
para evaluar el ajuste realizado por medio de ZINB y los cambios observados en las
abundancias de OOCE con respecto a variables ambientales.

Bibliografa
[1] Atkinson, A. C. (1981). Two graphical display for outlying and influential observations in
regresin. Biometrika, 68: 13-20.
[2] Hinde, J . e Demtrio, C. G. B (1998). Overdispersion: model and estimation. Computational
Statistics and Data Analysis, 27: 151-170.
[3] Orgeira, J . L. (2002). Ecologa y distribucin de aves antrticas. Tesis Doctoral. Fac. Cs.
Nat. e IML, Universidad Nac. de Tucumn.
[4] Paula, G. A. (1995). Influence and residuals in restricted generalized linear Models. Journal


of Statistical Computation and Simulation, 51: 315-352.
[5] Paula, G.A. (2012). Modelos de regressao com apoio computacional. Instituto de
Matemtica e Estadstica, Universidade de So Paulo. Brasil.
[6] Tasker, M. L.; P. H. J ones; T. Dixon & B. F. Blake. (1984). Counting seabirds at sea from
ships: a review of methods employed and a suggestion for a standardized approach. Auk, 101:
567-577.
[7] Zazulie, N., M. Rusticucci and S. Solomon. (2010). Changes in climate at High Southern
Latitudes: A unique daily record at Orcadas Spanning 1903-2008. American Meteorological
Society, 23: 189-196.



ANLISIS ESPACIO-TEMPORAL DEL CRECIMIENTO Y MORTALIDAD
EN UN BOSQUE ADULTO EN EL CENTRO-SUR DE CHILE

Christian Salas
1
, Pablo Donoso
2
, Daniel Soto
3
, Horacio Gilabert
4
, Marcelo Miranda
4

1
Laboratorio de Anlisis Cuantitativo de Recursos Naturales, Departamento de Ciencias
Forestales, Universidad de La Frontera, Temuco, Chile.

2
Facultad de Ciencias Forestales, Universidad Austral de Chile, Valdivia, Chile.

3
Department of Forest Ecosystems and Society, Oregon State University, Corvallis, OR, USA.

4
Departamento de Ecosistemas y Medio Ambiente, Pontifica Universidad Catlica de Chile,
Santiago, Chile.

christian.salas@ufrontera.cl

RESUMEN
El crecimiento y mortalidad a nivel de rbol individual y agregado de los bosques es slo posible
de ser evaluado mediante unidades de muestreo permanentes que son costosas de mantener y
adems existen en una baja cantidad. Esto se ve adems acentuado para bosques adultos
nativos en Chile, ya que estos son muy escasos debido al alto grado de intervencin antrpica.
En este contexto el anlisis de datos provenientes de unidades de muestreo permanente
requiere la aplicacin y desarrollo de modelos estadsticos que contribuyan a entender los
patrones espaciales y temporales del crecimiento y la mortalidad de rboles en ecosistemas
forestales. En la presente investigacin se realiza un anlisis espacial de datos de crecimiento
en dimetro y mortalidad de rboles de un bosque nativo adulto multiespecfico y multieataneo.
En base a datos medidos en dos ocasiones para un set de 10 unidades muestrales
permanentes establecidas hace 10 aos en un bosque adulto cercano a la ciudad de Temuco
en el centro-sur de Chile, se calcularon los incrementos peridicos anuales en dimetro para los
rboles vivos y se evalu la mortalidad. Se analizaron los patrones de distribucin espacial de la
mortalidad del periodo mediante la funcin de Ripley, y la asociacin espacial de la mortalidad
entre grupos de rboles (e.g., por especies) mediante la variante bivariada de la funcin de
Ripley. Se ajustaron diferentes modelos de semivariogramas para evaluar la autocorrelacin
espacial del crecimiento diametral de los rboles. Los resultados preliminares indican diferentes
patrones entre grupos de anlisis (i.e., especies tolerantes e intolerantes a la sombra).

Palabras clave: patrones espaciales, semivariogramas, crecimiento diametral.

Introduccin
El establecimiento y remedicin de unidades de muestreo (i.e., parcelas) permanentes (UMP)
constituyen la base de informacin necesaria para monitorear y evaluar los cambios que los
bosques tienen a travs del tiempo. Mediante este monitoreo es posible inferir la dinmica de
los bosques, evaluar la respuesta de stos a diferentes tratamientos silviculturales y
fundamentalmente poder analizar cuantitativamente y as tambin cualitativamente su
desarrollo. Todos estos aspectos son claves para poder: entender de mejor manera la dinmica
de los ecosistemas forestales; proponer tratamientos silviculturales que garanticen la
sustentabilidad de estos; as como para poder planificar diferentes acciones de manejo.
El presente estudio tiene por objetivo analizar los patrones espacio-temporales del crecimiento
en dimetro y la mortalidad de rboles en un ecosistema relicto boscoso nativo ubicado en el
centro-sur de Chile.


Desarrollo
Los datos empleados provienen de mediciones realizadas sobre la base de 10 unidades de
muestreo permanentes (UMP) establecidas en un bosque relicto adulto multietaneo dominado
por las especies arboreas Nothofagus obliqua (roble), Aextoxicum punctatum (olivillo) y
Eucryphia cordifolia (ulmo), entre otras, en las cercanas de Temuco, en el centro-sur de Chile.
Las mediciones se realizaron en los aos 2003 y 2012, siendo las nicas de su tipo disponibles
en Chile para este tipo de bosque. La figura 1 muestra la ubicacin de los rboles vivos dentro
de una unidad de muestreo permanente.

Figura 1: Ubicacin espacial de individuos arbreos en una unidad de muestreo permanente de
1 hectrea ha para (a) todas las especies, (b) A. punctatum, (c) N. obliqua, (d) L. philippiana, (e)
rboles dominantes, y (f) rboles muertos en pie. Los crculos representan el tamao de los
rboles, basados en su dimetro del fuste.
Luego de un exhaustivo proceso de validacin de los datos temporales y espaciales (i.e., se
conoce la posicin cartesiana de cada individuo vivo y muerto en pie), se estimaron las
variables: altura para aquellos rboles no muestras mediante modelos no-lineales ajustados en
el presente estudio, y el volumen mediante modelos especie-especficos ajustados por Salas
(2002). Posteriormente, se estimaron las variables de estado de rodal: densidad (TPH), rea
basal (BA), dimetro medio cuadrtico (QMD), altura media (Hmed) y volumen bruto total (VHA)
para cada una de las unidades muestrales, tanto para el tiempo inicial (t0) y as como para el
tiempo final (t1) del periodo evaluado. Empleando estas variables, se calcul el incremento
peridico anual (IPA) de cada variable de estado de rodal, la mortalidad (empleando la formula
de inters compuesto), y as tambin el IPA del dimetro a nivel individual.


Se realizaron anlisis espaciales mediante el ajuste de la funcin de Ripley (Ripley 1976, 1981)
para examinar los patrones de distribucin espacial. Dichos patrones fueron evaluadas para
cada ao para todas las especies, ya que otras segregaciones fueron mostradas por Salas et.
al. (2006). As tambin se ajustaron: modelos de interpolacin inversa espacial para el IPA en
dimetro individual, modelos de Kernel Gaussianos, y de semivariogramas (i.e., exponencial,
esfricos, Gaussiano, Schabenberger y Pierce 2002) para la misma variable empleando
diferentes configuraciones de grupos a comparar.

Los incrementos peridicos anuales para cada variable de estado de rodal, muestra una alta
variabilidad de la densidad y el volumen, as como los altsimos volmenes que estos bosques
adultos relictos pueden acumular.
El ajuste de la funcin de Ripley mostr para la mayora de los casos un patrn de distribucin
agrupado (Figura 2), empleando el modelo ajustado con todas las especies.
En la figura 3 se muestra el resultado de un ajuste de un modelo de interpolacin de inverso de
la distancia para el dimetro, para dos grupos ecolgicos, i.e., rboles dominantes y rboles
muertos en pie.

Figura 3: Interpolacin inversa a la distancia para el dimetro de rboles dominantes (e) y
muertos en pie (f).

Bibliografa
Ripley BD. (1976). The second-order analysis of stationary processes. J ournal of Applied
Probability 13:255-266.
Ripley BD. (1981). Spatial Statistics. J ohn Wiley & Sons. 252 p.


Salas C, V LeMay, P Nez, P Pacheco, A Espinosa. (2006). Spatial patterns in an old-growth
Nothofagus obliqua forest in south-central Chile. Forest Ecology and Management 231(1-3):38
46.
Schabenberger, O., & Pierce, F. J . (2002). Contemporary statistical models for the plant and soil
sciences. Boca Raton, FL, USA: CRC Press 738 p.
Salas C. (2002). Ajuste y validacin de ecuaciones de volumen para un relicto del bosque de
roble-laurel-lingue. Bosque 23(2):8192.


CONFERENCIAS



BIOMETRA Y GENTICA:
ANLISIS MULTIVARIADO A TRES MODOS PARA LA
CARACTERIZACIN DE RECURSOS FITOGENTICOS

SERGIO J. BRAMARDI

Facultad de Ciencias Agrarias y Forestales, Universidad Nacional de la Plata
Facultad de Ciencias Agrarias, Universidad Nacional del Comahue

bramardi@arnet.com.ar

RESUMEN

La interpretacin de datos genticos ha constituido, desde la publicacin de los
experimentos fundacionales de Gregor Mendel en 1866, un estmulo para la propuesta,
desarrollo y adaptacin de teoras y tcnicas estadsticas. Las disciplinas Gentica y
Biometra, han evolucionado conjuntamente durante el siglo XX y afrontan desde el
comienzo del siglo XXI, nuevos desafos en el anlisis de datos. En particular, la evaluacin
de Recursos Fitogenticos conservados en Bancos de Germoplasma, constituye una
instancia crtica para su aprovechamiento por parte de los genetistas en la bsqueda de
material para procesos de mejoramiento vegetal. Se presentan cuatro etapas claves en un
proceso de caracterizacin de un Banco de Germoplasma en el cual los mtodos clsicos
de Anlisis Multivariado que trabajan con matrices de Individuos por Variables, esto es con
datos de "dos vas o dos modos de orden n x p, cuyas filas y columnas recogen los datos
de n individuos y p variables respectivamente, ya no son suficientes para explorar la
estructura de estos cuerpos de datos. Estas instancias se presentan: (i) en el estudio de
descriptores fenotpicos morfolgicos y agronmicos sobre los que es factible la influencia
de factores ambientales que obliga que el registro de caracteres deba repetirse en el tiempo
y en distintos ambientes; (ii) en la caracterizacin conjunta de caracteres agro-morfolgicos
y moleculares; (iii) en la unificacin en un solo anlisis de los resultados provenientes de
diferentes ensayos de caracterizacin en los que se subdivide el material de un banco de
germoplasma, generalmente en el orden de los miles, para que sea manejable
experimentalmente; y por ltimo, (iv) al momento de querer establecer relaciones entre la
caracterizacin del material vegetal y el lugar geogrfico y/o ecolgico-ambiental del que
provienen. En todas estas situaciones, las observaciones de las variables han sido hechas
bajo distintas modalidades o momentos en el tiempo o espacio, es decir, en q distintas
condiciones, originndose lo que se denominan datos de tres modos. En algunos casos se
tiene para cada situacin o momento una tabla de datos de dos vas, por consiguiente la
informacin se puede representar mediante q matrices de orden n x p, como tambin es
posible concentrar la informacin proveniente de las diferentes tablas en una nica matriz de
orden n x p x q donde cada elemento representa la observacin originada por tres modos
totalmente cruzados: individuos, variables y condiciones; constituyendo una matriz cbica o
tabla de tres entradas, cuyo elemento genrico es {x
ijk
} con i = 1 ,..., n; j = 1 ,..., p y k = 1 , ...,
q, en estos casos los datos de tres modos reciben la denominacin Datos de Tres Vas
(Three Way Data). Por otro lado uno de los modos puede estar compuesto por distintos
conjuntos, por ejemplo que en cada condicin se registren diferentes variables a los mismos


individuos, o bien que en cada condicin se midan las mismas variables a diferentes grupos
de individuos. Estas estructuras reciben el nombre de Datos de Conjuntos Mltiples
(Multiway Set of Data). El modo extra en el diseo requiere una extensin de las tcnicas
clsicas para su anlisis. Es posible por supuesto, moldear los datos en el formato sencillo
dos vas o dos modos", re-acomodndolos en matrices rectangulares, pero esto implica
perder una parte de la informacin que podra ser muy importante para entender la
organizacin de los datos como un todo. La problemtica del anlisis de este tipo de datos
se ha afrontado desde dos escuelas diferenciadas. Por un lado la escuela francesa con el
mtodo Statis (Structuration de Tableaux A Trois Indices de la Statisque), el Anlisis
Factorial Mltiple y los Meta Biplot por citar los ms representativos. Por otro lado, en el
mbito de la escuela anglosajona nos encontramos con el Anlisis de Componentes
Principales a tres modos y Anlisis de Procrustes Generalizado como sus principales
exponentes. Los fundamentos tericos de estos mtodos son dismiles, as como sus
propiedades matemticas y procedimiento para su aplicacin. Sin embargo, casi todos
presentan una etapa de anlisis de las interrelaciones de los tres modos o vas, para luego,
culminar el tratamiento de los datos con alguna forma de construccin de una estructura de
consenso o compromiso de los individuos. Para la obtencin de esta configuracin consenso
la mayora de los mtodos se basan en la descomposicin en valores singulares (DVS) de
una tabla rectangular de datos. Algunos utilizan la DVS de Dos Vas yuxtaponiendo o
colapsando las matrices iniciales ponderadas y tratndolas como si fueran de dos modos,
este es el caso del mtodo Statis y Anlisis Factorial Mltiple. Otros mtodos recurren a una
DVS de Dos Vas en cada una de las q tablas iniciales e integran las configuraciones
resultantes, como por ejemplo los Meta-Biplot. Por ltimo estn los mtodos que utilizan la
DVS de Tres Vas, concatenando las matrices de productos cruzados correspondientes a las
configuraciones iniciales, como ejemplo clsico de esta metodologa se puede mencionar el
Anlisis de Componentes Principales a tres vas. El Anlisis de Procrustes Generalizado,
merece una mencin aparte, ya que es una tcnica enteramente geomtrica que propone la
armonizacin de diferentes configuraciones de un mismo conjunto de individuos a travs de
una serie de pasos iterativos que incluyen traslacin, rotacin y escalamientos de los datos
bajo dos criterios: que se mantengan las distancias entre individuos en las configuraciones
originales y que se minimice la suma de cuadrados entre puntos anlogos, es decir,
correspondientes al mismo elemento, y su centroide. En la presente exposicin se realizar
un raconto de estas tcnicas aplicadas al tratamiento de datos empricos y simulados
correspondientes a caracterizacin de Recursos Fitogenticos en Bancos de Germoplasma,
comparndolas con las tcnicas clsicas utilizadas por los genetistas y resaltando sus
virtudes y desventajas.

Palabras claves: banco de germoplasma, anlisis de datos a tres vas, datos de
conjuntos mltiples, interaccin genotipo-ambiente, caracteres agronmicos y
moleculares.



FORMULATING MIXED MODELS FOR EXPERIMENTS, INCLUDING
LONGITUDINAL EXPERIMENTS

Chris Brien
1
and Clarice Demtrio
2

1
School of Mathematics and Statistics, University of South Australia, Australia

2
Departmento de Cincias Exatas, ESALQ, Universidade de So Paulo, Brasil

Mixed models have become important in analyzing the results of experiments, particularly
those that require more complicated models such as those that involve longitudinal data. A
method for deriving the terms in a mixed model, described by Brien and Demtrio (2009) [J.
Agric. Biol. and Env. Stat., 14, 253-80] will be presented. It extends the method described by
Brien and Bailey [J. Roy. Stat. Soc., Series B, 68 (2006): 571-609] to explicitly identify terms
for which autocorrelation and smooth trend, arising from longitudinal observations, needs to
be incorporated in the model. At the same time we retain the principle that the model used
should include, at least, all the terms that are justified by the randomization. This is done by
dividing the factors into sets, called tiers, based on the randomization and determining the
nesting and crossing relationships between factors.

To illustrate the method, a mixed model for the randomized complete block design with
longitudinal observations is outlined. The mixed model analysis of data from a three-phase
experiment to investigate the effect of time of refinement on Eucalyptus pulp from four
different sources is also described. For this example, cubic smoothing splines are used to
describe differences in the trend over time and unstructured covariance matrices between
times are found to be justified.


CONSUMO DE ALIMENTOS SUSTENTABLES. DESAFOS PARA LA
MEDICIN DE ATRIBUTOS DE CALIDAD Y POSICIONAMIENTO EN
EL MERCADO

ELSA M. RODRIGUZ

Facultad de Ciencias Econmicas y Sociales-Universidad Nacional de Mar del Plata,
Argentina

emrodri@mdp.edu.ar

RESUMEN
La interaccin de aspectos socio-econmicos con los agronmicos y estadsticos cada vez
ms orientados al anlisis del desarrollo de tecnologas de bajo impacto ambiental, permiten
valorar los posibles retornos econmicos a obtener por estas producciones sustentables
(Rodrguez et al.; 2010, 2011). Los agentes comercializadores privados y los organismos
pblicos muestran un inters en conocer las respuestas de los consumidores a la
informacin que debera presentarse de los productos, debido a la incorporacin de atributos
por procesos productivos de bajo impacto ambiental y comercializados en los mercados.
Esta informacin resulta relevante al sector privado de la produccin para disear
estrategias de venta y al sector pblico para incrementar la efectividad de programas de
investigacin (INTA, Universidades, CONICET), programas de salud y polticas de control y
certificacin de calidad de los alimentos.
El principal desafo y contribucin al conocimiento cientfico se deriva de la combinacin y
aplicacin de los anlisis sensoriales -que se realizan para evaluar las propiedades
intrnsecas de los alimentos frescos- con las metodologas cualitativas y cuantitativas de la
Economa Experimental para el estudio de las percepciones y valoraciones de los
consumidores de alimentos sustentables.
La conferencia se centrar en la captacin de los principales factores que influyen en el
conocimiento que los consumidores tienen sobre alimentos producidos de manera
sustentable, lo que implica la rigurosidad del diseo de todo el proceso de indagacin. Se
presentarn metodologas economtricas/estadsticas a aplicar para la correcta
especificacin de modelos que permitan una ajustada estimacin de la utilidad que el
consumidor deriva de los atributos de alimentos de calidad diferenciada, de su disposicin a
aceptarlos y de su disposicin a pagar un sobreprecio por los mismos. De esta manera, se
expondrn los aspectos fundamentales de metodologas tales como Valuacin Contingente,
Choice Modelling y Subasta Experimental.

Bibliografa
Greene, W. (2000): Econometric analysis., 4ta. edicin, Prentice-Hall International, New
Jersey- USA..
Hanemann, W. (1984): Welfare evaluations in Contingent Valuation Experiments with
Discrete Responses. American Journal of Agricultural Economics, 66(3): 332-341.
Heckman, J. (1979): Sample selection bias as a specification error. Econometrica, 47, 153-
161.
Hensher, D. A.; Rose, J. M. & Greene, W. H. (2007): Applied Choice Analysis. A primer.
Cambridge University Press, New York.
Lancaster, K. (1966): A new approach to consumer theory. Journal of Political Economy,
74(2): 132-157.
Louviere, J. J.; Hensher, D. A. & Swait, J. D. (2000): Stated Choice Methods. Analysis and
applications. Cambridge University Press, New York.


Lupn, B. & Rodrguez, E. (2011): Quality attributes and socio-demographic factors affecting
channel choices when buying fresh potatoes in Argentina. The IAAE Triennial Conference,
Foz do Iguau-Brazil, August 2012.
Marschak, J. (1960): Binary choice constraints on random utility indication. K. Arrow (Ed.)
Stanford Symposium on Mathematical Methods in Social Sciences, CA: Stanford University
Press, Stanford.
McFadden, D. (1974): Conditional logit analysis of qualitative choice behavior. In P.
Zarembka (ed.), Frontiers in Econometrics, Academic Press, New York, 105-142.
Rodrguez, E.; Lacaze, V.; Lupn, B. & Gonzlez, J. (2010): Alimentos diferenciados por
atributos de producto y de procesos: una experiencia de investigacin socio-econmica
integrada a los aspectos agronmicos. Mini Conferencia Latinoamericana de Economa
Agrcola, AAEA, Ciudad de San Luis, octubre 2010.
Rodrguez, E.; Lupn, B. & Lacaze, V. (2011): Consumers perceptions about food quality
attributes and their incidence in Argentinean organic choices. Journal of Agricultural Science
and Technology A, Vol. 1, N 3, July 2011, 375-385, David Publishing Company.
Rodrguez, E.; Lupn, B. & Lacaze, V. (2009): Willingness to pay for organic food in
Argentina: evidence from a consumer survey. International Marketing and trade of quality
food products, Edited by Mauricio Canavari, Incola Cantore, Alexandra Castellini, Erika
Pignatti y Roberta Spadoni; Wageningen Academic Publishers, Part 3, 297-314,
Train, K. E. (2009): Discrete Choice Methods with simulation. Cambridge University Press,
2
nd


PARAMETRIC AND NON-PARAMETRIC MIXED MODELS FOR
DISEASE INCIDENCE AND SEVERITY: MODELIND PLANT DISEASES
IN TROPICAL CROPS.
RAL MACCHIVELLI
College of Agricultural Sciences, University of Puerto Rico, Mayagez, Puerto Rico
raul.macchiavelli@upr.edu

RESUMEN
Progress curves are used in plant disease epidemiology to describe temporal changes in the
proportion of diseased plants (disease incidence) or in the proportion of diseased plant
material (disease severity). Models typically used are intrinsically nonlinear and are derived
from differential equations representing characteristics of the epidemics. There are other
cases in which no clear non-linear model occurs, but still the disease progress curves need
to be characterized and compared. In both cases the observations are taken longitudinally on
the same unit (for example, the plant or the plot). Data are binary, proportions based on an
integer denominator, or real numbers in (0, 1). Mixed models can accommodate all these
features, since they implicitly incorporate correlation between longitudinal observations, and
can be applied with different distributions. Since the full likelihood is specified, likelihood
based inference can be applied and both unit specific and marginal inference are available.
In this paper we fit non-linear mixed models to describe disease incidence progress curves of
papaya ring spot virus in papaya and non-parametric (splines) models to compare disease
severity curves of black Sigatoka (caused by the fungus Mycosphaerella fijiensis) in banana
under different treatments. We compare the results of fitting these mixed models, discuss
alternatives to conduct marginal inference to estimate curves of interest, and interpret the
results in the analyzed examples.
Palabras clave: binary data, logistic-normal, marginal models, subject specific
models.



RECIENTES DESARROLLOS EN ANLISIS DE TABLAS DE TRES
VIAS: DEL COSTATIS al COTUCKER

M PURIFICACIN GALINDO-VILLARDN

Departamento de Estadstica Universidad de Salamanca. Salamanca (Espaa)

pgalindo@usal.es

RESUMEN
En este trabajo se presentan, en un marco comn, los principales desarrollos del
STATIS/DUAL-STATIS (LHERMIER DES PLANTES, 1976): X-STATIS (JAFFRENOU,
1978), COVSTATIS (THIOULOUSE, 2011), DISTATIS, (ABDI y col, 2007), Power-STATIS
(BENASSENI & BENNANI-DOSSE, 2012); CANOSTATIS (VALLEJO-ARBOLEDA y col
2007), k+1 STATIS (SAUZAY y col, 2006), DO-ACT (VIVIEN & SABATIER, 2004); STATIS-
4 (SABATIER y VIVEN, 2008); STATICO (THIOULOUSE, y col, 2004), COSTATIS
(THIOULOUSE, 2011), etc, y se realiza un estudio comparado poniendo de manifiesto
ventajas e inconvenientes en cada caso. As mismo se presentan mtodos alternativos al
STATIS que superan muchas de sus limitaciones, concretamente el AFM (ESCOFIER &
PAGES, 1988), el METABIPLOT (MARTN-RODRIGUEZ, et al., 2002),TUCKER3
(TUCKER, 1966) y COTUCKER (MENDES, 2011; MENDES, et al., 2013)

Palabras clave: STATIS, PTA, AFM, METABIPLOT, STATIS-4, DISTATIS, COVSTATIS, power-STATIS,
t+1 STATIS, DO-ACT, CANOSTATIS, TUCKER3, COSTATIS, STATICO, COTUCKER.

Introduccin
En Anlisis multivariantes estndar los datos se colocan en una matriz de dos vas
(individuos x variables, por ejemplo). En este caso los datos pueden ser indexados por dos
indices, uno referido al individuo y el otro para identificar la variable. Sin embargo, muchos
datos tienen estructura de tres vas, por ejemplo, cada individuo es considerado en
diferentes tiempos o condiciones. En este caso los datos son indexados con tres ndices.
(Three way data). Los anlisis multi-va son la extensin natural de los anlisis
multivariantes standard cuando los datos estn colocados en matrices de tres o ms vas.
STATIS, una extensin del Anlisis de Componentes Principales, es un mtodo para
analizar tablas de tres entradas que consideran varios conjuntos de variables sobre los
mismos individuos, o bien, las mismas variables sobre varios conjuntos de individuos
(STATIS DUAL), en tiempos u ocasiones diferentes.
EL STATIS que fue descrito por LHERMIER DES PLANTES (1976) en su tesis doctoral, ha
tenido una gran repercusin en el Anlisis de Datos y es muy amplia la literatura que
contempla diferentes desarrollos de tcnicas relacionadas y cientos de aplicaciones en
diferentes campos de la ciencia. Este mtodo, y de manera similar el AFM (ESCOFIER &
PAGES, 1988) y el METABIPLOT (MARTN-RODRIGUEZ et al., 2002) tratan de encontrar
una configuracin consenso a lo largo del tiempo (o condiciones) y por lo tanto trata de
evaluar la parte estable en la dinmica de las relaciones. De entre los diferentes mtodos
para estudiar tablas de tres vas, el STATIS es sin duda el ms utilizado.

Los Mtodos STATIS (STATIS DUAL)
Partimos de un conjunto de T estudios que identificaremos (X
t
, M
t
, D
t
) donde X
t
representa la
matriz de datos con I individuos y J variables, M
t
es la mtrica en el hiperespacio de los
individuos y D
t
es la mtrica en el hiperespacio de las variables. En general las mtricas
utilizadas coinciden con la matriz identidad. Tratamos de explorar simultneamente varias


matrices de datos X
t
donde cada una de ellas recoge informacin sobre J variables en I
individuos, en T ocasiones, o situaciones experimentales diferentes.
Cada uno de los estudios (X
t
, M
t
, D
t
) puede venir identificado por dos estructuras las cuales
estn asociadas a matrices de productos escalares: W
t
= X
t
M
t
X
t
T
la cual enfatiza las
posiciones de los individuos y C
t
= X
t
T
D
t
X
t
la cual enfatiza las estructuras de covariacin de
las variables. Denominaremos a W
t
y a C
t
objetos o configuraciones representantes de cada
estudio. En ambos casos se trata de estudiar la inter-estructura entre los distintos estudios y
si esta evidencia un comportamiento similar se define una estructura compromiso y se
representan los diferentes estudios sobre la estructura compromiso para poder analizar las
intra estructuras a travs de las trayectorias.
Comparar las inter-estructuras supone disponer de alguna forma de comparar las
configuraciones: es necesario definir una distancia entre ellas para poder valorar el parecido
o las diferencias. El mtodo STATIS (STATIS dual) utiliza el producto de Hilber-Schmidt
para inducir una distancia entre los objetos Wt (C
t
) representativos de los estudios. (LAVIT,
et al. 1994)
Los objetivos del STATIS son: 1) comparar y analizar las relaciones entre las matrices de
datos de partida, 2) integrar estas matrices en una sola que ser una media ponderada de
las matrices de partida y que la llamaremos matriz compromiso y 39 proyectar cada una de
las matrices originales sobre la consenso y analizar lo que tienen en comn y en qu
discrepan.
Las aplicaciones a distintos campos de la ciencia se cuentan por decenas: en quimiometra,
en ecologa, en medicina, en control estadstico de calidad, en biologa molecular, etc etc.
Recientes desarrollos del STATIS
Los desarrollos del STATIS pueden clasificarse en cuatro apartados:
1) De acuerdo a los datos de partida: Cuando todas las tablas de datos contienen
informacin sobre las mismas variables consideradas sobre los mismos individuos,
en diferentes tiempos o situaciones, se utiliza el X-STATIS o Anlisis Parcial Tridico
(PTA) (JAFFRENOU, 1978). En este caso se trabaja con las matrices de datos y con
con operadores. Si los operadores que integramos son matrices de covarianzas
tomadas sobre los mismos individuos se conoce con el nombre de COVSTATIS
(THIOULOUSE, 2011), y si se parte de varias matrices de distancias definidas sobre
los mismos individuos recibe el nombre de DISTATIS (ABDI y col, 2007) y puede ser
entendido como un MDS de tres vas.
2) De acuerdo a los pesos asignados al crear la matriz consenso: BENASSENI &
BENNANI-DOSSE, (2012) llaman Power-Statis a una versin de STATIS en la cual
el peso que se da a a cada matriz difiere de la propuesta de LHERMIER en la cual
el peso est relacionado con las componentes del primer vector propio de la matriz
de correlaciones vectoriales.
3) Si se tiene en cuenta informacin externa: t+1 STATIS (SAUZAY y col, 2006)
consideran las t matrices que se integran en el STATIS y una matriz ms con
informacin externa sobre los individuos. En 2008, SABATIER y VIVEN, extienden el
t+1 STATIS y proponen el STATIS-4 .Para el caso en que los individuos tengan
estructura de grupos, VALLEJO-ARBOLEDA et al, (2007) desarrollan el
CANOSTATIS.
4) Si se dispone de pares de tablas en t situaciones o tiempos diferentes: Cuando se
dispone de pares de t tablas, STATICO (STATIS y COINERCIA, SIMIER et al., 1999;
THIOULOUSE et al., 2004) y ms recientemente COSTATIS (COINERCIA Y
STATIS, THIOLOUSE et al., 2011), suponen interesantes alternativas que permiten
estudiar las co-estructuras.

Limitaciones del STATIS


La matriz consenso solo refleja la estructura de aquellas matrices altamente correlacionadas
con el primer vector propio de la matriz de correlaciones vectoriales. La ponderacin
utilizada en el Statis pondera a todas las variables de una matriz que est asociado al
compromiso, por un valor inicial que amplifica su valor original, haya o no participado en esa
asociacin. Sucede a la inversa con las variables de las matrices no asociadas al
compromiso.
El STATIS declara altamente relacionadas aquellas matrices que tienen una primera
direccin principal comn. No captura estructuras multidimensionales, ni estructuras
similares en las que no coincide la primera direccin principal. PAGES, 1996)
El STATIS y las tcnicas relacionadas solo son capaces de capturar la parte estable de la
estructura. De hecho las t matrices han de ser similares para que tenga sentido crear la
matriz consenso.

Alternativas a los Mtodos STATIS
Para resolver las limitaciones del STATIS existen en la literatura tcnicas alternativas.
Para capturar estructuras multidimensionales se puede utilizar el AFM (ESCOFIER &
PAGES, 1988) o el METABIPLOT (MARTN-RODRIGUEZ, et al, 2002). El segundo presenta
la ventaja, con respecto al primero, de que aunque las direcciones principales no aparezcan
en el mismo orden, si son similares, sern capturadas.
Para recoger los cambios (y/o interacciones) estn los modelos de TUCKER (TUCKER
1966). Estos modelos son ajustados con el objetivo de explicar la interaccin. Todas estas
metodologas tienen en cuenta una nica estructura (un cubo de datos, por ejemplo); sin
embargo, cuando el objetivo es estudiar pares de tablas, repetidas en el tiempo o en el
espacio, otro conjunto de tcnicas estn disponibles en la literatura: BGCOIA, (FRANQUET
et al, 1995), STATICO method (STATIS y COINERCIA, SIMIER et al., 1999; THIOULOUSE
et al., 2004) y ms recientemente COSTATIS (COINERCIA Y STATIS, THIOULOUSE,
2011). Sin embargo, estos mtodos solamente representan la componente estable de las
relaciones entre matrices, sin capturar lo que es diferente o las interacciones. Los mtodos
basados en los modelos de TUCKER pueden capturar esta informacin a travs de la Core
matrix y los BIPLOTs conjuntos relacionados y existe una recientsima propuesta, un nuevo
mtodo llamado CO-TUCKER (MENDES, 2011; MENDES y col, 2013, sometido) que
combina el Anlisis de CO-inercia (DOLEDEC & CHESSEL, 1994) y el anlisis TUCKER3
par analizar pares de k-tablas y capturar la parte cambiante (interacciones) de la dinmica
de las tablas de datos.

Bibliografa
Abdi H, Valentin D, Chollet S, Chrea C. (2007). Analyzing assessors and products in sorting
tasks: DISTATIS, theory and applications. Food Quality Prefer 18: 627640.
Benasseni J, Bennani-Dosse M. Analyzing multiset data by the power STATIS-ACT method.
(2012). Adv Data Anal Classif, 6 (1): 49-65
Doldec, S., and D. Chessel. (1994). Co-inertia analysis: an alternative method for studying
speciesenvironment relationships. Freshwater Biology 31:277294.
Escofier B.& Pags J. (1988). Analyses factorielles multiples. Dunod, Paris.
Franquet E, Doldec S, Chessel D (1995) Using multivariate analyses for separating spatial
and temporal effects within species-environment relationships. Hydrobiologia 300: 425-431.
Jaffrenou, PA. (1978).Sur LAnalyse des Familles Finies de Variables Vectorielles: Bases
Algbriques et Applications la Description Statistique, Thse de Troisime Cycle.
Universit de Lyon.
Lavit, C., Y. Escoufier, R. Sabatier, and P. Traissac. (1994). The ACT (Statis method).
Computational Statistics and Data Analysis 18: 97119.
LHermier des plantes, H. (1976). Structuration des Tableaux Trois Indices de la
Statistique, These de Troisieme cycle. University of Montpellier.


Martn-Rodrguez, J.; Galindo-Villardn, M.P.; Vicente-Villardn, J.L. (2002). Journal of
Statistical Planning and Inference. 102: 411423
Mendes, S. (2011). Mtodos multivariantes para evaluar patrones de estabilidad y cambio
desde una perspectiva BIPLOT. Tesis doctoral. Universidad de Salamanca.
Mendes, S.; Fernndez-Gmez
,
M.J.; Cotrim Marques, S.; Pardal,

M.A.; Ulisses Miranda
Azeiteiro,U.and Galindo-Villardn
,
M P. (2013). Co-Tucker: a new method for the
simultaneous analysis of a sequence of paired tables. Sometido a Environmental
and Ecological Statistics
Pages, J. (1996). Elments de Comparaison entre LAnalyse Factorielle Multiple et la
Mthode STATIS. Rev. Statistique Applique. XLIV (4). 81-95
Sabatier, R. & Vivien, M. (2008). A new linear method for analyzing four-way multiblocks
tables: STATIS-4. J. Chem. 22: 299-407
Sauzay L, Hanafi M, Qannari EM, Schlich P. (2006). Analyse de K + 1 tableaux a laide de la
methode STATIS: application en evaluation sensorielle. 9 ieme Journees Europeennes Agro-
industrie et Methodes Statistiques.Montpellier (France). 123.
Simier, M., L. Blanc, F. Pellegrin, and D. Nandris. (1999). Approche simultane de K couples
de tableaux: application ltude des relations pathologie vgtaleenvironnement. Revue
de Statistique Applique 47:3146.
Thioulouse J, Simier M, Chessel D. (2004). Simultaneous anlisis of a sequence of paired
ecological tables. Ecology 85:272283.
Thioulouse J. (2011). Simultaneous analysis of a sequence of paired ecological tables: a
comparison of several methods. Ann Appl Stat. 5 (4): 23002325
Tucker,LR. (1966). Some mathematical notes on three-mode factor analysis. Psychometrika,
31: 279-311
Vallejo-Arboleda A, Vicente-Villard n JL, Galindo-Villardn MP. (2007). Canonical STATIS:
Biplot analysis of multi-table group structured data based on STATIS-ACT methodology.
Comp Stat Data Anal, 51: 41934205.
Vivien, M.; Sabatier, R. (2004). A Generalization of STATIS-ACT strategy: DO-ACT for two.


DETECCIN DE QTLS A TRAVS DE
TCNICAS DE META-ANLISIS

J. R. DEMEY

Laboratorio de Biometra y Estadstica
Instituto de Estudios Avanzados IDEA, Caracas, Venezuela.
Email: jdemey@idea.gob.ve

RESUMEN

La disponibilidad y versatilidad de marcadores de ADN y mtodos de clculo han generado
un progreso considerable en el mejoramiento gentico de plantas. Estas nuevas tecnologas
se basan en la obtencin de resistencia horizontal o polignica que es gobernada por regiones
dentro del genoma que contienen genes asociados con un rasgo cuantitativo en particular, o
lo que se conoce como loci de rasgos cuantitativos (QTL). Sin embargo, la deteccin del
tamao de estas regiones cromosmicas, asociada entre otras, a la seleccin y el
cruzamiento de lneas parentales que difieren en uno o ms caracteres cuantitativos; el
anlisis de la segregacin de la descendencia para relacionar cada QTL con un marcador de
ADN conocido, o intervalo de marcadores, as como los mtodos de anlisis, han introducido
gran variabilidad. Por eso que encontrar mtodos que logren acotar el tamao de las
regiones es gran inters para los programas de mejoramiento. El presente trabajo muestra
el alcance de la tcnica de meta-anlisis en la obtencin de regiones consenso insesgadas,
que incluyen marcos abiertos de lectura ptimos y estrechamente relacionados con
caractersticas agronmicas de inters. Se ilustra el procedimiento en la deteccin de
regiones asociadas a resistencia a patgenos en el cultivo del tomate y se presenta de
manera detalla la metodologa de estimacin, los procedimientos de clculo y las rutinas
informticas desarrolladas.

Palabras clave: Meta-anlisis, QTL, Meta-QTLs, Marcos Abiertos de Lectura

Bibliografa
[1]. Carbonell, E. A.; Gerig, T. M., Balansard, E.; Asns, M. J. (1992). Interval mapping in
the analysis of nonadditive quantitative trait loci. Biometrics, 48:305-315.
[2]. Goffinet, B.; Gerber, S. (2000). Quantitative trait loci: a meta-analysis. Genetics,
155(1):463-473.
[3]. Lanaud, C.; Fouet, O.; Clment, D.; Boccara, M.; Risterucci, A. M.; Surujdeo-
Maharaj, S.; Legavre, T,; Argout, X. (2009). "A meta-QTL analysis of disease resistance
traits of Theobroma cacao L". Molecular Breeding, 24:361-374.
[4]. Sosnowski, O.; Charcosset, A.; Joets, J. (2012). BioMercator V3: an upgrade of
genetic map compilation and QTL meta-analysis algorithms. Bioinformatics, 28(15):2082-
2083.


COMBINING PIECES OF EVIDENCE IN CLINICAL RESEARCHES AND
META-ANALISIS OF DIAGNOSTIC TEST
PABLO VERDE
Coordination Centre for Clinical Trials, Heinrich-Heine University, Dsseldorf, Germany
pabloemilio.verde@uni-duesseldorf.de

RESUMEN
Meta-Analysis is a branch of statistical methods that allows researchers to combine
scientific results from multiple pieces of evidence into a single analysis. These
techniques are used to extend the scope of a single experiment, by combining results
from several experiments together or to make decisions in situations where further
experimentation may not be helpful, could not be ethical or may not be feasible.
Combining empirical evidence can be a challenge in practice; data we wish to
combine may have different grades of quality and information. As a consequence,
special statistical techniques have to be applied.
In this work we present a new meta-analysis approach to combine diagnostic results,
when two diagnostic tests are applied to the same group of patients. The main
problem in this type of meta-analysis is the lack of published information to make
direct comparison between tests and to account for intra-study correlation of
accuracy characteristics (e.g. sensitivities and specificities). We proposed a new
Bayesian hierarchical model, where the observed diagnostic results are considered
as a realization of a latent process which allows direct comparison between tests. A
new theoretical result establishing the relationship between observed and
unobserved quantities is presented and used for model building. Variability between
studies is modeled by using a mixture of multivariate scale normal distributions
(Verde, 2010). We give a Bayesian network representation of the model that
simplified computational techniques based on Markov Chain Monte Carlo (MCMC)
methods.
This new approach is illustrated with two systematic reviews: The first one
investigates the diagnostic accuracy of doctors aided with decision tools (e.g. neural
networks) compared with unaided doctors in patients with acute abdominal pain (Liu
et al. 2006). The second one compares the diagnostic accuracy of positron emission
tomography with computer tomography in the detection of lung cancer (Birim et al.
2005).
Palabras clave: multivariate meta-analysis, diagnostic test, generalized evidence
synthesis, MCMC, ecological inference.

Bibliografa
[1] Verde, P. E. (2010) Meta-Analysis of Diagnostic Test Data: a Bivariate Bayesian Modeling
Approach. Statistics in Medicine. Volume 29, Issue 30, pages 3088-3102.
[2] Liu J.L.Y., Wyatt J.C., Deeks J.J., Clamp S., Keen J., Verde P.E., Ohmann C., Wellwood
J., Dawes M., Altman D.G. (2006). Systematic reviews of clinical decision tools for acute
abdominal pain. Health Technol Assess. Nov;10(47):1-167, iii-iv. Review.


[3] Meta-analysis of positron emission tomographic and computer tomographic imaging in
detecting mediastinal lymph node metastases in nonsmall cell lung cancer. Birim et al.
(2005). Ann Thorac Surg 79(1):375-82.


MESA REDONDA


LA GENTICA TRAS LA ESTADSTICA DE MODELOS MIXTOS
PARA EL ANLISIS DE INFORMACIN GENMICA

RODOLFO J. C. CANTET

1
Departamento de Producin Animal, Facultad de Agronoma, UBA ,ARGETNINA

rcantet@mail.agro.uba.ar

RESUMEN

La cantidad de informacin que produce la genmica para el anlisis estadstico conlleva un
desafo computacional importante para el analista, debido a la presencia de estructura
poblacional, estructura familiar y relaciones de parentesco ocultas entre los datos de los
individuos en la poblacin control y en la que presenta el carcter de inters. El muestreo
estratificado por las diferencias de coancestra gentica (por ejemplo, razas, sub-
poblaciones) es conocido como estructura poblacional, mientras que la estructura familiar
se asocia con el parentesco gentico entre los individuos de la muestra. A su vez, la
existencia de un background gentico ancestral similar entre los individuos de la muestra
induce la relacin crptica u oculta. Los modelos lineales mixtos son una herramienta
fundamental para tener en cuenta estos factores de confundimiento en el anlisis, dentro del
marco terico de la gentica cuantitativa, particularmente en el anlisis de GWAS (genome
wide association studies). En la presente revisin se discuten las dos principales
parametrizaciones del modelo de anlisis para GWAS: la referida al anlisis marcador a
marcador y aquella referida al individuo. El anlisis de los individuos conlleva ventajas
genticas que el modelo tradicional multigen de efectos fijos carece, adems de las mayores
dificultades para ajustarlo debido a su dimensin. A travs de las matrices de covarianzas, el
modelo mixto captura la mezcla compleja entre la estructura poblacional (media) y las
relaciones ocultas (covarianzas), fenmenos inducidos por la genealoga, y permiten as
corregir por la estructura de correlacin durante el anlisis de mapeo. Finalmente, se
discuten diferentes modos de captar las relaciones ocultas a travs de matrices que
emplean algoritmos empleando la informacin genmica.



HERRAMIENTAS GENMICAS PARA EL MEJORAMIENTO
GENETICO VEGETAL

LUCA GUTIRREZ
1

1
Departamento de Biometra, Estadstica y Computacin, Universidad de la Repblica,
Uruguay

luciag@fagro.edu.uy

RESUMEN
Las herramientas genmicas en vegetales han sido incorporadas en los programas de
mejoramiento gentico como forma de aumentar la ganancia gentica. Tanto la seleccin
genmica (GWS) como la seleccin asistida por marcadores (MAS) han demostrado ser
promisorias. Para la seleccin asistida por marcadores moleculares es necesaria la previa
identificacin de regiones genmicas asociadas a los caracteres de inters (QTL). El mapeo
asociativo (GWAS) es eficiente en identificar QTL, pero los mtodos estadsticos aun
necesitan ms desarrollo. Los objetivos de este trabajo fueron presentar diferentes
herramientas estadsticas para el anlisis de datos genmicos. Especficamente se espera
comparar modelos mixtos con diferentes metodologas para el control de la estructura
poblacional en GWAS as como extender la metodologa propuesta para el estudio de la QEI
en poblaciones biparentales a poblaciones de GWAS. Se encontr que los modelos mixtos
son apropiados para el GWAS, pero que no existen grandes diferencias en los resultados
obtenidos a partir de diferentes modelos mixtos. A su vez la modelacin de la interaccin
genotipo por ambiente permiti la deteccin de QTL ambiente-especficos as como QTL
globales. El mapeo de QTL es promisorio en los programas de mejoramiento gentico para
entender las causas biolgicas de los caracteres cuantitativos. Sin embargo para lograr
ganancia gentica las herramientas de GWS son ms efectivas.

Palabras clave: qtl, gwas, gws, mas.

Introduccin
El mejoramiento gentico tradicional basado en la seleccin de padres superiores segn su
fenotipo ha sido efectivo en obtener cultivares de mejor adaptacin y mayores rendimientos
en cultivos de inters agronmico [1]. Sin embargo, los incrementos logrados por el
mejoramiento tradicional actual son marginales. A su vez, en las ltimas dcadas han
aparecido nuevas herramientas genmicas para asistir en el mejoramiento gentico como
son la seleccin asistida por marcadores (MAS) [1] y la seleccin genmica (GWS) [2].
La GWS consiste en utilizar marcadores moleculares y modelos de prediccin para
predecir el valor gentico de cada individuo [2]. GWS combina el poder y la relevancia de las
poblaciones de mejoramiento gentico con la resolucin y precisin de la tecnologa de
marcadores moleculares multiplex. La GWS ha sido ampliamente utilizada en el
mejoramiento gentico animal [3], pero no existen estudios empricos en plantas [4].
Por otro lado, para realizar MAS es necesario primero identificar marcadores moleculares
asociados con los caracteres cuantitativos de inters (QTL) [1]. Esta deteccin se realiza a
partir de un test de asociacin estadstica, esperando que sta est relacionada con un
ligamiento fsico. Existen dos estrategias para identificar QTL, una estrategia es basada en
poblaciones balanceadas, donde el desequilibrio de ligamiento es creado en el propio
experimento (i.e. mapeo de QTL); y otra utiliza poblaciones diversas en donde no existe un
control del desequilibrio de ligamiento (i.e. mapeo asociativo o GWAS).
La incorporacin de MAS a partir de mapeos de QTL tiene la limitante que los QTL
pueden no ser representativas del germoplasma del programa de mejoramiento [5]; el costo
de crear las poblaciones en general determina poblaciones relativamente pequeas con bajo
poder de deteccin; es necesaria una instancia de validacin de los QTL obtenidos; la


estimacin de los efectos de los QTL es sesgada [6]; y que requiere de una gran densidad
de marcadores moleculares. Parte de estas limitantes pueden ser sorteadas con GWAS que
tambin se basa en la identificacin de una asociacin estadstica marcador-carcter pero
en donde el ligamiento fsico no es la nica causa de asociacin ya que la estructura, la
seleccin, las mezclas, y otras causas evolutivas pueden generarla [5]. Por lo tanto, en el
GWAS es necesario controlar por estructura y para ello existe un gran nmero de mtodos.
Los primeros estudios utilizaron un modelo gentico bayesiano (STRUCTURE) [7].
Posteriormente se incorpor la matriz de relacionamiento gentico utilizando modelos mixtos
[8] sola y simultneamente junto a la estructura [9]. La matriz de STRUCTURE fue
cuestionada y se propusieron mtodos ms simples como son el anlisis por componentes
principales (PCA) [10] o por escalamiento multidimensional no-mtrico (nMDS) [11] y
recientemente por el uso de marcadores a lo largo del genoma [19]. Sin embargo, an no es
claro cul es el mejor mtodo de control de estructura en GWAS.
A su vez, los caracteres complejos que se utilizan en los programas de mejoramiento
muestran en general una interaccin genotipo-ambiente (GxE). Los modelos mixtos han sido
utilizados para estudiar la interaccin GxE asi como la interaccin QTL por ambiente (QEI)
en poblaciones biparentales a travs de la modelacin de la matriz de varianzas y
covarianzas [12], pero no en poblaciones de GWAS. Los objetivos de este trabajo son
presentar diferentes herramientas estadsticas para el anlisis de datos genmicos.
Especficamente se espera comparar modelos mixtos con diferentes metodologas para el
control de la estructura poblacin en GWAS as como extender la metodologa propuesta
para el estudio de la QEI en poblaciones biparentales a poblaciones de GWAS.

Desarrollo
Se utilizaron dos poblaciones: la primera consiste en 246 lneas avanzadas de cebada del
Oregon Barley CAP I,II y III que fueron genotipeadas para 3072 SNP y fenotipeadas para
cinco variables de calidad maltera [13]. La segunda consiste en 360 lneas avanzadas de
cebada de programas de mejoramiento gentico de Amrica Latina y del ICARDA que
fueron genotipeadas para 1536 SNP y fenotipeadas para tres enfermedades en mltiples
ambientes de Amrica [14].
Modelos con diferente control de la estructura poblacional fueron comparados a partir del
siguiente modelo mixto para mapeo asociativo [9]: , donde Y es una
variable aleatoria (i.e. vector de observaciones fenotpicas), X es una matriz de diseo de los
marcadores moleculares, es un vector de parmetros de los marcadores, Q es la matriz de
estructura, es un vector de parmetros asociados a la estructura, Z es una matriz de
incidencia que relaciona cada observacin con el individuo de donde proviene, u es el vector
de predictores de efectos aleatorios de background gentico, y e es un vector de errores
residuales. Diecisis modelos fueron comparados en la primera poblacin combinando
relacionamiento gentico (matriz K de TASSEL [15]; EMMA [16]; SPAGeDi [17]; sin control)
y estructura (STRUCTURE; PCA; nMDS; y sin control). Cinco modelos se compararon en la
segunda poblacin: sin control de estructura; PCA como efecto fijo; PCA como efecto
aleatorio [18]; y con relacionamiento gentico. Se utiliz un control de la tasa de falsos
positivos del experimento a travs de la utilizacin de la tasa de falsos positivos (FDR).
Para el anlisis de QEI se utiliz un anlisis en dos etapas. En la primer etapa, un anlisis
por ambiente con un p-valor liberal (p<0.0001) fue utilizado. En la segunda etapa, los
marcadores moleculares seleccionados fueron incluidos en un modelo conjunto en el que se
model la matriz de varianzas y covarianzas de la interaccin marcador carcter [12]. Se
usaron test de Wald y un nivel de significancia de 0.05.

El mejor modelo de control de la estructura depende del carcter (Fig. 1A-1B, Fig. 2 A-B),
del ambiente (Fig. 1A-1C, Fig. 2 B-C) y de la poblacin. Para las dos poblaciones con
diferente estructura gentica, evaluadas para diferentes caracteres se observ que no existe
un modelo ptimo para todos los casos, pero que los modelos de efectos fijos tuvieron
siempre un peor desempeo que los modelos mixtos (Fig. 1, 2) [13,14]. A su vez, los QTL
e Zu Q X Y + + + =


fueron consistentes a travs de los modelos mixtos, detectndose los mismos QTL con los
diferentes modelos [14]. Por lo tanto, se considera que es necesaria la utilizacin de
modelos mixtos en el anlisis por GWAS, pero que no es crucial la eleccin del modelo
particular.

Figura 1. Funcin de densidad acumulada (cdf) para los p-valores de los diferentes modelos
de GWAS en la poblacin de cebada del Oregon Barley CAP para: A) Extracto de malta en
el ambiente 1 (CO), B) Extracto de Malta en el ambiente 2 (PE), C) Beta-glucanos en el
ambiente 1 (CO). Los modelos son: sin estructura (negro continuo), STRUCTURE (azul
continuo), PCA (rojo continuo), nMDS (verde continuo), K (negro punteado), STRUCTURE +
K (azul punteado), PCA +K (rojo punteado), nMDS + K (verde punteado). Fuente: Gutirrez
et al., 2011 [13].

Figura 2. Funcin de densidad acumulada (cdf) para los p-valores de los diferentes modelos
de GWAS en la poblacin de cebada de Amrica Latina para: A) Mancha Borrosa en
Ambiente 1, B) Roya de la Hoja en Ambiente 1, C) Roya de la Hoja en Ambiente 2. Los
modelos son: sin estructura (amarillo), PCA fijo (azul), PCA aleatorio (violeta), K (rojo), PCA
+ K (verde) Fuente: Gutirrez et al., 2012 [14].

La utilizacin de modelos mixtos permiti la modelacin de la matriz de varianzas y
covarianzas para la interaccin QEI. De esta forma fue posible identificar QTL de efecto
ambiente-especifico, as como QTL de efecto global (Fig. 3).

0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
c
d
f
ME-CO
Naiv e
Q
P
M
K
Q+K
P+K
M+K
0.00 0.02 0.04 0.06 0.08 0.10
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
0
.
1
0
c
d
f
ME-CO
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
c
d
f
ME-PE
0.00 0.02 0.04 0.06 0.08 0.10
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
0
.
1
0
p-value
c
d
f
ME-PE
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
BG-CO
0.00 0.02 0.04 0.06 0.08 0.10
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
0
.
1
0
BG-CO
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
BG-PE
0.00 0.02 0.04 0.06 0.08 0.10
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
0
.
1
0
p-value
BG-PE
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
AA-CO
0.00 0.02 0.04 0.06 0.08 0.10
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
0
.
1
0
AA-CO
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
AA-PE
0.00 0.02 0.04 0.06 0.08 0.10
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
0
.
1
0
p-value
AA-PE
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
DP-CO
0.00 0.02 0.04 0.06 0.08 0.10
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
0
.
1
0
DP-CO
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
DP-PE
0.00 0.02 0.04 0.06 0.08 0.10
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
0
.
1
0
p-value
DP-PE
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
GPC-CO
0.00 0.02 0.04 0.06 0.08 0.10
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
0
.
1
0
GPC-CO
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
GPC-PE
0.00 0.02 0.04 0.06 0.08 0.10
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
0
.
1
0
p-value
GPC-PE
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
c
d
f
ME-CO
Naiv e
Q
P
M
K
Q+K
P+K
M+K
0.00 0.02 0.04 0.06 0.08 0.10
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
0
.
1
0
c
d
f
ME-CO
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
c
d
f
ME-PE
0.00 0.02 0.04 0.06 0.08 0.10
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
0
.
1
0
p-value
c
d
f
ME-PE
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
BG-CO
0.00 0.02 0.04 0.06 0.08 0.10
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
0
.
1
0
BG-CO
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
BG-PE
0.00 0.02 0.04 0.06 0.08 0.10
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
0
.
1
0
p-value
BG-PE
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
AA-CO
0.00 0.02 0.04 0.06 0.08 0.10
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
0
.
1
0
AA-CO
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
AA-PE
0.00 0.02 0.04 0.06 0.08 0.10
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
0
.
1
0
p-value
AA-PE
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
DP-CO
0.00 0.02 0.04 0.06 0.08 0.10
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
0
.
1
0
DP-CO
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
DP-PE
0.00 0.02 0.04 0.06 0.08 0.10
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
0
.
1
0
p-value
DP-PE
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
GPC-CO
0.00 0.02 0.04 0.06 0.08 0.10
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
0
.
1
0
GPC-CO
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
GPC-PE
0.00 0.02 0.04 0.06 0.08 0.10
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
0
.
1
0
p-value
GPC-PE
A B
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
c
d
f
ME-CO
Naiv e
Q
P
M
K
Q+K
P+K
M+K
0.00 0.02 0.04 0.06 0.08 0.10
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
0
.
1
0
c
d
f
ME-CO
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
c
d
f
ME-PE
0.00 0.02 0.04 0.06 0.08 0.10
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
0
.
1
0
p-value
c
d
f
ME-PE
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
BG-CO
0.00 0.02 0.04 0.06 0.08 0.10
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
0
.
1
0
BG-CO
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
BG-PE
0.00 0.02 0.04 0.06 0.08 0.10
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
0
.
1
0
p-value
BG-PE
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
AA-CO
0.00 0.02 0.04 0.06 0.08 0.10
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
0
.
1
0
AA-CO
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
AA-PE
0.00 0.02 0.04 0.06 0.08 0.10
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
0
.
1
0
p-value
AA-PE
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
DP-CO
0.00 0.02 0.04 0.06 0.08 0.10
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
0
.
1
0
DP-CO
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
DP-PE
0.00 0.02 0.04 0.06 0.08 0.10
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
0
.
1
0
p-value
DP-PE
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
GPC-CO
0.00 0.02 0.04 0.06 0.08 0.10
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
0
.
1
0
GPC-CO
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
GPC-PE
0.00 0.02 0.04 0.06 0.08 0.10
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
0
.
1
0
p-value
GPC-PE
C
A B C


Figura 3. Efecto de sustitucin allica de los marcadores seleccionados en el modelo de
QTL por ambiente para seis ambientes: A1-A6 en la poblacin de GWAS de cebada de
Amrica Latina evaluada para roya de la hoja. Color azul o rojo en el global indica que el
QTL es de efecto global, color gris indica que el QTL es ambiente-especifico.

Bibliografa
[1] Hospital, A., Frdric, A.T. (1997). Marker-Assisted Introgression of Quantitative Trait
Loci. Genetics 147(3): 1469-1485.
[2] Meuwissen, T.H.E., B.J. Hayes, M.E. Goddard. (2001). Prediction of total genetic value
using genome-wide dense marker maps. Genetics 157:18191829.
[3] Hayes, B.J., Bowman, P.J., Chamberlain, A.J. Goddard, M.E. 2009. Genomic selection in
dairy cattle: Progress and challenges. Journal of Dairy Science 92(2): 433443.
[4] Heffner, E.L., Jannink, J.-L., Sorrells, M.E. (2011). Genomic Selection accuracy using
multifamily prediction models in a wheat breeding program. The plant Genome 4: 65-75.
[5] Jannink, J.-L., Bink, M.C.A.M., Jansen, R.C. (2001). Using complex plant pedigrees to
map valuable genes. Trends in Plant Science 6:337-342.
[6] Beavis, W. (1994). The power and deceit of QTL experiments: Lessons from comparative
QTL studies. Proc. Corn Sorghum Ind. Res. Conf. 49: 250-266
[7] Pritchard, J.K., M. Stephens, and P. Donnelly. 2000. Inference of population structure
using multilocus genotype data. Genetics 155:945959.
[8] Parisseaux, B., Bernardo, R., (2004). Insilico mapping of quantitative trait loci in maize,
Theor. Appl. Genet. 109: 508-514.
[9] Yu, J., Pressoir, G., Briggs, W.H., Bi, I.V., Yamasake, M., Doebley, J.F., McMullen, M.S.,
Gaut, B.S., Nielsen, D.M., Holland, J.B., Kresovich, S., Buckler, E.S. (2006). A unified mixed-
model method for association mapping that accounts for multiple levels of relatedness. Nat.
Genet. 38: 203-208.
[10] Price, A.L., Patterson, N.J., Plenge, R.M., Weinblatt, M.E., Shadick, N.A., Reich, D.
(2006). Principal components analysis corrects for stratification in genome-wide association
studies, Nat. Genet. 38: 904909.
[11] Zhu, C.S., Yu, J.M. (2009). Nonmetric multidimensional scaling corrects for population
structure in association mapping with different sample types. Genetics 182:875888.
[19] Bernardo, R. Genomewide Markers for Controlling Background Variation in Association
Mapping. (2013). The Plant Genome 6(1): 1-9.
[12] Boer, M., Wright, D., Feng, L., Podlich, D., Luo, L., Cooper, M., van Eeuwijk, F. (2007). A
mixed model QTL analysis for multiple environment trial data using environmental
covariables for QTLxE with an example in maize. Genetics 177:18011813.

A1
A2
A3
A4
A5
A6
GLOBAL
Chr
Pos


[13] Gutierrez, L., Cuesta-Marcos, A., Castro, A.J., von Zitzewitz, J., Schmitt, M., Hayes,
P.M., (2011). Association mapping of malting quality quantitative trait loci in winter barley:
positive signals from small germplasm arrays. The Plant Genome 4:256-272.
[14] Gutierrez, L., Berberian, N., Capettini, F., Falcioni, E., Fros, D., Germn, S., Hayes,
P.M., Huerta-Espino, J., Herrera, S., Pereyra, S., Prez, C., Sandoval-Islas, S., Singh, R.,
Castro, A.J. (2013). Genome-Wide Association Mapping Identifies Disease-Resistance
QTLs in Barley Germplasm from Latin America Publicado en Zhang, G., Li, C., Liu, X. (Eds)
(2013), Advance in Barley Sciences. Springer, Netherlands, pp 209 216.
[15] Bradbury, P., Parker, T., Hamblin, M.T., Jannink, J.L. (2011). Assesment of power and
false discovery rate in genome-wide association studies using the BarleyCAP germplasm,
Crop Sci. 51: 52-5
[16] Kang, H.M., N.A. Zaitlen, C.M. Wade, A.Kirby, D. Heckerman, M.J. Daly, and E. Eskin.
(2008). Efficient control of population structure in model organism association mapping.
Genetics 178(3): 1709-1723.
[17] Hardy, O.J., Vekemans, X. (2002). SPAGeDi: A versatile computer program to analyse
spatial genetic structure at the individual or population levels. Mol. Ecol. Notes 2:618620.
[18] Malosetti, M., van der Linden, C.G., Vosman, B., van Eeuwijk, F.A. (2007). A mixed-
model approach to association mapping using pedigree information with an illustration of
resistance to Phytophtora infestans in potato. Genetics 175:879889.


REPRESENTACIN GRFICA DE INFORMACIN MULTIVARIANTE.
APLICACIN AL SISTEMA DE SALUD DE CHILE (2010)

IRENE SCHIATTINO
1
, CLAUDIO SILVA
1

1
Escuela de Salud Pblica. Facultad de Medicina. Universidad de Chile.

ischiattino@med.uchile.cl

RESUMEN
El objetivo del presente trabajo es divulgar entre los investigadores en salud pblica
algunas propuestas de grficos estadsticos multivariantes, tales como las caras de
Chernoff, los grficos de estrella, las curvas de Andrews y grficos de radar.
Los grficos estadsticos multivariantes propuestos son aplicados para describir los
Sistemas de Salud Pblicos de Chile, ao 2010, (n=29) en base a informacin cuantitativa
de dimensin p=7; ellos son procesados usando software estadsticos standard como R,
STATA y SAS. La descripcin de los 29 Sistemas de Salud Pblicos de Chile en base a
informacin cuantitativa de dimensin siete, representados en cada uno de los grficos
multivariantes exhibidos, permite determinar conglomerados, estndares y tendencias. La
disponibilidad de eficientes software estadsticos sugiere complementar las indispensables
estrategias de anlisis exploratorio de nuestra informacin con representaciones grficas
adecuadas al contexto multidimensional, que pueden ayudar a alcanzar una mejor
comprensin del problema de inters. La sntesis grfica generada por la aplicacin de
grficos estadsticos multivariantes para describir los Sistemas de Salud Pblicos de Chile
complementa nuestro conocimiento de este aspecto de la realidad nacional, puede sugerir
algunas hiptesis, refutar otras y ayudar en la interpretacin de resultados complejos.
Naturalmente esto es extensible a muchas otras situaciones de inters para el investigador
salubrista o de otras reas.

Palabras clave: investigacin en Salud Pblica, informacin multivariante

Introduccin
La investigacin en Salud Pblica es esencialmente observacional; por lo tanto siempre
estamos enfrentando situaciones de estudio multidimensionales, referidas a informacin
naturalmente compleja. Familiarizarnos con tal informacin requiere un anlisis exploratorio
de datos exhaustivo, no slo uni y bidimensional, sino multidimensional.
En dcadas recientes se ha desarrollado una gran variedad de procedimientos grficos para
representar datos multivariantes (Ver referencias), que la disponibilidad de eficientes
software estadsticos sugiere aplicar para complementar las estrategias bsicas uni y
bidimensionales de anlisis exploratorio de la informacin. Representaciones grficas
novedosas pueden ayudarnos a alcanzar una mejor comprensin del problema de inters.
En esta lnea de pensamiento docente-estadstico, el objetivo de este trabajo es presentar
una aplicacin local de algunas de las propuestas de grficos estadsticos multivariantes,
tales como Caras de Chernoff, Grficos de estrella, Grficos de radar y Curvas de Andrews.
Estos grficos en general responden a qu variables son las dominantes en cada unidad
de observacin elegida? se pueden establecer similitudes entre estas unidades? se
pueden establecer grupos (clusters)? existen valores atpicos?. En la actualidad podemos
encontrar variadas aplicaciones de estos grficos, en el mbito de percepcin de
consumidores, calidad de servicio, actitud hacia polticas de proteccin del medio ambiente,
clasificacin de productos, ensayos clnicos, ciencias sociales, etc. En este trabajo, son
aplicados para describir los Sistemas de Salud Pblicos de Chile (n=29) en base a
informacin cuantitativa de dimensin p=7, Ao 2010.
Los mtodos grficos descritos son implementados principalmente en los software
estadsticos R, STATA y SAS.


Desarrollo
El Sistema Pblico de Salud Chileno cubre el territorio nacional y est estructurado en 29
organizaciones denominadas Servicios de Salud. La informacin estadstica sobre el
funcionamiento de cada uno de ellos es llevada por el Ministerio de Salud y se actualiza
constantemente en la pgina web del Departamento de Estadsticas e Informacin de Salud
de ese ministerio ( www.deis.cl). De esa fuente seleccionamos 7 dimensiones: Dotacin,
Das Cama Disponibles, Das Cama Ocupados, Das de Estada, Promedio Camas
Disponibles, Nmero de Egresos y Nmero de Egresos Fallecidos para cada uno de los
servicios (ao 2010). Un dendrograma clsico evidencia la heterogeneidad de estos 29
vectores. Las variables fueron estandarizadas para evitar que una variable domine el
clculo de distancias y el proceso de conglomeracin debido a que sus valores son (por un
tema de escala) miles de veces mayores que los de las otras variable.

Resultados
Se obtuvieron las representaciones grficas de Caras de Chernoff de los Sevicios de Salud
agrupados en seis cluster segn lo sugerido en el Dendograma, obtenido mediante
estandarizacin clsica de sus variables . Cada una de las caras representa un Servicio de
Salud y las variables fueron asignadas a los rasgos fsicos como se indica: fline=Dotacin,
isize=Das Cama Disponibles, bcurv=Das Cama Ocupados, hupper=Das de Estada,
hdark=Dias de estada, nose=Promedio Camas Disponibles, msize=Nmero de Egresos,
mcurv=Nmero de egresos Fallecidos.
El grfico de Estrellas de los Servicios de Salud Chilenos, asignan a cada unidad de
observacin una estrella con tantos rayos o ejes (igualmente espaciados y que confluyen en
un centro geomtrico) representando las 7 variables consideradas. Las longitudes de los
rayos son proporcionales a los valores de las variables en la observacin asociada a la
estrella. Los extremos de los rayos se conectan con segmentos de lneas rectas para formar
una estrella. Agrupamos las observaciones segn las similitudes que presentan las
estrellas, sugeridas por el dendograma.
El grfico de Radar se asemeja a un grfico de estrella, pero se construye en base a UNA
estrella para cada variable en estudio y no para cada unidad de observacin; las unidades
de observacin identifican rayos concntricos. Los valores individuales de cada variable,
debidamente estandarizados, se representan sobre los rayos recin mencionados y la
conexin de ellos genera la estrella de esas variables.
Las Curvas de Andrews (1972), Andrews propuso un mtodo basado en la transformacin
de Fourier para representar datos multivariantes en dos dimensiones. Cada punto k
dimensional es representado por una funcin
........ )......... 3 cos( ) 3 ( ) 2 cos( ) 2 ( ) cos( ) (
2
) (
7 6 5 4 3 2
1
t X t sen X t X t sen X t X t sen X
X
t f + + + + + + =
X
en un rango de
t t < < t
para permitir la representacin de los datos y
k
X X X ,......... ,
2 1
= X
representa el vector de observaciones. Se puede demostrar que esta
representacin preserva las distancias eucldeas, en el sentido de que a dos elementos de
la poblacin con valores similares de las variables corresponden curvas prximas. Cada
variable de cada observacin es representado por una componente individual en la suma
de la transformada de Fourier. La magnitud de cada variable de un sujeto o elemento
particular afecta la frecuencia, la amplitud y la periodicidad de la funcin
) (t f
X
, dando una
representacin nica para cada sujeto. Se presentan aqu, las Curvas de Andrews para
cada uno de los Servicios de Salud Chilenos, cada una de las funciones representa el
comportamiento de las dimensiones estudiadas. Cada seccin de esta figura muestra como
se agrupan estas grficas replicando los conglomerados iniciales.



Conclusiones
La informacin multivariante en trminos de distancias (euclidianas o no) y su uso para
detectar agrupaciones de casos en conglomerados, es familiar en los cursos clsicos de
Estadstica y, de alguna manera, llega al pblico general. Sin embargo, es innegable que la
individualidad de cada atributo desaparece, a menudo, en este enfoque. En cambio, los
mtodos grficos ilustrados aqu, respetan, en distinta medida, esa individualidad y son una
ayuda en la interpretacin de los resultados, determinando clusters, estndares y
tendencias.
La descripcin de los 29 Sistemas de Salud Pblicos de Chile en base a informacin
cuantitativa de dimensin siete, representados en cada uno de los grficos multivariantes,
corresponde a una realidad en Chile y resulta motivante que la sntesis grfica generada por
cada mtodo sea consistente con esa percepcin: para nuestros alumnos resulta motivador
que anlisis necesariamente sofisticados en trminos matemticos, tengan una cara
amistosa, palpable, real y, a veces, hasta cmica. Debemos, adems, destacar que la
inquietud por representar adecuadamente informacin multivariante se mantiene vigente y
busca explotar las posibilidades tecnolgicas ms recientes. Por ejemplo, la Organizacin
para la Cooperacin y el Desarrollo Econmicos (OECD) ha creado un Better Life Index
que rene informacin de cada uno de sus 36 pases miembros sobre 11 ndices socio-
econmicos (que a su vez resumen datos sobre 96 variables). La representacin grfica
multivariante propuesta es muy interesante, colorida y animada, pero escapa a las
posibilidades de un texto clsico; sugerimos visitar http://www.oecdbetterlifeindex.org/

Bibliografa
[1] Chernoff H. (1973). The Use of Faces to Represent Points in K-Dimensional Space
Graphically. Journal of the American Statistical Association, 68(342): 361368.
[2] Friendly M. (1991). Statistical Graphics for Multivariate Data. Proceedings of the SAS
User's Group International Conference,16, 1157-1162
[3] Toit S.H.C, Steyn A.G.W y Stumpf R.H. (1986). Graphical Exploratory Data Analysis.
New York: Springer-Verlag
[4] Raciborski R. (2009). Graphical representation of multivariate data using Chernoff
faces. The Stata Journal, 9(3), 374-387.
[5] Shi-Tao Y., Glaxo S. y King P. A. Using Radar Chart to display Clinical Data. NESUG18
(Northeast SAS Users Group Conference Proceeding)
www.nesug.org/conference/generalconference.html
[6] Stata Graphics (2012). Reference manual. Release12. A Stata Press Publication Stata
Corp LP College Station, Texas.


MODELOS TEMPORALES BAYESIANOS CON APLICACIONES

FRANCISCO TORRES-AVILS
1

1
Profesor Asistente, Departamento de Matemtica y Ciencia de la Computacin, Universidad
de Santiago de Chile

francisco.torres@usach.cl

RESUMEN
El presente trabajo explora alternativas metodolgicas para el anlisis de datos en salud,
cuando se posee una componente temporal indexada a la informacin. Se exponen dos
potenciales modelos con diferentes aplicaciones y se discute el proceso de estimacin
desde el punto de vista Bayesiano. La primera aplicacin intenta encontrar asociaciones
entre la incidencia de Diabetes Tipo 1 en la Regin Metropolitana de Santiago con factores
medio-ambientales y otros virus. La segunda tiene por objetivo explicar el comportamiento
de la mortalidad por trquea, bronquio y pulmn en Chile usando modelos ms generales
que los tradicionales en la literatura. Para los anlisis se usa un software estadstico
especializado. Finalmente se entregan las conclusiones ms relevantes de las aplicaciones
de ambos modelos.

Palabras clave: series de tiempo, tasa de incidencia, tasa estandarizada de
mortalidad, regresin Poisson, modelo lineal dinmico bayesiano, inferencia
bayesiana.

Introduccin
El ajuste de modelos asociados a datos medidos u observados en el tiempo ha sido
desarrollado ampliamente en la literatura estadstica especializada. En algunas reas de
estudio, una de las limitantes est relacionada con la disponibilidad de informacin, la cual
suele estar sujeta al inicio de estudios, la calidad de informacin o simplemente el periodo
de inters que se fija para ste.
Este trabajo presenta dos metodologas a aplicaciones distintas, relacionadas con
enfermedades crnicas, cuyas soluciones son calculadas usando estimacin Bayesiana. En
ambos casos se dispone de datos discretos, pero cuyos objetivos resultan ser distintos
(Gonzlez et al., 2013).
En el primer caso, se modela la tasa de incidencia de Diabetes Tipo 1 (DMT1) observada en
la Regin Metropolitana de Santiago, en funcin de factores medio-ambientales y otros
potenciales virus presentes en el mismo periodo de tiempo. Si bien esta enfermedad crnica
no presenta tasas consideradas altas, la tendencia es al alza, por lo que el objetivo es
buscar asociaciones con factores del entorno que permitan generar hiptesis desde el punto
de la Salud Pblica.
Por otro lado, el cncer de trquea, bronquio y pulmn es una de las mayores causas de
mortalidad en Chile. Los ltimos trabajos se han enfocado en describir el comportamiento
geogrfico de esta mortalidad en el pas (Icaza, et al., 2006; Icaza, et al., 2013), por lo que
es natural intentar explicar su comportamiento desde el punto de vista temporal. Por este
motivo, se busca establecer un modelo que permita, no solo explicar el comportamiento de
este tipo de cncer, sino tambin determinar aquel modelo que permita predecir el
comportamiento en funcin de una ventana de tiempo pre-fijada por el investigador (Torres-
Avils et al., 2013).



Desarrollo
Para el desarrollo de estas dos aplicaciones, se asumieron dos modelos distintos.

Modelo 1: Modelo para tasa de incidencia DMT1 para datos de conteo.
) ( ~
t t
Poisson y
t kt k t t t
x x x c | | | | + + + + + = , ) log(
2 2 1 1 0

t t t
u + =
1
c c ) , 0 ( ~
2
o Normal u
t

donde representa la semana epidemiolgica, , medida de enero 2000 a
diciembre de 2007 por semana epidemiolgica, y
kt t t
x x x , , ,
2 1
son las covariables y sus
potenciales rezagos significativos. El parmetro representa el rezago temporal del error.

Modelo 2: Modelo para tasa de mortalidad trquea, bronquio y pulmn para .

Se utilizaron modelos lineales dinmicos (DLM, por su sigla en ingls) bayesianos. Donde
representa el logaritmo de la tasa de mortalidad en el tiempo y el modelo se puede
representar por medio del siguiente sistema de ecuaciones:

donde, es un vector de orden que est formada por covariables, es el vector de
los parmetros desconocidos del modelo, es una matriz de orden que describe la
evolucin de los parmetros contenidos en en el tiempo, y representan errores
aleatorios, los que se asumen tpicamente normalmente distribuidos con media y matrices
de varianzas covarianzas (dependiendo de la estructura de ) y respectivamente.
Para el proceso de estimacin, se asumieron distribuciones a priori no informativas,
aproximadas por distribuciones propias. Para ambos casos, se seleccion el mejor modelo
usando criterios de seleccin tales como el Criterio de Informacin de Devianza (DIC en
ingls, Spiegelhalter et al., 2002) y se realiz el anlisis de residuos correspondiente.

Los modelos presentaron buenos ajustes en ambos problemas. Las soluciones encontradas
se resumen a continuacin.
Para el estudio de la DMT1, se lograron determinar las asociaciones desde un punto de
vista ecolgico, en donde contaminantes especficos y dos tipos de virus respiratorios (y sus
respectivos rezagos) resultaron ser significativos. En este caso, el uso de modelos lineales
generalizados (de conteo) result ser una buena alternativa para encontrar asociaciones no
lineales.
Respecto al estudio temporal de la mortalidad, se ajustaron modelos de primer y segundo
orden, y se concluy que el mejor ajuste lo present el modelo de primer orden, siendo
tambin el de mayor poder predictivo. Esto sugiere que su comportamiento puede ser
explicado mayormente por su tendencia. Queda abierto el problema de establecer
covariables que permitan explicar este problema en particular.
Si bien estos modelos son solo aplicaciones a problemas especficos, a partir de estos es
posible generar estrategias que permitan establecer metodologas adecuadas para estudiar
problemas en salud con estructuras temporales ms complejas.



Agradecimientos
El presente trabajo fue financiado por el proyecto Fondecyt de Iniciacin 11110119.

Bibliografa
[1] Gonzlez , N.; Torres-Avils, F.; Carrasco, E.; Salas, F.; Prez-Bravo, F. (2013). Estudio
temporal de diabetes mellitus tipo 1 en Chile: asociacin con factores ambientales durante el
perodo 2000-2007. Revista Mdica de Chile, 141(5), 595-601.
[2] Icaza, G.; Nez, L.; Torres, F.; Daz, N.; Varela, D. (2006). Distribucin geogrfica de
mortalidad por tumores malignos de estmago, trquea, bronquios y pulmn, Chile 1997-
2004.Revista Mdica de Chile, 135(11), 1397-1405.
[3] Icaza, G.; Nez, L.; Torres-Avils, F.; Daz, N.; Villarroel, J.; Soto, A.; Correa, G. (2013).
Atlas de Mortalidad en Chile 2001-2008. Editorial Universidad de Talca, Chile.
[4] Torres-Avils, F.; Moraga, T.; Nez, L.; Icaza, G. (2013). Mortalidad por cncer
pulmonar en Chile, tendencia y proyeccin a seis aos con modelos lineales dinmicos
bayesianos. Manuscrito sometido a Gaceta Sanitaria.
[5] Spiegelhalter, D.J.; Best, N.G.; Carlin, B.P. y Van der Linde, A. (2002). "Bayesian
measures of model complexity and fit (with discussion)". Journal of the Royal Statistical
Society, Series B, 64 (4), 583639.



INDICE DE AUTORES

Abbiati Nora, 260, 266
Abbiati Nora, 278
Abbott Liliana Alicia, 26, 29
Aguate Fernando, 257
Albeza Ramn E, 142
Alderete Mariela Del Carmen, 397
Aldunate Consuelo, 67
Alegre Patricia, 230
Alibaud Sebastin, 224
Almiron Mara Del Carmen, 139
Alonso Pedano Mariana, 352
Altendorff Laura, 254
Andrade Alberto J., 307
Angarita Adriana, 336
Antik Ariel, 243
Aranda Gisella Daiana, 164
Araya Hctor, 224
Arce Osvaldo Ernesto, 90
Arciniegas Alarcn Sergio, 124
Arcos Antonio, 384, 387
Arenas Luis, 272
Arredondo Meja Jhon Eder, 64
Avila Olga, 221
vila Silvia , 164
Avila-Proser Vladimir, 144
Ayala Aguilera Lder, 173, 333
Azeiteiro Ulisses, 79
Baccal Nora, 96
Balzano-Nogueira Leandro, 390, 394
Balzarini Mnica Graciela, 170
Balzarini Mnica, 257, 288, 297, 344, 358
Barra Jose Luis, 32
Barrionuevo Andrea, 352
Basso L.R., 282
Belmartino Andrea, 35
Bentez De Parra, 23
Berges Miriam, ,35, 127
Beribe Mara Jos, 250
Berkunsky Igor, 93
Berra Silvina, 32
Bertero H. Daniel, 307
Birchmeier Ana, 260
Blanco Mara Del Rosario, 266
Bobeda Griselda R.R., 139, 291
Boca Rosa Teresa, 314
Bologna Susana, 82, 86
Bongiovanni Marcelo, 82
Bono Alejandra, 32
Bramardi Sergio, 99, 227, 240, 310
Brescia Vctor, 380
Bruno Cecilia, 288, 358
Brunotto Mabel, 32
Burbano Pantoja Victor Miguel Angel, 41
Burgueo Juan, 213
Caballero Mendoza Csar Arnaldo, 183
Cabezas Viviana, 243
Calfinier Gastn, 164
Calvo Paula C., 167
Cnovas Laura Luca, 179
Carbonell Emilio, 390
Carignano Hugo, 250
Caro Patricia, 161, 164, 192
Carrera Larisa Ivn, 317
Carrera Liza Natalia, 317
Carvajal Natalia Trinidad, 164
Carvajar Muquillaza Cristian, 20
Casellas Karina, 380
Castao Fernando, 102
Castro Ariel, 294
Castro Kuriss Claudia, 57
Castro Marina, 236
Cendoya Mara Gabriela, 53, 102
Cepeda Rosana, 93
Ceretta Sergio, 236
Cerezo Blandn Alexis, 323
Chabbal Marco, 291
Chaila Salvador, 300
Chaparro Marcos, 60
Chaparro Mauro, 60
Clausse Alejandro, 73
Colihueque Nelson, 135
Contini Liliana Ester, 221, 317
Corcuera Vctor Ral, 176. 326
Crdoba Mariano, 257, 288
Coronel Mariano, 263
Correa Morales Juan Carlos, 64
Cortelezzi Agustina, 93
Coss Mara Elena, 282


Costa Trtara Sabrina, 227, 307
Coste Elena Beatriz, 254, 282
Curia Lisandro, 227
Curioni Ana, 131
Curti Ramiro, 227, 307
Dalurzo Humberto, 139
De La Vega Abelardo, 307
De Mello Marcello, 372, 376
De Morais Augusto, 333
Defacio Raquel, 240
Delfino Hugo, 147
Delgado Santiago German, 102
Della Vedova Romina, 269
Demetrio Clarice, 397
Demey Jhonny, 390, 394
Depetris De Guiguet Edith, 198, 263, 355
Descalzo Adriana Mara, 360
Di Renzo Miguel Angel, 86, 170
Di Rienzo Julio Alejandro, 73
Dias Carlos Tadeu Dos Santos, 368
Diez Nardy, 394
Dinon Mara Anabella, 106
Domitrovic Hugo A., 109
Donoso Pablo, 401
Dos Santos Dias Carlos Tadeu, 115, 124
Dussel Vernica, 70
Echeverra Luca, 127
Egido Jaime, 76
Escudero Sandra, 82
Etchepare Ral, 317
Farias Alessandra, 155, 158
Fernndez Blanco Ana, 230
Fernndez Eduardo, 260
Fernndez Gmez M Jos, 79
Fernndez Juan Antonio, 90
Fernndez Madero Julieta, 282
Figueroa Laura, 161, 192
Filippini Olga Susana, 118, 131, 147, 348
Flores Mariana, 278
Fonseca Miriam B, 142
Frade Virginia, 121
Fuentealba Jenny, 99
Gaiad Jose Emilio, 291
Galindo M Purificacin, 50, 76, 79, 210, 330,
394
Galiotti Hugo, 179
Gallego Isabel, 50
Gambetti Paola Carolina, 282
Garca Alberto, 189
Garca Arancibia Rodrigo, 198, 263
Garcia Arancibia Rodrigo, 355
Garca-Pea Marisol, 115
Garibotti Gilda, 70
Ghiggia Lelia Ins, 90
Gilabert Horacio, 401
Gimnez Gustavo, 189
Gimnez Laura I., 139
Gimnez Laura, 291
Gimnez Patricia, 112
Giorgini Diana Alejandra, 147
Gittins Cecilia. G, 167
Gonzlez Barrios Pablo, 236
Gonzlez Campos Jos Alejandro, 20
Gonzlez Caas Carolina, 64
Gonzlez Jos, 38
Gonzlez Julia, 340
Gonzlez Laila Yaned, 201
Gonzlez Laura, 216
Gonzlez Soledad, 285
Gonzlez-Acua Daniel, 144
Gonzlez-Reymndez Agustn, 294
Gorostiague Pablo, 352
Gutirrez Luca, 236, 294, 297
Gutierrez Mnica Patricia, 336
Henrquez Carlos Felipe, 336
Hernndez David R., 109
Humada Gonzlez Guido Gustavo, 173, 183,
333
Ibaez Mercedes Alicia, 170
Infante Clementina, 201
Jaime Adriana Patricia, 90
Jos Luis, 320
Juan Mara Teresa, 96
Kacoliris Federico, 93
Kandus Mariana, 176, 326
Kelmansky Diana, 44
Laffaye Federico, 192
Larraguibe - Marcela, 67
Lavalle Andrea, 189, 227
Lavalle Andrea, 99
Lema Daniel, 380
Lencina Viviana Garca Borges, 397
Len Jos Rafael, 158
Leranoz Esteban, 300


Lidia Mara, 23
Liseras Natacha, 35
Llera Joaqun Antonio, 179
Lpez Bautista Ezequiel Abraham, 368, 372, 376
Lpez Bautista Ezequiel, 364
Lpez Luis Alberto, 151, 195, 201
Lopez-Villalobos N, 250
Lupn Beatriz, 340
Macian Ana Josefina, 90
Manrquez Ronald, 38
Maranho Paulo Leandro Srgio, 79
Marinelli Claudia, 93
Marotta Pablo, 266
Marques Snia, 79
Marticorena Marta, 240
Martinengo Nora Beatriz, 179
Martinez Alvarez Diego, 82
Martnez Carla, 118
Martinez Rubn, 260
Mateu Jorge, 186
Matus Susana, 179
Mazza Silvia, 291
Melo Carlos, 186
Melo Julio, 218
Melo Oscar, 186, 218
Melo Sandra, 218
Mendes Susana, 79
Menni M. Fernanda, 167
Miranda Marcelo, 401
Miranda Mara Jos, 23
Molina David, 384
Monterubbianesi Mara Loria, 106
Montoro Virginia, 96
Montoya Alejandra, 291
Morales Matas, 272
Morelli Candelaria, 161, 164, 192
Morelli Mara Claudia, 179
Moreno Fabiana, 121
Moreno Ferrero Vicente, 176
Moreno Florencia, 70
Moreno Lucila, 144
Moschini Ricardo, 348
Muoz Morales Duberney, 216
Nakamura Edmilson Akiyoshi, 364
Nakamura Luiz Ricardo, 364, 368, 376
Natal Marcela, 60
Neiva De Mello Marcello, 368
Neiva Dias Carlos Tadeu Dos Santos, 372
Nez Myriam, 243
Ochoa Mara Del Carmen, 300
Ordano Mariano, 233
Orellana Liliana, 70
Orgeira Jos Luis, 397
Ortega Baes Pablo, 352
Ortiz Julio C., 109
Paccapelo Mara Valeria, 304
Pace Guerrero Ignacio, 127
Pacheco Martha Del Pilar, 41
Palacio Facundo, 233
Palacios Luciano, 118
Paonessa Adriana, 221
Passucci Juan, 121
Patat Mara Laura, 47
Paternina Iliana Mara, 155
Patino M Carmen, 210
Paz Myriam Rosana, 90
Paz Sergio, 278
Pea Malavera Andrea, 297
Perelman Susana, 323
Pereyra Ana Mara, 254, 282
Prez Osvaldo, 236
Perrachione Marcos, 216
Picallo Alejandra Beatriz, 254, 282
Piedade Snia Mara De Stefano, 376
Pistorale Susana, 29
Poli Mario, 250
Ponce Zaldua Eugenia, 164
Ponteville Christiane, 243
Pose Nlida, 53
Prada Gloria Esperanza, 336
Previgliano Ignacio, 243
Prieto Victor, 213
Quaresma Edilan De Santana, 364, 368, 372,
376
Quiroz Facundo, 102
Ramalho De Morais Augusto, 173, 183
Ramos Carlos, 195
Rangel Ilka, 330
Raa Erica, 300
Raschia Mara Agustina, 250
Reeb Pablo, 310
Refojo Daniela, 278
Reinoso Enso H., 269, 275


Reynaldi Francisco J., 275
Ricca Alejandra Patricia, 348
Ricci Lila, 44, 47
Rizzo Sergio, 360
Rocha V. M., 282
Rodrigues Liska Gilberto, 173, 183, 333
Rodriguez Edgardo, M., 121
Rodrguez Elsa M., 340
Rodrguez Miguel, 50
Rojas Dante, 348
Rojas Elizabeth, 82, 86
Roldan Dana, 250
Romero Mara Cristina, 269, 275
Romero Mara Del Carmen, 73
Rossetti Luciana, 360
Rossini Gustavo, 198, 355
Rovegno Mara Soledad, 266
Rozen F. B., 282
Rubio Natalia, 189
Rubira Franco, 82
Rudolph Erich, 135
Rueda Mara Del Mar, 384, 3873
Sajama Jess, 352
Salaberry Teresa, 102
Salas Christian, 401
Salerno Juan Carlos, 176, 326
Salines Luis, 86
San Martino Silvina, 106
Snchez Diana C, 142, 207
Snchez Sebastin, 109
Sancho Ana Mara, 348, 360
Santana Mara Anglica, 390, 394
Santinn Juan J., 109
Saravia Jos Ramn, 204
Saso Mara Virginia, 164
Savian Taciana Villela, 364
Schiattino Irene, 67
Scotta Marcelo, 221
Serralunga Gabriela, 285
Silva Claudio, 67
Silva de la Fuente Ma. Carolina, 144
Silva Giselle Belen, 164
Simn Jorgelina, 109
Simoniello Fernanda, 221
Simoy Veronica, 93
Singer Julio, 397
Sobrero Mara Teresa, 300
Soldini Diego, 86
Sosa Cecilia, 352
Sosa Matas, 179
Soto Daniel, 401
Soto Rodrigo, 320
Spara Adriana Fernanda, 26
Spth Ernesto, 121
Steibel Juan P., 310
Shring Silvia, 352
Tablada Elena Margot, 216
Tassile Valentn, 189
Teich Ingrid, 344
Tejedor Fabio, 201
Toledo Gloria, 67
Torrecilla Marangel, 164
Trujillo Manuel, 387
Urrutia Mara Ines, 269, 275
Vaira Stella Maris, 317
Valdelamar Juan Carlos, 155
Valdivieso Miranda Margoth Adriana, 41
Vega M Concepcin, 210
Velandia Daira Luz, 155, 158
Velzquez Berta, 307
Vernengo Eduardo Anibal, 26
Vicente Galindo Enrique, 246
Vicente Galindo Purificacin, 246
Vicente M Purificacin, 210
Vicente Villardn, 320
Vicente-Villardn Jos Luis, 394
Vicentin Jimena, 198
Vignera Mara Laura, 131
Vilar Diego, 236
Viloria Hermes, 330
Vinante Diego, 352
Von Mhlenbrock Soledad, 67
Wolff Renata, 26
Yez Loreto, 285
Yaez Miguel, 135
Zamuner Ester, 53
Zarate Ana Mara, 32
Zrate Mara Fernanda, 151
Zuliani Roxanna, 99

Gab 2013

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Gab 2013

Cargado por

Copyright:

Formatos disponibles

IV Encuentro Iberoamericano de Biometra y XVIII Reunin Cientfica del GAB

Mar del Plata, Argentina Septiembre 2013 0

eR u es el parmetro de posicin, 0 > el parmetro de dispersin y la funcin ) (u k

IV Encuentro Iberoamericano de Biometra y XVIII Reunin Cientfica del GAB

es la media general de pirt;

AMBIENTE UTILIZANDO A DECOMPOSIO POR

x o vector linha que

Media poblacional de la cantidad de racimos por planta en la campaa i momento t-j

ya que no es posible pesar racimos. Por lo tanto, se

con informacin general de la variedad. Este valor de c es

También podría gustarte