Documentos de Académico
Documentos de Profesional
Documentos de Cultura
La rápida tasa de cambios sociales, ambientales y tecnológicos actuales genera una necesidad
apremiante de nuevas teorías y de examinar las an guas a la luz de las nuevas realidades.
La omisión del modelado predic vo también resulta en una brecha entre la inves gación y la
prác ca. En campos como las finanzas, donde la prác ca se centra en la predicción mientras
que la inves gación académica se enfoca en la explicación, se ha confiado en modelos
considerados pilares de inves gación pero que han demostrado tener un rendimiento
deficiente en la prác ca.
En campos que se centran en el modelado predic vo, la omisión del modelado explica vo
debe ser examinada. Los campos cien ficos suelen definirse por un cuerpo cohesivo de
conocimientos teóricos que pueden ser probados, por lo que algún po de prueba, ya sea
empírica o no, debe ser un componente esencial del campo. En áreas como la bioinformá ca,
donde hay poca teoría pero abundancia de datos, los modelos predic vos son fundamentales
para generar vías para el desarrollo teórico causal.
Otra ambigüedad que puede beneficiarse de una dis nción entre explica vo y predic vo es la
definición de parsimonia. Algunos sos enen que los modelos predic vos deben ser más
simples que los modelos explica vos: "La simplicidad es relevante porque las familias
complejas a menudo enen un mal desempeño en la predicción de nuevos datos, aunque
pueden ajustarse muy bien a los datos an guos" (Sober, 2002). El mismo argumento fue
presentado por Has e, Tibshirani y Friedman (2009): "Típicamente, cuanto más complejo
hacemos el modelo, menor es el sesgo pero mayor es la varianza". En contraste, algunos
modelos predic vos en la prác ca son muy complejos, y de hecho, Breiman (2001b) comentó:
"en algunos casos, los modelos predic vos son más complejos para capturar pequeños ma ces
que mejoran la precisión predic va". Zellner (2001) u lizó el término "sofis cadamente
simple" para definir la calidad de un modelo "bueno". Sugeriría que las definiciones de
parsimonia y complejidad dependen de la tarea: predic va o explica va. Por ejemplo, un
modelo "demasiado complicado" en términos explica vos podría resultar "sofis cadamente
simple" para fines predic vos.
Es nuestra responsabilidad ser conscientes de cómo se u lizan los modelos estadís cos en la
inves gación fuera de la estadís ca, por qué se u lizan de esa manera y, en respuesta,
desarrollar métodos que respalden una inves gación cien fica sólida. Este conocimiento se
puede adquirir dentro de nuestro campo invitando a cien ficos de diferentes disciplinas a dar
charlas en conferencias y seminarios de estadís ca, y al requerir que los estudiantes de
posgrado en estadís ca lean y presenten trabajos de inves gación de otras disciplinas.
Como disciplina, debemos reconocer la diferencia entre la modelización explica va, predic va
y descrip va, e integrarla en la educación estadís ca tanto para estadís cos como para no
estadís cos, lo antes posible, pero especialmente en cursos de "métodos de inves gación".
Esto requiere la creación de materiales escritos que sean fácilmente accesibles y comprensibles
para los no estadís cos. Deberíamos abogar tanto por la modelización explica va como por la
predic va, aclarar sus diferencias y usos cien ficos y prác cos dis n vos, y difundir
herramientas y conocimientos para implementar ambas. Un aspecto par cular a considerar es
abogar por un uso más cuidadoso de términos como "predictores", "predicciones" y "poder
predic vo", para reducir los efectos de la terminología en conclusiones cien ficas incorrectas.
La conciencia de la dis nción entre modelización explica va y predic va, y de las diferentes
funciones cien ficas que cada una cumple, es esencial para el progreso del
conocimiento cien fico.
APÉNDICE: ¿ES EL MODELO "VERDADERO" EL MEJOR MODELO PREDICTIVO? UN EJEMPLO DE
REGRESIÓN LINEAL
Para ilustrar esto, considera el modelo estadís co f (x) = β1x1 + β2x2 + ε que se asume
correctamente especificado con respecto a F. U lizando datos, obtenemos el modelo es mado
fˆ, que ene las propiedades
Aunque el sesgo del modelo insuficientemente especificado f ∗(x) es mayor que el de f (x), su
varianza puede ser menor, y en algunos casos tan pequeña que el EPE total será menor para el
modelo insuficientemente especificado. Wu, Harris y McAuley (2007) mostraron el resultado
general para un modelo de regresión lineal insuficientemente especificado con múl ples
predictores. En par cular, demostraron que el modelo insuficientemente especificado que
excluye q predictores ene un EPE más bajo cuando se cumple la siguiente desigualdad:
Esto significa que el modelo insuficientemente especificado produce predicciones más
precisas, en términos de un EPE más bajo, en las siguientes situaciones:
cuando los valores absolutos reales de los parámetros omi dos (en nuestro ejemplo, β2) son
pequeños;
cuando el tamaño de la muestra es pequeño o el rango de las variables omi das es pequeño.
La conclusión se resume bien en las palabras de Hagerty y Srinivasan (1991): "Notamos que la
prác ca en la inves gación aplicada de concluir que un modelo con una validez predic va más
alta es 'más verdadero', no es una inferencia válida. Este ar culo muestra que un modelo más
parsimonioso pero menos verdadero puede tener una validez predic va más alta que un
modelo más verdadero pero menos parsimonioso".
AGRADECIMIENTOS
Agradezco a dos revisores anónimos, al editor asociado y al editor por sus sugerencias y
comentarios que mejoraron este manuscrito. Expreso mi gra tud a muchos colegas por sus
valiosos comentarios y discusiones fruc feras que me han ayudado a desarrollar el argumento
explica vo/predic vo presentado en este ar culo. Estoy agradecido con O o Koppius
(Erasmus) y Ravi Bapna (U Minnesota) por familiarizarme con la modelización explica va en
Sistemas de Información, por perseguir colabora vamente la predicción en este campo y por
las incansables discusiones sobre este trabajo. Agradezco a Ayala Cohen (Technion), Ralph
Snyder (Monash), Rob Hyndman (Monash) y Bill Langford (RMIT) por sus detallados
comentarios sobre borradores anteriores de este ar culo. Un agradecimiento especial a Boaz
Shmueli y Raquelle Azran por su minuciosa lectura y discusiones sobre el manuscrito. Y un
agradecimiento especial por comentarios y sugerencias invaluables a Murray Aitkin (U
Melbourne), Yoav Benjamini (Tel Aviv U), Smarajit Bose (ISI), Saibal Cha opadhyay (IIMC), Ram
Chellapah (Emory), E Doveh (Technion), Paul Feigin (Technion), Paulo Goes (U Arizona), Avi
Goldfarb (Toronto U), Norma Hubele (ASU), Ron Kene (KPA Inc.), Paul Lajbcygier (Monash),
Thomas Lumley (U Washington), David Madigan (Columbia U), Isaac Meilejson (Tel Aviv U),
Douglas Montgomery (ASU), Amita Pal (ISI), Don Poski (Monash), Foster Provost (NYU),
Saharon Rosset (Tel Aviv U), Jeffrey Simonoff (NYU) y David Steinberg (Tel Aviv U).