Está en la página 1de 268

La revolución Google Scholar
Destapando la caja de Pandora académica

Enrique Orduña-Malea · Alberto Martín-Martín
Juan M. Ayllón · Emilio Delgado López-Cózar
Prologado por
Peter Jacsó
Anne-Wil Harzing

La revolución Google Scholar
Destapando la caja de Pandora académica

Granada · 2016

Destapando la caja de Pandora académica ISBN: 978-84-338-5985-3 Edita: Editorial Universidad de Granada UNE. distribución. Unión de Editoriales Universitarias Españolas Diseño de la edición: Francisco Vega Álvarez Cualquier forma de reproducción. comunicación pública o transformación de esta obra sólo puede ser realizada con la autorización de sus titulares. salvo excepción prevista por la ley. .© LOS AUTORES © UNIVERSIDAD DE GRANADA La revolución Google Scholar.

..... tamaño y evolución......................................................... 41 Capítulo 3 Las dos caras de Google Scholar (II): La herramienta de evaluación.......................... 75 Capítulo 4 Capturando la Web académica: Funcionamiento general............................................................ 99 Capítulo 5 El retrato de Google Scholar: Cobertura................................................................................................................ 15 INTRODUCCIÓN21 BLOQUE A Google Scholar: el buscador académico universal..................... 25 Capítulo 1 Los orígenes......... 119 ........................................................................... 27 Capítulo 2 Las dos caras de Google Scholar (I): El buscador académico................. 9 PREFACIO II Sacrificar un poco de precisión por una cobertura (mucho) más amplia....................................Contenidos PREFACIO I La revolución de Google Scholar: destapando la caja de pandora académica......

................................................... 171 Capítulo 8 Google Scholar Metrics: El impacto de las revistas científicas............... 133 Capítulo 7 Google Scholar en la balanza: Fortalezas...................... 185 Capítulo 10 Productos derivados independientes.. 217 CONCLUSIONES Google Scholar: la caja de pandora académica.............................................................................. 249 BIBLIOGRAFÍA253 ................ debilidades y peligros..........................................................................................Capítulo 6 El proceso de búsqueda en Google Scholar: Prestaciones y servicios................................ 155 BLOQUE B La familia Google Scholar: Productos derivados oficiales e independientes................................................ 173 Capítulo 9 Google Scholar Citations: Los perfiles académicos en la Web..................................

en las estanterías digitales de sus bibliotecas. tanto en inglés como en español. libros. privando a los autores reales tanto de sus autorías como de sus citas. magacines. tesis doctorales y patentes. La mayoría de los usuarios no conocen lo que alberga la caja de GS y no se preocupan por aprenderlo. revistas científicas. por cuántos años. siempre y cuando encuentren algunos buenos artículos de revistas. algunas otras malas. a 700. capítulos de libro. actas de congresos. Los desarrolladores de Google Scholar (GS) pusieron muchas cosas en su caja de almacenamiento. libros… y en qué medida están cubiertos. más cuando muchos de éstos se encuentran fácilmente disponibles tanto en fuentes de acceso abierto como de pago. Los cuatro autores. El hecho de estar familiarizado con sus artículos de revistas y conferencias. artículos. realizaron una extensiva e intensiva serie de pruebas y análisis de resultados. El único punto en el que discrepo profundamente con los autores es cuando éstos empequeñecen las consecuencias “letales” de un ejemplo específico: cuando GS atribuyó a I INTRODUCTION la autoría de 40. algunas de ellas buenas. dos años después. el número de ítems (registros).000 ítems aproximadamente. en qué idiomas. A los bibliotecarios y otros profesionales de la información les gustaría conocer el tamaño real aproximado de GS.Prefacio I La revolución de Google Scholar: destapando la caja de pandora académica La caja de Pandora fue un regalo de Zeus que no debía ser abierto. . que explica las ventajas y los inconvenientes de GS y demuestra la competencia de los autores y su experiencia (incluso cuando no estamos de acuerdo en algunos temas). Se aprecia que para algunos de los asuntos controvertidos los autores citen artículos que critican y/o reconocen las “soluciones” de GS.100 documentos y. hizo fácil que aceptara la invitación para escribir un prólogo a este libro. profesores en diversas universidades en España. escribieron un libro excelente sobre la base de sus investigaciones.

añadiendo esa cadena sin sentido de caracteres. enriquecida por cientos de referencias a materiales primarios de investigación publicados acerca de GS durante los últimos doce años. es simplemente el título de la sección II. Figura A1. sobre todo para las secciones acerca de la génesis de GS. Esto es como alabar al abusador de una mujer de que éste ha reducido considerablemente los golpes a su esposa e hijos. el feo y el malo de GS. El autor. tal y como se muestra en la siguiente captura de pantalla (Figura A3). otorgadas por GS al autor fantasma. son muy valiosos para comprender sus ventajas e inconvenientes. GS añade contenido absurdo creado a través de un scraping de la plantilla de la pantalla de búsqueda. Los trabajos citados. todavía de bajo nivel. Esto no es un síntoma raro o casual. supuestamente llamado IIB STATISTICS según GS. (2008) Incluso para un autor muy solitario. Un síndrome relativamente nuevo de GS es que éste sustituye el resumen/extracto original de los artículos de revista o actas de congresos. idiomas y la habilidad para buscar el texto completo de documentos primarios. Extracto del famoso ejemplo de autor I INTRODUCTION Source: Bar-Ilan.10 La revolución Google Scholar En efecto. entre ellos muchos de los artículos de los autores así como artículos de conferencias. ante la cual indican los autores que “la mejora del sistema fue simplemente espectacular”. Resulta extraño por qué el título de la segunda sección fue el elegido por GS para generar el nombre falso de autor y no los títulos de la primera o la tercera sección. El malo es que los parsers (analizadores) de GS. Background Statistics. En el caso de que no exista resumen. GS redujo esta autoría a cinco registros a fecha de septiembre de 2015. sino muy común. cabeceras de secciones y etiquetas de las opciones de los menús de búsqueda (FigA2). . la ventaja de agruparse en un cuarteto para escribir este libro es obvia. Lo “bueno” es la amplitud de los documentos primarios en términos de tipologías documentales. informes técnicos y comentarios acerca del bueno. Los tres autores auténticos se ven privados de su estatus de autor y de las cinco citas recibidas. J. siguen produciendo miles de autores fantasma creados a partir de las palabras de los títulos de los documentos.

Google Scholar añade un sumario a partir de las opciones en la plantilla de búsqueda en el sitio web de Wiley Online Library 11 .Prefacio · Parte I · Peter Jacsó Figura A2. Ejemplo de autor fantasma (IIB STATISTICS) extraído de un título de sección Figura A3.

así como de los elementos del proceso de búsqueda a través del prisma crítico de los especialistas en búsquedas en bases de datos. la lista de revistas cubiertas y la cobertura temporal cubierta. Es decir. predecesoras de los enlaces digitales). Journal Citation Reports y Scimago.000 hits con el contenido que se ilustra a continuación. La primera parte trata de la génesis de GS y sus características como motor de búsqueda (una herramienta de descubrimiento de recursos) así como de su uso como una herramienta de evaluación que pretende cuantificar la productividad científica y su impacto en diferentes niveles. son muchas las fuentes no académicas. del servicio de Scopus y de Google Scholar. Web of Science. tal y como hacen los humanos cuando dicen algo en voz muy baja al ser conscientes de que lo que dicen no tiene sentido.12 La revolución Google Scholar En el caso de la colección digital del sitio web de John Wiley. Esto refuerza la sensación de que. Como las prácticas de los médicos de vudú desde América del Norte a la India. La cobertura del libro es excelente y completa. color gris. como por ejemplo el tamaño de la base de datos. exceptuando la decepcionante omisión de la fértil obra de Eugene Garfield desde mediados de los 1950 en adelante acerca de la indización de citas y la búsqueda basada en referencias citadas. La prestación “fea” más característica de GS es el secretismo relativo a la información esencial. el número de citas totales. cuál es el tamaño y cobertura estimados. Las siete secciones dentro de este primer bloque dirigen a los lectores a través del proceso de cómo GS captura los datos. GS se las arregla para producir 552. casi invisible. el número de registros maestros. datos que son fácilmente disponibles en bases de datos hospedadas por EBSCO. a pesar del uso del adjetivo Scholar (o Académico en muchos países de habla hispana). que van desde los autores individuales e investigadores hasta los artículos. así como de . actas de congresos. Microsoft Academic Search (que se ha ido desvaneciendo). La columna vertebral de estos servicios de bases de datos son las referencias citadas y citantes (creadas manualmente por Garfield en tarjetas Hollerith. Proquests. Las cerca de 270 páginas del libro se componen de dos partes principales (bloques). Scopus. El segundo bloque discute las ventajas e inconvenientes de Google Scholar Metrics for publications y de Google Scholar Citations. capítulos de libro y libros. mostrando el número de hits en el más brillante. Su clásico trabajo publicado en la revista Science hace 60 años proporcionó la idea nuclear para la implementación de los índices de citas de ISI.

incluyendo el excelente y gratuito software Publish or Perish.Prefacio · Parte I · Peter Jacsó algunas utilidades que ayudan en los procesos de input y output. lo cual no es precisamente el punto fuerte de GS. El competente. pero esto podría revelar demasiado acerca de las limitaciones de GS. podrían constituir una característica excepcional para este excelente libro. Professor Peter Jacsó Library and Information Science Program Department of information and Computer Sciences Honolulu. La evaluación de la investigación a nivel institucional requerirá a Google Scholar la disposición de información relativa a la afiliación de los autores en un formato y contenido consistentes. gráficos y tablas. El libro contiene ilustraciones muy informativas. objetivo y muy actualizado contenido del libro es muy necesario en tanto que las medidas basadas en métricas del rendimiento e impacto de la investigación son más y más ampliamente utilizadas por las relativamente objetivas evaluaciones del rendimiento a nivel individual de los investigadores y revistas. Hawaii 2016 April 5 13 . La incorporación de enlaces directos a las referencias citadas y la creación de consultas en las que se pueda hacer clic para poder repetir las pruebas de muestra. La navegación por todos los elementos de los metadatos será esencial. junto a un listado sistemático de las ventajas e inconvenientes (a partir del listado de resultados de GS de los propios autores) podría contribuir al uso de esta obra como un libro de texto digital tanto para los estudiantes como para los profesores. La edición digital puede ayudar con alta resolución e imágenes en color. La inclusión de búsquedas en las que se pueda clicar a la hora de generar los perfiles de autor de GS. aunque en la versión impresa utilizada para este prólogo no eran todas bien legibles.

.

Dedicándome al área del Comercio internacional. investigadores trabajando en disciplinas vecinas como la Economía o Psicología. capítulos de libro o incluso un ranking de revistas) tenían un fuerte impacto en términos de citas. He estado siguiendo a Google Scholar desde su lanzamiento en 2004.Prefacio II Sacrificar un poco de precisión por una cobertura (mucho) más amplia Si me pidieran que resumiera mi “veredicto” sobre Google Scholar en tan solo diez palabras. por ejemplo. En esas disciplinas. Acceda a Google Scholar… y a publish or perish! Acceda a Google Scholar! Cuando realizaba búsquedas sobre mi obra en Google Scholar. descubrí que en la Web of Science estaban indizadas muy pocas de las revistas en las que había publicado. una proporción mucho mayor de revistas académicas sí estaban incluidas en la Web of Science. hace diez años era muy difícil para un académico del área del Comercio internacional convencer a un tribunal de promoción de que había alcanzado tanto impacto como. Aquellas revistas que sí se encontraban incluidas tenían bajos factores de impacto. la cita anterior sería un probable candidato. aunque mi interés se incrementó en 2006. . mi expediente parecía inmediatamente mucho más brillante. A consecuencia de esto. Desafortunadamente. cuando necesitaba justificar el impacto de investigación en mi solicitud de promoción a Profesor Titular. de tal forma que éstas pudieran ser comparadas entre investigadores. debido en gran medida a que muchas de las revistas que las estaban citando no estaban (todavía) incluidas en Web of Science. Resultó que mi trabajo era realmente muy citado. incluso las publicaciones no convencionales (como libros. la interfaz de Google Scholar no hacía muy sencilla la tarea de agregar métricas de citas de una forma accesible.

Una búsqueda en Google Scholar (incluyendo todas las palabras) para la expresión <Harzing “Publish or Perish”> genera cerca de 2000 resultados. Utiliza Google Scholar para capturar citas brutas. La mayoría de estos artículos han usado Google Scholar como fuente de datos.2% 65. Para mí.7% Ciencias 64. en algunas disciplinas. Publish or Perish (PoP) nació en Octubre de 2006 (http://www. .0% Ciencias sociales 30.6% Ciencias de la vida 70. Journal of Informetrics o Journal of the Association for Information Science & Technology. analizarlas y presentar posteriormente un amplio rango de métricas derivadas. Avances de Google Scholar durante la última década Google Scholar ha recorrido un largo camino desde sus primeros días.5% 7. Su cobertura ha mejorado de forma espectacular y en la actualidad es mejor que Web of Science o Scopus para cualquier disciplina (Harzing y Alakangas. debido en gran parte a que estas bases de datos no incluyen libros y.16 La revolución Google Scholar Como consecuencia de ello. PoP es una aplicación informática que recupera y analiza citas académicas. existen actualmente muchos estudios bibliométricos que confían en Google Scholar (generalmente a través de Publish or Perish) para realizar su investigación.htm). cubren solamente una fracción de las revistas.6% 45. esto representó además el comienzo de un nuevo “pasatiempo académico”. 2016). Ingeniería.5% 66.harzing.com/pop. Ciencias de la vida. tanto la Web of Science como Scopus pierden un gran número de citas en las Humanidades y Ciencias sociales. Tal y como es evidente a primera vista. Disciplina Citas en Scopus como % de citas en Google Scholar Citas en Web of Science como % de citas en Google Scholar Humanidades 11.7% Ingenierías 57.0% 22. haciendo investigación en el campo de la Bibliometría. Comparando citas en Google Scholar con citas en Web of Science y Scopus La tabla B1 resume parte de los principales resultados de un reciente estudio sobre 146 investigadores en Ciencias. Desde entonces he publicado más de una docena de artículos en revistas como Scientometrics. Como consecuencia. 2016).8% Tabla B1. Ciencias sociales y Humanidades (Harzing y Alakangas.

US Environmental Protection Agency o el US Agency for International Development). Hewlett Packard o IBM). Google Scholar ha jugado desde mi punto de vista un papel fundamental en la democratización del análisis de citas (Harzing y Mijhardt. Países donde en muchas universidades no tienen acceso ni a Scopus ni a la Web of Science.htm). existen miles de bibliotecas por todo el mundo que listan el software como una alternativa gratuita a Scopus y la Web of Science. Ade- 17 . de las cuales las más importantes se encuentran resumidas en mi tutorial de Publish or Perish (Harzing. Mediante Publish or Perish cualquier persona con un ordenador y acceso a Internet puede ejecutar análisis bibliométricos. tanto el software como Google Scholar son particularmente populares en Italia. MIT.harzing. tales como Harvard. Me parece particularmente agradable que tanto en Italia como en Grecia la aplicación haya sido regularmente utilizada para promover la transparencia y la meritocracia en nombramientos universitarios.Prefacio · Parte II · Anne-Wil Harzing Sin embargo.5 y 2 veces más citas que Web of Science y Scopus. Es particularmente gratificante observar que el software es ampliamente utilizado en universidades altamente posicionadas. Así mismo existe un peligro nada despreciable a que.SSHRC en Canadá o el Centre National de la Recherche Scientifique . el US Department of Energy. incluso en las ingenierías. Paraguay. com/poptips/index. Google Scholar y Publish or Perish cubren claramente una necesidad! Más cerca de (mi) casa. A nivel general. Ciencias y Ciencias de la vida. 2016.CNRS en Francia) hasta laboratorios de investigación (por ejemplo. http://www. Mongolia. Stanford. desde investigadores y bibliotecarios particulares en más de 80 países hasta departamentos gubernamentales (por ejemplo. No es de extrañar que el software sea usado en todo el mundo. 2015). Google Scholar proporciona entre 1. se propicie un cierto nivel de uso inexperto o sencillamente ignorante. Microsoft. Botsuana. Sin embargo. Grecia y Polonia. Sin embargo. Oxford o Cambridge. gracias a un acceso sencillo a las herramientas bibliométricas. es incluso más satisfactorio ver su igualmente alta utilización en universidades con escasos recursos en países como Armenia. Google Scholar y Publish or Perish han democratizado el análisis de citas Soy la primera en reconocer que Google Scholar tiene importantes limitaciones. universidades que poseen un amplio acceso a otras alternativas comerciales. Tayikistán y Uruguay. desde agencias de financiación (como el Social Sciences and Humanities Research Council .

Para el momento en que he puesto en marcha el sitio web de la Web of Knowledge o de Scopus. y que no discrimina las prácticas de publicación fuera del campo de las Ciencias (de la Vida) (Harzing. Google Scholar necesitaría siempre ser triangulada con otras fuentes de datos. esto es poco consuelo para las (pocas) personas a las que se les ha “robado” sus publicaciones más citadas porque Google Scholar no ha analizado gramaticalmente bien su nombre. los inevitables deslices de Google Scholar no influirán significativamente en los resultados.18 La revolución Google Scholar más. 2015). ¿El veredicto? Utilizar Google Scholar significa sacrificar un cierto grado de precisión. En cualquier caso. estoy encantada de que su experiencia hasta la fecha se haya integrado ahora en una monografía. Del mismo modo que los asiáticos del Este. Desde 2008. A lo que podría añadir… “y una respuesta a la velocidad de un rayo”. recordado mi contraseña y accedido. ninguno de ellos ha sido tan diligente en sus esfuerzos para proporcionar una mejor imagen de Google Scholar que el Grupo de Investigación EC3. Emilio y su equipo han trabajado sin descanso para explorar el funcionamiento interno de Google Scholar. Si se requiriera de una precisión del 99-100%. especialmente en aquellos con elevados niveles de agregación o centrados en métricas robustas como el h-index. En la mayoría de los análisis bibliométricos. 2013). De ahí mi cita de apertura: “Sacrificar un poco de precisión por una cobertura (mucho) más amplia”. tanto en éstos como en otros países. como investigadora en el campo de las Ciencias sociales. Por tanto. estoy más que feliz por aceptar el error ocasional de Google Scholar a cambio de una cobertura que es muy superior a la de Scopus y Web of Science. he terminado prácticamente mis búsquedas en Publish or Perish! ¿Por qué necesitamos este libro? Aunque muchos investigadores han utilizado Google Scholar como fuente de datos. Lo único que lamento es que no esté (todavía) disponible en inglés! . también éstos podrían descubrir que la Web of Knowledge de Thomson Reuters no está particularmente bien versada en distinguir con precisión a los investigadores con nombres no anglosajones (Harzing. Sin embargo. los investigadores que publican en sus idiomas locales en lugar de en Inglés necesitan confiar en Google Scholar si desean obtener una cobertura de su trabajo más que incidental.

harzing. 105(3). harzing.com/poptips/index. a collection of tips to introduce users to the program’s main functions in 80 easy chunks.W.co.W.com/papers. A. Disponible en: http://www. Publish or Perish tutorial.uk/tto/science/article4543774. Disponible en: http://www. (2013). 2334.W.htm#esi [Cobertura de prensa en: http://www.com 19 .harzing. Scientometrics.harzing.ece https://www. Scientometrics.timeshighereducation. January 29 www.htm Harzing.W. Disponible en: http://www. A. “Proof over promise: Towards a more inclusive ranking of Dutch academics in Economics & Business”. Mijnhardt. (2015).htm#isi Professor Anne-Wil Harzing Middlesex University London Hendon. W. (2015).thetimes.com/papers.. 727-749. 102(1). 2259-2270.uk/news/week-higher-education-%E2%80%93-3-september-2015 ] Harzing. The problem of homonyms in Thomson Reuters Essential Science Indicators”. Scientometrics.harzing. A.htm#top40 Harzing. “Health warning: Might contain multiple personalities. 93(1).com/papers. “Document categories in the ISI Web of Knowledge: misunderstanding the Social Sciences?”. Disponible en: http://www. London 2016.Prefacio · Parte II · Anne-Wil Harzing Referencias Harzing.co. (2016). A.

.

porque créanme hay casos en que la obra es la vida. celebrado en San Sebastián. concluyendo con un relato de sus fortalezas y limitaciones. Todo empezó allá por el año 2008 cuando los organizadores del V Foro sobre evaluación de la calidad de la educación superior y de la investigación. intenté por primera vez explicar qué cubría. sabia máxima que no es más que una constatación existencial: en lo que hacemos está lo que somos. Para empezar diré que es el resultado de siete años dedicados de forma intensa y extensa a descubrir las entrañas de Google Scholar.Introducción Cuando yo cursaba el bachillerato. en algunos casos como el de nuestro egregio premio nobel Ramón y Cajal. desde el primer momento. y ahora vienen a mi memoria las figuras del padre Severino y de Don Francisco. Añado yo que. A partir de ahí empecé a bucear y pes- . por lo que era importante no sólo conocer las creaciones literarias sino también sus entresijos. por qué podía ser interesante su uso. cómo funcionaba. Venía yo de publicar una serie de artículos sobre la Web of Science y su universo de productos bibliográficos y bibliométricos. me encargaron la organización de una sesión docente sobre Google Scholar. y Google Scholar apareció ante mí. qué ofrecía. Mis profesores. como una alternativa novedosa y extraordinariamente sugestiva para buscar y acceder a documentos científicos imposibles de recuperar con las bases de datos tradicionales. no se entiende la vida sin la obra. Llevó por título “Qué es y cómo utilizar Google Scholar” y. allá por los años setenta del siglo pasado. mis manuales de literatura dividían invariablemente el estudio de un autor en dos partes: la dedicada a desvelar la vida y la enfocada a conocer la obra. Pues bien. en esa sesión. pretende esta breve introducción explicar cuál es la tramoya vital que explica la concepción y ejecución de esta obra. nos recalcaban que no es posible entender la obra de un autor sin indagar sobre su vida. es por lo que la ponencia que presenté en el siguiente foro llevó ya por título “Google Scholar: ¿herramienta de evaluación científica?”. Pero inmediatamente advertí de sus potencialidades para la evaluación de las publicaciones científicas. aparte de dar a conocer a una audiencia expectante en saber lo que era y prometía el nuevo buscador académico.

com. Y a las pruebas me remito: un balance del trabajo desplegado durante estos años ha dado por fruto: —— La confección de 9 productos de evaluación bibliométrica (H Index Scholar. y todos los logros alcanzados se deben a la concordia. después de los creadores de Google Scholar.y sin ánimo de ser pretencioso . fraternidad y camaradería que reina entre nosotros. Publishers Scholar Metrics. compromiso y honestidad. más que dichosa y venturosa fue la incorporación al grupo de trabajo de Juanma. La suma de habilidades diversas (siempre el todo es superior a las partes) es posible porque se asienta en personalidades caracterizadas por la bondad. Pero el impulso decisivo para llevar a buen puerto toda nuestra labor fue el feliz encuentro con los otros firmantes de esta obra: Enrique Orduña. somos seguramente uno de los grupos que más saben acerca de los secretos que atesora el buscador. Scholar Mirrors. la obra es el resultado inexorable de la vida. 2010-2014. es) para dar cuenta de los resultados de investigación que se vayan publicando sobre Google Scholar como fuente de información y evaluación científica. quedando atrapado en sus redes. 21 documentos de trabajo y 15 informes. Formamos un auténtico equipo. La tenacidad. becario FPI (2013). Indice H revistas científicas españolas según Google Scholar Metrics (ediciones 20072011. que ya hizo unos primeros tanteos sobre el estudio de la presencia de las universidades españolas en Google Scholar. después. como buscadores de información en la Web. —— La publicación de 17 artículos en revistas. generosidad.22 La revolución Google Scholar car en las vastas y cambiantes aguas por las que navegaba el buscador. Classics Scholar’ Profiles. 2009-2013. Todo este trabajo entusiasta y prolongado en el tiempo permite que pueda afirmar con orgullo . Proceedings Scholar Metrics. y Alberto Martín y Juan Manuel Ayllón. La Biblioteconomía y Documentación española según Google Scholar Citations). —— La edición de un boletín (http://googlescholardigest. 2008-2012. Sobre estas bases hemos construido un más que exitoso conjunto de resultados. Si feliz fue el encuentro con Enrique. Journal Scholar Metrics. laboriosidad y las brillantes habilidades técnicas de que hacen gala han sido el complemento perfecto para los resultados alcanzados por nuestro grupo. y Alberto. desplegó en su excelente tesis un portentoso abanico de técnicas y herramientas webmétricas. fundamentales para conocer los intestinos de Google y Google Scholar. comprensión.blogspot. 2011-2015). Enrique.que. primero. En definitiva. . becario FPU (2014).

Y todo ello ofrecido de forma gratuita. El libro viene precedido de dos prólogos firmados por dos de sus mejores conocedores: Peter Jacsó. y de los autores que los publican. de patentes. sin duda una manera de ayudar a transformar el mundo en la buena dirección… Subtitulamos la “caja de pandora académica” porque GS proporciona información que permite evaluar el interés y el impacto de los documentos. esto es. Se ha convertido. en una valiosísima fuente de datos con múltiples usos bibliométricos. de este libro. como herramienta de evaluación científica.). Hoy la simple Caja de búsqueda de Google. etc. bajo cualquier formato y tipología documental. la faz crítica frente a la faz loable… Respecto a la estructura del libro. como no podía ser menos. sometiendo al tercer grado al buscador para desvelar sus virtudes y carencias. con estos prefacios se muestran esos dos rostros que conviven en Google Scholar. producidos en cualquier país. Y hay que empezar necesariamente por sus prolegómenos.Introducción · Emilio Delgado López-Cózar Y ahora que ya conocemos las mimbres y la urdimbre toca hablar del cesto. de tesis. y Anne-Wil Harzing. El título. costosa (la mayoría de las bases de datos exigen cuantiosas suscripciones) y con complejas y poco amigables interfaces de búsqueda. La sección A dedicada a describir minuciosamente 23 . sin quererlo. el investigador que más ha escudriñado GS. Ahora ya queda lejana a la par que anacrónica la forma de buscar información científica anterior a la aparición de Google Scholar: dispersa en múltiples fuentes (catálogos de bibliotecas. bases de datos bibliográficas de revistas en distinta disciplinas. creadora de Publish or Perish. que se ha implantado como un estándar de facto. el que lo ha hecho más inquisitivamente y con más acierto. Con ello se hace realidad el sueño de Anurag Acharya de poner a disposición de los que menos recursos tienen toda la información científica que cuelga de la Web. se encarga por sí sola de traducir las palabras que se escriben en ella en numerosos y pertinentes resultados de búsqueda escritos en cualquier lengua. Dado que este es un libro con múltiples caras. la del buscador y la de la herramienta bibliométrica. que constituyen todo un lujo. sólo recalcar que lo hemos dividido en dos secciones. contribuyendo decisivamente al masivo uso del buscador y a la popularización de la propia bibliometría. resume sintéticamente todo lo que pensamos sobre GS: ha supuesto una auténtica revolución en la forma de buscar y de encontrar información científica y de acceder a ella de manera fácil y rápida. un magnífico software que ha hecho factible el uso bibliométrico de Google Scholar.

nacido en julio de 2011 como un servicio a los autores para que generen un perfil donde se muestren los documentos publicados y recogidos en Google Scholar. que permitiera a los usuarios identificar las más influyentes revistas. En fin. Dado que Google Scholar presenta una doble cara. Publishers Scholar Metrics. se realiza un repaso exhaustivo de toda la literatura científica que ha indagado empíricamente sobre el comportamiento de Google Scholar hasta hoy en esta doble faceta. en español). Y Google Scholar Metrics (Estadísticas en español). Proceedings Scholar Metrics y Scholar Mirrors. señalando sus fortalezas y debilidades. generando una serie de indicadores bibliométricos. y que conforman lo que denominamos la familia Google Scholar: Google Scholar Citations (Mis citas. nacido en abril de 2012 como ranking de publicaciones científicas ordenado en función del h-index a partir de los datos de citaciones de Google Scholar. 11 de marzo de 2016 . el primero dedicado en exclusiva a la descripción de los principales productos derivados de Google Scholar. creo que este libro ofrece una revisión omnicomprensiva a la par que minuciosa sobre lo que es a día de hoy Google Scholar y sus derivaciones. H Index Scholar. de manera que viene a ser un estado de la cuestión. Emilio Delgado López-Cózar Profesor de la Facultad de Comunicación y Documentación Universidad de Granada Huétor Vega. congresos y repositorios. cobertura y crecimiento. Se traza su origen y evolución. Journal Scholar Metrics. se examina su tamaño. así como el número de citas que cada uno de ellos ha recibido.24 La revolución Google Scholar las características y prestaciones de Google Scholar. debilidades y peligros. la de buscador (razón por la que nació y que realmente lo identifica) y la de herramienta de evaluación (una aplicación sobrevenida y no buscada inicialmente por sus creadores). Scholarometer. se desmenuza su funcionamiento general. se pormenorizan las prestaciones y servicios que proporciona como buscador y se apuntan sus fortalezas. En el segundo apartado hemos incluido aquellos productos independientes a la compañía y que se han gestado para ofrecer distintas herramientas bibliométricas: Publish or Perish. funciones y prestaciones. De forma sintética hemos descrito sus características. La sección B la hemos dividido en dos apartados.

Bloque A Google Scholar: el buscador académico universal .

.

.base-search. Dada la revolución que ha supuesto este buscador. describir sus características y funcionamiento y presentar algunas de sus aplicaciones métricas más importantes.psu. Podría ser considerado como un buscador especializado en localizar información académica en la Web. CiteseerX 2 destaca por sus prestaciones para la exportación de registros. que incorpora además ciertos elementos de valor añadido (indicadores de naturaleza bibliométrica como número de citas a los documentos académicos) que puedan ser utilizados para la evaluación científica y que estén finalmente abiertos a cualquier tipología documental (no sólo artículos sino patentes. 1 http://www. Por ejemplo. tanto en la búsqueda como en la evaluación de la actividad científica. el motor de búsqueda académico desarrollado por Google Inc. tal y como proponía Codina (2007). presentaciones.com . Finalmente.net 2 http://citeseerx. Google Scholar.com/scirus 4 http://academic.ist. es el que dispone de una mayor cobertura de material académico. En la actualidad cohabitan diversos motores de búsqueda académicos. etc. cada uno con sus propias características y funcionalidades.sciencedirect.microsoft. Scirus 3 (actualmente deshabilitado) destacaba por una interfaz de búsqueda superior mientras que Microsoft Academic Search 4 (que tras desactualizarse ha renacido de sus cenizas recientemente) por sus servicios de valor añadido. BASE 1 es quien aporta un mayor número de contenidos en acceso abierto.edu 3 http://www. siendo ésta la aproximación seguida por Ortega (2014) en su completo y exhaustivo estudio comparativo de motores de búsqueda académicos. con el fin de conocer cómo ha contribuido definitivamente a la popularización y democratización de la evaluación de la actividad científica.). material docente.Capítulo 1 Los orígenes No es sencillo encontrar una definición exhaustiva y globalmente aceptada de motor de búsqueda académico (academic search engine).research. este libro está dedicado exclusivamente a conocer su historia.

entre otras muchas cuestiones sociales y políticas.28 La revolución Google Scholar Google Scholar es un buscador web académico (Ortega. advertir que “existían” contenidos relevantes en algún lugar suponía un auténtico cambio en las reglas del juego. Aunque no se pudiera acceder a ella por diversos motivos. co-creador y alma de este buscador. Estos y otros muchos servicios serán desgranados a lo largo de la presente obra con el propósito de facilitar una visión holística del entorno académico que Google Scholar supone en la actualidad. siempre cabía la posibilidad de escribir una carta al autor solicitándole una copia (Levy. el acceso directo a los textos completos (cuando esto es posible por cuestiones legales) o la indicación del número de citas recibidas por cada registro. libro. si conocías la existencia de cierto artículo. terribles dificultades a los estudiantes para poder costearse y tener acceso a materiales académicos que fueran realmente relevantes en sus estudios. 2014) gratuito que indiza la literatura científica en un amplio abanico de disciplinas. actual distinguished engineer en Google. Sin embargo. Para un estudiante medio indio esto era prácticamente imposible. tipologías documentales e idiomas. un enfoque amplio que resulta necesario para comprender el verdadero impacto que este buscador especializado está generando en la sociedad académica de principios del siglo XXI. Nacimiento No sería posible relatar la historia y los orígenes de Google Scholar sin indagar en la figura de Anurag Acharya. 2014). Está por tanto especializado en buscar e identificar material bibliográfico de carácter académico proporcionando además una serie de servicios adicionales de gran valor. informe o material académico. tales como la disponibilidad de las referencias bibliográficas de los registros en distintos estándares (permitiendo su posterior descarga a gestores de referencias). India). . 2015). Acharya nació en Bikaner (Rajasthan. Tal y como el propio Acharya ha reconocido en diversas entrevistas (Van Noorden. procedimiento que el todavía estudiante Anurag utilizó en más de una ocasión. donde se graduó en Computer Science & Engineering en el campus de Kharagpur del Indian Institute of Technology. ya en su época de estudiante (a mediados de los 1980s) tuvo conciencia de la importancia que suponía el hecho de conocer la existencia de información “ahí fuera”. Crecer y estudiar en una zona en desarrollo implicaba.

Sin embargo. tras unos años de vida académica que podríamos etiquetar como estándar. 2015) y que presumi- 29 .es) Los desarrollos en tecnologías de la información y comunicación han revolucionado la compartición mundial de material de todo tipo en la Red. que el propio Anurag Acharya hacía accesible desde el blog oficial de Google Scholar.com. que obtuvo en la Carneggie Mellon University en 1994. todavía común hoy día. Ejemplo de postal de solicitud de artículo científico Fuente: Anurag Acharya (http://googlescholar. transformando el modo en que se produce el intercambio de material académico entre pares. Este recuerdo. Acharya sintió la necesidad de dar un cambio de rumbo a su trayectoria y aplicar sus conocimientos en proyectos más complicados. todavía no existía). el Dr. que hoy día hace esbozar una sonrisa al Doctor Acharya (Giles. que definitivamente marcaran la diferencia (Levy. Tras completar sus estudios universitarios. 2005). Sin embargo. para un estudiante en India no era tan obvio en aquella época (la Web.blogspot. Acharya marchó a los Estados Unidos para realizar el doctorado en Computer Science.Bloque A · Capítulo 1 · Los Orígenes En la figura 1 se muestra a modo de ejemplo una postal típica de solicitud de artículo científico. es no obstante fundamental para comprender parte del funcionamiento interno de Google Scholar para indizar la inmensidad de la Web académica en todo el planeta. por ejemplo. Figura 1. Posteriormente tuvo la oportunidad de trabajar como investigador posdoctoral en la University of Maryland para finalmente obtener una plaza como Assistant professor en la University of California – Santa Bárbara (Giles. 2005).

como China o Rusia). período en que consiguieron dominar el mercado de los buscadores a escala global (a excepción de unos pocos países con gran aceptación y uso de motores de búsqueda nacionales. gracias en parte a la amplia aceptación del sistema Android en los Smartphones. en la arteria vital de la compañía).comscore. Acharya se integró finalmente en el equipo de Google en 2000 (Van Noorden.6% de cuota de mercado. precisamente en un momento en el que se cuestionaba su futuro profesional y académico. To organize the world’s information and make it universally accessible and useful.netmarketshare. también fueron años de mucho trabajo y demasiado estrés. La misión de esta empresa (organizar la información del mundo y hacerla universalmente accesible y útil) 5 tuvo un calado importante en la mente de Acharya.com/search-engine-market-share. Google (y todos sus sitios web asociados) supone el 67% del mercado de las búsquedas desde escritorio en los Estados Unidos. 2014). el resultado todavía es más impactante.com/business/technology/googling-on-mobile-devicessurpasses-pcs-in-us-for-1st-time/2015/05/05/909a9c6a-f344-11e4-bca5-21b51bbdf93e_ story. En 1999 tuvo la oportunidad de visitar a un colega que había comenzado a trabajar en una nueva startup en Palo Alto (California). Un predominio que siguen manteniendo en la actualidad. debía dejar 5 Cfr. Según datos de Netmarketshare 8.washingtonpost.2% del mercado mundial de los motores de búsqueda móvil (tableta + teléfono inteligente). Según sus propias palabras. Un predominio realmente abrumador.google. donde se mantuvo por cuatro años que a la postre resultaron vitales en la compañía californiana. seguido de Microsoft con el 19.html 8 https://www. Más allá de los éxitos de la compañía. que terminaron por quemar laboralmente a Acharya por completo. Si el análisis lo exportamos a las búsquedas desde dispositivos móviles. denominada Google. https://www. Google ha confirmado recientemente de forma oficial que las búsquedas que se realizan desde los teléfonos móviles inteligentes han superado por vez primera en número a las realizadas desde ordenadores portátiles y de sobremesa en los Estados Unidos 7. Google representa a fecha de junio de 2014 el 92. aspx?qprid=4&qpcustomd=1 .es/intl/en/about 6 http://www. Según datos de Comscore 6 a fecha de noviembre de 2014.com/Insights/Market-Rankings/comScore-Releases-December2014-US-Desktop-Search-Engine-Rankings 7 http://www. La terrible carga de trabajo llegó a tal punto de hacerle plantear una salida. concretamente en el equipo de indización (es decir.30 La revolución Google Scholar blemente tuvieran un impacto más claro e intenso en la sociedad.

¿En qué medida tal circunstancia había podido privar a grandes mentes. de inspiración para su vida y obra? Y al mismo tiempo. decidieron tomarse un año sabático. tanto Acharya como un compañero del equipo de indización (Alex Verstak). pero con menor presión (Levy. Los datos que manejaban Acharya y Verstak indicaban que los usuarios estaban enviando consultas puramente académicas a Google. los dos ingenieros pronto se dieron cuenta de una circunstancia que a la postre devino fundamental en el desarrollo futuro del proyecto. sino simplemente la de mejorar el ranking de documentos académicos en las búsquedas web (Van Noorden. simplemente buscan respuestas a sus preguntas. fue entonces cuando Acharya pudo darse cuenta de lo valiosa que podría ser una herramienta dirigida a estudiantes y académicos que pudiera proporcionar información y acceso a la literatura científica y académica circulante. la idea que tenían en mente no era la de crear ningún Google académico. ¿qué impacto podrían haber tenido ciertas obras si su distribución no hubiera sido tan limitada al no disponer de plataformas de difusión de este tipo?. el buscador les proporcionará documentos donde. presumiblemente. Algo que hubiera cambiado la vida a millones de estudiantes que. el resto de usuarios no tienen ningún conocimiento o idea prefijada del tipo de resultado que van a obtener. 2006). ¿habría cambiado la vida de cientos de investigadores? A lo que podríamos añadir… ¿está efectivamente cambiando hoy día? 9 Cfr. El usuario que busca material académico sabe que está buscando material académico. no podían acceder a material académico de calidad. Sin embargo. Existía una gran diferencia entre el usuario que realizaba la búsqueda de un material académico y el usuario que realizaba la búsqueda de cualquier otro tipo de información (como buscar una pizzería o un fontanero). Ante esta situación de crisis. El proyecto evolucionó y viró por tanto de dirección. 2015) 9. por ello comenzaron a experimentar la extracción automática de metadatos y posterior posicionamiento y ordenación de la literatura científica. Es decir.Bloque A · Capítulo 1 · Los Orígenes la empresa o hacer algo que fuera interesante para él.” (Levy 2015)” 31 . como él en su juventud. en su país y en muchos otros lugares. 2014). but is lower pressure. puedan estar las respuestas. Una diferencia absurdamente sencilla. “Either I have to leave the company or I have to do something that can be interesting to me. con el propósito de integrar estos resultados en el buscador general (Hughes. Durante esta época de “descanso” ambos comenzaron a trabajar por su cuenta en la mejora de la indización del buscador. En cambio.

Verstak y Acharya estamparon el objetivo definitivo de Google Scholar: hacer que los problemas del mundo se resuelvan un 10% más eficientemente (Levy. Ambos provenían del mundo académico por lo que conocían sobradamente las necesidades reales de los investigadores cuando éstos se enfrentan a la ardua tarea de localizar información científica: las fuentes. la inmediata reacción de éste fue: ¿por qué no está “vivo” esto todavía? Evolución Google Scholar nació finalmente el 18 de noviembre de 2004 con solo dos personas en su equipo (Acharya y Verstak). http://en. Cuantos más votos hubiera alcanzado un determinado artículo. Este acto de citación podía entenderse como un “voto” a un documento (este concepto se debe entender de forma general y sin entrar en el arduo debate acerca de las distintas motivaciones de los científicos para citar o no citar). Entre las características de este ya viejo algoritmo se encontraba la de imitar el comportamiento de las bases de datos bibliométricas (en aquella época.org/ wiki/Google_Scholar . 10 Cfr. los artículos científicos recibían citas de otros artículos publicados con posterioridad que mostraban o reflejaban una deuda científica con los textos pioneros. más allá de su enorme cobertura y dinamismo (aspectos que serán estudiados en capítulos posteriores). fundamentalmente Web of Science.wikipedia. He aquí una bella paradoja en la historia de la búsqueda y recuperación de la información. La mayor novedad. propiedad de Thomson Reuters). Cuando tras varias pruebas enseñaron finalmente el prototipo a Larry Page (co-creador de Google). radicaba en la aplicación de la tecnología de Google a la hora de posicionar los artículos mostrados en los resultados de una determinada consulta. Efectivamente. permitiendo un acceso más fácil y preciso al conocimiento científico 10. 2012). la materia y los autores eran y son las piedras angulares sobre las que bascula cualquier consulta de esta naturaleza. su relevancia sería mayor de entre aquellos otros textos que hubieran recibido apenas alguna o ninguna cita. To make the world’s problem solvers 10% more efficient. 2015). El elemento que permitió a Google distinguirse del resto de competidores en el mercado de los buscadores web fue el PageRank (Brin y Page. así como en la identificación de las relaciones entre los distintos artículos (linking).32 La revolución Google Scholar Con esas ideas en mente.

2005). apenas unas semanas antes. en los inicios de Google el factor clave se basaba principalmente tanto en la cantidad de enlaces (considerados como citas o votos) que una página recibía como en el establecimiento de pesos en función del lugar donde provenía el enlace (es decir. A pesar de disponer de una interfaz sencilla y de pocas funcionalidades extra. y además la fórmula completa es secreto industrial. El éxito de Google Scholar como buscador (y como marca) fue inmediato pese a coincidir en el tiempo con el anuncio de una nueva base de datos bibliográfica (Scopus. no era lo mismo recibir un enlace del Washington Post que de la página personal de un estudiante de secundaria). mientras Web of Science y Scopus iniciaban una rivalidad como bases de datos bibliográficas de referencia en el mundo científico. por lo que la precisión y relevancia de los resultados incrementaba sin cesar. La cantidad de factores que intervienen en la relevancia de una página web en la actualidad es enorme (se estima que existen más de 200 posibles factores) 11. tienen diferentes matices a la hora de contabilizarlos. 2004).Bloque A · Capítulo 1 · Los Orígenes Esta idea de los “votos” sugirió a Sergey Brin y Larry Page. Por supuesto. y el resto ya es Historia. aunque acciones con innegables similitudes.com/google-ranking-factors 12 https://moz. utilizando para ello la tecnología y el conocimiento del buscador general de Google. Ninguna otra base de datos bibliográfica o bibliométrica del momento proporcionaba esta funcionalidad más allá de posicionar los artículos según su número de citas (Giles. presentada el 3 de noviembre de 2004 (Reed Elsevier. la posibilidad de posicionar los resultados ante una consulta determinada en función de los “votos” que tuvieran las páginas web que aparecían en la página de resultados (y que ya tenían por tanto una relación con la consulta realizada por los usuarios). El sistema era capaz de posicionar los artículos en función de su relevancia ante una determinada consulta. Esta analogía que la bibliometría había llevado a los motores de búsqueda volvía al mecanismo de Google Scholar para crear un sistema novedoso en el acceso a la literatura científica. de una variabilidad y dinamismo muy alto (se estima que Google realiza entre 500-600 modificaciones menores de su algoritmo durante un año y ocasionalmente modificaciones de gran envergadura) 12. Google Scho 11 http://backlinko. El sistema era asimismo capaz de acceder a una cantidad de artículos a texto completo cada vez mayor. A pesar de todo ello. el algoritmo era en realidad mucho más complejo pues determinar un “voto” y contabilizar una cita.com/google-algorithm-change 33 . propiedad de Elsevier). creadores de Google. Un hecho es que el algoritmo funcionó.

En concreto. Butler señalaba que las primeras impresiones de Google Scholar por parte de los expertos (tanto bibliotecarios como informáticos) sugerían que el servicio era impresionante tanto en escala como en funcionalidad.617) y MSN (2. 2004) ya se habían hecho eco del impacto de este buscador. en el sentido amplio del término. Tanto Verstak como Acharya eran plenamente conscientes de que una base de datos académica sólo puede sobrevivir si los materiales más relevantes están incluidos en su catálogo. Pubmed-Medline (14. El caso más mediático tal vez lo constituyó la American Chemical Society (ACS). Y eso marcaba la diferencia (de ahí la obligatoriedad de que los textos dispongan de un resumen para ser incluidos en Google Scholar. aunque algunos manuscritos estuvieran detrás de una plataforma de pago (y por tanto no accesibles aunque aparecieran en los resultados de búsqueda).616). Pubmed central (9. tanto Science (Leslie. simplemente el hecho de poder incluir una descripción o un resumen ya implicaba mostrar al usuario que ese contenido existía. 2004) como Nature (Butler.34 La revolución Google Scholar lar iba creciendo en otro sector básico: en la búsqueda y localización de información académica.756) y Google Scholar (105. como se verá en el capítulo dedicado a la indización). se comenzaba a detectar una tendencia que resultaría clave en las posteriores negociaciones de Google con los editores: Google Scholar aumentaba las visitas a las páginas web de las revistas. Las negociaciones de Google Scholar con las editoriales académicas más potentes fueron complicadas. Es más. Giles (2005) ya informa que Google Scholar dirige más tráfico a las sedes web de Nature que cualquier otro motor de búsqueda académico multidisciplinar mientras que Giustini (2005) proporciona datos de visitas al British Medical Journal (noviembre de 2005). quienes reclamaron que Google . Y para ello Acharya tuvo que negociar duramente con las editoriales privadas desde el principio y durante años.522). En cualquier caso. informando que Google (345.336).185) son las dos fuentes desde donde se reciben más visitas. Estos mismos datos a fecha de 2015 (para aquellos servicios que todavía siguen vivos) deben ser tan escalofriantes como privados. Antes de que el producto hubiera cumplido su primer año de funcionamiento. Proporcionar información era la base fundamental sobre la que se sustentaban y con la que Acharya deseaba cumplir ese sueño que comenzó a imaginar durante sus años de estudiante. seguidas a cierta distancia de Yahoo! (57. El acceso al texto completo de los artículos constituyó uno de los principales campos de batalla con los que el equipo de Google Scholar tuvo que lidiar durante los primeros años del producto.967). Highwire press (8.

Pese a ello. permitiendo solamente ser indizadas por Google Scholar utilizando la información bibliográfica y el resumen. Otra cosa bien distinta es que los usuarios finales puedan o no acceder a los textos completos proporcionados por las editoriales. las instituciones que tienen acuerdos con 35 . Ingenta. en 2005 ya incluía en su catálogo a los principales editores. entre otros: Association of Computer Machinery (ACM). En este punto se debe aclarar un tema de suma importancia y que generalmente suele dar pie a errores y malinterpretaciones. En este sentido. así como de importantes archivos online como el de la NASA Astrophysics Data System o repositorios como Arxiv o Pubmed. Google Scholar indiza los textos completos con el fin de que los resultados ante determinadas consultas sean los más pertinentes. Nature Publishing Group. Vine (2005) descubre que Google Scholar indiza sus contenidos con casi un año de retraso. Al parecer. 2005). cuyos términos no trascendieron a la luz pública y donde las partes se limitaron a firmar un acuerdo en el que se comprometían a costear los honorarios de los abogados. aunque no todos ellos en su completitud (Notess. pese a que Pubmed ya se encontraba indizada en 2005. Springer o Wiley. 2004). Institute of Electrical and Electronic Engineers (IEEE).Bloque A · Capítulo 1 · Los Orígenes Scholar ejercía una competencia desleal a su plataforma SciFinder Scholar (una aplicación de escritorio de pago que servía para indizar información almacenada en la base de datos de la ACS). 2004). Blackwell.S. hecho que dependerá de las posibles subscripciones que tengan contratadas los usuarios. tanto Elsevier como Highwire y la American Chemical Society no estaban todavía incluidas en los acuerdos para acceder al texto completo de los artículos publicados por estas importantes editoriales. la demanda se centraba especialmente en el uso del término “Scholar” y no en la herramienta como tal (Hines. Dado que Google Scholar no proporciona una lista detallada de las editoriales incluidas (ni tampoco de las revistas. Es decir. La demanda terminó con un acuerdo extrajudicial en Washington en 2006. hecho que limitaba ampliamente su uso para investigadores que precisaran información médica actualizada. autores o materias. District Court for the District of Columbia (Mehta. siempre ha sido genuinamente complejo conocer los acuerdos específicos a los que había llegado con las distintas editoriales. La ACS interpuso una querella el 9 de diciembre de 2004 (menos de un mes después del lanzamiento del buscador) en el U. En la revisión posterior realizada por Vine (2006). Por ejemplo. asuntos todos ellos que serán discutidos con mayor profundidad en el apartado dedicado a la cobertura). el acuerdo de acceso completo se refiere a Google Scholar y no a los usuarios finales.

Esta biblioteca digital fundada en 1995 por William G. por lo que no tenían posibilidad de separar de forma efectiva los resúmenes de los artículos (tarea costosísima en tiempo y dinero). para autenticar usuarios y proporcionar acceso a los textos completos en el caso de que estén disponibles a través de las distintas subscripciones institucionales. 2015). El acceso al texto completo gracias a la existencia de copias privadas de los autores depositadas en repositorios institucionales (en la forma de preprints o postprints) o en plataformas de intercambio de material académico (como ResearchGate 13) constituye igualmente un asunto aparte.org . pues no se precisa de Google Scholar para acceder a dichos contenidos.36 La revolución Google Scholar las editoriales (bibliotecas académicas fundamentalmente) pueden configurar OpenURL Link resolvers (como SFX). Bowen (entonces Rector de la Princeton University) constituye en la actualidad la mayor plataforma de artículos online del mundo (Levy. en su posterior análisis de Google Scholar. notifica que el buscador ya tiene acceso al texto completo tanto de Highwire como de la American Chemical Society. Una de las posibles razones de la renuncia inicial de Elsevier a ser indizados por Google Scholar a texto completo. a la que seguramente no deseaban perjudicar en favor de Google Scholar (Scirus fue deshabilitada definitivamente en 2014). convenció a los responsables de JSTOR para ofrecer la primera página de cada artículo de forma gratuita (pues en la primera página suele estar incluido el resumen). De esta forma. Acharya. aunque sin duda éste facilita su descubrimiento. La indización de la plataforma JSTOR 14 supuso otro importante hito en la evolución de Google Scholar. podría deberse a que disponían de su propia plataforma web (Scirus).researchgate. Cecchino (2010). 2007). Finalmente.net 14 http://www. Y disponer de un resumen en abierto (aparte de la información bibliográfica) es requisito obligatorio para ser indizado en el buscador académico. en su faceta de negociador y evangelista de Google Scholar. y esta primera página podía servir adicionalmente de aliciente a los usuarios para solicitar la compra de un artículo que pudiera ser de su interés tras leer 13 https://www.jstor. más allá de las posibles cuestiones legales o de competencia. El principal problema de JSTOR tenía para ser indizada en Google Scholar era que solamente ofrecía acceso de pago para artículos escaneados. No es hasta 2007 cuando las revistas de Elsevier comienzan a ser incluidas a través de Science Direct (Brantley. podrían estar indizados en Google Scholar (aunque no a texto completo).

una década después de su lanzamiento (Van Noorden. Más allá de los distintos acuerdos alcanzados con diversas editoriales académicas. no sólo por la escasez de plantilla asignada sino por la publicidad y difusión del producto. En la actualidad (septiembre de 2015). Este hecho ha llevado en ocasiones a ser ligeramente discriminado dentro de la misma compañía de Mountain View. Google Scholar ha ido paulatinamente ampliando la gama de servicios y prestaciones desde su lanzamiento. el producto ha ido mejorando progresivamente durante sus primeros diez años de existencia no sólo en la calidad de sus resultados. Este hecho puede deberse a que Google Scholar actualmente no genera beneficios a la compañía. Aunque 37 . La inclusión de publicidad o de resultados patrocinados (tal y como ocurre en el buscador general) se antoja de complicada aplicación en un entorno académico. que se incluye entre los “buscadores especializados” como Google Finance o Google Trends. hecho que pudo directamente observarse en 2011 cuando se eliminó el acceso directo al producto desde el menú desplegable de opciones de la página principal de Google. cuando Acharya es preguntado respecto a este asunto (Levy. 2014). una reflexión que parece sonar más bien a una cortés excusa que a un argumento con sólidas raíces. JSTOR tiene indizados alrededor de tres millones de registros en Google Scholar. y que ha ido poco a poco creciendo hasta las nueve personas que lo conformaban en 2014. Otros buscadores especializados como Google Patents todavía corren peor suerte al no estar siquiera incluidos en esta página de productos.Bloque A · Capítulo 1 · Los Orígenes el resumen. duramente criticados en sus inicios (Jacsó. En cualquier caso. En la actualidad se precisan hasta tres clics y un scroll (todo un mundo en la Web) para poder acceder al servicio. Un número absolutamente ridículo si lo comparamos con las extensas plantillas de otros productos y servicios de Google (y de otros productos de la competencia). el distinguised engineer responde que este hecho no afectó a las visitas que el producto recibía (que siempre han ido en continuo ascenso) y que además aquellos usuarios que desean utilizar el producto no tienen mayor problema en encontrarlo. Pese a ello. 2005b). sino por la cantidad de nuevos servicios adicionales de gran utilidad. tanto por parte de los posibles anunciantes como de los usuarios. todos ellos productos portentosos pero alejados del usuario común. constituyendo uno de sus principales proveedores de contenidos. 2015). un esfuerzo digno de alabanza si consideramos que el equipo inicial estaba únicamente formado por Acharya y Verstak.

y Google Scholar Metrics (abril de 2012). las aportaciones más mediáticas hasta la fecha han sido indudablemente Google Scholar Citations (noviembre de 2011). RefMan. funcionalidades de enlazado (linking) entre una amplia variedad de idiomas (de especial importancia el soporte a idiomas no europeos. superior derecha) ya se incluye la posibilidad de realizar una búsqueda avanzada. prestación que ya incluía desde sus inicios. japonés y coreano) o incluso proyectos de digitalización y almacenamiento de revistas académicas impresas. en 2006 se incorporó una herramienta de exportación de referencias de forma que los resultados obtenidos ante una determinada consulta pudieran ser exportados a distintos gestores de referencias (RefWorks.38 La revolución Google Scholar bien es cierto que estas mejoras han ido apareciendo de forma más bien irregular y sin apenas publicidad (Quint. con los que Google Scholar ha comenzado a proporcionar indicadores de naturaleza bibliométrica más allá de los datos de citas recibidas a cada artículo. que ofrece listados de revistas académicas en función del h-index). es preciso remarcar que la finalidad de las citas recibidas en Google Scholar era (y es) básicamente la de ordenar los resultados para presentar en las posiciones superiores a los “presumiblemente” más relevantes ante una consulta concreta (este asunto se tratará con mayor profundidad en el capítulo dedicado a las prestaciones de Google Scholar). accesible desde noviembre de 2013. Sin embargo. En 2006 (figura 2b. No obstante. como el chino. superior izquierda) se observa la pantalla austera de Google Scholar en su lanzamiento.org/ . En la figura 2 se puede observar a título ilustrativo la evolución de Google Scholar a partir de su página de inicio con diversas capturas de pantalla realizadas a través de Internet Archive y su Wayback machine 15. 2007). que permite la creación de perfiles individuales de investigadores. Otras herramientas que se han ido incorporando a lo largo de los años han sido el botón “Artículos relacionados”. desarrollada en asociación con Beijing Wan- 15 https://archive. la caja de búsqueda imitando al buscador general y simplemente un botón de información y de enlace directo a Google. El año 2006 es igualmente importante pues aparece la versión de Google Scholar para China. ha pasado en cambio algo más inadvertida. así como una herramienta de preferencias del buscador (disponibles desde principios de 2005). Endnote y BibTeX). Por ejemplo. La incorporación de Google Scholar Library (una biblioteca personal para gestionar y etiquetar artículos). En 2004 (figura 2a. donde destaca la declaración “beta” del producto.

se recoge el momento de la celebración del décimo aniversario. que ya no aparece en 2010 (figura 2d. centro-derecha). dedicado al proceso de búsqueda en Google Scholar). “Mapas” y “Más servicios”).com.htm 17 http://googlescholar. que sigue vigente en la actualidad (la búsqueda avanzada será descrita con mayor detalle en el capítulo 6. eliminada oficialmente a mediados de 2011). donde ya se permite seleccionar la búsqueda de artículos.cn/english/doc/2006-02/21/content_522254.Bloque A · Capítulo 1 · Los Orígenes fang Data y Chongqing VIP Information 16. en 2014 (figura 2f. aparte de un botón de “Acerca de” y “Ayuda” específicos de Google Scholar. pues además de dejar definitivamente atrás la etiqueta de “beta” y lanzar productos derivados de gran impacto. aparte de la configuración del buscador.es/2012/05/our-new-modern-look. donde ya se ha incluido el servicio de biblioteca personal. cada vez más completa. mostrándose más cercana a la caja de búsqueda.chinadaily. centro-izquierda) al integrar el antiguo menú de inicio de Google (“Google Imágenes”. patentes y textos de jurisprudencia. 16 http://www. en el que se destaca fundamentalmente la incorporación de filtros a los resultados a través tanto de un menú lateral izquierdo como superior (todavía presentes aunque con ciertos retoques y cambios). El 2012 constituyó un año especialmente importante. así como el acceso a la búsqueda avanzada a través de una pequeña pestaña situada a la derecha de la caja principal de búsqueda. fue el año en el que el sistema modificó gran parte de la interfaz interna de los resultados 17. “Noticias”.blogspot. La integración con Google sigue presente no sólo con el enlace al buscador sino con un enlace a la ayuda de Google. inferior izquierda) se observa la desaparición de la declaración de beta. En 2012 (figura 2e. así como la incorporación en la parte superior izquierda de la pantalla del acceso a los perfiles personales. y el menú de opciones se ha movido desde la parte superior derecha hacia el centro superior de la pantalla. Esta integración se hace todavía más patente en 2008 (figura 2c.com. inferior derecha). Finalmente. al ranking de revistas y a los sistemas de alerta. “Vídeos”.html 39 .

medio derecha: noviembre 2010.40 La revolución Google Scholar Figura 2. Evolución de Google Scholar (2004. inferior derecha: noviembre 2014. superior derecha: noviembre 2006. 2006. inferior izquierda: noviembre 2012. 2008. . 2010. medio izquierda: noviembre: 2008. 2012 y 2014) Superior izquierda: noviembre 2004.

dios de la mitología romana que tenía dos caras mirando hacia ambos lados de su perfil.Capítulo 2 Las dos caras de Google Scholar (I): El buscador académico Al igual que Jano (Figura 3). así como en la percepción de éste en sus diferentes usuarios. Este segundo capítulo se centra exclusivamente en el papel de Google Scholar como buscador de información académica hegemónico. Efectivamente. Figura 3. Google Scholar es por una parte un buscador (facilita el inicio de la búsqueda de material científico) y. Las dos caras de Google Scholar . una herramienta susceptible de ser utilizada para evaluar la actividad científica. Su papel hegemónico actual tanto en las búsquedas académicas como en la gestión de perfiles académicos personales es fiel reflejo de los tiempos de cambio que se viven actualmente en el mundo de la comunicación científica y la tendencia hacia la democratización bibliométrica. por otra parte. Google Scholar tiene dos caras que representan asimismo un comienzo en la búsqueda científica y un final en la evaluación de la actividad científica. dios de los comienzos y los finales (de ahí que le fuera consagrado el primer mes del año).

com/scholar. Google Scholar ha sido ampliamente analizado y cuestionado tanto por la Academia como por el mundo de los profesionales de la información (Howland.com/support/glossary#TrustFlow . creado a partir de la tecnología flow metrics de la empresa Majestic.compete. Una definición de su significado se puede encontrar en el siguiente recurso: https://majestic. tenían en mente su creación como tal. el número de sitios web desde donde se recibe al menos un enlace (Referring domains) 3 y la calidad del sitio (Trustflow) a partir de los datos obtenidos mediante Majestic Site Ex 1 https://siteanalytics. Compete 1 muestra la escalofriante cifra de 6. Y sin ninguna campaña de marketing especial por parte de la empresa matriz.com>. la visibilidad web del producto es incuestionable en todo el mundo. la visibilidad es elevadísima 2.com 2 Los datos reales de visitas al servicio no son públicos.974.487. Aun considerando las limitaciones de este servicio para calcular las visitas reales al sitio (la metodología está basada en paneles de usuarios a partir de los cuales se realiza una inferencia estimada de las visitas). 2009). desde su publicación en 2004. Sin embargo. en ningún momento. Wright.612 millones de usuarios únicos en marzo de 2014.411 millones de usuarios únicos en el mercado norteamericano a fecha de marzo de 2015 para el sitio web <scholar. Las visitas al dominio general de Google Scholar (que corresponden exclusivamente a la versión estadounidense) deberían complementarse con las visitas a cada una de las versiones nacionales existentes (el URL de acceso al producto está conformado por un conjunto de URL alias. este mismo indicador mostraba 2. Evaluando tanto su gran potencial en el mercado de las búsquedas académicas como todas las posibles amenazas que su uso irresponsable o impreciso podrían suponer. otros servicios gratuitos con estimación de visitas (Quantcast o Alexa) no proporcionan información del sitio al constituir un subdominio dentro de Google 3 Trustflow es un parámetro similar al PageRank (pero de rango 0 a 100). se podría decir que el nacimiento de Google Scholar fue un tanto humilde.google. El objetivo de este capítulo es pues el de ofrecer un repaso histórico acerca de la reacción del mundo científico y profesional ante este producto. En la Tabla 1 se ofrece un ejemplo de los URLs de acceso a 30 países aparte de la matriz norteamericana. Un proyecto menor para Google. que dirigen a distintas versiones del producto). Boughan y Roberts. A día de hoy. tratando de desvelar sus puntos fuertes y débiles. desarrollado por dos ingenieros durante su año sabático que. mostrando el número de enlaces externos que recibe cada uno (Inlinks).42 La revolución Google Scholar El buscador académico hegemónico A pesar del relativo eco recibido tras su lanzamiento.google.

302 5.google.175 14.289 30 scholar.634 4.hk scholar.088. o porque a pesar de tener versión nacional.475 21 scholar.Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) plorer (historic index) 4.634 2.google. por ejemplo).fi Finlandia 553.com 5 https://moz.google.628 24 scholar.tr Turquía 667.google.131 7. URLs alias de Google Scholar e indicadores web (Majestic Site Explorer.com.google.se scholar.google.co.630 27 scholar.598 31 scholar.437.983 3. y los países mostrados constituyen únicamente una muestra selectiva 7.616 2.nl Países Bajos scholar.413 17. una de las principales herramientas de indicadores web actuales.au scholar.google.br scholar.google.164 30 826.030. En todo caso.530.google.google. están redondeados.it Italia 503.136 188.419 7.845 5.209 53 Reino Unido 4.com/researchtools/ose 6 https://ahrefs.344 22 URL PAÍS scholar.586 7.183 5. Tabla 1. algunos países no disponen de versión propia.com.435.007.google.com. 6 de enero 2016) Inlinks Referring Domains Trustflow 614.com.google.127 3.090 32 scholar.kr Corea del Sur 1.google.ca Canadá scholar.uk scholar.806 36 Australia 499.632 29 India 2.google. el caso de México).google.022 26 Brasil 391.no Noruega 853.367 31 España 762.059 42 Alemania 3.google.149.google.com 7 Además.in 4 https://majestic.google. bien por no disponer de versión nacional de Google (como Nigeria.de scholar.336 31 Suecia 269.210 1.be Bélgica 1.com Estados Unidos scholar.fr Francia scholar. Google Scholar redirige a la versión norteamericana (por ejemplo.714 30 1.es scholar.co. pueden ser muy diferentes a los obtenidos mediante otros servicios similares como OpenSiteExplorer 5 o Ahrefs 6.115 1.416 33 China 871.148 39 2.co.278. 43 . los datos de esta tabla deben leerse obligatoriamente de forma ilustrativa y comparativa pues éstos poseen una enorme variabilidad (incluso diaria).711 1.529 1.

co. aparte del hecho de ser multilingüe.ru Rusia 421.569 790 25 scholar. su simpleza.uk> hacia <scholar.pt Portugal 262. La versión inglesa es la segunda en visibilidad. seguida sorprendentemente por Alemania. Como muestra de ello.google.co.google. Pubmed. Scopus.412 407 20 scholar.097 912 24 scholar. Resultan no obstante datos útiles para conocer. Por ejemplo.google. no sólo frente al resto de motores de búsqueda académicos (Ortega.com.co.dk Dinamarca 63.google.nz Nueva Zelanda 70. rapidez. . los posibles enlaces desde <scholar.google.google.293 473 19 scholar.za Suráfrica 19.330 29 scholar. La facilidad de uso de Google Scholar.020 26 scholar.google.co Colombia 24. sencillez. las versiones más populares y utilizadas y la orden de magnitud de su impacto. Los más de 660 millones de enlaces desde más de 170 mil sitios web que recibe la versión norteamericana de Google Scholar constituyen un claro indicio de la amplia difusión y penetración de este motor de búsqueda académico.google.google. en la figura 4 (superior) se muestra la evolución de las tendencias mundiales de búsqueda en Google de los términos asociados a diversas bases de datos (Google Scholar.google.311 688 31 scholar.jp Japón 39 11 11 Además. el sistema no filtra los posibles enlaces que puedan dirigir de un alias a otro. a través de un rápido vistazo.google.ar Argentina 179. 2014) sino frente a otras bases de datos bibliométricas.351 1. Es decir.google.44 La revolución Google Scholar URL PAÍS Inlinks Referring Domains Trustflow scholar.google.356 803 29 scholar.ch Suiza 22.513 1.co. Web of Science. universal y sobre todo gratuito.428 990 28 scholar.210 750 19 scholar. Microsoft Academic Search) desde 2004 hasta la actualidad. pues en realidad pertenecen a dominios web independientes.com.il Israel 9.cl Chile 14. han contribuido a su actual popularización.gr Grecia 164.471 988 31 scholar. la asignación de enlaces no es restrictiva.google.at Austria 208.google.887 686 28 scholar.com> se cuentan como enlaces externos a este último.

Sin embargo.Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) Figura 4. rojo: “Pubmed”. en la figura 4 (inferior) se ofrecen los patrones de 8 La desactualización se detectó debido a la caída abrupta en la cobertura de la literatura reciente. aunque el sistema seguía funcionando. aunque la compañía de Redmond nunca indicó esta circunstancia oficialmente en la plataforma web (Orduña-Malea. especialmente Microsoft Academic Search. desactualizada durante años por Microsoft 8. El resto de bases de datos permanecen a una distancia considerable. Figura inferior izquierda: tendencias de búsqueda geográfica entre enero-julio de 2004. Tendencias de búsqueda (Google Trends) Figura superior: azul: “Google Scholar”. Este hecho provoca que los usuarios tiendan a comenzar sus búsquedas en este último y. los perfiles de usuarios son inaccesibles. En la actualidad el 100% de la cobertura de Pubmed está incluida en Google Scholar. verde: “Scopus”. Adicionalmente. terminen accediendo a Pubmed para consultar datos bibliográficos más completos o metaanálisis. En la actualidad (mayo de 2015). Figura inferior derecha: tendencias de búsqueda geográfica entre febrero-mayo de 2014 En la figura 4 (superior) se pueden destacar los caminos divergentes que han seguido Google Scholar (en color azul) y Pubmed (en color rojo). estas visitas ya no se reflejan como consultas al buscador de Google. sino que aparecen como accesos o visitas desde Google Scholar a Pubmed. pero con una interfaz y funcionalidades distintas 45 . Ayllon y Delgado López-Cózar. 2014). violeta: “Microsoft Academic Search”. Martín-Martín. Nota: en marzo de 2016 el buscador volvió a funcionar. amarillo: “Web of Science”. si la navegación lo requiere.

lo que tenía un efecto negativo en las ciencias sociales y humanidades. Este hecho ya es detectado por Ortega (2015) en su estudio de la demografía de los perfiles creados en Google Scholar Citations. aunque por supuesto la tarjeta de presentación de Google Scholar en 2015 no tiene comparación alguna con la de 2004. 2006). principalmente). Jacsó (2006) usa los términos “shallowness” (superficial) y “artificial unintelligence” (desinteligencia artificial) para describir el programa. estudiante) y muy significativamente del área de conocimiento. En cierto modo. cada una de ellas con sus espinas correspondientes. China y sorprendentemente Brasil. enfado. ni siquiera inmediato. el camino de Google Scholar no ha sido sencillo. aunque escepticismo (Brophy y Bawden. depresión y finalmente aceptación). En un primer momento.46 La revolución Google Scholar consulta geográficos a nivel mundial entre enero-julio de 2004 (izquierda) y febrero-mayo de 2015 (derecha). cuyos objetivos se centraron exclusivamente en el estudio del buscador con el propósito de analizar su capacidad como herramienta de evalua- . A esta fase le sigue un período de estudio sistemático (Robinson y Wusteman. El grado de cobertura de Google Scholar dependía en sus inicios fuertemente de los acuerdos con las editoriales y de su capacidad de rastreo de la web profunda (deep web) para localizar literatura gris. Tanto desde el sector del profesional de la información (usuarios intermediarios) como desde el académico (los usuarios finales) el producto fue acogido con una amplia diversidad de opiniones y sentimientos: desde la más exagerada admiración hasta la más injustificada crítica. Su aceptación nunca fue (ni es) completa. 2007) donde recibe críticas durísimas. donde Brasil ocupa un puesto prominente. Desde el sector académico las opiniones diferían fundamentalmente en función del usuario (investigador. 2005). Reino Unido y Australia. Por ejemplo. profesor. Desde el sector bibliotecario se pueden vislumbrar tres fases diferenciadas. A estos dos importantes focos (profesional y académico general) se añadiría con cierta posterioridad un tercero (el sector de la Bibliometría). A pesar del impacto actual del producto. Aparte de las zonas anglófonas (Estados Unidos. negociación. se pasa a una tercera fase de cierto optimismo acerca del potencial de Google Scholar para lograr el 100% de la disponibilidad de la información online para una institución (Pomerantz. se podría decir que las bibliotecas han ido cumpliendo las distintas fases clásicas del duelo (negación. Finalmente. Su travesía podría definirse como un camino de rosas. Google Scholar es observado con curiosidad. se destacan las consultas desde los países escandinavos.

2%) y Medicina (16.vosviewer.1) (Van Eck y Waltman. 2004-2014) Estos datos se exportaron posteriormente con el fin de ser visualizados a través de la herramienta VOSViewer 10 (v. Publicaciones por área de conocimiento (Scopus. Realizando una búsqueda en la base de datos Scopus 9. Por tanto. Scientometrics (23) y Online Information Review (22) han sido las dos revistas científicas en las que se ha publicado la mayor cantidad de trabajos. Informática (42. En la figura 6 se ofrece el mapa de acoplamiento bibliográfico obtenido. a aquellos para los que Google Scholar es el propio objeto de investigación. La distribución completa por área de conocimiento se ofrece en la figura 5. 2010).Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) ción científica.6. La literatura científica ha reflejado pues estos tres frentes de trabajo a lo largo de los últimos años.5%). 1.com 47 . mientras que las áreas científicas desde las que se ha abordado el tema han sido las Ciencias sociales (46. 10 http://www. dentro del sector académico resultaría necesario distinguir por una parte a los investigadores que utilizaban Google Scholar como herramienta de búsqueda de información científica y. 9 Google Scholar no permite la exportación masiva y estructurada de registros bibliográficos. por otra parte.6%). Figura 5. se han recogido hasta 472 trabajos publicados desde 2004 hasta 2014 en los que el término “Google Scholar” aparecía en el título o en las palabras clave.

48 La revolución Google Scholar Figura 6. Mapa de acoplamiento bibliográfico (Scopus 2004-2014) .

El análisis del corpus textual de estos registros bibliográficos permite la elaboración de un mapa de los principales conceptos o temas abordados. siendo uno de ellos (redondeado en rojo) el núcleo de la literatura con mayor grado de similitud en función de las referencias comunes contenidas en cada documento. Figura 7. 2007).Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) Se puede observar por una parte la creación de dos clusters (figura 6. donde se pueden apreciar claramente tres grandes bloques: el orientado a la biblioteca (cluster azul). Este mapa se muestra en la figura 7. Pero no nos adelantemos a los acontecimientos. Mapa de conceptos (Scopus. así como la relación entre éstos. Si se realiza un zoom a este núcleo (figura 6. Este mismo artículo recibe 483 citas en Google Scholar. 2004-2014) 49 . superior). a la sazón los más importantes en la literatura científica relacionada con el estudio de Google Scholar. El documento más citado hasta la fecha (mayo 2015) es “Impact of data sources on citation counts and rankings of LIS faculty: Web of Science versus Scopus and Google Scholar” (Meho y Yang. procesos y estudios comparativos (cluster verde). con 304 citas recibidas. inferior). a los análisis bibliométricos (cluster rojo) y finalmente a los métodos. el espinoso tema de la cantidad y calidad de estas citas será tratado más adelante. se pueden observar con mayor detalle las conexiones establecidas entre estos documentos.

comisionados por la Online Computer Library Center (OCLC). profesionales o académicos) y posteriormente nos ocuparemos del frente de investigación que toma Google Scholar como objeto de estudio.). Por claridad expositiva. a continuación se van a desgranar los principales hallazgos y discusiones científicas en torno a Google Scholar. comenzaremos con la línea de investigación centrada en Google Scholar como buscador (desde el punto de vista de los usuarios. herramientas de descubrimiento. Los resultados de su trabajo muestran que el 45% de los estudiantes analizados había empleado Google como primera opción a la hora de localizar este tipo de información. a) Percepción de la calidad. bases de datos bibliográficas. Griffiths y Brophy (2005) llevan a cabo uno de los trabajos pioneros en este ámbito al realizar un estudio de usuarios en el Reino Unido con el propósito de ampliar el conocimiento acerca del comportamiento de los estudiantes a la hora de utilizar recursos académicos. ya sean estudiantes.50 La revolución Google Scholar Tomando como punto de partida los datos obtenidos en las figuras anteriores. etc. académicos y profesionales de la información) y. Los usuarios y Google Scholar Entre los estudios que abordan el análisis de Google Scholar como buscador académico se pueden distinguir por un lado aquellos que pretenden conocer el grado de percepción de la calidad y utilidad del producto por parte de diferentes tipos de usuarios (estudiantes. realizan un amplio estudio . utilidad y grado de utilización ¿Qué piensan los estudiantes? La irrupción de Google Scholar en el mercado de los buscadores de información académica supuso una auténtica revolución en el comportamiento de los usuarios a la hora de comenzar sus procesos de búsqueda y recuperación de información científica. concretamente para analizar su validez en la evaluación de la actividad académica. Dada su sencillez y potencialidad no es de extrañar que pronto surgieran los primeros estudios tratando de valorar el impacto de este nuevo buscador en los estudiantes. las investigaciones orientadas a comparar las prestaciones de Google Scholar con otros productos de información bibliotecarios (catálogos. Una explicación razonable a estos resultados puede deberse a la popularización de los motores de búsqueda como herramienta entre los alumnos. por otro lado. En ese sentido De Rosa et al (2005).

sino que está propiciando un notable cambio en la forma de trabajar en el sentido amplio.Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) a través de una encuesta a 3. el virus Google había sido inoculado. el efecto de Google (buscador general o académico) va mucho más allá de un cambio de la herramienta usada como punto de partida de las búsquedas. Singapur. India. Los resultados de este informe indican que el 89% de estos estudiantes en activo utilizaban los motores de búsqueda para comenzar sus procesos de búsqueda de información mientras que sólo el 2% utilizaba el sitio web de la biblioteca para este propósito. concentración en 51 . aunque las personas jóvenes demuestran una aparente facilidad y familiaridad con los aparatos electrónicos y los ordenadores. ¿es capaz el usuario de distinguir los contenidos de calidad de los banales o incluso falsos? Efectivamente.ya había superado un punto de no retorno en los usuarios. Este hecho no sólo confirma los estudios anteriores (que detectaban el amplio uso de estas herramientas como punto de partida de sus búsquedas informacionales) sino que trae a colación otro grave problema: ¿deben ser todos los resultados obtenidos a través de un motor de búsqueda considerados en la misma medida?. El impacto de los motores de búsqueda . El principal objetivo del estudio era pues el de conocer el impacto de la transición digital en el comportamiento informacional de la llamada Generación Google y guiar a los servicios bibliotecarios para que éstos pudieran anticiparse y reaccionar de forma más efectiva ante los cambios emergentes en el comportamiento de los usuarios. Nótese que este fenómeno ya ocurría nada más y nada menos que en mayo-junio de 2005. comprendiendo un amplio rango de edades (de 15 a 57 años). transformando de ese modo los hábitos de consumo de información.y en especial de Google . confían excesivamente en los motores de búsqueda. Canadá. los autores indican que. la British Library y el JISC (anteriormente Joint Information Systems Committee) financian un informe con el fin de identificar el modo en el que los investigadores del futuro (aquellos nacidos después de 1993) iban a acceder e interactuar con los recursos digitales en un margen de 5 a 10 años (Rowlands et al. En ese sentido. Reino Unido y Estados Unidos).348 usuarios para conocer las percepciones que los estudiantes tenían de los recursos bibliotecarios y de información. Conscientes de ello. Los sorprendentes resultados del informe muestran que el impacto de las Tecnologías de la Información y Comunicación (TIC) en los jóvenes se había sobreestimado. 2008). del total de encuestados. 396 eran estudiantes en activo (tanto de grado como de posgrado) de seis zonas geográficas diferentes (Australia.

espe 11 También conocida como la generación del milenio. Debido a un efecto de neuroplasticidad. En paralelo. Por ejemplo. los usuarios ven modificadas sus estructuras y rutinas de pensamiento al ser expuestos de una manera inmersiva (tanto a nivel profesional como personal) al funcionamiento de los motores de búsqueda. En la investigación. Ciencias Sociales (cerca del 40%) e Ingeniería e Informática (más del 40%). mientras que las bases de datos bibliométricas e interfaces de búsqueda de revistas electrónicas eran más populares en los campos de la Biología y Ciencias biomédicas (el efecto de la cobertura de Google Scholar en las disciplinas se detallará en capítulos posteriores). 2011). Si estos datos no fueran ya suficientemente reveladores por sí mismos. Con la intención de complementar los resultados obtenidos en este primer informe acerca de la Generación Google. Del total de la muestra analizada. puede llevarnos a una preocupante superficialidad intelectual (Carr. . centrándose en esta ocasión en el comportamiento en la búsqueda de información e investigación de los estudiantes de doctorado pertenecientes a la Generación Y 11. participaron hasta 72 instituciones de educación superior a través de la promoción y difusión de un cuestionario entre sus alumnos de doctorado. abarca las fechas de nacimiento entre 1980 y comienzos de la década de 2000 aproximadamente. la British Library y el JISC financian un nuevo proyecto de investigación de tres años de duración (Carpenter. los recursos de Google eran preferidos especialmente en Artes y Humanidades (cerca del 30%).52 La revolución Google Scholar el estudio y profundidad de lectura y pensamiento crítico. los datos mostraban diferencias importantes en función de las distintas disciplinas académicas. unos 17. El catálogo de la biblioteca constituía uno de los recursos menos requeridos. Este estudio comprende sin embargo solamente a los nacidos entre 1982 y 1994. 2012). siendo especialmente usado en Artes y Humanidades (con apenas el 13% de los usuarios) y Ciencias sociales (10%). se reclutaron 60 estudiantes de 36 instituciones con los que se realizó un estudio cualitativo longitudinal. Los resultados generales obtenidos en los estudios mencionados anteriormente (uso predominante de los motores de búsqueda. realizada entre 2009 y 2011. el 30% de los estudiantes utilizaba Google o Google Scholar como fuente principal para localizar literatura científica. de no revertirse.000 estudiantes respondieron al menos a un informe anual. Por tanto. situación que. pues habrían simplificado sus procesos y tareas de investigación durante sus estudios. Endnote y Mendeley). no se consideran “nativos digitales”. Sin embargo. se podría añadir que una amplia mayoría de estudiantes indicaron que hubieran deseado haber conocido antes ciertas tecnologías y aplicaciones (especialmente Google Scholar.

seguido de Google Scholar. ayuda específica de un bibliotecario. Summon (herramienta de descubrimiento). el análisis estadístico revela utilidad percibida. el catálogo. especialmente el catálogo de la biblioteca) han sido posteriormente comprobados y ratificados en multitud de trabajos. De los 1. Finalmente. el 75% había utilizado Google Scholar. EBSCOhost). entre los estudiantes en detrimento de los productos bibliotecarios. Los resultados obtenidos revelan que cuando los estudiantes comienzan la búsqueda de información. el catálogo de la biblioteca.988 estudiantes de posgrado en la University of Minnesota en 2009. Tutorial de Infoquest. más del 25% de éstos nunca usaba las bases de datos bibliotecarias.038 alumnos distribuidos entre estudiantes de grado (26%).1% de los estudiantes indicó que no usaba Google Scholar. la encuesta LibQual+ 2009 (Cook et al. El 14. Por ejemplo. lealtad y. los hallazgos más interesantes de este estudio se reflejen en las contestaciones proporcionadas ante la pregunta “Cuán útiles eran los resultados que encontraste en la búsqueda más reciente a través de las siguientes fuentes” 12. en menor medida.141 (11. Para ello realizan una encuesta a 9.Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) cialmente Google. en ese orden. Dubicki (2010) examina por su parte los hábitos de investigación de los estudiantes de grado y posgrado en el área de Negocios hallando que Google era el punto de inicio en las búsquedas de al menos el 50% de los estudiantes. Cothran (2011) analiza por otro lado en qué medida los estudiantes graduados perciben Google Scholar como un recurso útil y fácil de utilizar. Tal vez. la percepción de Summon se encontraba fuertemente 12 Los usuarios disponían de las siguientes fuentes para evaluar: Google. 53 .6% en el caso de Summon y al 39. tal y como señalan el 42% de los encuestados (22% indican Google Scholar y el 20% Google general). guías temáticas. Wikipedia. Las bases de datos bibliotecarias logran un porcentaje alto (26%) pero inferior a Google si combinamos los porcentajes de sus dos buscadores (general y académico).7% en el caso del catálogo de la biblioteca. Google Scholar. quienes estudian los hábitos de investigación de los estudiantes de la Royal Roads University a partir de una encuesta a 1. más del 76% son propensos a usar Google. este porcentaje ascendía al 20. facilidad de uso. bases de datos de editores (por ejemplo. las bases de datos de artículos y Wikipedia. igualmente. Bagget y Williams (2011) realizan igualmente una encuesta en este caso a 58 estudiantes de la Shenandoah University. 2009) concluye que los estudiantes norteamericanos utilizan los motores de búsqueda a diario. se puede destacar el trabajo de Mussell y Croft (2013). Nuevamente Google demuestra ser el lugar favorito para comenzar una búsqueda. posgrado (62%) y otros estudiantes que continúan estudios (12%).4%) estudiantes que finalmente contestan el cuestionario. y “otras”. En todo caso.

que los investigadores predoctorales. adicionalmente se detecta un amplio uso de marcadores de páginas web en el navegador para acceder con mayor rapidez a los recursos o lugares de interés. Lercher (2008) realiza una encuesta dirigida a los profesores de ocho departamentos en Louisiana State University (concretamente los de Química. estos datos serían menores. los datos empíricos que aportamos en este apartado vienen a demostrar todo lo contrario.4% de los alumnos). tenderían a utilizar otras herramientas más precisas y controladas. de una posible extensión del sistema académico a través del uso de reposito- . 2013). El propósito de la encuesta era conocer la utilidad. Inglés. N= 755). según avanzamos en rangos de edad y nivel educativo. La mayoría de los investigadores utilizan sólo ocasionalmente la página web de la biblioteca como punto de partida en sus búsquedas. en función de las necesidades de los investigadores. Los investigadores lo usan tanto para buscar información metodológica como para localizar números de ISSN. Y este argumento sería completamente lógico. Aunque en el momento del estudio Google Scholar es apenas conocido por los investigadores analizados. Como dato de interés. teóricamente más formados en el manejo de herramientas profesionales de búsqueda (imprescindibles para su trabajo) y con una mayor madurez intelectual y capacidad adquisitiva. En otro estudio similar.4% de los estudiantes encuestados la marcaba como esencial. Filosofía y Ciencias políticas). traspasando asimismo generaciones (Mussell y Croft.54 La revolución Google Scholar polarizada (el 39. al menos desde un punto de vista teórico. Historia. Haglung y Olsson (2008) realizan un estudio observacional de los investigadores en Suecia de 2005 a 2006. el recurso considerado “esencial” para un mayor porcentaje de alumnos era las bases de datos de los editores (64. Matemáticas.1%. mientras que Google Scholar era marcada en esta misma categoría por el 35. uno podría estar tentado a pensar que el uso de estas herramientas estaba más extendido entre los jóvenes y que. Es decir. Ciencias de los sistemas de información y decisión. el buscador general de Google domina como punto de partida a la hora de localizar información científica. ¿Qué piensan los investigadores? Según los estudios vistos anteriormente acerca de la Generación Google y su confianza excesiva en los motores de búsqueda. posdoctorales y senior. Ingeniería eléctrica y computación. Sin embargo. La preferencia de los motores de búsqueda sobre los recursos bibliotecarios se extiende desde los estudiantes a los estudiantes de posgrado.

5%) y Google Scholar (18. El 83% de los investigadores había usado Google Scholar mientras que un 13% adicional mostraba una intención en probarlo. No obstante.csuc. profesores e investigadores) acerca de las preferencias de éstos en el uso de bases de datos. integrado actualmente en el CSUC (Consorcio de Servicios Universitarios de Cataluña. gracias en parte a la velocidad y relevancia de los resultados que proporcionan. donde se refleja que tanto Google como Google Scholar son explícitamente citados por casi una cuarta parte de los encuestados a pesar de que en el cuestionario no se menciona explícitamente a ninguna base de datos o motor de búsqueda concreto. Aun así.6%) seguida de Pubmed (21. Adicionalmente. solamente con el 36%).Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) rios. el resultado quizás más interesante se produce cuando el 67% de los profesores indican que enviarían un trabajo a una colección web (se entiende dentro del repositorio) si el trabajo se pudiera encontrar así de forma más sencilla a través de Google Scholar. Las principales diferencias 13 http://www. Se debe reconocer no obstante que no existe una coincidencia plena en todos los estudios realizados hasta la fecha (algunos resultados son incluso contradictorios). Consorci de Serveis Universitaris de Catalunya) 13. De las 72 respuestas obtenidas (de un censo de 347 profesores). la base de datos preferida era WoS (seleccionada por el 41. el 90% indican que utilizarían Google Scholar en la búsqueda de material académico o científico.7%). Los autores obtienen 137 respuestas a su cuestionario (datos de 2007). el 86% indica que utilizan los motores de búsqueda para localizar trabajos no publicados (unpublished) en sus campos de especialidad. por lo que los resultados deben considerarse con cierta cautela. los datos por departamento no son representativos (la tasa más alta de respuesta por departamento corresponde a Filosofía. la muestra de este estudio es muy pequeña y desigual. Sin embargo. Su objetivo principal no es el análisis de Google Scholar sino el estudio cualitativo del impacto de las revistas electrónicas en el comportamiento informacional de los investigadores de las universidades que pertenecen al Consorcio de Bibliotecas Universitarias de Cataluña (Consorci de Biblioteques Universitàries de Catalunya).cat 55 . Ollé y Borrego (2010) consideran una muestra algo más amplia. pero sí se comienza a percibir que para muchos investigadores los motores de búsqueda académicos han comenzado a “suplantar” a las bases de datos tradicionales. con académicos pertenecientes a diversas instituciones. Hightower y Caldwell (2010) realizan una encuesta a 220 miembros de la University of California – Santa Cruz (principalmente estudiantes de posgrado.

Brown y Swan (2007) llevan a cabo un estudio financiado conjuntamente por la Research Information Network (RIN) y el Consortium of University Research Libraries (CURL) con el objetivo de conocer la forma en la que los investigadores interactúan con las bibliotecas académicas en el Reino Unido.025 profesores tanto en colegios como en universidades. destacando levemente en Economía. los autores observan que tanto Google como Google Scholar son herramientas frecuentemente utilizadas por los investigadores (61% y 35% respectivamente). Google es utilizado “frecuentemente” por el 65% de los investigadores encuestados. y al igual que Lercher (2008). Mientras que Google Scholar era elegida principalmente por su facilidad de uso y rapidez. Oppenheim y Rowland (2008) quienes se proponen demostrar el grado de efectividad de diversas herramientas (Google. Google y Google Scholar eran capaces de localizar el 76. Windows Live Academic (versión anterior de Microsoft Academic Search) no es usado “frecuentemente” por ningún investigador (más del 90% no lo utiliza “nunca”). Si nos transportamos desde el Reino Unido hacia los Estados Unidos. mientras que Google Scholar por el 40%. en el que se encuestaron a 3. también se disponen de estudios más amplios con un mayor número de instituciones analizadas y en diferentes países. De los 2. Por ejemplo. mientras que los resultados de OpenDOAR y OAIster eran desalentadores.56 La revolución Google Scholar detectadas por los investigadores radicaban en las razones detrás de las preferencias.519 artículos considerados. Ciencias sociales y Humanidades han abandonado las . es necesario disponer de muestras mayores para analizar este fenómeno con mayor precisión. Economía y Sociología. resulta obligado mencionar el Informe Ithaka 2009 (Schonfeld y Housewright. OAIster y OpenDOAR) a la hora de localizar versiones en acceso abierto de artículos científicos (peer-reviewed) en las áreas de Ecología. En cualquier caso. Manejando datos empíricos de 2. Afortunadamente. aquellos que preferían WoS se sentían más confiados acerca de la calidad de los resultados. 2010). Y prácticamente el 70% de los usuarios no usan “nunca” los repositorios institucionales. Todavía resultan más impactantes los datos acerca de las fuentes utilizadas específicamente para localizar contenidos en acceso abierto. Google Scholar. El uso de fuentes específicas de acceso a material en Open Access fue igualmente estudiado por Norris.84% de éstas. hasta 967 disponían de versiones en acceso abierto. el tamaño muestral es excesivamente reducido y centrado en instituciones concretas. El estudio concluye que los investigadores de Ciencias.250 investigadores y 300 bibliotecarios.

En noviembre de 2012 se tomaron datos para la elaboración de una nueva edición de esta encuesta (Housewright et al. seguido de los motores de búsqueda (en torno al 25%). Por lo tanto. tema que se detallará y desarrollará con mayor amplitud en el apartado 1. y que tanto Google como Google Scholar se encuentran entre los métodos preferidos para localizar información en las revistas académicas. En cualquier caso.498 científicos británicos. En Medicina el uso de las bases de datos específicas es mayor (40%). excepto en Medicina. 2013). no sólo entre los estudiantes sino también entre los profesores e investigadores. mientras que un porcentaje menor (en torno al 15%) indica que comienzan sus búsquedas mediante el catálogo de la biblioteca o alguna base de datos o catálogo nacional o internacional. los datos varían por disciplina. Un tercio de los encuestados indica que comienzan la búsqueda en una base de datos o recurso electrónico específico.edu) productos bibliográficos plenamente adaptados al mundo web (Mendeley) o el uso de otros canales sociales para difundir y consumir contenidos académicos o de apoyo a la investigación (Mas-Bleda y Aguillo. Academia. Si bien es cierto que estos porcentajes. sólo el 2% de los profesores manifiestan que comienzan la búsqueda mediante una visita física a las instalaciones de la biblioteca. los motores de búsqueda constituyen el recurso más utilizado en todas las áreas. que constituyen e integran el llamado movimiento de las Altmetrics (Priem y Hemminger. uso y visitas a 57 . En agosto de 2014 la revista Nature publica los resultados de una encuesta realizada con el fin de conocer el conocimiento. como ya se ha comentado anteriormente.4. Esta tendencia todavía se acentúa más con la aparición de redes sociales académicas (ResearchGate.Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) instalaciones bibliotecarias y los recursos de búsqueda tradicionales (catálogos y bases de datos) para utilizar motores de búsqueda. cobertura que ha ido evolucionando a lo largo de los años. 2015). Con todo. parece demostrada la tendencia creciente hacia el uso de motores de búsqueda en detrimento de los productos bibliotecarios. en esta nueva edición hasta el 40% indican que comienzan sus procesos de investigación a través de un motor de búsqueda de propósito general. 2010). manejando en esta ocasión una muestra de 3. En Artes y Humanidades el uso de las bases de datos específicas se reduce y aumenta el uso de los catálogos. están fuertemente influidos por la distinta cobertura de Google Scholar en las distintas áreas. Si en el Informe Ithaka 2009 el descubrimiento de contenidos a través de Google y Google Scholar ocupaba el tercer lugar cuando se les preguntaba a los usuarios con qué frecuencia utilizaban diferentes métodos para localizar información en revistas científicas.

tanto estudiantes como investigadores o profesionales) descubren. 2014). cubriendo todas las regiones del mundo y todos los sectores profesionales. los motores de búsqueda académicos son el segundo recurso más popular como punto de partida de la búsqueda (solamente superados por las bases de datos bibliográficas especializadas). sino que predomina respecto a otros motores de búsqueda académicos: el 80% de los encuestados ni siquiera conoce Microsoft Academic Search. 2014). Como aspecto digno de ser mencionado. Probablemente Gardner e Inger (2013) son los que han realizado el estudio más amplio hasta la fecha. Estudios más recientes. El ranking de relevancia de Google Scholar (basado principalmente en el número de citas). Las conclusiones del estudio vienen a reflejar que cuando los lectores buscan contenidos.000) conoce y visita regularmente Google Scholar (sólo se le acerca en uso ResearchGate. aunque este aspecto será tratado en capítulos posteriores. Para ello realizan una amplia encuesta a lectores (n=19. Aunque los datos específicos acerca del procedimiento seguido en esta encuesta no se dan a conocer. Google Scholar no sólo predomina respecto a los productos bibliotecarios más tradicionales o respecto a las plataformas sociales orientadas a la Academia. los autores observan que los motores de búsqueda son considerados con una menor importancia cuando los lectores desean descubrir artículos más recientes. Estos autores se proponen comprender cómo los lectores (en sentido amplio.064) entre mayo y julio de 2012.58 La revolución Google Scholar diversas plataformas y sitios de redes sociales por parte de los investigadores (Van Noorden. acceden y navegan por el contenido de las revistas científicas. especialmente los investigadores (50% de los encuestados) y estudiantes (20%).com/resources/research. señalan igualmente que los usuarios encuentran información de una forma mucho más sencilla a través de Google que a través de las propias páginas web de las universidades. como los E-Expectations research reports 14. pretendidamente su máxima competencia en la tecnología de los motores de búsqueda académicos (Orduña-Malea et al. favorece ligeramente a los artículos más antiguos. Arte y Humanidades (n=480). utilizado regularmente por cerca del 50%). Esto constituye un verdadero inconveniente para la utilización y visibilidad de los propios repositorios insti 14 http://omniupdate.html . por lo que estos datos resultan lógicos en cierta medida. para lo que usan preferentemente los sistemas de alertas o la navegación por la propia página web de la publicación. Este factor asciende al 70% en Ciencias sociales. se estima que en el área de Ciencia e Ingeniería aproximadamente el 60% de los encuestados (n=3.

2005). Hartman y Mullen (2008) realizan un amplio y detallado estudio para conocer la presencia del buscador como recurso de información entre los productos de las bibliotecas. éstos no han iniciado la búsqueda desde la página web del repositorio. ¿Qué piensan los profesionales de la información? Tras la aparición en escena de Google Scholar muchos bibliotecarios comienzan a informar. 2008). que estudiantes y profesores están empezando a emplear masivamente los motores de búsqueda. Las autoras realizan el estudio en dos momentos temporales (2005 y 2007) y comparan los resultados. basándose tanto en los estudios empíricos mostrados en los apartados anteriores como en su propia experiencia diaria. en este caso tomando como muestra las sedes web de las 113 instituciones pertenecientes a la Association of Research Libraries (ARL). un auténtico jarro de agua fría al producto que realmente está proporcionando los contenidos al motor de búsqueda. En 2007 estos porcentajes habían ascendido al 68% y 32% respectivamente. la sospecha a que Google Scholar pueda reemplazar a corto plazo a otras herramientas de búsqueda más establecidas (y caras) existe entre el colectivo de profesionales de la información (Giles. revelando que la aceptación e integración del buscador como recurso en las páginas web de las bibliotecas pertenecientes a la ARL había crecido. si no se realizan los ajustes oportunos. En 2005 sólo el 24% de las instituciones (27) listaban a Google Scholar en los índices alfabéticos de bases de datos y en el 14% de los listados de bases de datos organizados por materia. cuantificando si Google Scholar aparece enlazado desde la página de inicio del OPAC (Online Public Access Catalog) o en diversos listados de bases de datos y guías temáticas.Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) tucionales pues. Muchos de ellos comienzan a evaluar la utilidad de este nuevo buscador. así como su potencial como servicio de valor añadido a los recursos que la biblioteca ofrece (Hartman y Mullen. ¿debe estar plenamente integrado entre las colecciones y servicios a través de su presencia en la web de la biblioteca? Con el propósito de conocer precisamente el grado de integración de Google Scholar como recurso en las bibliotecas. El gran reto en esos momentos para las bibliotecas académicas es planificar qué hacer con este nuevo producto gratuito. la visita directa desde Google Scholar al texto completo alojado en un repositorio institucional puede no reflejarse en las estadísticas de visitas del repositorio (Arlitsch y O´Brian. aunque los usuarios acaben accediendo a un documento alojado en un repositorio. 59 . 2012). De hecho.

. pero todavía nos necesitas a nosotros y a nuestras bases de datos exhaustivas” comenzaba a hacerse pervasivo en la mayoría de guías bibliotecarias (York. sin previo aviso. por otro lado. se trata de una expresión metafórica que hace referencia a un problema obvio que nadie quiere afrontar. 2005). Era absolutamente comprensible que la irrupción en el mercado de un producto de las características de Google Scholar supusiera un importante reto y una gran preocupación en el sector bibliotecario. pero inesperadamente encuentran que son las sedes web de las facultades y de los estudiantes. aunque el sentido es el mismo. identificándose por un lado a los “puristas” (aquellos que deseaban proteger a los usuarios de contenidos no estrictamente académicos) y. usándose en ocasiones “elefante” o “gorila”. distinguiendo por una parte las sedes web institucionales y por otra las bibliotecarias. Neuhaus. y no las bibliotecarias. 256 Master’s institutions.60 La revolución Google Scholar En un estudio similar. 267 Baccalaureate institutions y 293 Associates institutions) a partir de un análisis webmétrico para determinar el número de sitios web desde los que se enlaza a Google Scholar (a fecha de 2007). Un producto que llegó al mercado de las búsquedas de súbito. que nadie espera 15 Cfr. 2009). el miedo a que los usuarios se acercaran a Google Scholar y se alejaran de la biblioteca ya se respiraba en el ambiente. Quizás una de las principales reticencias del sector bibliotecario proviniera del hecho de que las bibliotecas nunca habían formado parte del desarrollo de Google Scholar (Walters. 2005). desde donde se enlaza a Google Scholar con mayor frecuencia. La posición además de los bibliotecarios respecto al uso de Google Scholar se polarizó muy rápidamente (York. Sin embargo. York utiliza muy acertadamente el término “intentando manejarse con un elefante en la habitación” 15. un total de 948 universidades y colleges. “Trying to come to terms with the new 800-pound dragon in their living room” (York. Neuhaus y Asher (2008) analizan el grado de adopción de Google Scholar en instituciones y centros universitarios (en concreto. hecho que explicaba la utilización masiva de los buscadores por un amplio abanico de usuarios. Los autores comprueban que las instituciones de investigación enlazan con mayor frecuencia a Google Scholar que las instituciones de menor tamaño. a los que sí introducían el producto a los usuarios. El término en ingles suele variar. Primero Internet y posteriormente la Web (junto con el desarrollo de los motores de búsqueda gratuitos) habían provocado que la inmensa mayoría del conocimiento residiera por primera vez en la historia fuera de la biblioteca física (Blankenship. pero de una forma muy cautelosa. 2005). desde estudiantes jóvenes a investigadores senior. 132 Research institutions. donde un mensaje del tipo “Scholar está bien. 2007).

Ettinger (2008). por si esto fuera poco. y que. Aparte de la razonada crítica relativa al grado de academicidad de los contenidos (debido al filtro automático desarrollado por Google). A esto debe unirse un cierto desconocimiento inicial acerca del funcionamiento real del buscador. en el que se confiesa que las bibliotecas tienen muy poca influencia en Google Scholar en comparación con los servicios de descubrimiento que producen las empresas del sector (por ejemplo. Los autores clarifican posteriormente este conflictivo punto al lector: “el algoritmo PageRank hace una conjetura calculada acerca de lo que él cree que es académico. sostiene que más que lamentarnos del uso de herramientas como Google Scholar (con sus virtudes e inconvenientes.Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) ba. pero con una penetración mundial imparable). no se tenía una idea clara de los requisitos técnicos que se debían cumplir para poder incluir nuevos contenidos. que precisa controlar o filtrar la ordenación de resultados. las bibliotecas deben pensar ineludiblemente en formas de asimilarlo estra 16 “common cold” and “vitamin c” 61 . tras realizar una búsqueda básica 16. un producto en el que los profesionales de la información no habían sido tenidos en cuenta para su diseño. Por ejemplo. de forma acertada. Y para más inri. 2015). ni siquiera habían sido consultados como expertos. una caja negra. indican que “ilógicamente. utilizaba un sistema de ordenación de resultados diferente cuyo funcionamiento era secreto. Giustini y Barsky (2005). Este sentir se refleja en el informe “The future of library resource discovery” (Breeding. Una definición que no es del todo precisa (el algoritmo PageRank en ningún caso decide qué es o no académico). existía cierta incomprensión en torno a un producto del que no se conocía su cobertura. que podía provocar comprensibles dificultades a los usuarios para determinar si los resultados eran o no académicos. A esto nos debemos preguntar lo siguiente: ¿ilógico para quién? Probablemente sea ilógico para un bibliotecario. y lista los artículos en función de lo relevantes y populares que son”. los artículos de 1990 son listados primero. Google Scholar no participó en el NISO Open Discovery Initiative). se percibe por tanto como un desarrollo ajeno e invasivo al sector de la información. pero no para la amplísima mayoría de usuarios (Google Scholar no es un producto orientado a los profesionales de las búsquedas sino a los usuarios finales). y que ilustra a la perfección las dudas e intensos debates que surgen a mediados de la primera década del 2000 entre los profesionales de la información. y no los artículos más recientes”. elaborado por la National Information Standards Organization (NISO).

62

La revolución Google Scholar

tégicamente. Hartman y Bowering Mullen (2008), conscientes de que
Google Scholar supone un lugar familiar en el que comenzar los procesos
de búsqueda de información ya difícilmente sustituible, resaltan la habilidad de éste para conectar a los usuarios afiliados a una biblioteca con
los contenidos disponibles por las suscripciones a través del servicio de
link resolvers 17, circunstancia igualmente señalada por Giustini y Barsky
(2005), quienes muestran a Google Scholar como una pasarela gratuita
hacia información científica para los usuarios no afiliados a una universidad u hospital, o que simplemente realizan sus búsquedas fuera de los
dominios de estas instituciones (pensemos igualmente en los estudiantes que puedan realizar búsquedas desde su hogar).
La tecnología del link resolver ofrece adicionalmente la posibilidad
de cuantificar el número de usuarios que llegan a la biblioteca a través
de enlaces desde Google Scholar y conocer por tanto el tráfico que éste
está proporcionando o redirigiendo a los contenidos contratados por
las bibliotecas (Detlor y Lewis, 2006), aunque los productos y bases de
datos bibliotecarias no hayan sido utilizados para localizar y acceder a
estos contenidos. Esta circunstancia permite a Herrera (2011) conocer
el número de clics (a través del link resolver de Google Scholar) que habían terminado en visitas web a los contenidos alojados en la University
of Mississipi Library. Para ello realiza un análisis longitudinal (de 2006 a
2009) constatando un crecimiento del porcentaje de clics procedentes
de Google Scholar desde el 4% en 2006 hasta el 27% en 2009. Así mismo
observa un crecimiento del porcentaje de clics procedentes de la Web of
Knowledge (del 2% al 11%).
El producto que más porcentaje de visitas proporcionaba a la biblioteca (EBSCO) no había cambiado durante el período de análisis, aunque
el porcentaje de visitas que proporcionaba sí había bajado considerablemente (del 61% al 52%). Otro resultado importante de esta investigación
es que se observaban más clics desde Google Scholar a los recursos bibliotecarios (10.522), que desde los usuarios del sitio web de la biblioteca
a Google Scholar (801). Estos apabullantes datos tal vez contesten por sí
mismos a las dudas iniciales de los bibliotecarios acerca de la posible
integración de Google Scholar entre las colecciones y servicios de la bi 17 Link resolver (o link-server): es una aplicación que permite conectar de forma especial la
fuente y el destino de un hipervínculo. En este caso, la fuente tiene la forma de un OpenURL (enlace estandarizado que contiene información bibliográfica). Cuando un usuario
hace click en el enlace, la aplicación comprueba, basándose en la información bibliográfica del OpenURL, si la biblioteca de una determinada institución ha adquirido o suscrito
el acceso al texto completo del recurso solicitado. Si es así, lo recupera si el usuario es
capaz de autenticarse como miembro de dicha institución.

Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I)

blioteca a través de su página web. Nos guste o no, esta cuestión resulta
hoy en día indiferente a los usuarios; éstos encuentran Google Scholar
con cierta facilidad (esté o no enlazada desde el sitio web de la biblioteca) y comienzan sus búsquedas desde su austera pero sencilla y efectiva
página de inicio.
Posteriormente, Wang y Howard (2012) analizan los datos de uso de
Google Scholar desde 2006 a 2011 desde tres herramientas (SFX link resolver, Web Access Management proxy server y ILLiad interlibrary loan server)
de la San Francisco State University. Los datos indican una preferencia de
Google Scholar respecto a la herramienta de búsqueda federada de la
universidad (Metalib), convirtiéndose en una importante fuente de solicitud de préstamos interbibliotecarios.

b) Estudios comparativos con otros productos bibliotecarios

Entre los estudios dedicados a Google Scholar en su faceta de buscador destacan por una parte aquellos orientados a la comparación con las
tradicionales bases de datos bibliográficas y, por otra parte, a su comparación con otros productos más modernos, como son las herramientas
de descubrimiento.
Bases de datos bibliográficas
La literatura pronto comprueba el efecto de dos importantes variables externas a la hora de realizar comparaciones entre Google Scholar y
otras bases de datos bibliográficas:
—— La disciplina y área de conocimiento: los distintos acuerdos con editoriales o el cumplimiento de ciertos requisitos técnicos en las sedes
web de éstas influyen en los contenidos que finalmente son indizados. Y esto a su vez influye en la precisión y amplitud de los resultados ante consultas determinadas.
—— El tipo de consulta: la precisión del buscador varía significativamente
de consultas con términos generales y amplios a consultas con términos concretos y específicos.
Veamos con mayor detalle cada uno de estos enfoques:
Tipo de consulta:
Dado el carácter multidisciplinar de Google Scholar (aunque su cobertura fuera muy desigual en sus inicios), muchos profesionales se planteaban la necesidad de evaluar las prestaciones de Google Scholar a la
hora de localizar información relevante en una disciplina y comparar los

63

64

La revolución Google Scholar

resultados con los ofrecidos por distintas bases de datos bibliográficas
especializadas, que eran entonces tradicionalmente adquiridas bajo licencia por las bibliotecas universitarias y de centros de investigación.
Obviamente, los resultados obtenidos eran diferentes en cada disciplina
(lo que se traducía en mensajes contradictorios a la comunidad respecto
a las prestaciones y cobertura del buscador), pero todas incidían en la
facilidad de uso, gratuidad y amplia cobertura general.
Por ejemplo, Cutler (2010), compara los resultados de búsqueda de la
Energy Technology Data Exchange – World Energy Base (ETDEWEB) con Google y Google Scholar con el propósito de determinar si ésta todavía era capaz de proporcionar resultados únicos no contenidos en los buscadores
web. Los resultados muestran que ETDEWEB proporciona resultados únicos en el 86.7% de las 15 consultas realizadas en el ensayo. Sin embargo,
más allá de este resultado, el autor descubre diferencias en la tipología
y enfoque de los resultados obtenidos: Google proporciona resultados
para no especialistas; Google Scholar por su parte proporciona resultados académicos, pero de propósito más general, mientras que ETDEWEB
proporciona resultados específicos en Energía, Tecnología y Desarrollo.
Con ello, Cutler concluye que Google y Google Scholar aportan o añaden
valor en el proceso de descubrimiento de literatura en tecnología.
Es probable que este hecho convirtiera a Google Scholar más eficiente
en áreas con mecanismos de comunicación científica diferentes a los tradicionales, como por ejemplo las ingenierías, en las que el uso de Google
Scholar estaba creciendo, como ya indicaba el informe Ithaka 2009 (Housewright et al, 2013). Meier y Conkling (2008) comparan Google Scholar y
Compendex en ocho áreas de la ingeniería, concluyendo que el buscador
académico es una herramienta útil tanto para localizar literatura en esta
disciplina (especialmente por su cobertura en los últimos 10-15 años)
como para servir de punto de partida en los proyectos de investigación
de los estudiantes. Sin embargo, Cusker (2013), quien también compara
Google Scholar y Compendex, pone de relieve las grandes prestaciones de
esta última respecto a Scholar, especialmente a la hora de reordenar artículos por fecha de publicación, autor y relevancia. Igualmente reclama
que el buscador ofrece un número de resultados relevantes realmente
amplio, pero que no ofrece en cambio medios suficientes para organizarlos y combinarlos de manera eficiente y útil. A pesar de todo, el autor
se decanta, como balance final entre ambas bases de datos, por Google
Scholar, pues ofrece sus limitadas prestaciones, ciertamente inferiores,
de forma gratuita.

Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I)

Más recientemente, Stirbu et al (2015) se centran en el área de la
Geografía, comparando los posibles beneficios de Google Scholar frente
a tres bases de datos (WoS, FRANCIS y GeoRef), pero poniendo el énfasis
en la evaluación de los resultados obtenidos y no tanto en las prestaciones de las bases de datos. Para ello, aplican búsquedas bibliográficas
idénticas a todas las bases de datos analizadas restringiendo los resultados a la literatura más reciente (2005 a 2009). Google Scholar muestra un
amplio grado de solapamiento con el resto de las bases de datos, pero
ofrece además un importante número de resultados únicos (independientes del año de publicación, campo o palabra clave buscada). Aunque
el resto de productos permiten localizar ciertamente información más
especializada, los autores indican la utilidad de Google Scholar a la hora
de localizar distintos tipos de literatura relacionada con la Geografía humana y física.
Esta complementariedad y capacidad de localizar información útil no
recogida en otros productos es igualmente recogida por Tober (2011),
quien compara Pubmed/MEDLINE con ScienceDirect, Scopus y Google Scholar para evaluar qué producto es más efectivo en el área de medicina
láser, mediante la aplicación de una serie de criterios de evaluación
(recuperación, precisión e importancia). Mientras que Pubmed aparece
como el producto más excepcional, Scopus destaca en efectividad y Google Scholar en importancia.
Tipo de consulta:
Los estudios anteriores confirman a Google Scholar como un producto con una cobertura amplia y complementaria a las bases de datos
bibliográficas especializadas, aunque de comportamiento desigual en
función de la disciplina estudiada. Sin embargo, independientemente
del área de conocimiento, el tipo de consulta efectuada en el buscador
es vital a la hora de valorar los resultados. Una cuestión es realizar consultas generales y amplias con el objetivo de localizar artículos y material
académico de calidad acerca de una disciplina y otra bien distinta localizar material específico y especializado a partir de consultas concretas y
búsquedas sistemáticas. Y en este sentido, los resultados obtenidos son
ciertamente contradictorios.
Por ejemplo, Callicott y Vaughn (2005) confeccionan cinco búsquedas
con las que pretenden reflejar temas típicos de estudiantes universitarios en sus trabajos de investigación. Cada una de las búsquedas son
posteriormente aplicadas a los siguientes buscadores: Google Scholar,

65

66

La revolución Google Scholar

el catálogo en línea del College of Charleston, EBSCO’s Academic Search
Premier, y a una base de datos suscrita con acceso a diversos recursos
(MLA International Bibliography, Business Source Premier, Environmental
and pollution management, Art full text, y America: History and Life). Los
resultados de las búsquedas realizadas en Google Scholar resultaban, en
la mayoría de las ocasiones, mejores en comparación con el resto tanto en cantidad como en calidad de los resultados, aunque los autores
constatan diferencias importantes en función de cada una de las cinco
búsquedas analizadas.
Gardner y Eng (2005) comparan los resultados ante una consulta sobre el tema “homeschooling”, tanto en Google Scholar como por PsycINFO, Social Science Citation Index y ERIC; las bases de datos se comparan
en función del contenido, actualización, relevancia y solapamiento de
los resultados. Los autores confirman que Google Scholar es el producto
que mayor número de resultados proporciona, así como en una mayor
variedad de tipologías, fuentes y relevancia, aunque se observa una menor actualización de los resultados. El estudio concluye que la carencia
de control de calidad y la imposibilidad de dejar al usuario organizar los
resultados lo hacen menos efectivo que las bases de datos de pago a la
hora de encontrar material académico en ciencias sociales.
Cambiando de disciplina, Jones (2005) se propone testar las capacidades de diversos buscadores a la hora de recuperar información en Biología; para ello utiliza el término “Nodilittorina” 18 y observa que Google
Scholar recupera un mayor número de registros relevantes que a través
del resto de bases de datos de su análisis (BasicBIOSIS, ArticleFirst, ECO,
ProQuest, WilsonWeb, SciFinder Scholar, HighWire y MEDLINE). Sólo BIOSIS
previews obtiene una mayor tasa de recuperación en la búsqueda; así
mismo, Jones informa que la cobertura de literatura reciente en el buscador es impresionante, más allá de los criterios de ordenación y relevancia, demostrando así la fortaleza de Scholar en búsquedas específicas.
Por otra parte, Robinson y Wusteman (2007) diseñan ocho búsquedas con el propósito de examinar la relevancia de los 10 primeros resultados de búsqueda tanto en Google Scholar como en los buscadores
generales Google, Ask.com y Yahoo!; las ocho búsquedas se dividen en
cuatro consultas específicas sobre Ciencias de la vida y ambientales (denominadas consultas científicas) y en cuatro consultas generales (denominadas consultas no científicas) 19. Los resultados indican que Google
18 Género de molusco gasterópodo marino, de la familia de los caracoles.
19 La nomenclatura de consultas científicas y no científicas (scientific queries and nonscientific queries en el original), se consideran poco apropiadas y susceptibles de generar confusión, pero son los términos usados por los autores.

gracias a la indización del texto completo de los contenidos de las revistas y editoriales con las que ha llegado a algún tipo de acuerdo comercial. Por ejemplo. en términos generales. Esta excesiva dependencia de los resultados en función de las búsquedas específicas no es aceptable en áreas sensibles como la Medicina. una mejor disposición ante consultas sobre temas específicos por palabra clave.1%.Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) Scholar proporciona resultados más relevantes para las cuatro búsquedas específicas (38. quienes comparan la cobertura de Google Scholar con Chemical Abstracs Service (CAS) ante seis búsquedas diferentes. Los autores concluyen que Google Scholar devuelve más resultados para búsquedas de temas (gracias a que las búsquedas se hacen a texto completo). donde además puede suponer un riesgo que la interfaz de búsqueda simple y básica de Google pueda comenzar a modificar los patrones y procesos de búsqueda de información científica (Giustini. los estudios anteriores vienen a confirman una amplia cobertura de Google Scholar y. Sin embargo. Pese a la amplia variedad de resultados. CAS devuelve más resultados para compuestos químicos y búsquedas de nombres personales (gracias a la búsqueda avanzada). no permite la búsqueda booleana. a pesar de que Google Scholar no está especialmente diseñada para la búsqueda exhaustiva acerca de cuestiones clínicas. De los 702 registros recuperados. mientras que el solapamiento (registros en ambas bases de datos) es solamente del 10. Giustini (2005) concluye finalmente que. Anders y Evans 67 .9% están únicamente en CAS. 2005).76% de resultados relevantes) que para las generales (algo menos del 20% de resultados relevantes). especialmente críticos en la medicina basada en la evidencia. aunque no para revisiones exhaustivas de literatura científica. carece de límites para las tipologías documentales y no permite beneficiarse de la extraordinaria indización que proporciona la National Library of Medicine. en algunos casos contradictorios (por ejemplo en el caso del grado de actualización de los resultados). lo que la hace excesivamente dependiente del tipo de consulta realizada. los autores hallan que el 55% están indizados únicamente en Scholar y el 34. constituye una herramienta de búsqueda útil para el descubrimiento de contenidos por navegación o serendipia. Google Scholar carece de todas las prestaciones importantes de MEDLINE: no trabaja con las Medical Subject Headings (MeSH). Otro estudio de gran interés es el realizado por Levine-Clark y Kraus (2007). Desde entonces las comparaciones entre Pubmed y Google Scholar han sido frecuentes en la literatura a la hora de valorar sus prestaciones para ser utilizados en consultas clínicas.

quienes comparan los resultados obtenidos en Pubmed y Google Scholar a través de cuatro consultas basadas en cuestiones clínicas. El 67. a cada investigador que acepta participar en el estudio se le proporciona una consulta clínica aleatoria centrada en terapia renal (obtenida previamente de una revisión sistemática). eficientes y útiles para informar sobre protocolos de cuidado de pacientes basados en la evidencia. mientras que ese porcentaje asciende al 80% en el caso de Scholar.68 La revolución Google Scholar (2010) comparan los resultados sobre tres temas clínicos relacionados con cuidados respiratorios. Los autores demuestran la importancia de Google Scholar en los procesos iniciales de búsqueda de literatura sobre cuestiones clínicas. 6% para Pubmed). Los resultados indican que. Este hecho es debido presumiblemente a la influencia del número de citas recibidas en los criterios de ordenación de los resultados (unido al hecho de que Scholar proporciona un mayor número de citas totales recibidas). Google Scholar: 69%).6% de los artículos recuperados en Pubmed son considerados como “posiblemente” relevantes. Estos términos se introducen tanto en Pubmed como en Google Scholar y se analizan los primeros 40 resultados (denominada consulta rápida) para comparar las prestaciones de relevancia y precisión de ambos buscadores. La relevancia de los resultados es abordada igualmente por Nourbakhsh et al (2012). Google Scholar recupera el doble de artículos relevantes (22% frente al 11% de Pubmed) y proporciona un mayor número de artículos en acceso abierto que Pubmed (14% frente al 5%). evaluando posteriormente los resultados en función de la relevancia y calidad de éstos. aunque la precisión es similar en ambos (8% para Google Scholar. para guiar en el cuidado de pacientes individuales o en propósitos educacionales. Los resultados indican que Pubmed tiene una mejor precisión y parece superior a la hora de realizar búsquedas validadas. Shariff et al (2013) contactan a través de una encuesta con un conjunto de nefrólogos canadienses. haciendo de Google Scholar una mejor herramienta para consultas “rápidas”. y recomiendan finalmente su utilización siempre en combinación con Pubmed. Los investigadores participantes proporcionan posteriormente los términos de búsqueda que ellos introducirían en un recurso bibliográfico para recuperar estudios relevantes que permitieran resolver la consulta clínica que habían recibido. Los resultados más controvertidos son probablemente los obtenidos por Gehanno. aunque el porcentaje de recuperación de resultados es similar en ambos buscadores (Pubmed: 71%. usando para ello el filtro “clinical queries” en Pubmed y la búsqueda avanzada en Google Scholar. Rollin y Darmoni (2013). quienes realizan un estudio con el .

y ser usada en revisiones sistemáticas. Sin embargo. Igualmente evalúan la precisión de un test de diagnóstico para una condición dada en un grupo de pacientes específicos. para determinar si Google Scholar es suficientemente sensible para ser usado como buscador único. quienes identifican 21 revisiones sistemáticas en Biomedicina y estudian la recuperación teniendo en cuenta el límite impuesto por Google para la visualización (1. quienes indican que Google Scholar no puede ser usada de forma única en revisiones sistemáticas pues los continuos cambios de contenido. dado que no es lo mismo buscar artículos para los que ya conoces su título (método utilizado por Gehanno).cochrane. solo el 72% de las referencias incluidas podían realmente ser usadas al encontrarse listadas dentro de los primeros 1. de algoritmo y de su estructura de la base de datos no la hacen idónea para estos fines. el buscador podría convertirse en una base de datos bibliográfica líder en Medicina. tratamiento y rehabilitación. Estas conclusiones son fuertemente criticadas por Giustini y Boulos (2013). Se investigan los efectos de intervenciones para la prevención. por lo que Google Scholar no debería ser utilizada como fuente única en las búsquedas de revisiones sistemáticas. que descubrirlos en un proceso de revisión sistemática original. El 80% de las referencias incluidas en las 21 revisiones sistemáticas se encontraban en Google Scholar (frente al 68% de Pubmed). y posteriormente buscan cada estudio en Google Scholar para evaluar el porcentaje de trabajos que podrían haber sido identificados buscando únicamente en este buscador. mejorando las opciones de búsqueda para incrementar la precisión.000 resultados. Los resultados muestran que los 738 estudios originales contenidos en las 29 revisiones sistemáticas eran localizables en Google Scholar.000 ítems). sino de forma conjunta con Pubmed. 20 Las revisiones de Cochrane son revisiones sistemáticas de investigación primaria en salud y política sanitaria. y que son reconocidas internacionalmente con los más altos estándares salud basada en la evidencia. Se publican online en la Biblioteca Cochrane: http://community.org/cochrane-reviews 69 .Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) firme propósito de evaluar la cobertura de Google Scholar específicamente en las revisiones sistemáticas sobre ensayos clínicos. Los resultados reflejan una mayor cobertura de Google Scholar. Para ello recogen 29 revisiones sistemáticas publicadas en la Cochrane Database Systematic Reviews 20 y en JAMA (Journal of the American Medical Association) en 2009. La importancia de la mayor o menor utilidad de Google Scholar como base de datos bibliográfica para la búsqueda de revisiones sistemáticas genera un importante debate que prosigue con el estudio de Bramer et al (2013). Por tanto.

pues simplemente se basan en comprobar la existencia o no de referencias de calidad. Cualquier análisis con dos años de antigüedad ya no resulta representativo de la situación actual del buscador. de forma que cada búsqueda se lanza a un conjunto diversos de recursos y bases de datos para posteriormente recuperar y combinar todos los resultados y presentarlos unificados al usuario. Entrenamiento de los usuarios: La utilidad de las herramientas de búsqueda depende asimismo del posible entrenamiento previo que tengan los usuarios. no está preparada todavía como una herramienta de búsqueda profesional para tareas donde es necesaria una metodología de recuperación estructurada. exportación de un amplio número de referencias. Nygren y Widmarck (2007) comparan Google Scholar con Metalib (una herramienta de búsqueda federada que representa a más de 200 bases de datos) 21 21 Metalib es un metabuscador. Los resultados finales sugieren a los autores que Google Scholar no proporciona los elementos necesarios para una recuperación de literatura científica sistemática (tales como una optimización incremental de la búsqueda. los autores identifican 14 revisiones sistemáticas de Cochrane y trasladan las estrategias de búsqueda a Google Scholar para medir la recuperación y precisión de éste en condiciones derivadas de procedimientos convencionales de búsqueda estructurada en recuperación de literatura científica.70 La revolución Google Scholar Boeker. En cambio. existen otras variables externas que pueden afectar a la validez de los estudios sobre Google Scholar en su comparación con otros productos de búsqueda: El período temporal: La calidad de los resultados de Google Scholar mejora continuamente. específica). Otras variables externas: Aparte de la disciplina (área de conocimiento) y tipo de consulta (general. Vach y Motschall (2013) también critican las altas expectativas creadas en torno a la amplia tasa de respuesta de Google Scholar en revisiones sistemáticas. incidiendo en el hecho de que dichos estudios no utilizan la interfaz de búsqueda de Google Scholar de forma realista. constructor visual de búsquedas o existencia de un histórico de búsquedas). . Para ello. por lo que el año del análisis resulta necesario para contextualizar adecuadamente los resultados. las limitaciones de la interfaz del buscador deberían considerarse a la hora de comparar este producto con otras herramientas de recuperación profesionales. Por ello. Haya.

Los autores utilizan el término “cita” para referirse a cada “hit” que el buscador devuelve ante una consulta. objetividad. habiendo recibido formación previa la mitad de los estudiantes. cobertura y relevancia). de media.Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) a través un estudio de usuarios compuesto por 32 estudiantes de doctorado en ciencias sociales de la Stockholm University. Además. Ciencias y Ciencias sociales. Tras ello. Estas conclusiones tienen una especial importancia dada la diferencia integral en el funcionamiento de estas dos herramientas. usando para ello tres grados de valoración (por debajo de la calidad media. Para ello. encontraban relativamente más artículos académicos (revisados por pares) en Scholar. estos investigadores aplican el “índice de academicidad” a los resultados obtenidos a través de un modelo basado en categorías (precisión. Relevancia y precisión: Howland et al (2009) constatan por su parte la existencia de demasiados análisis centrados en la comparación de título por título (o registro por registro 22) para evaluar a Google Scholar como herramienta. y que puede disponer de distintas versiones agrupadas. especializados en Humanidades. los estudiantes que habían recibido un entrenamiento previo en las dos herramientas. 71 . reservando “citas” para contabilizar las citaciones que recibe un determinado hit asociado a un documento. aunque los estudiantes no estaban completamente entusiasmados con ninguna de las dos herramientas. autoridad. en este libro se utilizan los términos “resultados” o “registros” para referirse a los “hits”. quienes realizan búsquedas relacionadas con sus trabajos de tesis. aspectos todos ellos esenciales para valorar correctamente a Google Scholar. por encima de la calidad media). a lo largo de una sesión de 20 minutos. El entrenamiento había tenido además un efecto positivo tanto en la cantidad como en la calidad de los artículos localizados. desarrollan una consulta basada 22 En el original se usa el término “cita”. Los autores plantean que esos estudios (basados en medidas puramente numéricas) no reflejan ni miden la eficacia de ninguna búsqueda particular ni la naturaleza académica o los algoritmos de descubrimiento de los contenidos. Para evitar la posible y razonable confusión. los estudiantes localizaban más del doble de documentos relevantes en Google Scholar que en Metalib. Este error terminológico se constata igualmente en diversos artículos publicados en la primera mitad del siglo XXI. hasta siete bibliotecarios de la Brigham Young University. Los autores advierten que. actualización. El estudio consistía en contabilizar los resultados que los estudiantes obtenían en sus búsquedas como “relevantes” si éstos marcaban o guardaban los resultados para ser utilizados en un futuro. calidad media.

Posteriormente adaptan esta consulta a un conjunto de bases de datos (SportDiscus. se plantea precisamente un análisis comparativo de la recuperación y precisión de los resultados de Google Scholar con otro conjunto de bases de datos (EconLit. PsycINFO.6% más académico que los materiales encontrados únicamente en el resto de las bases de datos bibliotecarias analizadas. en promedio. un 17. PAIS. . GEOBASE. pero prestando especial atención a la efectividad de las búsquedas simples y las realizadas por expertos. POPLINE. Esa “falta” de lógica a la que aludía Giustini (2005) para indicar que Google Scholar no mostraba los resultados ordenados por fecha queda pues resuelta del siguiente modo por Howland y sus colegas: la clave del éxito es la relevancia y el amplio universo de información contenida. Medline. En otro trabajo representativo. PubMed. la indización del texto completo resulta pues esencial a la hora de conseguir la máxima relevancia en las búsquedas. Los resultados muestran además que las búsquedas simples en Google Scholar. los resultados muestran que Google Scholar es. Business source premier. Applied Science and Technology Abstracts. Esto viene a confirmar en parte los resultados previos de otros investigadores: las búsquedas de términos simples (LevineClark y Kraus. y Google Scholar) y evalúan los 30 primeros resultados obtenidos en cada una de éstas con el modelo diseñado.72 La revolución Google Scholar en una necesidad de información típica o estándar solicitada por estudiantes. Jstor. Pubmed y Sociological Abstracts tienen consistentemente una mayor respuesta y precisión que las búsquedas diseñadas por los expertos. Es más. GEOBASE. llevado a cabo por Walters (2011). El análisis de los resultados revela que Google Scholar es una de las pocas bases de datos capaz de recuperar resultados relevantes y con una precisión razonable a partir de la posición 50 en la página de resultados. Tal vez podríamos creernos que la potencialidad de Google Scholar sólo reside en los primeros 20 ó 30 resultados. Sorprendentemente. 2007) y temas específicos (Robinson y Wusteman. Social Sciences Citation Index. Social Sciences Full Text y Sociological Abstracts). Para ello se evalúan las respuestas obtenidas a 32 búsquedas (9 de ellas consultas simples construidas mediante palabras clave y 23 construidas por bibliotecarios expertos). 2007) obtienen resultados precisos y relevantes en Google Scholar. relacionadas todas ellas con el tema de la “migración”. Linguistic and language behavior. inciden especialmente en indicar que las bases de datos han fallado principalmente en ordenar los resultados por fecha en lugar de por relevancia.

quienes comparan Serials Solution’s Central Search (personalizada por la Florida Gulf Coast University Library) con Google Scholar y Microsoft Academic Search. Zhang (2013). especialmente ante consultas sencillas y basadas en palabras clave de términos específicos. aunque también depende obviamente de la herramienta con la que se compare. es superior en ocasiones (dependiendo de áreas de conocimiento) a la de bases de datos bibliográficas especializadas. por ejemplo. comparando Google Scholar con Ex Libris Primo®. concluyen que interfaces simples pueden ser igualmente útiles. las bibliotecas académicas comienzan a reconfigurar sus sitios web en torno a ese concepto de caja de búsqueda única para proporcionar a sus usuarios una experiencia de búsqueda similar a Google. tras analizar 500 artículos de revistas alemanas en diversas áreas y comparar los resultados de Google Scholar con los de la herramienta de descubrimiento de EBSCO implementada en la University Library of Cologne. aunque la herramienta de descubrimiento recibe puntuaciones sensiblemente inferiores en el aspecto de la usabilidad del producto. Con todo. los distintos estudios reseñados a lo largo de este apartado. descubriendo que la relevancia de ambos productos es similar. se centra en conocer la evaluación de los resultados de búsqueda por parte de los usuarios. Con el fin de competir con esa interfaz simple y diseño intuitivo de los motores de búsqueda como Google y Google Scholar. Sin embargo. Otro interesante estudio es el 73 . sino que la relevancia de sus resultados. dependiendo de las preferencias de los usuarios y de las necesidades de información.Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) Herramientas de descubrimiento Resumiendo. Incluso las diversas tecnologías de búsqueda federada no pueden competir con Google en rapidez. Chen (2006) es claro por su parte en su diagnóstico de la situación: los sistemas de búsqueda federados han fallado en su propósito de convertirse en ventanillas únicas de consulta y acceso a la información académica. Kaluza (2013). simplicidad y facilidad de uso. en lo que podríamos denominar una transición desde los pioneros sistemas de búsqueda federados hacia los modernos recursos de descubrimiento (Mussel y Croft. la precisión de estas herramientas de nueva generación no parece superar en prestaciones a Google Scholar si tenemos en cuenta el coste de su adquisición. aunque destaca su adecuación como primer paso en la búsqueda científica por su gratuidad y resultados generales satisfactorios. podemos concluir que Google Scholar no sólo es el buscador preferido por los distintos usuarios para comenzar sus búsquedas. Cooke y Donlan (2008). 2013). concluye que los resultados de Google Scholar son inferiores en todos los aspectos. a día de hoy.

entre las conclusiones del reciente informe técnico elaborado desde la NISO acerca del futuro de las herramientas de descubrimiento de las bibliotecas (Breeding.26%). aunque el hecho de que Google Scholar no revele la escala y amplitud del material disponible (una información necesaria para poder valorar y evaluar sus prestaciones como producto de información académico). todavía mejora más Google Scholar (79. resultaría beneficioso para la NISO extender programas o crear grupos de trabajo que. a pesar de las múltiples limitaciones que éste indudablemente tiene. que envuelve muchas de las características de los servicios de descubrimiento.74 La revolución Google Scholar realizado por Namei y Young (2015). entre otras cuestiones. Sin embargo.91% de los resultados proporcionados por Summon se consideran relevantes por el 73. 2015).97%). . se destacan los siguientes puntos: —— Los motores de búsqueda académicos (como Google Scholar o Microsoft Academic Search) pueden ser vistos como una alternativa a las herramientas de descubrimiento producidas por organizaciones bibliotecarias. aunque el porcentaje de Summon mejora (76. El informe indica finalmente que. especialmente Google Scholar. Esta circunstancia plantea una discusión y debate crucial para los servicios bibliotecarios actuales. El 73. hoy por hoy. cuando las consultas se restringen a ítems académicos (278 consultas). y que serán descritas con mayor detalle más adelante.65%). —— Google Scholar.14%) mientras que Google se mantiene prácticamente igual (90. se sitúa como uno de los más importantes canales a través del que los estudiantes y académicos acceden a los contenidos proporcionados por las bibliotecas. —— La escala y sofisticación de la tecnología implicada en Google Scholar excede con mucho el de los proveedores de servicios bibliotecarios. exploraran y adquirieran prácticas recomendadas relacionadas con la publicación de contenido en la Web de forma que se maximizara su indización por parte de los motores de búsqueda académicos. Estos resultados plantean serias dudas acerca de la necesidad de invertir dinero en el desarrollo (y adquisición) de estos productos considerando que. quienes envían 299 consultas a la herramienta Summon (implementada en la University of Southern California). Google Scholar es completamente gratuito.57% en Google Scholar mientras que Google buscador general obtiene el mejor porcentaje (90. Google y Google Scholar y comparan la relevancia de los resultados obtenidos en los tres buscadores. De hecho.

Gracias a todo el material recopilado en Google Scholar’s Digest se ha elaborado gran parte de este capítulo. ha estado sujeta en muchas ocasiones a conjeturas y opiniones. Por otra parte. con el que se pretenden dos claros objetivos.Capítulo 3 Las dos caras de Google Scholar (II): La herramienta de evaluación Así como las prestaciones de Google Scholar en tanto que buscador han sido continuamente probadas y analizadas (especialmente por los profesionales de la información) de cara a conocer sus principales características. los autores creamos en 2014 el producto “Google Scholar Digest: research on Google Scholar empirical evidences” 1. Por una parte. localizar y recopilar la mayor cantidad de trabajos científicos que hayan aportado evidencias empíricas acerca del uso de Google Scholar para la evaluación de la actividad investigadora. Desde los inadmisibles errores en la calidad de la información que afectan a los indicadores proporcionados por Google Scholar (esgrimidos por los detractores) hasta su innegable capacidad para recopilar nuevas 1 http://googlescholardigest.com. Por razones de espacio (y de discurso) no aparecen en esta obra todos los trabajos allí recopilados (que se mantienen accesibles desde el sitio web) sino sólo aquellos necesarios para enarbolar la discusión necesaria acerca de este espinoso asunto. pero en contadas ocasiones a evidencias empíricas. funcionamiento y funcionalidades para localizar información científica. la evaluación acerca de su mayor o menor pertinencia para ser utilizada como herramienta para el análisis de la actividad investigadora tanto de usuarios como de revistas u otras agregaciones. prueban (en ocasiones aciertan y en otras yerran) y discuten (pero no opinan). este portal sirve de base para el depósito de nuevo material empírico realizado desde el propio grupo de investigación.blogspot. y bajo la creencia del hecho de que los investigadores dudan. Por esta razón.es . bajo la forma de diversos informes y documentos de trabajo.

eran corregidas o minimizadas posteriormente por parte del equipo de Mountain view (al igual que ahora sucede con los Working papers y Reports depositados por nosotros mismos en Google Scholar’s Digest). incluso atribuye un gran valor al servicio de versiones (que se verá en capítulos posteriores) pues éstas guían al usuario de una manera sencilla para acceder al texto completo de documentos primarios. fundamentalmente desde la prestigiosa revista Online Information Review. La evaluación de la actividad académica Si existiera un premio al investigador más crítico con Google Scholar. promociones. es decir.sin duda alguna . Las críticas que este profesor de la University of Hawai’i at Mãnoa ha dirigido hacia este buscador durante años han sido feroces.76 La revolución Google Scholar evidencias de impacto en las Ciencias sociales y Humanidades a través de un producto sencillo y gratuito (requerida por sus defensores). este apartado refleja las principales discusiones académicas surgidas durante la última década. Sucesivos tests en los que detecta de forma extendida errores en la identificación de nombres de autores. es probablemente la persona que más influyera durante la primera década del siglo XXI en su mejora y optimización. en algunos casos completamente justificadas mientras que en otras desmesuradas.para Peter Jacsó. Según sus propias palabras. renovación o cancelación de revistas o la elaboración de diferentes rankings de actividad académica que pretenden reflejar un supuesto prestigio profesional. distribución de la financiación. pues las cuestiones que Jacsó destapaba. Una cosa es buscar material para satisfacer necesidades informacionales y otra bien distinta es buscar para evaluar. Jacsó (2008a) tiene claro desde el principio las diferencias entre un Google Scholar buscador y otro como herramienta bibliométrica. Pese a ello. para ayudar en la toma de decisiones relativas a contrataciones. como por ejemplo hallar el número de citas recibidas o determinar el h-index (tanto de personas como de revistas) es un asunto bien diferente. Google Scholar es una excelente herramienta para localizar información o documentos que pueden no estar representados en las bases de datos bibliográficas tradicionales. y en ocasiones incluso hirientes. Jacsó (2008c) somete a Google Scholar al tercer grado. premios de investigación. volumen/número o paginación). revistas y de datos bibliográficos (año de publicación. el uso de Google Scholar con fines bibliométricos. el galardón iría a parar . Sin embargo. El algoritmo de vinculación de citas de documentos citantes a documentos citados no es confiable igual- .

quienes al analizar a un conjunto de profesores del área de Biblioteconomía y Ciencias de la información en los EE. la excesiva dependencia en la cooperación con los editores puede influir en la correcta in- 77 . adoptaran una actitud más crítica. al trabajar con los datos de forma rápida y relativamente superficial. Unless it changes its course. Todo ello provoca que las estimaciones de hits (resultados ante una consulta) y citas resulten groseras.” [Dean Giustini] Los problemas localizados por Jacsó son igualmente identificados por Meho y Yang (2007). Estos errores hacen que autores al principio optimistas respecto a las posibilidades de un motor de búsqueda académico de funcionamiento automático y cobertura mundial. Por ello. obteniendo duplicados. triplicados o cuadruplicados de documentos no agrupados correctamente. la existencia de estos errores hace que los indicadores bibliométricos que puedan ofrecer sean de poco uso real. GS well go the way of the dodo bird eventually. but more likely misleading and based on very spurious use of algorithms establishing similarity and relationships between references […] Google Scholar should withdraw the “cited by” feature from its Beta version and probably not offer it in the final version. Así mismo. Meho y Yang se dirigen fundamentalmente al software empleado. Por ejemplo. por lo que los autores reales se ven privados del reconocimiento. repletos de falsos positivos y negativos. lo que genera la obtención de números excesivos o absurdos. mientras que el algoritmo de vinculación de versiones no funciona completamente bien. and many web searchers are now moving back to regular Google for indiscriminate scholarly trawling of the web […]. Los errores en las atribuciones de autores generan errores subsiguientes en la asignación de citas. Bornmann et al (2009) destacan que la diversa tipología documental en Google Scholar dificulta los procesos comparativos con fines evaluativos basados en citas. Las críticas de Jacsó. comprueban cómo Google Scholar pierde el 12% (501) de las citas relevantes debido a errores del sistema.Bloque A · Capítulo 3 · Las dos caras de Google Scholar (II) mente.” [Reinhard Wetz] “Scholar is not as useful as promised. aunque los datos y estadísticas aportados por Google Scholar puedan ser informativas. especialmente por cuestiones de matching (el motor de búsqueda falla a la hora de identificar los documentos pertinentes respecto a la búsqueda realizada). aunque existen otras variables de importancia. pues no es posible conocer los tipos de documentos que se están comparando. El propio Jacsó (2008b) destaca algunos de ellos: “Google Scholar’s ability to identify citations is at best dodgy.UU.

podemos considerar que la mejora del sistema ha sido sencillamente espectacular. Jacsó (2006. Google Scholar muestra a “I Introduction” como al autor más prolífico con 40. independientemente de los medios financieros de sus instituciones. que resumen en los siguientes puntos: inclusión de citas no académicas. . especialmente Jacsó. En otro trabajo. 2 Pese a ello. Merece una atención especial el trabajo realizado por Harzing y Van der Wal (2008). Harzing critica a Jacsó precisamente por trabajar igualmente con muestras pequeñas y por centrarse en casos basados en consultas manuales. concluyendo que Google Scholar carece del control de calidad necesario para su correcto uso como herramienta bibliométrica incidiendo. especialmente en la evaluación de la investigación. 299) proclama asimismo que. Harzing. aunque dependen de la fuente de datos. no inclusión de todas las revistas académicas. mientras Jacsó (2006) critica el trabajo de Pauly y Stergiou (2005) por trabajar con una muestra reducida (114 artículos). Por ejemplo. un producto gratuito mientras que las principales herramientas de uso bibliométrico (WoS y Scopus) son de (prohibitivo) pago. quienes hacen hincapié en la posibilidad que brinda Google Scholar para democratizar el análisis de citas al proporcionar éste a cada académico la disponibilidad gratuita a los datos de citas. Harzing y Van der Wal son conscientes no obstante de las importantes desventajas que supone Google Scholar en el análisis de citas. p. y actualización lenta (cada 2 ó 3 meses). al igual que Bornmann et al. en lugar de realizar diseños de investigación a mayor escala. todo no han sido críticas. Teniendo en cuenta el incremento de cobertura del sistema desde 2008 hasta 2015. en que su mayor cobertura está constituida por ítems no comparables con aquellos contenidos en las bases de datos bibliométricas. replica la consulta en 2008 localizando entonces sólo 956 artículos firmados por “I Introduction”.78 La revolución Google Scholar dización de citas. a día de hoy.100 artículos. No olvidemos que Google Scholar es. con el fin de mostrar los pasos positivos que el sistema está realizando para mejorar. cobertura desigual entre campos del conocimiento. Aguillo (2011) utiliza una aproximación cibermétrica con el fin de comprobar la utilidad de Google Scholar para la realización de análisis bibliométricos. Una búsqueda realizada a fecha de septiembre de 2015 por nuestra parte (Figura 8) muestra apenas cinco resultados. se muestran disconformes especialmente con las formas empleadas por los detractores de Google Scholar. resultados ilógicos debido al procesamiento automático de las citas. 2 Estas cifras han mejorado sustancialmente. Sin embargo. en los errores de atribución de nombres. deficiencias para artículos antiguos (tal vez no digitalizados todavía).

com/scholar?hl=en&q=author%3A%22I+Introduction%22> Métricas de evaluación y bases de datos bibliométricas La irrupción de Google Scholar en el mercado de los productos de información bibliométrica produjo una oleada de trabajos (que todavía dura a fecha actual) en los que se trataba de comparar el número de citas que las diferentes bases de datos proporcionan con el propósito de conocer la posible correlación entre éstas. que 79 . Asignación errónea de autores en Google Scholar <https://scholar.Bloque A · Capítulo 3 · Las dos caras de Google Scholar (II) Figura 8. Con ello se pretendía conocer la mayor o menor necesidad de un uso combinado de diferentes plataformas para obtener una imagen completa de las citas recibidas por un autor o revista principalmente. frente al concepto “one size fits all”.google.

80

La revolución Google Scholar

aboga por el uso de un único producto, así como el papel que Google
Scholar juega en este nuevo sistema.
En el campo de la medicina y áreas afines, los estudios han puesto
su interés en la comparación entre Google Scholar y MEDLINE/Pubmed.
Al contrario de los estudios vistos en el capítulo anterior (centrados en
las prestaciones de búsqueda), en este caso se han fundamentado en
la localización de citas. A pesar de la habilidad de Google Scholar para
devolver resultados relevantes y proporcionar - de forma gratuita - una
trazabilidad de las citaciones recibidas por cada resultado obtenido, algunos autores expresan al comienzo serias dudas acerca de su capacidad para proporcionar citas recientes (Henderson, 2005), necesarias en
investigación médica dada la rápida obsolescencia en esta disciplina, así
como ciertos sesgos hacia la literatura más antigua, que podrían limitar
los análisis de citas desde Google Scholar en esta disciplina; de ahí que
la comparación de éste con Pubmed podría proporcionar información
precisa acerca de su mayor o menor utilidad.
Shultz (2007) compara y contrasta un total de 10 búsquedas en Pubmed y Google Scholar. Pese a que el autor concluye que ambos sistemas
funcionan de forma muy diferente (y por tanto no pueden ser comparados directamente), sus resultados ya atisban las principales características de Google Scholar: a) mayor cantidad de citas (en 8 de las 10 consultas, Google Scholar recupera más citas que Pubmed); b) localización de
citas únicas (de las 247 citas recuperadas por Google Scholar, el 50.61%
eran únicas, es decir, no recuperadas en Pubmed); c) diversidad de documentos citantes (el 12.96% de los resultados obtenidos en Google Scholar no eran artículos de revista); y la ampliación del espectro citante (el
4.05% de los resultados únicos de GS provenían de revistas no indizadas
en Pubmed).
Freeman et al (2009) también localizan más citas en Google Scholar
que en Pubmed al evaluar la capacidad de éstas dos bases de datos para
evaluar el impacto de revisiones de consultas sobre información en
drogas publicados en The Annals of Pharmacotherapy Drug Information
Rounds. Sin embargo, constatan la capacidad de Pubmed para localizar
información más específica y relevante.
Estos resultados concuerdan parcialmente con los obtenidos por
Mastrangelo et al (2010), quienes recopilan información acerca de los
factores de riesgo de sarcoma a través de Pubmed y Google Scholar. Los
autores, aparte de subrayar la mayor cantidad de citas recopiladas por
Google Scholar y la muy baja concordancia entre ambas bases de datos
(8%), inciden en el hecho de que muchas de las citas recuperadas por

Bloque A · Capítulo 3 · Las dos caras de Google Scholar (II)

Google Scholar son innecesarias, provenientes de resultados desactualizados e incluso falsos (debidos a fallos en la asignación de autores a
artículos), lo que ayuda en gran parte a la obtención de más resultados,
pero que precisan de un proceso posterior de filtrado.
Los autores detectan adicionalmente un problema ya planteado anteriormente y relativo al grado de comparabilidad entre los productos,
dada la diferente naturaleza de los materiales indizados en ambas bases de datos. La detección de una gran cantidad de las citas de Google
Scholar provenientes de fuentes no convencionales (libros, conferencias,
actas de congresos, posters, cartas, editoriales, etc.) complica la comparación directa de los dos buscadores. El idioma constituye un problema
adicional. Por ejemplo, Mastrangelo et al (2010) solamente tienen en
cuenta los artículos publicados en inglés para llevar a cabo su estudio.
No obstante, la delimitación temática de Pubmed (y su completa indización actual por parte de Google Scholar) 3 ha hecho que la mayoría de
los trabajos comparativos en términos de citas se hayan dirigido a las
tres principales bases de datos bibliométricas: Web of Science core collection, Scopus y Google Scholar.
Desde un inicio, existió un gran interés por la comunidad científica
en conocer las diferencias en términos globales del número de citas que
Google Scholar era capaz de recopilar respecto a Scopus y WoS. Por ejemplo, Jacsó (2005a) recoge los 30 artículos más citados en Current Science y
analiza las citas recibidas por éstos en las tres bases de datos. Sus resultados muestran que, aparentemente, tanto WoS como Scopus recuperan
un número de citas muy similar (977 y 992 respectivamente), mientras
que en Google Scholar los datos son muy inferiores (358), debido a que
éste sólo tiene indizados 14 de los 30 artículos analizados.
Este trabajo constituye una excepción en la literatura al ser de los pocos en los que se recuperan menos citas en Google Scholar. Los procesos
de búsqueda empleados para la localización de los artículos, la meticulosidad del autor para eliminar citas erróneas (labor no siempre realizada
en este tipo de estudios) así como las mayores deficiencias del sistema
en aquel momento a la hora de vincular correctamente las distintas versiones de los documentos pudieron influir en sus resultados.
Sin embargo, una gran parte de los estudios posteriores se han caracterizado de hecho por localizar más citas en Google Scholar. Por ejemplo, Martell (2009) analiza 217 artículos publicados en College & Research
3 La consulta <site:ncbi.nlm.nih.gov> en Google Scholar arroja un total de 3.650.000
resultados (julio 2015). Aunque el comando “site” no es exhaustivo, proporciona una idea
general de la alta tasa de indización en Google Scholar del material contenido en Pubmed.

81

82

La revolución Google Scholar

Libraries entre 2000 y 2006, observando que el promedio de citas por
artículo en WoS es de 3.1, mientras que en Google Scholar es de 6.4. Posteriormente, Minasny et al (2013) observan por su parte que el número
de citas en Google Scholar es 1.9 veces mayor que el de WoS a la hora de
analizar las citas recibidas por más de 300 investigadores del área de
Ciencias de la Tierra. Con todo, este tipo de estudios comparativos de
citas vienen fuertemente delimitados por las distintas disciplinas científicas y su desigual cobertura en cada base de datos.
Uno de los primeros análisis de citas por disciplinas en Google Scholar
fue el realizado por Bakkalbasi et al (2006), quienes estudian las citas recibidas en WoS, Scopus y Google Scholar para los artículos pertenecientes
a dos disciplinas (Oncología y Física de la materia condensada) en dos
momentos temporales (1993 y 2003). Los resultados muestran diferencias en función de la base de datos, del año de publicación y de la disciplina. Centrándonos en la muestra más reciente (2003), en Oncología
es Scopus la que obtiene un mayor promedio de citas (8.9), seguida de
WoS (8.3) y Scholar (6.2). Sin embargo, en Física de la materia condensada
es WoS la que ocupa el primer lugar (3.9), seguida de Scopus y Scholar
(ambas con un promedio de 2.2). Estos datos vendrían a coincidir con los
resultados previamente discutidos de Jacsó (2005a), aunque los autores
reconocen la capacidad de Scholar de aportar citas únicas no contenidas en las restantes bases de datos, aspecto en el que se ahondará más
adelante.
Posteriormente, Kousha y Thelwall (2008) llevan a cabo una de las
contribuciones más importantes en el área al analizar una muestra amplia (882 artículos) conformada por 39 revistas en Acceso Abierto recogidas en la WoS (versión 2011), en diversas áreas (Biología, Química,
Física e Informática). Los autores encuentran diferencias significativas
entre las citas recibidas en WoS y Scholar por área. Por ejemplo, tanto en
Física (WoS: 1.111; Scholar: 1.313) como especialmente en Informática
(WoS: 1.117; Scholar: 2.884), el número de citas recopiladas por Scholar es
claramente superior, mientras que en Biología en ligeramente inferior
(WoS: 1.288; Scholar: 1.113) y en Química claramente inferior (WoS: 668;
Scholar: 279).
Los autores atribuyen las posibles razones de este fenómeno a la tipología de fuentes de citas incluidas en Scholar y no incluidas en WoS. De
este modo, por un lado, la Física (repositorios) e Informática (congresos)
se ven favorecidas, mientras que la Biología y Química (citas fundamentalmente de revistas) se ven perjudicadas. No obstante, en el caso de la
Química, las razones debían buscarse entonces en la cobertura deficien-

Bloque A · Capítulo 3 · Las dos caras de Google Scholar (II)

te de ésta en Scholar, debido a la no inclusión de la American Chemical
Society, como se ha comentado previamente.
Este hecho se confirma nuevamente con el trabajo de Bornmann et
al (2009), quienes tras examinar un conjunto de 1.837 artículos (aceptados para su publicación en la prestigiosa revista Angewandte Chemie
International Edition, o bien rechazados, pero posteriormente publicados
en cualquier otro lugar) calibran la medida en la que el uso de Google
Scholar puede proporcionar citas válidas en el campo de la Química. Los
autores recuperan 44.502 citas a través de la WoS, 44.601 desde Scopus,
48.160 desde Chemical Abstracts, pero solamente 9.320 a través de Google Scholar, demostrando la deficiente cobertura de éste en el campo de
la Química en aquellos momentos.
Dada la dependencia de la disciplina bajo estudio, los autores comienzan paulatinamente a centrar sus estudios en las correlaciones
obtenidas más allá del número total de citas recibidas en cada base de
datos, gracias en parte a los resultados positivos de los primeros análisis
realizados. De ese modo, Pauly y Stergiou (2005), a partir de un estudio
a 99 artículos seleccionados de 11 disciplinas diferentes, obtienen una
buena correlación entre el número de citas en Google Scholar y WoS. De
forma similar, Belew (2005), a partir de un conjunto de 203 publicaciones, encuentra igualmente una alta correlación entre las citas proporcionadas por estas dos bases de datos.
La correlación de Scholar con Scopus es igualmente analizada por
Kousha, Thelwall y Rezaie (2011), quienes encuentran ligeras diferencias
por área de conocimiento. En el caso de Derecho, la correlación entre
Scopus y Google Scholar es de 0.7, mientras que sube hasta 0.9 en el caso
de la Sociología, mostrando su gran utilidad en disciplinas orientadas a
las Ciencias Sociales.
Este tipo de cálculos también se han aplicado a otros niveles de estudio. Por ejemplo, Vaughan y Shaw (2008) obtienen la correlación entre WoS y Scholar en función de la tipología documental, a partir de una
muestra de 1.483 publicaciones que representan la producción científica
de una Facultad de Biblioteconomía y Documentación, encontrando correlaciones altas en el caso de los libros (0.75), intermedias en el caso de
los capítulos de libro (0.59) y sorprendentemente bajas en el caso de las
actas de congresos (0.29).
Por otra parte, Bar-Ilan, Levene y Lin (2007) se proponen testar un
conjunto de medidas para comparar las diferentes bases de datos de
citas, tomando como muestra las citas a los artículos indizados por WoS

83

84

La revolución Google Scholar

por un listado de autores israelitas (un total de 44) altamente citados.
Los resultados obtenidos revelan altas similaridades entre Scopus y WoS,
mientras que la similaridad de Scholar con el resto es menor, indicando
de este modo que su cobertura es considerablemente diferente.
La circunstancia de que, a pesar de las diferencias notables en la cobertura, se obtengan (especialmente en algunas disciplinas) correlaciones elevadas entre el número de citas obtenido en Scholar y el resto de
bases de datos, ha llevado a algunos autores a explorar la relación entre
los contenidos albergados en Scholar (que reflejan en parte una presencia web) y otros indicadores bibliométricos de actividad.
Por ejemplo, Smith (2007) compara la tasa de citas de ocho universidades de Nueva Zelanda a través de Google Scholar con los resultados
del New Zealand’s Performance Based Research Funding (PBRF), un ejercicio de evaluación de la investigación. La alta correlación entre los resultados de producción del PBRF y el total de citas (0.94), así como del total
de hits recuperados (0.85) ponen en evidencia que el número de citas
medida a través de Google Scholar es una medida útil de los datos de
producción de una institución, a pesar de los problemas metodológicos
asociados al buscador.
Orduna-Malea, Serrano-Cobos y Lloret-Romero (2009) estudian
igualmente la validez de Google Scholar como servicio capaz de reflejar adecuadamente la producción científica de una universidad, en este
caso comparando la producción científica de las universidades públicas
españolas a través de Scopus con la cobertura de documentación científica que las sedes web de estas universidades tienen indizadas en Google
Scholar. Los resultados muestran, si se excluyen ciertos outliers (bases de
datos bibliográficas depositadas en los dominios web de algunas universidades como Dialnet y Compludoc), que la producción académica de las
univeridades a través de Scopus y la publicación web en Scholar están
muy correlacionadas, aunque constituyen conjuntos documentales de
diferente naturaleza.

En búsqueda de las citas únicas y del impacto total

Más allá del número total de citas obtenidas por cada base de datos,
de la correlación entre éstas o de la naturaleza de sus contenidos, en lo
que sí existe consenso es en que ninguna base de datos proporciona las
necesidades completas para un análisis de citas si lo que pretendemos
es conocer el impacto “total” de una publicación, revista o autor. Este es
el caso por ejemplo del conocido trabajo de Judith Bar-Ilan (2010), quien
realiza un análisis de citas completo al clásico libro “Introduction to in-

Por tanto. La autora descubre que. revistas o artículos buenos (o malos) siguen siendo . sí localiza 109 citas no incluidas en éstas. aunque Google Scholar es incapaz de localizar el 30% de las citas que sí cubren Scopus y WoS (unas 90). Otra cosa bien distinta es la pretensión de recopilar el mayor número de citas reales existentes para valorar la influencia de una persona. el valor añadido que puede suponer Google Scholar (especialmente en su capacidad para localizar nuevas citas) debe ser tenido en cuenta. de Leo Egghe y Ronald Rousseu. Google Scholar: 83). Levine-Clark y Gil (2008) llegan a una conclusión similar al estudiar las citas recibidas por un conjunto de revistas de Economía y Negocios.7% en el caso de Nisonger (13% de citas únicas procedentes de Scholar). New England Journal of Medicine) entre 1999 y 2008 a través de WoS. la combinación de aquellas es necesaria. Efectivamente. la combinación de WoS y Scholar incrementa el número de citas en un 25. A pesar de ello. Nisonger) con perfiles ligeramente diferentes (Information Science y Library Science respectivamente). Yang y Meho (2006) analizan las citas recogidas en WoS. Y esta circunstancia no sucede de forma exclusiva (aunque tal vez sí de forma más acusada) en las ciencias sociales. Scopus: 98. Dado que ninguna base de datos proporciona las necesidades para un análisis completo de citas (Bakkalbasi et al.4% para Mostafa (5. 2006).buenos o malos independientemente del metro (base de datos) que utilicemos para medir (lo que es válido hasta cierto punto según qué disciplinas). Estos datos corresponden con las apreciaciones de Bauer y Bakkalbasi (2005) al tratarse de material antiguo y probablemente fuera de la Web académica. especialmente para Nisonger (WoS: 173. Lancet. Meho y Yang (2007) amplían el estudio inicial a 15 autores.Bloque A · Capítulo 3 · Las dos caras de Google Scholar (II) formetrics”. Scopus y Scholar ayuda a revelar una imagen más precisa y exhaustiva del impacto de los autores. concluyendo que el uso combinado de WoS. tal y como pretendía Bar-Ilan en su estudio. Kulkarni et al (2009) comparan los perfiles de citación para 328 artículos publicados en revistas de medicina general (JAMA. publicación o idea en la sociedad en general y en la comunidad científica en particular. destacando el papel de Google Scholar al recopilar citas de actas de congresos y revistas en idiomas diferentes al inglés. Scopus y Scholar para dos profesores del área de Library and Information Science (Javed Mostafa y Thomas E. Por ejemplo. las correlaciones nos dicen básicamente que los autores.9% de citas únicas en Scholar) y un 19. Scopus y Scholar observando 85 . Los resultados muestran que WoS en la base de datos que más citas recupera para los dos profesores y Scholar la que menos.más o menos .

27% (n= 2737) Química WoS – GS: 53.9%).67% (n= 1044) WoS – GS: 43. procedentes de diversas disciplinas (Biología. Recopilación de trabajos relativos a citas únicas en Google Scholar AUTORES DISCIPLINA SOLAPAMIENTO CITAS ÚNICAS GS Bakkalbasi et al (2006) Oncología WoS – GS: 4% Scopus – GS: 5% 13% (n= 614) Materia condensada WoS – GS: 9% Scopus – GS: 3% 50% (n= 296) Mikki (2009) Ciencias de la Tierra WoS – GS: 26% 68% (n= sin datos) Jaćimović.35% 81. Thelwall y Rezaie (2011) Derecho Scopus – GS: 83.4% de todas las citas recuperadas por Scholar son únicas) y Física (47. tanto cuantitativa como cualitativamente.47% 66.33% 81. Física e Informática). Química. Kousha y Thelwall (2008) analizan en profundidad este fenómeno. Para ello toman una muestra de 882 artículos provenientes de 39 revistas de Acceso Abierto a fecha de 2001. pero mucho menores en Química (21.93% (n= 511) Biología WoS – GS: 29.02% 81. Ante esta situación.87% 90.40% (n=122) Arqueología Scopus – GS: 72.54% 80.6% (n= 27) Kousha.89% (n=792) Filosofía Scopus – GS: 71.9% 11.7% (n= 380) Šember.8% 58% (n=167) García-Pérez (2010) Psicología WoS – GS: 41.73% (n=222) Ciencias políticas Scopus – GS: 73. Los resultados arrojan porcentajes de citas únicas en Google Scholar elevados para Informática (78.18% (n= 333) Historia Scopus – GS: 76.4%). Petrović y Živković (2010) Odontología WoS – GS: 55.8% Scopus – GS: 55. . citas diferentes.86 La revolución Google Scholar cómo las tres bases de datos producen.80% (n= 318) Informática Física WoS – GS: 68.08% (n= 222) Sociología Scopus – GS: 71. Tabla 2.07% 82.94% 86. se ha procedido a calcularlos manualmente. En aquellos casos en los que los datos porcentuales no se ofrecían en la fuente original. definiendo “citas únicas en Google Scholar” como aquellas citas recuperadas por Scholar pero que no se encuentran en las bases de datos bibliométricas con las que se compara (esencialmente WoS y Scopus).2% 54.76% 81.62% (n= 707) Kousha y Thelwall Elaboración propia.99% (n= 517) Comunicación Scopus – GS: 77.4% 37. Utrobičić y Petrak (2010) Medicina WoS – GS: 44% Scopus – GS: 51% 22% (n= 86) Adriaanse y Rensleigh (2013) Ciencias ambientales WoS – GS: 15% Scopus – GS: 3.4% 59.3% 34.1% (n=563) Zarifmahmoudi y Sadeghi (2012) Medicina nuclear Scopus – GS: 23.

Los datos mostrados en la Tabla 2 deben leerse de forma muy contextualizada. Y. Con el propósito de ofrecer una panorámica general de las investigaciones realizadas se ha elaborado la Tabla 2. tal y como hacen Vaughan y Shaw (2008). especialmente en Ciencias Sociales y Huma- 87 . poniendo un especial énfasis en Google Scholar. destaca la corriente de autores que razona que la consideración de fuentes alternativas supone una ventaja de Google Scholar. Y en esta discusión aparecen claramente dos dimensiones complementarias: fuentes académicas vs fuentes no académicas. 2008). Tipologías documentales citantes Más allá de calcular el número de citas y citas únicas que proporciona cada base de datos. sobrevalorarían la investigación de menor calidad. pues el año de realización del estudio. la procedencia y tipología de estas citas introduce obviamente una nueva y necesaria discusión: ¿deberíamos valorar una cita procedente de un artículo publicado en una revista recogida en los Journal Citation Reports igual que una cita de una revista no indizada? ¿Y de un informe? ¿Y de un trabajo final de carrera? Tal y como Kousha y Thelwall (2008) indican.Bloque A · Capítulo 3 · Las dos caras de Google Scholar (II) Estos resultados llevan a la comunidad científica a desarrollar numerosos trabajos dedicados a conocer tanto el grado de solapamiento entre bases de datos bibliométricas. la comunidad ha adoptado en este punto claramente dos posiciones bien diferenciadas. la disciplina y el tamaño de la muestra afecta significativamente a los resultados obtenidos. en la que se muestra una recopilación de los principales trabajos empíricos relativos al cálculo de citas únicas en Google Scholar. En cualquier caso. pues esta circunstancia puede ser útil para el seguimiento de citas en un amplio rango de documentos académicos y proporcionar de ese modo un tipo de impacto más amplio y completo (Kousha y Thelwall. A pesar de la dificultad que supone medir el impacto intelectual que pueden aportar las citas en función de su procedencia. fuentes indizadas en WoS/Scopus vs fuentes no indizadas. el solapamiento entre bases de datos y el porcentaje de citas únicas. la aportación de Google Scholar a la recuperación de citas queda fuera de toda duda. así como el porcentaje de citas únicas que cada una de ellas proporciona. por el contrario. que puede ser importante en muchos campos. dentro de las académicas. Por un lado. mostrando las disciplinas analizadas. es todavía una cuestión no resuelta si la inclusión de citas de documentos no revisados por pares mejoraría el valor de los resultados del conteo de citaciones o si.

35%). capítulos de libro.7%). tesis…) hasta otras fuentes menos académicas (como currículums.8%).66%).6% de informes técnicos y un 4.86%). capítulos de libros (3. Por otro lado.). páginas web. actas de congresos. sino que desciende a la identificación de citas únicas en Google Scholar. 2008b). Entre las tipologías de fuentes de citas en Google Scholar sobresale una por derecho propio: las monografías. Van Aalst (2010) o Bergman (2012) discuten igualmente la amplia diversidad de fuentes de citas en Google Scholar.5% de tesinas y tesis doctorales.42%). Los libros se encuentran totalmente excluidos de las grandes bases de datos bibliométricas (únicamente aparecen en las referencias citadas). 2008a. actas de congresos (33. el estudio de la variedad de tipologías documentales de las fuentes de citas en Google Scholar es actualmente un área de gran interés.62%) y libros (1. En el análisis de citas de 15 investigadores que estos autores realizan posteriormente (Meho y Yang. un 12. pueden influir y tergiversar los conteos de citas y por tanto el impacto científico real (Jacsó.9%) o informes (9. los autores obtenían un 33. pues documentos enviados por estudiantes. Independientemente de la calidad de las citas y su influencia en el retrato más o menos fidedigno del impacto científico.7%). entradas de blogs o listas de discusión. tesis (4. tesinas de máster (4. webibliografías.6% de las citas procedentes de actas de congresos. Un porcentaje de citas realmente significativo (50. Este asunto ya fue abordado por Yang y Meho (2006) en su análisis de los profesores Mostafa y Nisonger. 2007). informes. Aunque las revistas constituyen la tipología más presente (25. etc. la autora identifica no sólo las citas por categoría documental.9%). entre las que se pueden encontrar desde fuentes más académicas (revistas. lo que muestra la variación que puede existir entre carreras científicas diferentes incluso dentro de áreas disciplinares similares. comentado previamente.1%. que han sido incluidos en Google Scholar por el mero hecho de estar online (independientemente de su valor académico). que en el caso de Nisonger sólo representa el 17. Con posterioridad. 2007).2%) proporcionan un porcentaje alto de citas únicas. la alta diversidad de procedencia de las citas obtenida en Google Scholar se confirma: artículos de revista (40. libros. otras tipologías como las actas de congresos (22.32%). En el análisis realizado por Bar-Ilan (2010) del libro “Introduction to informetrics”. tesis (13.88 La revolución Google Scholar nas (Schroeder. destaca la corriente que considera negativa esta circunstancia. otros trabajos como los de Mukherjee (2009).75%). entre otros. Pese a existir proyectos . En el caso concreto de Mostafa. informes técnicos (2. capítulos de libros (8.

Este hecho. Thelwall y Rezaie (2011) realizan un estudio más amplio con el fin de examinar las citas procedentes de Google Scholar y Google Books como fuentes alternativas de evidencia de impacto científico.com/products_tools/multidisciplinary/bookcitationindex 5 Galardón anual entregado por la Academy of Management al libro juzgado por haber realizado la contribución más destacada al avance global en la disciplina de la Gestión del conocimiento en los dos años precedentes. El promedio de citas localizadas por libro en WoS es de 346. 2015). entre otros importantes problemas conceptuales como las citas de diferentes ediciones de un libro (Torres-Salinas et al. Aunque en capítulos posteriores (dedicados a la cobertura de Google Scholar) se incidirá nuevamente en este hecho. ha permitido abrir una línea de investigación centrada en el impacto de las monografías (tanto como fuentes citantes como documentos citados). http://aom. No todos los libros académicos incluidos en Google Books se encuentran en Google Scholar debido a una serie de factores tanto técnicos como de cobertura y filtrado de documentos. contabilizan las citas recibidas por los distintos ganadores del Terry Book Award (10 monografías) 5. Una diferencia más que notable. en las que los libros y capítulos de libros constituyen vehículos esenciales de comunicación científica.Bloque A · Capítulo 3 · Las dos caras de Google Scholar (II) en marcha. 2014). Conviene diferenciar las citas a libros proporcionadas por Google Scholar de los datos de citas que pudiera proporcionar Google Books (Kousha y Thelwall.org/Meetings/awards/2015George-R--Terry-Book-Award.aspx 89 . se debe dejar claro que las bases de datos de Google Scholar y Google Books son diferentes. En ese sentido. Posteriormente. en su exploración de Google Scholar como una nueva fuente para el análisis de citaciones. su cobertura es todavía insuficiente y excesivamente sesgada hacia el idioma inglés como para poder ser usada con fines bibliométricos. Kousha.000 monografías que habían sido remiti- 4 http://wokinfo. Google Scholar se erige como la principal fuente actual de citas procedentes de monografías. Para ello recogen 1. En los trabajos señalados al comienzo de esta sección ya se mostraba el importante porcentaje de citas (tanto totales como únicas) provenientes de libros en Google Scholar. de gran importancia para la evaluación de autores en disciplinas de Ciencias Sociales y Humanas. unido a la enorme base de datos del buscador. mientras que en Google Scholar alcanza las 833 citas por libro. Una muestra de ello es el trabajo llevado a cabo por Harzing y Van der Wal (2008) quienes. como el Book Citation Index 4 (elaborado por Thomson Reuters en 2011).

Google Books y Scopus. El hecho de que Google Scholar sea una importante fuente de citas a monografías ha permitido revelar por otra parte el gran impacto científico de éstas.410 documentos (71%) en los que se puede identificar la tipología documental. Los autores contabilizan que la mediana de citas a libros obtenida desde Google Books y Google Scholar era dos y tres veces respectivamente más elevada que la obtenida desde Scopus. el 18% son monografías. Además. oculto o simplemente ignorado. Este sistema fue sustituido por por el denominado REF (Research Excellence Framework). Universitat Autònoma de Barcelona y la Universidad del País Vasco). De los 45. es la tipología documental con mayor promedio de citas por documento (2. seguida de los artículos en revistas (con 1. Un ejemplo ilustrativo lo conforma el estudio realizado por Etxebarria y Gomez-Aranga (2010). Los autores identifican que ciertos investigadores tienen un nivel internacional y son reconocidos independientemente de la base de datos utilizada.uk . El efecto de la consideración de las monografías en la evaluación de los autores es tan rotundo que su consideración ya resulta ineludible. Este hecho sugiere a los autores que Google Scholar puede ser una fuente de citas necesaria en aquellos casos donde las publicaciones en tipologías distintas a los artículos de revista son importantes. La mayor sorpresa llega no obstante cuando los documentos se ordenan según su número total de citas. Universitat de Barcelona.700).700). quienes comparan Scopus y Google Scholar a la hora de medir la producción en ciencias sociales en cuatro universidades españolas (Universidad Complutense de Madrid. el 62% son libros. y dentro del top 25. Derecho. dentro del top 1% de documentos más citados. categorizando las monografías por disciplina (Arqueología. SHEFC. Política y Estudios internacionales. HEFCW y DELNI). sin 6 RAE (Research Assessment Exercise): ejercicio de evaluación por las agencias financiadoras de la educación superior británicas (HEFCE.90 La revolución Google Scholar das al RAE (Research Assessment Exercise) 6 en 2008 por parte de los autores como evidencia de su producción científica. realizado aproximadamente cada cinco años. hasta ahora relativamente minusvalorado. Filosofía. Historia y Estudios culturales y de medios). que fue aplicado por primera vez en 2014 para evaluar el período 2008-2013. con el fin de evaluar la calidad de la investigación llevada a cabo por las universidades británicas. Sociología. Estos resultados remueven absolutamente los cimientos de la evaluación tradicional del impacto científico basada en análisis de citas desde y hacia revistas de calidad (la elite) en Scopus y WoS.000 documentos más citados en Google Scholar durante el período 1950-2013. Martin-Martin et al (2014) analizan los 64.ac. se localizan hasta 14 monografías. y para cada libro comparan las citas recibidas desde Google Scholar.ref. http://www.

informática. la mayoría de los autores prestigiosos en sus comunidades científicas locales ni siquiera aparecen en Scopus. las disciplinas que más se benefician de Google Scholar en el estudio realizado son las ingenierías. De ahí el enorme beneficio del uso de Google Scholar para la evaluación de estos investigadores. En concreto. Recopilación de trabajos relativos a comparación de citas recibidas por tipología de documento citante (Google Scholar. gestión y administración de empresas.Bloque A · Capítulo 3 · Las dos caras de Google Scholar (II) embargo. Web of Science. ha dado lugar al 91 . Tabla 3. y especialmente en tipologías documentales básicas para la comunicación de la ciencia en gran multitud de disciplinas científicas sociales y humanas. economía. matemáticas y humanidades. Scopus) AUTORES UNIDAD DOCUMENTO GS WOS SCOPUS Winter & Zadpoor & Dodou (2014) N= 58 (multidisciplinar) Revistas 805 546 -- Conferencias 123 53 -- Libros/Capítulos de libro 63 7 -- Tesis 75 0 -- Informes 13 0 -- Artículos originales 39 30 40 Artículos de revisión Miri & Raoofi & Heidari (2012) Bergman (2012) Meho & Yang (2007) Jaćimović & Petrović & Živković (2010) N= 104 (Hepatología) N= Sin datos (Ciencias sociales) Artículos publicados por 5 revistas durante 2005 N= 1093 (Documentación) N= 158 28 25 25 Informes breves 9 8 10 Editorial 8 4 7 Informe de casos 3 3 3 Carta al editor - 1 1 1951 1735 1782 Artículo Libro 318 -- 1 Artículo en congreso 32 -- 25 Revisión 24 -- 248 Editorial 1 -- 28 Carta 1 -- 10 Artículo 2215 1529 1754 Artículo en congreso 1849 229 359 Revisión 86 172 147 Editorial 25 63 36 Reseña 3 17 0 Carta 2 9 2 Ítem bibliográfico 1 2 1 Artículo 117 50 56 Revisión 13 4 6 Editorial 3 1 3 Actas de congreso 3 2 3 Estas continuas evidencias de impacto global.

En este último apartado del capítulo se aborda la construcción de indicadores bibliométricos a partir de los datos extraídos de Google Scholar. especialmente del h-index. 2006). Elaboración de indicadores bibliométricos En los apartados precedentes se ha dejado constancia de la importancia de Google Scholar como fuente de citas. El h-index es un indicador compuesto ideado por el físico Jorge Hirsch (2005). así como de la aplicación de procesos de normalización. necesarios para su utilización en distintos campos científicos. mediante el que se pretende conocer el impacto de un investigador a partir del número de publicaciones y el número de citas recibidas. en el contexto de la evaluación. 2015). el artículo en el que se propuso el indicador ha logrado las 1973 citas en la Web of Science Core Collection. La insultante sencillez de su cálculo. es evidente que 7 Actualmente (septiembre 2015). . entre las que destaca por derecho propio el g-index (Egghe. En este sentido. así como estudios acerca de sus ventajas e inconvenientes (Costas y Bordons. Bornmann et al (2015) han desarrollado recientemente procedimientos para comprobar el grado de normalización del impacto de citación en Google Scholar (tomados de los procedimientos de la bibliometría clásica) concluyendo que los datos de Google Scholar resultan adecuados para la normalización. citas únicas y citas procedentes de tipologías documentales alternativas. mientras que alcanza las 5060 en Google Scholar. esenciales en determinadas disciplinas científicas. Sin entrar en la discusión acerca de las características de este indicador o la mayor o menor necesidad de sus variantes (un tema que merecería por sí mismo una obra entera dedicada a ello). provocaron una amplia y rápida expansión 7 así como la aparición de numerosas variantes (Alonso et al. entre algunos otros). 2012. en la Tabla 3 se muestran algunos de los principales trabajos que ofrecen datos de citas recibidas por tipología de documento en Google Scholar. valores elevados para un artículo en bibliometría. Waltman y Van Eck. Sin embargo. su robustez frente a errores y su posterior aplicación a otras unidades de estudio (revistas. 2009). Wilsdon et al. etc.). comparándolas posteriormente con Web of Science o Scopus. A modo de resumen. 2007. universidades. todavía debe prestarse atención a la confiabilidad de los datos y a la necesidad de su filtrado. un autor tiene un índice “h” cuando “h” de sus artículos publicados tienen al menos “h” citas cada uno de ellos. 2014.92 La revolución Google Scholar testeo de este buscador como posible fuente de citas en programas y ejercicios de evaluación estatales (Prins et al. la capacidad de generar comparaciones instantáneas.

Por ejemplo. la autora declara que en la mayoría de los resultados obtenidos a través de Google Scholar son considerablemente diferentes a los obtenidos por WoS y Scopus. Bar-Ilan (2007) compara los h-index de una lista de autores altamente citados de Israel. pero los rankings (tanto de autores como de revistas) no varían significativamente o sólo de manera moderada cuando se ordenan por el h-index. las comparaciones del valor del h-index deben realizarse obligatoriamente en el marco de una base de datos específica para que tengan sentido. Unas conclusiones similares obtienen Amara y Landry (2012). Las conclusiones apuntan a que Google Scholar proporciona resultados significativamente más altos que WoS. Sin embargo. con un cierto margen de error tolerable. tras analizar el h-index de 277 revistas de comunicación a través de Google Scholar Metrics.Bloque A · Capítulo 3 · Las dos caras de Google Scholar (II) cada base de datos bibliométrica proporciona citas duplicadas y únicas. la comunidad científica precisamente ha construido un creciente corpus dedicado a la influencia de la base de datos en el cálculo del h-index. 93 . a partir de las citas obtenidas en WoS. los investigadores que exhiben un mejor rendimiento académico en WoS. quienes comparan por su parte la producción de investigadores en Escuelas de negocio canadienses según WoS y Google Scholar. también tienen los mejores valores en Google Scholar. pues una sola base de datos no puede ser confiable para proporcionar una evaluación exclusiva del impacto de un investigador. trabajos posteriores obtienen resultados bien diferentes. Por su parte. Delgado-López-Cózar y Repiso-Caballero (2014). indizados o no en una determinada base de datos). Sin embargo. así como a determinar las posibles diferencias en los rankings de autores proporcionados. Franceschet (2009) analiza tanto autores como publicaciones en el área de Informática a través de WoS y Google Scholar. las posiciones de los autores más y menos importantes. Los primeros trabajos al respecto no son muy positivos respecto al papel de Google Scholar en este asunto. fiables y válidos como aquellos generados por Web of Science o Scopus. Aparte de constatar las diferencias entre las distintas disciplinas. Scopus y WoS para calcular el h-index más fidedigno posible. Scopus y Google Scholar. independientemente de que el h-index no fuera el completo de los autores (el formado por todos los trabajos publicados por un autor. Por ejemplo. por lo que en realidad se precisa tanto de WoS. Aunque los valores absolutos son superiores en Google Scholar. mostrando resultados tan solventes. concluyen que Google Scholar es capaz de identificar las principales revistas de la disciplina. El objetivo detrás de estos trabajos es determinar si una sola base de datos sería suficiente para conocer. De forma paralela.

las pobres prestaciones de búsqueda que ofrece Google Scholar (que serán detalladas en el apartado dedicado a sus ventajas e inconvenientes) impiden que el trabajo de recopilación y análisis sea rápido y amigable. Cambiando de disciplina. obteniendo correlaciones significativas de Scholar tanto con WoS (r= 0.79 con Scopus). las autocitas no se pueden eliminar automáticamente en Google Scholar. a pesar de que Google Scholar proporciona una mayor cobertura y citas que Scopus y WoS. 40% superior a WoS). un parámetro al que el h-index es sensible. en concreto al Journal Scholar Metrics. Cabezas-Clavijo y Delgado López-Cózar (2013) comparan el h-index obtenido por las revistas más relevantes en el área de Medicina intensiva en WoS.97). y que puede ser controlado tanto en WoS como en Scopus (donde existe la posibilidad de excluir las autocitas en el cálculo de ciertos indicadores como el h-index). no existen variaciones importantes en las clasificaciones generadas a partir de cada fuente de datos. Los resultados indican que.93) como con Scopus (r= 0. Los autores demuestran que el h-index a nivel individual incrementa en un 24% de media al contar las autocitas. Lamentablemente.94 La revolución Google Scholar Del mismo modo. aunque la correlación entre los distintos rankings es elevada. r= 0. aunque los valores medios del h-index en Google Scholar son prácticamente un 15% y 30% más elevados a los obtenidos en Scopus y WoS respectivamente. éste exige un proceso de filtrado y depuración importante de datos Otro importante problema que afecta al cálculo del h-index en Google Scholar son las autocitas. y pese a proporcionar valores de h-index más elevados (47% superior a Scopus. Una experiencia interesante la constituye el trabajo de Couto et al (2009). en el que precisamente se trabaja con la computación de autocitas. . en este caso en revistas. Zarifmahmoudi y Sadeghi (2012b) comparan igualmente el h-index de los investigadores en este caso en el área de Medicina nuclear en Irán. se observa un gran parecido entre los rankings proporcionados por las tres bases de datos (r= 0. Rosenstreich y Wooliscroft (2009) destacan que. Scopus y Google Scholar. dedicado a los productos derivados de Google Scholar. Este asunto será tratado nuevamente en el Bloque B. Por otro lado. quienes desarrollan un servicio web denominado CIDS (Citation Impact Discerning Self-Citations) para analizar la influencia de las autocitas en el análisis de impacto de un equipo de investigación en Informática (formado por 72 personas y un corpus de 229 artículos). Sin embargo. obteniendo diferentes h-index en función de la base de datos.895 con WoS.

n= 19. 95 . Scopus y WoS. corporativos como a nivel de revista. pero eso podría ser irresponsable. n= 10. En el posterior estudio realizado por Anne-Wil Harzing (2014) a partir de la misma muestra de 20 autores. Jacsó analiza su impacto académico a través de Google Scholar. las deficiencias de Google Scholar son particularmente voluminosas de tal forma que sus estimaciones de hits no pueden ser aceptadas ni siquiera como punto de partida para la evaluación del rendimiento académico. quienes comparan los hindex de 3. Medicina y Física). Scopus y Google Scholar) muestran limitaciones. 9 Para celebrar el 75 aniversario de F. los estudios más recientes ofrecen mejores resultados. Podría listar aquí el h-index de F.Bloque A · Capítulo 3 · Las dos caras de Google Scholar (II) Pero no sólo la poca amigabilidad del sistema o la imposibilidad de eliminar las autocitas afectan al cómputo del h-index desde Google Scholar. En cualquier caso. n= 5. Estos datos se confirman con el estudio empírico llevado a cabo por Delgado López-Cózar y Cabezas-Clavijo (2013). mostrando información acerca de publicaciones no cubiertas por éstas a la hora de computar el h-index automático que generan (Jacsó. mientras que en Economía son claramente superiores en Google Scholar. lo que puede convertir a Google Scholar en una herramienta mucho más adecuada para la evaluación del impacto de la investigación.W Lancaster. Economía. but it would be irresponsible” 8- 9.W.667) como en Scimago Journal Rank (edición 2011. Lancaster según Google Scholar. tanto individuales. Jacsó es implacable: “I could list here the h-index of F. quien tras realizar un análisis longitudinal (entre abril 2011 y enero 2012) a 20 investigadores galardonados con el premio Nobel (en las disciplinas de la Química.W. confiables ni reproducibles) distorsionan los indicadores de métricas.423 revistas recogidas tanto en Journal Citation Reports (edición 2011. destaca que el h-index promedio para los novelistas en Medicina y Física es bastante similar tanto en Google Scholar como en WoS. 2008a). aunque ciertamente pueden ayudar a revelar ciertas limitaciones de WoS y Scopus. Lancaster as reported by Google Scholar.708) y Google Scholar Metrics (edición 2007-2011. la autora constata (tras un seguimiento mensual durante 2012) que la base de datos presenta menos diferencias entre disciplinas y que la tasa de crecimiento se ha estabilizado (estabilizándose así mismo el crecimiento del h-index en el tiempo). Los metadatos creados por Google Scholar (que no son estándar. Cabe destacar el trabajo de Harzing (2013a). Los resul 8 Cfr. quien expresa que aunque las tres bases de datos (WoS. A pesar de esta última declaración.567). tal y como denuncia Jacsó (2012c). En el caso de la Química los datos son superiores en WoS. con el fin de estudiar la forma más real y justa de calcular su h-index.

82). por lo que sus resultados no deben generalizarse. excepto para el número de publicaciones en Scopus. Para ellos hemos utilizado la base de datos Scopus (simplemente por ser más automática la identificación controlada de autores por disciplina dentro de una determinada institución). las correlaciones entre los distintos indicadores son por lo general altas y significativas (α=0.81). Por supuesto. . hemos procedido a identificar los autores más prolíficos en el área de Informática (una de las disciplinas más favorecidas con el uso de Google Scholar) para una determinada universidad (en este caso la Universitat Politècnica de València). correlaciona significativamente con el resto de bases de datos. a pesar de la falta de estandarización en GSM y de las diferencias en las ventanas de citación entre fuentes. los datos más importantes son que la correlación entre el h-index obtenido en Scopus y el obtenido en Google Scholar es elevado (r= 0. Los resultados para los autores con al menos 100 publicaciones en el área “Computer Science” afiliados a la Universitat Politècnica de València se muestran en la Tabla 4 (superior). con excepciones en algunos autores específicos cuyo rendimiento en Google Scholar puede ser mucho mayor debido a la idiosincrasia de su disciplina (o mucho menor si su producción científica no está en el espacio público online).96 La revolución Google Scholar tados obtenidos indican que las tres fuentes posicionan de manera muy similar las revistas (salvo algunas excepciones como PNAS o PLoS One). el h-index proporcionado por Google Scholar Metrics (GSM) obtiene una correlación significativa con el h-index de Scimago Journal Rank (0. hemos recopilado el número total de citas y h-index en Google Scholar (a través de los perfiles creados en Google Scholar Citations). Con el propósito de mostrar un ejemplo sencillo a la par de útil que ilustre las diferencias entre el h-index computado entre diferentes bases de datos. Posteriormente. Como se puede observar en la Tabla 4 (inferior).88) y con el Factor de Impacto de Journal Citation Reports (0. para estos mismos autores. el hindex.05). En concreto. Tras ello hemos recopilado tanto el número de publicaciones como el total de citas recibidas y el h-index a fecha de septiembre de 2015. aunque superior en valor en Google Scholar. la Tabla 4 constituye sólo un ejemplo con una muestra muy reducida de autores en una disciplina muy concreta (y considerando únicamente a los más productivos). Sin embargo. que no alcanza correlaciones importantes salvo con el número de citas obtenidas en Google Scholar. Estos datos refuerzan las ideas mostradas previamente.

20 *0.82 *0. Alcañiz 114 2212 24 -- -- E.51 *0. Autores más prolíficos en la Universitat Politècnica de València (UPV) en área de Computer Science (Scopus. Botti 148 1031 16 3227 30 P.Bloque A · Capítulo 3 · Las dos caras de Google Scholar (II) Tabla 4.58 *0.39 0. Duato 249 1611 25 11567 48 O. Calafate 119 752 13 2134 23 M. Vidal 110 1942 24 7166 44 J. Manzoni 148 1031 15 3503 27 J. Pastor 184 970 15 5164 32 P.C.78 1 h-index GS 0.12 1 h-index Scopus 0. Rosso 167 629 13 3976 34 J.T.80 1 Citas GS 0. Flich 100 649 14 2112 26 Citas GS h-index GS Artículos Scopus Citas Scopus h-index Scopus Artículos 1 Citas Scopus 0. Cano 143 739 14 2988 24 V.050 (two-tailed test) 1 97 .62 *0.91 * Nivel de significancia alpha=0. Lloret 153 739 12 2234 22 V. Autor Scopus GSC Publicaciones Citas h-index Citas h-index J. Julián 135 739 9 1613 22 C. 2015).

.

entre las áreas potenciales de acción para la NISO (National Information Standards Organization). Sin duda. aspecto crucial si recordamos el papel que juega Google Scholar en la búsqueda de información académica hoy día. Aunque Google Scholar tiene su propio conjunto de robots. con el propósito de aportar un granito de ayuda a aquellas personas que se dedican a la creación y difusión de contenidos académicos en la Web. 2015). Marshall Breeding (2015) destaca. en el peor de los casos. existen . diferentes de aquellos utilizados para la búsqueda general de Google. Google maneja una red masiva de aplicaciones de robots automatizados que recorren la Web en busca de contenido. Los robots de indización asociados a Google Scholar recogen de manera sistemática los metadatos y el texto completo para todos los contenidos que el sistema considera como “académicos” (Breeding. Este capítulo está dedicado pues a detallar.Capítulo 4 Capturando la Web académica: Funcionamiento general En un reciente informe acerca del futuro de las herramientas de descubrimiento. el funcionamiento y los requisitos de indización de Google Scholar. Documento académico y Web académica El funcionamiento de Google Scholar es similar al de Google. la más absoluta invisibilidad en el buscador. el desconocimiento acerca de los pilares fundamentales en los que se sustenta el funcionamiento de Google Scholar puede provocar en el mejor de los casos una pérdida de visibilidad e impacto de muchos contenidos y. aunque presenta unas diferencias importantes especialmente en la indización de los contenidos. de forma algo más técnica. Algunos de estos robots o crawlers están preparados para detectar recursos académicos disponibles en la Web pública e incluirlos posteriormente en el índice de Google Scholar. la creación de un grupo de trabajo que podría explorar prácticas recomendadas en relación a la presentación de contenido en la Web que maximizaran la exposición e indización de éstos en Google Scholar.

La cuestión ahora radica en conocer qué entiende exactamente Google Scholar por documento académico y por Web académica. El sistema se basa fundamentalmente en la estructura del documento y en la posterior identificación de cada una de sus partes constituyentes. Resultados y Discusión). Google Scholar solamente indiza “documentos académicos” alojados en la “Web académica” (Figura 9). siendo un aspecto delimitado generalmente por las normas específicas de una publicación. Metodología. Aunque existen diversos métodos más o menos implantados para estructurar un documento científico (como por ejemplo el formato IMRYD para el caso de los trabajos de investigación. existen ciertos elementos que deben aparecer en cualquier texto que se considere académico. Simplificando. salvo dos importantes excepciones (patentes y disposiciones legales) que se detallarán más adelante.100 La revolución Google Scholar evidentes sinergias entre ellos. Google Scholar proporciona en su ayuda cierta información orientativa. nomenclatura y orden exacto de los elementos constitutivos de un documento científico (más allá del sentido común). no existe ninguna norma obligatoria para determinar el tipo. aunque el funcionamiento exacto del sistema no sea conocido con exactitud. Pese a ello. en la que se basa gran parte de este capítulo. basado en el siguiente orden de elementos: Introducción. con independencia de la es- . Indización de contenidos en Google Scholar La metodología que Google Scholar ha utilizado para determinar qué es un documento académico es bastante más pedestre y pragmática de la que nos podríamos imaginar a priori. Figura 9. y cómo realiza a grandes rasgos este proceso.

y que la estructura puede variar en función de la tipolo- 101 . —— Que posea unos autores (deben mostrarse justo debajo del título en una línea separada). entre otros. Un documento sin resumen no será indizado en Google Scholar. ya comentado en el capítulo 1) es una práctica válida. referencias. el resumen es completamente obligatorio (tal y como ya se ha comentado previamente). o similar. —— Que contenga una sección independiente titulada como Bibliografía. Aunque ciertamente no existen normas universales para estructurar un documento. Estructura de un documento científico en Google Scholar De todos estos puntos.Bloque A · Capítulo 4 · Capturando la Web académica tructura organizativa utilizada. Figura 10. Como en algunas publicaciones el resumen va incrustado en la primera página del documento. Google Scholar considera los siguientes aspectos (Figura 10): —— Que el documento esté encabezado por un título (a ser posible en una fuente mayor que el resto del documento). unos autores o una bibliografía. —— Que tenga resumen. liberar esta primera página (tal y como hace JSTOR. como son un título. Siguiendo este principio.

aunque no esté exento de errores y causísticas. Adicionalmente. a modo de ejemplo. . Otros motores de búsqueda académicos. Por otra parte. En la Tabla 5 se puede observar. dada la estructura de sus sedes web. En este punto. autor. Servicios de distribución o almacenaje. Bases de datos bibliográficas. de la que Google Scholar se nutre y alimenta. la existencia de estos elementos (título. Repositorios temáticos. pueda estar indizada correctamente en Google Scholar. el segundo requisito para la incorporación de un documento a la base de datos es que este recurso esté alojado en la llamada “Web académica”. 1 Los datos se han obtenido mediante la aplicación del comando de búsqueda “site”. y además está sujeto a procesos de redondeo de datos en la estimación de resultados que proporciona el buscador. En estos casos. Este parámetro no es exhaustivo. Aunque estos datos no deben ser tomados al pie de la letra (no son más que estimaciones) 1. Editoriales comerciales.102 La revolución Google Scholar gía documental. la cantidad de documentos recopilados por Google Scholar de algunas de las entidades más representativas. Organismos públicos de investigación. se debe indicar la existencia de acuerdos comerciales no públicos entre Google Scholar y ciertas editoriales privadas. En cualquier caso. resumen y referencias bibliográficas) es común en la inmensa mayoría de documentos académicos. asunto que trataremos en la sección dedicada al proceso de indización y a los requisitos técnicos específicos que deben cumplirse. siendo por ello un método sencillo de implementar y con ciertas garantías de éxito a la hora de determinar si un documento es o no científico. las disciplinas o las normas concretas de una editorial. nos sirven para reflejar la amplitud y diversidad del espacio académico web. nada impide que otro tipo de institución (pública o privada). el buscador incorpora a su base de datos los contenidos correspondientes. Una vez determinado qué es un documento académico para Google Scholar. algunas instituciones. Google simplemente confía en los espacios públicos web proporcionados por diferentes entidades y organizaciones con cierto marchamo científico o académico. no se prestan de forma adecuada a este análisis (basado en calcular la cantidad de documentos alojandos en su dominio web). por supuesto. Entre éstas destacan las siguientes entidades: —— —— —— —— —— —— —— Universidades e instituciones de educación superior.

400 Consejo Superior de Investigaciones Científicas (CSIC) csic.000 Organismos de investigación Repositorios temáticos Plataformas de editoriales comerciales Motores de búsqueda académicos Proceso y requisitos de indización En el momento en que un usuario deposita un documento en un espacio considerado por Google Scholar como académico.es 31.edu 86.ac.edu 660.000 ELIS eprints.987.com 229.com 8.org 3.de 85.000 Bases de datos Pubmed ncbi.000 Servicios de distribución Ingenta Connect ingentaconnect. 103 . el sistema automáticamente indizará el nuevo registro en la base de datos.unirioja.260.com 485.psu. especialmente si el proceso se ha realizado en alguna plataforma diseñada con algún tipo de software especial (por ejemplo Dspace o EPrints en el caso de los repositorios.000 Max Planck Gesellschaft mpg.430. Tipos de entidades en el espacio académico web TIPO DE ENTIDAD ENTIDAD URL REGISTROS Universidades MIT harvard. y no los incorporados directamente debido a cualquier tipo de acuerdo) de forma que sirva igualmente para ilustrar de forma más didáctica su funcionamiento a los lectores menos familiarizados con esta base de datos.000 Emerald emeraldinsight.nlm.es 2.100.000 CiteseerX citeseerx.gov 3.700 Elsevier sciencedirect. que disponen de módulos especialmente diseñados para describir los documentos (insertar metadatos) y que sean recolectados por los robots de los motores de búsqueda. procederemos a continuación a detallar el proceso de indización que sigue Google Scholar desde el principio paso a paso (centrándonos exclusivamente en los contenidos incorporados automáticamente por un crawler.ist.000 Wiley onlinelibrary.000 Dialnet dialnet. o bien OJS en el caso de publicaciones periódicas).wiley.edu 39.600 Stanford University stanford.es 71. Sin embargo.org 11.300 Arxiv arxiv.000 Social Science Research Network ssm.rclis.670.jp 13.com 343.nih.900 Universidad de Granada ugr.com 5.700 National Institute of Informatics nii.440.Bloque A · Capítulo 4 · Capturando la Web académica Tabla 5. como Google Scholar. dado que esto no siempre sucede así (por diversos motivos que iremos relatando a lo largo de este capítulo).

si es un repositorio. Figura 11. 2 https://support. Paso 1: inclusión en la Web académica El primer paso que debe realizarse es la solicitud de inclusión en Google Scholar.google.com/scholar/troubleshooter/2898950?rd=1 . esta información puede ser vital para lograr una correcta indización en la base de datos. el buscador dispone de una interfaz desde la que el webmaster debe indicar qué tipo de sitio web desea dar de alta en el sistema 2. Interfaz de solicitud de inclusión en Google Scholar Fuente: Google Paso 2: requisitos básicos Una vez el usuario ha seguido los pasos de la solicitud de inclusión comentados previamente.104 La revolución Google Scholar Estas fases de indización están fundamentalmente orientadas a los webmasters o personas encargadas de la puesta a punto de las sedes web que deben albergar los documentos académicos que Google Scholar indizará en su base de datos y no al usuario final (que se limitará a depositar un documento en una plataforma siguiendo unos sencillos pasos). Para ello. aunque en algunos casos particulares (como por ejemplo las páginas personales de los académicos alojadas fuera del espacio web de la universidad). el sistema accederá al URL correspondiente para verificar una serie de parámetros y requisitos técnicos que deben cumplir las sedes web para que sus contenidos sean admitidos. por ejemplo. una revista u otro tipo de sede web (Figura 11).

Entre los 64. el 69. los tipos de ficheros más recomendados son HTML y PDF. PDF (GZ). Los documentos ofimáticos (principalmente DOC. Esta decisión permite que los contenidos de pago (no sólo artículos de revistas sino monografías) puedan ser indizados si éstos ofrecen al menos el resumen del documento. entre las que destacan las siguientes: —— Tipos de ficheros admitidos: HTML. —— Tamaño: ficheros que no superen los 5 MB. Por último. En su defecto. están claramente en desuso dentro de Google Scholar. aunque el formato PDF ya puede ser legible directamente desde un navegador web.2% se encontraban en PDF y el 30. el sistema introduce una serie de limitaciones técnicas que deben conocerse de forma obligatoria. PPTX). Estos datos reflejan por sí mismos la importancia de estos ficheros en la base de datos. Respecto al primer punto. éste debe ofrecer de forma gratuita y fácil de consultar (cuando un usuario hace clic en un resultado de búsqueda en Google Scholar). se deben tener en cuenta adicionalmente dos puntos importantes para asegurar una correcta indización: 105 . En el caso de los ficheros PDF. reflejando de este modo las dos realidades (online y offline) que predominan actualmente. puede servir de sustituto la primera página del artículo o documento.000 documentos altamente citados en Google Scholar analizados por MartinMartin et al (2014). De los 4. el 86% lo constituían documentos en formato PDF y el 12% en HTML. los documentos sin información de autores o sin título pueden igualmente ser excluidos automáticamente.Bloque A · Capítulo 4 · Capturando la Web académica Para que el sitio web sea correctamente admitido. DOCX. al menos uno de los siguientes recursos: texto completo o resumen. de donde Google Scholar los identifica e indiza. Un documento sin resumen no será incluido en Google Scholar. PDF.3% en HTML. Volvemos a incidir en que el resumen es un elemento completamente obligatorio. pese a que no existe restricción técnica alguna para su correcta indización. PPT. Paso 3: Formatos de fichero Aparte de la identificación de un contenido como un recurso académico gracias a su estructura. PS (GZ). sin necesidad de que el texto completo esté accesible.765 documentos a texto completo analizados por Jamali y Nabavi (2015). pues estos formatos suelen transformarse en PDF antes de ser depositados en la Web.

el sistema limita el tamaño máximo de los ficheros. como veremos más adelante.pdf”.html#content . cuya presencia es común en los repositorios institucionales de una universidad (pensemos por ejemplo en un trabajo final de grado de un estudiante de Arquitectura. por ejemplo). tesinas y otros documentos de trabajo.com/intl/en/scholar/inclusion.google. —— El nombre del fichero PDF que contenga el documento a texto completo debe terminar en “. 3 https://play. siempre y cuando no se incumpla ninguno de los requisitos técnicos impuestos. como son las tesis doctorales. monografías y trabajos finales de carrera. En la ayuda de Google Scholar se indica claramente que los libros.106 La revolución Google Scholar —— El fichero debe ser legible por texto. https:// scholar. Una posible forma de eludir parcialmente este problema es crear una página web de inicio en la que se ofrezcan todos los metadatos del documento (sin olvidar el resumen) y un enlace al texto completo. Todo fichero que supere los 5 MB no será indizado en Google Scholar. no debe estar en formato imagen. De esta forma. se indica claramente que Google Scholar incluye automáticamente los trabajos académicos desde Google Books 4. Es importante tener en cuenta que Google Scholar es incapaz de detectar los caracteres incrustados en un fichero tipo imagen.google. aunque es una opción que no recomienda Google Scholar.com/books/uploads 4 Google Scholar automatically includes scholarly works from Google Book Search. En el caso de ficheros PDF que son el resultado de un proceso de digitalización. Esto afecta especialmente a diversas tipologías documentales académicas. Igualmente. Respecto a la segunda restricción. Es importante por tanto tener en cuenta este punto para cumplir con esta especificación. En otros casos se aconseja reducir el tamaño de los ficheros PDF antes de ser depositados en la Web. los documentos deberán ser transformados obligatoriamente a través de un programa de reconocimiento óptico de caracteres OCR (Optical Character Recognition) antes de ser depositados en la Web. Google Scholar sí podría indizar el documento a partir de los metadatos ofreciendo adicionalmente el enlace al texto completo. En algunos sistemas de repositorios la especificación del tipo de fichero se omite. monografías y trabajos que superen el tamaño máximo podrán ser depositados en Google Books directamente por parte de los autores 3. Es decir. ni de extraer por tanto citas. El troceado de un documento en diversos ficheros más ligeros es igualmente posible. con la gran cantidad de planos y pliegos de condiciones de un proyecto arquitectónico.

es/ 107 . Figura 12.39 MB y en el segundo de 1. Finalmente hemos procedido a buscar estos dos documentos en Google Scholar. Indización para ficheros de más de 5MB de tamaño 5 http://digibug.ugr.1MB. En el primer caso el fichero tiene un peso de 7. Para ello hemos recogido dos tesis doctorales del repositorio institucional de la Universidad de Granada (Digibug) 5.Bloque A · Capítulo 4 · Capturando la Web académica En la figura 12 se muestra un ejemplo de la indización en Google Scholar en función del peso.

etcétera: 6 http://www. a pesar de ello. se aconseja introducir el siguiente código en el fichero “robots. se debe bloquear a los robots para que no accedan a páginas dinámicamente generadas. el sitio web no será indizado. y tras múltiples búsquedas realizadas. formularios.txt” del sitio web. es fundamental verificar que el sitio web permite la entrada del robot de búsqueda de Google Scholar porque si está excluido (en ocasiones los webmasters excluyen la entrada de ciertos robots porque pueden ralentizar el sitio web o ser potencialmente dañinos). inservibles para la localización de registros. Para asegurarse de que el crawler de Google Scholar no está bloqueado. que ofrece un acceso a la URI del documento (donde se encuentran los metadatos y desde allí el acceso al texto completo proporcionados por el repositorio). Pero el texto completo no se encuentra directamente accesible desde Google Scholar. apareciendo bajo la etiqueta de “Citation”. A pesar de esta restricción.org . han sido indizados en Google Scholar. arriba) no se encuentra indizado en Google Scholar de forma completa. En cambio. y para evitar posibles problemas en la indización de ciertas tipologías documentales.robotstxt. ofreciendo acceso al texto completo de la tesis en la parte derecha de la pantalla. los autores hemos constatado que en ocasiones existen documentos PDF que superan las restricciones de tamaño y. se aconseja tener en cuenta el límite de 5MB impuesto por Google Scholar. Paso 4: requisitos técnicos (I): aceptar la visita Aunque pueda parecer obvio. En cualquier caso. siguiendo los consejos del Robot Exclusion Protocol 6: User-agent: Googlebot Allow: / De forma contraria. abajo). el segundo fichero sí se encuentra integrado de forma completa (Figura 12. como los carritos de compra. Entendemos que la norma no supone un umbral fijo y exacto o que no funciona al 100% de su efectividad.108 La revolución Google Scholar El primer fichero (Figura 12.

Aceptar disclaimers. sino que Google Scholar no pierda tiempo en rastrear lugares donde no va a localizar información académica. antes de leer el resumen (o texto completo). Por supuesto. una página web debe evitar requerir a los usuarios (o robots de búsqueda). esto facilita igualmente el trabajo de sus robots y sus procesos automáticos de indización de documentos. En concreto. Rechazar ventanas emergentes o anuncios intersticiales. no sólo evitamos que el robot pueda acceder a zonas restringidas. Esto es especialmente importante en las sedes web de las universidades. Si el usuario no puede acceder a un contenido. pulsar botones o desplazarse por la página (scroll). como se ha comentado anteriormente. tras realizar una consulta determinada en el cajetín de búsqueda de Google Scholar y haber obtenido un conjunto de resultados. Instalar software especial. Paso 5: requisitos técnicos (II): usabilidad El objetivo fundamental de Google Scholar es facilitar al usuario la localización rápida y sencilla de los documentos académicos. cursos OCW. pueda acceder directamente al texto completo o al resumen. en las que una gran parte de los contenidos están accesibles únicamente a los alumnos o profesores una vez se han identificado con sus cuentas de usuario en la intranet (material docente. El fin es que un usuario. respecto a los sitios en los que se requiere una contraseña para acceder a los contenidos. Google Scholar no lo indiza. Para cumplir con este objetivo. al clicar en alguno de éstos. Clicar en enlaces.php De esta forma. las siguientes acciones: —— —— —— —— —— Identificarse como usuarios registrados. el sistema impone una serie de restricciones técnicas a los sitios web.Bloque A · Capítulo 4 · Capturando la Web académica User-agent: * Disallow: /add_cart. 109 . y que pueden ralentizar y complicar su trabajo de indización del sitio web. Por ello todos sus esfuerzos van encaminados a que los ficheros sean localizados en el menor número de clics. Entre las restricciones anteriores cabe destacar la primera.

es/editum/catalog/book/1151 . pues no se cumplirá la regla de una obra igual a un URL. la indización se realizará de forma incorrecta. en otros muchos casos. donde cada capítulo o artículo constituyen obras completamente independientes (en contenido y autoría). Si ese PDF (constituido por una multitud de trabajos académicos individuales) es depositado directamente en un repositorio u otra plataforma para hacerlo accesible a Google Scholar. Veamos un ejemplo para ilustrar este enorme problema. En ocasiones. Esta obra está compuesta por 37 capítulos completamente independientes (Figura 13. el almacenamiento de documentación académica en intranets o zonas restringidas puede obedecer a políticas web específicas dentro de una institución u organización para asegurar la confidencialidad de cierta información. coordinado por Rosa Nortes Martínez Artero y José Ignacio Alonso Roque. Toda documentación en una intranet será opaca a Google Scholar. Si buscamos la obra colectiva “Investigación educativa en educación primaria”. que podrían de hecho estar recibiendo citas de forma independiente. Pensemos por ejemplo en las monografías por capítulos o en las actas de congresos.um. superior). que lo identifique unívocamente en la Web. Es decir.110 La revolución Google Scholar etc.). que simplemente quedan relacionadas al estar compiladas en un mismo volumen. constituye un buen ejemplo de libro por capítulos como tipología documental. La regla a seguir es clara: cada registro debe corresponder con un documento académico y debe disponer de su propio URL. La obra completa quedará bien registrada. proteger ciertos derechos de propiedad intelectual o proporcionar ventajas competitivas sólo a sus usuarios. pero no así cada uno de los capítulos o partes. obedece al mero desconocimiento o desinterés. 7 http://libros. Por tanto: Evitemos los ficheros con más de una obra intelectual: Un fichero PDF puede contener en realidad una amplia cantidad de obras intelectuales independientes. Paso 6: requisitos técnicos (III): identificación de ficheros La identificación y localización de los ficheros es igualmente clave para el correcto funcionamiento de Google Scholar. que podemos localizar en el sitio web del servicio de publicaciones de la Universidad de Murcia (Editum) 7.

En estos casos. se aconseja crear un fichero independiente para cada obra intelectual existente y posteriormente depositar cada uno de ellos por separado. Google Scholar ha obviado completamente la información de la estructura de esta monografía. “HIDEA: cuestionario de aproximación diagnóstica contextualizado del trastorno por déficit de atención e hiperactividad (TDAH)”. 9 http://libros. de forma que cada nuevo fichero tenga un URL propio que lo defina e identifique en la Red. En cambio. pero no los cataloga como registros independientes. Google Scholar sólo ha sido capaz de describir de forma independiente 9. que además no coincide a nivel jerárquico con el URL que contiene la información bibliográfica (el registro de la obra completa está alojado en la carpeta “downloads” mientras que la información bibliográfica está en la carpeta “books”). “Estudio sobre el consumo televisivo de los escolares de educación primaria de la región de murcia”. “¿Qué programas de televisión ven los alumnos de educación primaria? preferencias según su nacionalidad”. la podemos localizar sin problemas (Figura 13. aptitudes intelectuales y rendimiento académico: un estudio en alumnos de educación primaria”. no podremos identificarlos (Figura 13. privando a sus respectivos autores no sólo de la publicación sino de las posibles citas recibidas. a nivel de posicionamiento en buscadores no es la más adecuada. El resto de capítulos se localizan porque Google Scholar detecta que aparecen en el sumario de la obra colectiva. 8 En concreto los siguientes capítulos: “Comparación de la intensidad del esfuerzo de actividades cardio-respiratorias en función de la estructura de la sesión en escolares de primaria”. medio). En el caso de ejemplo anterior. solamente existe un URL vinculado al registro 9. En definitiva. inferior).um. “La participación de las familias en contextos educativos multiculturales: hacia una escuela intercultural e inclusiva”. si buscamos cada capítulo de libro de forma independiente. “Relaciones entre autoestima. De los 37 capítulos.Bloque A · Capítulo 4 · Capturando la Web académica Si buscamos esta obra en Google Scholar. y en algunos casos por existir diversas versiones 8. “Efecto de una unidad didáctica de resistencia aeróbica basada en juegos sobre la capacidad cardio-respiratoria de escolares de 5º curso de primaria”. Aunque a nivel técnico es una solución completamente válida. “Libros interactivos multimedia (LIM) al servicio de la competencia comunicativa oral y escrita en educación primaria”. una ventana hacia el aprendizaje”. “El cuento.es/editum/catalog/download/1151/1821/1421-1 111 .

que retomaremos en el capítulo final. Tratamiento de obras colectivas a Google Scholar: obra localizada en servicio editorial (superior). supone adecuar una sede web a los requisitos particulares impuestos por una determinada base de datos privada. o en grandes colecciones de actas de congresos). obra localizada en Google Scholar (medio). lo que implica una discusión no menos intensa. pues implica tener que adecuar toda una colección de monografías y sus respectivos capítulos (pensemos en grandes servicios editoriales con cientos de libros y miles de capítulos de libro. aunque costosa económicamente. capítulo de libro no localizado en Google Scholar (inferior) Este problema de indización tiene una solución sencilla conceptualmente. Evitemos dividir una obra en distintos ficheros: El caso contrario ocurre cuando un fichero que contiene una única obra intelectual se desea particionar o dividir en diversos ficheros para facilitar su carga/descarga o el acceso a cierto material complementario . Además.112 La revolución Google Scholar Figura 13.

En el caso de que finalmente se mantuvieran varios ficheros para una misma obra.Bloque A · Capítulo 4 · Capturando la Web académica de forma independiente. al exportarse a un fichero electrónico. La exclusión del texto completo de un documento puede tener un 10 A continuación. se aconsejaría la creación de un fichero adicional que incluyera la información clave (título. una opción sería la de generar distintos registros separados (cada uno con un fichero) 10 o bien la de reunir en un mismo registro todos los ficheros. etc. al menos el título del documento debería tener un elemento diferenciador (tomo 1. Este podría ser el caso de una tesis doctoral que. En estos casos. En el primer caso. Por tanto.handle. pues solamente ofrece enlace a un fichero. dada su extensión.) y posteriormente el autor podría al menos fusionar ambos registros en su perfil académico personal en Google Scholar Citations (como se verá en el bloque B). asegurando que al menos sólo existe un URI único. En el caso de que fuera imposible obtener un único fichero PDF que incluyera todo el contenido y cuyo peso fuera inferior a los 5MB. se consideraría una mala práctica la fragmentación del contenido pues cada fichero dispondría de un URL independiente y Google Scholar podría no comprender que se tratan de diferentes partes de una misma obra. autores. y siguiendo con la norma de “una obra un URL”. En la segunda opción. Ambas opciones deberían evitarse en la medida de lo posible. que podría depositarse o bien en Google Books (para intentar asegurar su indización completa en Google Scholar) o en cualquier repositorio (si el fichero superara los 5MB no se indizaría a texto completo). es importante seguirlas y cumplirlas en la medida de lo posible. parte 1. resumen y bibliografía). se muestran dos URLs que pertenecen a dos tomos de una misma tesis doctoral: http://hdl.ugr. dadas las restricciones técnicas de Google Scholar a este respecto. y no uno por registro 11. a través de los metadatos asociados al registro. se hubieran generado los correspondientes ficheros (un PDF por tomo). de forma que Google Scholar indizara al menos correctamente la obra completa y.net/10481/35674 11 A continuación. se muestra un URI al que se asocian 5 ficheros de una misma tesis doctoral: http://digibug.handle. Google Scholar no sabría cuál de los ficheros PDF debería mostrar como acceso a texto completo. se hubiera publicado en varios tomos y.es/handle/10481/6142 113 .net/10481/35673 http://hdl. informar a Google Scholar del URL con el documento a texto completo.

ante cualquier búsqueda que se realice.pdf http://digibug. símbolos y códigos alfanuméricos.pdf y 2460_2. Además de las limitaciones técnicas. por los campos del fichero descriptivo o metadatos). Entre los URL existentes y otro posible URL amigable (como el propuesto a continuación). las plataformas utilizadas (como los repositorios) automatizan estas tareas. los resultados en posicionamiento académico web podrían ser abismales: http://digibug. y no siempre los usuarios son conscientes de ello. Si el documento está correctamente indizado. específicamente remarcadas en la ayuda de Google Scholar. solamente encontraremos el documento si buscamos por las palabras del título. El nombre de los ficheros debe contener información semántica (especialmente información del autor y título) y el URL final debe evitar diacríticos. con los útiles a la par de semánticos nombres de 2460_1.ugr.es/tesis/VeraCasares_acciones-caracter-formativo-tercera-edad.es/bitstream/10481/14556/2/2460_2. la disposición del texto completo permitirá la extracción de las posibles citas contenidas en el documento.114 La revolución Google Scholar efecto negativo en su visibilidad.pdf.ugr.pdf . Además.ugr. si procede.pdf http://digibug. resumen y palabras clave (en definitiva.pdf Obviamente.es/bitstream/10481/14556/1/2460_1. En ese sentido se desea remarcar nuevamente que una cosa es que Google Scholar identifique y describa un documento (apareciendo por tanto en los resultados de búsqueda como un registro) y otra muy distinta que ofrezca un enlace directo al texto completo. por lo que su personalización puede ser compleja y 12 El URL a cada fichero es el siguiente: http://digibug.es/bitstream/10481/14556/1/2460_1. en ocasiones los usuarios ni siquiera son conscientes de que el texto completo no está indizado.ugr. Veamos como ejemplo un registro correspondiente a una tesis doctoral depositada en el repositorio Digibug. compuesto por dos ficheros PDF 12. Es más. pues éstos impiden un correcto posicionamiento de los contenidos. pequeños detalles pueden impedir no sólo el buen posicionamiento de un documento en un motor de búsqueda académico (será más difícil de localizar) sino que puede impedir además su indización en el sistema (que puede influir claramente en el impacto en citas). autor. En caso contrario. Google Scholar podrá bucear dentro del texto para localizar en él la aparición de los términos de búsqueda y devolver. el documento en cuestión entre los resultados. algo imposible si no es capaz de leer el documento a texto completo.

En concreto. Las recomendaciones anteriores van encaminadas a la disposición de un URL por fichero (a poder ser HTML o PDF). se recomienda que cada artículo sea accesible desde la página de inicio. Esquema de enlaces posibles hacia el fichero final Desde la página de inicio de un sitio web podemos encontrarnos directamente un fichero (a texto completo o resumen. podríamos encontrarnos de nuevo o con un fichero (texto completo o resumen) o bien con otro hiperenlace. siguiendo un máximo de 10 enlaces. Google Scholar propone algunas recomendaciones para acceder de forma sencilla a estos ficheros al navegar por el sitio web académico correspondiente.Bloque A · Capítulo 4 · Capturando la Web académica tediosa en ocasiones. en ambos casos con sus metadatos correspondientes) o bien un hiperenlace. un usuario. Adicionalmente. inferior a 5MB y que corresponda con una obra académica independiente. pero deberían estar siempre contemplados en los momentos iniciales de diseño. En la figura 14 se ejemplifica gráficamente el proceso. En ésta. Es decir. debería poder llegar al texto completo (o resumen) de una obra en menos de 10 clics. Figura 14. Este proceso podría 115 . Si pulsamos en el hiperenlace (contamos 1 enlace) accederíamos a una segunda página. al llegar a la página principal de un sitio web.

“citation_author” y “citation_publication_date”. se proporcionan una serie de recomendaciones a la hora de crear los metadatos asociados a cada registro. se recomienda crear un fichero HTML con un enlace al URL de cada documento. con el fin de obtener una descripción bibliográfica de los mismos. Es importante indicar que las etiquetas “citation_title”.). Ejemplo de esquema de metadatos recomendado La exportación de datos bibliográficos debe configurarse preferentemente mediante meta-etiquetas HTML. se recomienda crear una interfaz de búsqueda adicional que liste los artículos incluidos sólo en las dos últimas semanas (para indizar rápidamente las novedades). etc. En el caso de sitios web complejos con cantidades grandes de documentos (editoriales.000 documentos. se recomienda proporcionar una forma de ordenar los registros por fecha de publicación o fecha de registro.116 La revolución Google Scholar repetirse hasta un máximo de 10 veces. se proponen las siguientes recomendaciones: —— Hasta 1. —— Si se manejan cientos de miles de documentos. Por otra parte. —— Si se manejan miles de documentos. para facilitar la tarea al robot de búsqueda. debería accederse directamente al recurso final con el texto completo. nombre del autor . correspondientes al título del documento. desde la página de resultados del buscador. Figura 15. Paso 7: requisitos de indización: metadatos y maquetación Por último. Un número superior de pasos supondría una complejidad excesiva para el robot de búsqueda a la hora de indizar los contenidos académicos del sitio web. En la figura 15 se observa un ejemplo de metadatos asociados a un documento. repositorios.

Bloque A · Capítulo 4 · Capturando la Web académica y fecha de publicación. para los ficheros PDF se propone como alternativa una indización sin meta-etiquetas. en el caso de que no esté incluido en el documento actual. Dublin Core es un esquema de metadatos sencillo que no incluye un campo de información específico para el número de citas recibidas por los documentos. siendo éste uno de los indicadores clave para el posicionamiento de los resultados de búsqueda. páginas. 117 . Mediante la etiqueta “citation_pdf_url” se puede redirigir al robot de búsqueda al URL que contenga el texto completo. La pérdida de visibilidad que este hecho puede suponer a los repositorios es importante si no se corrije. ¿qué utilidad proporciona Dublin Core a Google Scholar? La respuesta es ninguna. BE Press y PRISM.title” únicamente y exclusivamente para el título del artículo. son obligatorios para la correcta indización. los repositorios como DSpace funcionan con Dublin Core. Por defecto. mediante la clase “citation_title”. número. Este hecho ha sido empíricamente estudiado por Arlitsch y O’Brian (2012) para diversos repositorios institucionales norteamericanos y posteriormente por Orduña-Malea y Delgado López-Cózar (2015) para el conjunto de repositorios latinoamericanos. —— Usar Dublin Core como última opción. a menos que se sigan ciertos patrones de uso recomendados por el equipo de Google Scholar (por ejemplo. Por tanto. título de la revista…). entre otras). La importancia de este último punto es máxima. se indican las siguientes consideraciones generales: —— Google Scholar soporta los esquemas Highwire Press. —— Emplear etiquetas <h1> ó <h2>. Eprints. cuando Google Scholar claramente nos indica que no debería utilizarse. Adicionalmente. cuyas principales características se describen a continuación: Título: —— Usar el tamaño de fuente más grande del documento. Estas directrices están principalmente orientadas a los ficheros HTML. si lo que deseamos es estar correctamente indizados en su base de datos. Por otra parte. La razón por la que probablemente Google Scholar ha adoptado esta decisión es sencilla. Dublin Core no proporciona etiquetas unívocas para los datos bibliográficos de un artículo académico publicado en una revista (volumen. utilizar la etiqueta “DC. —— Usar CSS.

Información bibliográfica: —— A incluir en la cabecera o pie de página de la primera página. —— Usar CSS. como “references”. [2]… En HTML: incluir la etiqueta <ol>. “bibliography”. mediante la clase “citation_author”. Referencias bibliográficas: —— Utilizar una cabecera estándar. Fuentes: —— Evitar fuentes Type 3 en los PDF. .118 La revolución Google Scholar Autores: —— Deben situarse inmediatamente antes o después del título. —— Usar etiquetas <h3>. —— Las referencias individuales pueden ser numeradas: En PDF: [1].

editoriales o al menos fuentes de contenidos ha avivado sin duda este debate. tal vez de menor importancia para la mayoría de usuarios finales (y por tanto de menor importancia para los responsables de Google Scholar). El desconocimiento de la cobertura real y la política opaca de la compañía californiana han desencadenado una multitud de elucubraciones acerca del verdadero tamaño de la base de datos. A lo largo de este capítulo se describen los principales trabajos aportados por la literatura científica en torno a la cobertura de Google Scholar. Cobertura opaca y dinámica Durante el primer lustro del Siglo XXI se sucedieron diversos estudios en los que se deseaba conocer la tasa de indización de Google Scholar para determinadas editoriales y fuentes de contenidos con el firme propósito de testar profesionalmente el producto. sino de comparar el material existente en una editorial y los registros que Google Scholar era capaz de recopilar ante una consulta delimitada a dicha editorial. La ausencia de una master-list de publicaciones. El hecho de co-existir ciertas limitaciones técnicas y acuerdos comerciales ha provocado que algunos contenidos académicos en abierto puedan no estar incluidos en el buscador y sí lo estén en cambio algunos contenidos de pago. . tamaño y evolución La cantidad y calidad de los contenidos alojados en Google Scholar sigue siendo motivo de agrias y en ocasiones estériles discusiones. pero de gran importancia para los profesionales de la información. No se trataba de comparar los resultados devueltos por distintos buscadores y bases de datos (aspecto ya tratado en el capítulo 2).Capítulo 5 El retrato de Google Scholar Cobertura. tanto bibliotecarios (más centrados en la faceta de buscador de contenidos) como especialistas en bibliometría (más enfocados a la faceta de fuente de evidencia de impacto científico). de forma que ayuden a retratar mejor al buscador académico. así como a su tamaño y evolución.

Noruzzi (2005) observa que Google Scholar no indizaba artículos en persa. chino. permitía comparar los contenidos alojados en una editorial (y recuperados por su propio buscador) con los resultados que Google Scholar tenía indizados de ese lugar. que Jacsó (2005a) comprobara que a mediados de abril de 2005 existía un retraso de 6 meses en la actualización de la base de datos de Google Scholar.120 La revolución Google Scholar Debemos destacar muy especialmente el sistema Polysearch. Este método permitía conocer el grado de indización de algunas editoriales. . por ejemplo. tras realizar un análisis de citas a la prestigiosa revista Journal of the American Society for Information Science and Technology (JASIST). El sistema permitía a grandes rasgos comparar los resultados de una búsqueda directa en el buscador online de una editorial con los resultados de esa misma búsqueda realizada en Google Scholar y restringiendo la búsqueda al dominio web de la editorial. constataran que el material más reciente estaba mejor recogido en Google Scholar que el material antiguo. mientras que Kesen. Şenol y Yanar (2008) detectaban errores en la recuperación de caracteres especiales en turco. lo que permitía obtener un nuevo retrato de Google Scholar. Interfaz de Polysearch El buscador. Figura 16. japonés o arábigo. Los trabajos comparativos entre la cobertura de Google Scholar y las distintas editoriales permitieron. Aunque la última actualización data del 22 de octubre de 2005 y el sistema ya no funciona correctamente. desarrollado por Peter Jacsó precisamente con el propósito de conocer la cobertura de Google Scholar para determinadas editoriales. que Neuhaus et al (2006) detectaran un retraso de al menos 3 meses en la actualización de la información de BioMed Central o que Bauer y Bakkalbasi (2005). Igualmente se descubrieron ciertas inconsistencias en los resultados devueltos en determinados idiomas. aunque de forma un tanto pedestre. la interfaz sigue online (Figura 16).

quienes calculan la cobertura de Google Scholar en función de diversas editoriales. mientras que el porcentaje promedio ronda el 95% para el resto de las revistas. y en el trabajo de Neuhaus et al (2006). desde un 33% en los 1950s hasta un 88% en los 2000s. 2007) constatan la ausencia de revistas importantes sí indizadas en WoS. Christianson (2007). tras seleccionar 960 artículos de Ecología en la base Compendex. Este dinamismo y crecimiento irregular de Google Scholar ha propiciado por tanto que muchos estudios acerca de su cobertura hayan 121 . Así mismo. un 86% a las del Science Citation Index y sólo de un 81% a las revistas incluidas en el Arts & Humanities Citation Index. aunque con importantes diferencias entre éstas. Estos datos son contrastados posteriormente por Chen (2010) quien. Bakkalbasi et al (2006) detectan que tras noviembre de 2005 la cobertura de Google Scholar da un salto espectacular.Bloque A · Capítulo 5 · El retrato de Google Scholar Otros trabajos han detectado deficiencias en la cobertura y actualización de Google Scholar. Por ejemplo. tras tomar muestras aleatorias en 8 bases de datos distintas. Mayr y Walter (2006. Los datos son sorprendentes pues reflejan un 100% de cobertura en el caso de Pubmed. pero que asciendía al 98% en 2010. Los resultados obtenidos muestran que la indización completa al 100% solamente es lograda por 8 revistas. comprueba que Google Scholar solo indiza el 66% de éstos y Lewandowski (2010) comprueba por su parte la indización en Google Scholar de 35 revistas del área de Library & Information Sciences en el período 2004-2006. cuando precisamente años atrás se había discutido la deficiente cobertura de ésta en Google Scholar. quienes observan un crecimiento de la cobertura de Compendex en Google Scholar (a partir de una muestra de registros) a lo largo del tiempo. la cobertura real podría ser dramáticamente menor. y en la cobertura de revistas de sociología en alemán. pues la cobertura de Google Scholar ha demostrado ser muy dinámica. En concreto. por lo que los sesgos o deficiencias advertidos durante los primeros años han ido desaparenciendo en su mayor parte. Los efectos de la evolución de la cobertura de Google Scholar se observan igualmente en el trabajo realizado por Meier y Conkling (2008). Todos estos estudios empíricos deben no obstante contextualizarse en el tiempo. advierte que la cobertura de Google Scholar oscilaba entre el 30% y el 88% en 2005. detectan carencias importantes en revistas de acceso abierto. Por otra parte. Teniendo en cuenta que los autores consideraban indizada una revista si al menos un artículo estaba indizado en Google Scholar. Google Scholar proporcionaba una cobertura del 88% a las revistas del Social Science Citation Index.

Pomerantz. Los defensores de WoS argumentan que esta base de datos actúa como filtro de alto nivel frente al ruido (Winter.122 La revolución Google Scholar quedado completamente obsoletos. 2006). sino para la evaluación de su impacto global en la sociedad. 2014). Google Scholar podría convertirse irremediablemente en la fuente principal no sólo de acceso a la literatura científica. En el caso de las humanidades. En ese momento. pues la cobertura en estos campos (así como en la literatura no inglesa) es muy pobre. 2014). 2013a) y después cierta estabilización (Harzing. estas presuntas debilidades se han transformando en fortalezas diez años después. con el añadido de disponer de acceso a textos completos aparte de sus capacidades de búsqueda y localización de información (superiores a WoS al buscar en el texto completo de los documentos) e información adicional de citas y otros servicios complementarios. Por ejemplo. Estos resultados llevan a los autores a concluir que Google Scholar presenta importantes sesgos por disciplinas y que no es todavía una herramienta válida para la búsqueda de información académica en las Humanidades. El crecimiento continuo en la cobertura de Google Scholar (conforme va recopilando más fuentes académicas en abierto. Sin embargo. por cuestiones de política de publicaciones de algunas de sus principales editoriales). en ese caso WoS se convertiría en un subconjunto de Google Scholar. Zadpoor y Dodou. Google Scholar incluye dos colecciones de documentos adicionalmente (disposiciones legales y patentes). independientemente de su valor académico. en sus primeros años la disciplina de la Química estuvo mal representada (como vimos. Negocio y Ciencias Sociales. Educación. va logrando más acuerdos comerciales con diferentes grupos editoriales y se van digitalizando colecciones antiguas de revistas en papel) ha llevado a algunos autores a criticar que la cantidad va en contra de la calidad de sus contenidos. mientras que los defensores de Google Scholar argumentan que éste podría cubrir en breve la tesis de Kilmour del 100% de disponibilidad de la información (Kilmour. Neuhaus et al (2006) obtienen coberturas muy bajas (44% en el caso de ERIC y un 6% en el caso de Historical Abstracts). Efectivamente. en algún momento la cobertura de WoS en Google Scholar podría ser completa. al incorporar todo el material que localiza. 1989. que . Cobertura adicional: disposiciones legales y patentes Aparte de la colección de artículos (que incluye todas las tipologías documentales consideradas como documentos académicos. tras ello vino un proceso de rápido crecimiento (Harzing. desde artículos en revistas a monografías).

desde la búsqueda avanzada. Las disposiciones legales fueron incluidas en 2009. Además. los tribunales federales de Distrito. lo que permite buscar casos influyentes (por lo general antiguos o internacionales) que aún no están en línea o disponibles públicamente. Figura 17.google. éstas incluyen el acceso a las opiniones publicadas de apelación del Estado y de la Corte Suprema de los casos de Estados Unidos desde 1950. a través de un breve comunicado en el Blog oficial de Google Scholar. y por tanto no siguen los requisitos de indización del resto de materiales académicos. La búsqueda se puede hacer global o bien se puede seleccionar la Corte de Estado o Federal correspondiente.Bloque A · Capítulo 5 · El retrato de Google Scholar no cumplen ni los requisitos de documento académico (a partir de su estructura) ni de estar depositados en la Web académica. de apelación. fiscales y de quiebras desde 1923 y los casos de la Corte Suprema de Estados Unidos desde 1791. Búsqueda de disposiciones legales en Google Scholar <https://scholar.com/scholar?q=samsung+vs+apple> 123 . incluye citas de casos citados por opiniones o artículos de revistas indizadas. Para realizar una búsqueda se debe seleccionar la opción “Case law” previamente (solamente aparece si el idioma de la interfaz está en inglés). Estos materiales están depositados como colecciones independientes con el fin de proporcionar un valor añadido a los usuarios. En la figura 17 se muestra un ejemplo de búsqueda de disposiciones legales que hagan referencia a los litigios entre dos compañías (Samsung y Apple).

—— No se permite la búsqueda por materia. aunque esto es una suposición que debería comprobarse empíricamente.8% la cantidad de patentes en Google Scholar respecto de las existentes en Google Patents. la posibilidad de recopilar este tipo de material cuando se realiza una búsqueda es interesante para el usuario. en la parte izquierda de la pantalla disponemos de la opción “Case law” (disposiciones legales en la versión española) activada. pues las colecciones de artículos y de disposiciones legales son independientes y se encuentran separadas. y la razón por la que están incluidos en Google Scholar es un tanto incierta. Es posible que aparezcan aquellos documentos de patentes que hayan sido citados o referenciados en otros documentos académicos indizados por Google Scholar. aunque sí de gran utilidad. Estos documentos provienen de la base de datos de Google Patents.124 La revolución Google Scholar Como se puede observar en la figura 17. la posibilidad de exportar los resultados. Obviamente. éstos se encuentran integrados dentro de la colección de artículos de forma que no se puede restringir la consulta específica a estos materiales (solamente incluirlos o excluirlos en la búsqueda). Ortega (2014) cifra en torno al 12. Esto es importante. —— Las actualizaciones (tanto de los artículos como de las disposiciones legales) pueden tardar entre 6-9 meses en aparecer. Estos aspectos limitan el uso de esta herramienta como una fuente decisiva en asuntos legales. En el mundo académico puede ser tolerable esperar esta cantidad de tiempo para una actualización. el sistema presenta una serie de importantes limitaciones: —— Está restringido a los Estados Unidos. En cuanto a los documentos de patentes. Ortega (2014) advierte en cualquier caso que en la colección de disposiciones legales también se incluyen artículos de revista especializados en Derecho. —— Etc. así como el . —— La cobertura excluye estatutos y regulaciones.). que pueden estar igualmente incluidos en la colección de artículos. pero no en el entorno legal. etc. El resto de opciones son idénticas a las que se ofrecen para la búsqueda de artículos (filtrado por años y ordenación de resultados por año o relevancia. Pese a que la disposición de este tipo de material es interesante y supone un gran avance hacia el acceso abierto a la documentación legal (además de ofrecer información de valor añadido como las citas recibidas. Finalmente. mediante la opción “Select courts” se pueden seleccionar las Cortes judiciales o tribunales específicos en los que se desea buscar.

Bloque A · Capítulo 5 · El retrato de Google Scholar hecho de ofrecer datos de citas (no incluidos en Google Patents). Cuando Anurag Acharya es consultado acerca de esta cuestión. Sin embargo.com/scholar?q=RFID+tag+switched+capacitor> Tamaño y evolución El cálculo del tamaño de Google Scholar (en términos de número de registros) es un tema igualmente candente en la comunidad académica. Así mismo.google. En la figura 18 se muestra un ejemplo de consulta en Google Scholar en la que aparecen documentos de patentes integrados entre los resultados. expresa sus dudas 125 . el desconocimiento de sus criterios de inclusión en la colección impide la realización de búsquedas exhaustivas. Figura 18. su postura es clara: esta discusión no es útil. 2014). más si consideramos la escasa información oficial que se nos ofrece acerca del producto. Incluso utiliza la expresión “bike-shedding” (Van Noorden. Inclusión de patentes en Google Scholar <https://scholar. que deberían realizarse en bases de datos de patentes especializadas.

que impiden un cálculo preciso del número de registros.3 millones . Bensman. aunque el autor advierte de los problemas de búsqueda asociados al filtrado de años. incluso si se conociera. no vería la forma en la que este dato podría ayudar a los usuarios acerca de cuándo o cómo utilizar Google Scholar (Hughes. pero constituye un dato esencial si se desea utilizar Google Scholar como objeto de estudio.126 La revolución Google Scholar acerca de la importancia en conocer este tamaño pues. Algunos años después. Smolinsky y Sage (2014) utilizan el modelo Yule-Simon para estimar hasta qué medida el trabajo de los premios Nobel en Química. quien ofrece datos anuales comparativos entre WoS. y ganadores de la medalla Fields en Matemáticas. más allá de la cobertura o tamaño total de la base de datos. Aguillo (2012) estima el tamaño de Google Scholar en 83 millones de registros (a fecha de 2010) utilizando un método basado en el análisis de nombres de dominio (Top Level Domains). a lo largo de los últimos años. Un ejemplo pionero lo constituye Jacsó (2005a). están incorporados en el corpus de conocimiento de sus disciplinas a partir de Google Scholar. 2006). Siguiendo con esta línea de trabajos. En esos mismos términos se expresan otros autores como SJ Bensman. diversos autores han tratado de cuantificar el tamaño de Google Scholar. Scopus y Google Scholar en número de registros desde 1955 a 2005. Bensman et al (2014) analizan la capacidad de Google Scholar para construir un conjunto documental relevante para la evaluación de los trabajos científicos de un conjunto de autores galardonados con el Premio Nobel de Economía. Los bibliómetras deben conocer por su parte el tamaño y la evolución de la base de datos para poder dar contexto a sus análisis cuantitativos y conocer la mayor o menor representatividad de la base de datos en función de diversos parámetros. Los profesionales de la información tienen la obligación de caracterizar y describir exhaustivamente un producto de información como es un motor de búsqueda académico. Posteriormente. Khabsa y Giles (2014) cifran el tamaño en 99. Por ello. quien incide en la importancia del corpus de documentos disponibles para una consulta específica. creemos sinceramente que es una aproximación incompleta. Estamos de acuerdo que a un porcentaje importante de usuarios finales los datos de tamaño no van a interesarles o influirles. Aunque no podemos dejar de estar de acuerdo con esta postura (centrada en la relevancia del sistema ante las consultas de los usuarios). Los bibliotecarios deben conocer las características y la composición del producto tanto para evaluar el producto como para sus procesos de formación de usuarios. Bajo esta idea.

de los que 94.3 millones (a fecha de diciembre de 2013). como por ejemplo la cantidad de artículos sin año de publi- 127 .3 de citaciones y cerca de un millón de patentes. En cuanto al crecimiento. aproximadamente). 18. Orduna-Malea et al (2015).Bloque A · Capítulo 5 · El retrato de Google Scholar (a fecha de 2013.5 millones de artículos. Web of Science. El cálculo del número de registros contenidos en Google Scholar por año no es preciso debido a una serie de conocidos problemas. y sólo considerando los documentos en inglés) mientras que Ortega (2014) obtiene 109.73 corresponden a la colección de artículos y el resto a la colección de disposiciones legales. Scopus y Microsoft Academic Search en número de registros Fuente: Orduna-Malea et al (2015) Estos datos deben no obstante tomarse con extrema cautela. En la figura 19 se ofrece la comparativa obtenida por Orduna-Malea et al (2015) entre las principales bases de datos. y sólo a nivel orientativo. de los que 99. Finalmente. la clara superioridad de Google Scholar y la menor cobertura de Microsoft Academic Search. utilizando diversos métodos. Figura 19. donde se destaca la igualdad entre WoS y Scopus. Comparación del tamaño de Google Scholar.8 millones corresponden a la colección de artículos (compuesta por 80. estiman el tamaño entre 160 y 165 millones de documentos (a fecha de mayo de 2014). la figura 20 muestra el número de registros anuales en las cuatro bases de datos analizadas en el período 1800-2010.

Scopus y Microsoft Academic Search en número de registros Fuente: Orduna-Malea et al (2015) Por otra parte. 2014). que implican una falta de correspondencia entre los hits obtenidos (un valor además redondeado) y los documentos almacenados. Estos estudios no pueden ser replicados debido al alto crecimiento retroactivo de Google Scholar (Winter.128 La revolución Google Scholar cación o las versiones de documentos no agrupadas correctamente. dada la imposibilidad de cuantificarlos con precisión. podemos concluir que. Comparación del crecimiento anual de Google Scholar. Google Scholar y el big data académico Con los datos de cobertura. estamos ante la mayor base de datos académica que existe en la actualidad. Figura 20. sin duda. mientras que en Web of Science no se han contabilizado los registros equivalentes (denominados “cited references”). crecimiento y tamaño vistos en los apartados anteriores. Adicionalmente. la comparación con la Web of Science tiene ciertos sesgos. pues en Google Scholar se han contabilizado los registros tipo “citations” (estos registros serán explicados en el capítulo siguiente). Estas características unidas a la filosofía del producto de recopilar automáticamente la Web académica (y una parte importan- . existe un importante problema de falta de replicabilidad. Zadpoor y Dodou. Web of Science. un producto que incluye todas las tipologías documentales en la mayoría de idiomas y con una tasa de crecimiento superior tanto a Web of Science Core Collection como a Scopus.

Bloque A · Capítulo 5 · El retrato de Google Scholar te de la privada con las editoriales). Desde el momento en que Google Scholar automáticamente rastrea. pese a tener una cobertura notable. viene en realidad determinada por una serie de restricciones (tecnológicas y económicas fundamentalmente). indiza y vacía cualquier documento de apariencia científica depositado en un dominio académico por voluntad de un autor. y cuyas principales características se pueden observar mejor de forma gráfica en la Figura 22. nos llevan irremediablemente a considerar Google Scholar como un sistema de big data académico (Figura 21). Las bases de datos clásicas. no dejan representar la punta del iceberg del impacto científico. constituyen sistemas cerrados basados en la selección controlada de una colección de revistas a partir de la cual se construyen índices de citas desde artículos de revistas de elite hacia otros artículos de revistas de elite. derivada de la conocida Ley de Bradford de concentración de la literatura científica. Esta asunción. y sin sufrir ningún control externo previo (el de los repositorios es sólo un filtro técnico que no opera sobre los contenidos). el sistema nos conduce a la voladura de todos los controles o filtros científicos a los que estaban sometidos 129 . Características de Google Scholar La cobertura y el funcionamiento de Google Scholar ha permitido la creación de una familia de productos (junto a Google Scholar Citations y Google Scholar Metrics. Sin embargo. que serán comentados en el Bloque B del libro) completamente opuesta a la familia clásica de bases de datos bibliométricas. Figura 21.

este concepto no debe llevar a engaño. que refleja estrictamente al mundo científico (en realidad a una parte concreta de éste). Figura 22. ofreciendo un producto gratuito basado en la recolección de cualquier tipo de material sin más moderación que la de haber sido depositado en la Web académica y cumplir ciertos requisitos formales. permitiendo ver la parte oculta del iceberg de la citación. Los índices de citas Google Scholar se construyen desde cualquier recurso académico hacia cualquier recurso académico. sus trabajos y las publicaciones en las que éstos comunicaban sus resultados de investigación (peer review). dando así luz donde antes no había más que sombra (especialmente en las Ciencias Sociales y Humanidades). se rompe con la aparición de Google Scholar. Google Scholar frente a las bases de datos bibliométricas clásicas Esta selección de revistas elitistas. aunque se necesite un filtrado (no siem- . que representa una apertura desde el estricto mundo científico al más amplio concepto de mundo académico.130 La revolución Google Scholar tradicionalmente los investigadores. la elite también está incluida en Google Scholar. Sin embargo.

los errores y las imprecisiones vayan a existir. Efecto en la contabilización de citas de una tasa de error del 10% 131 . en un sistema automático. Es evidente que. Pero con todo. Estos datos hablan por sí solos. Esto implica. el sistema es capaz de lo más importante. En un sistema big data académico hemos de olvidarnos sin embargo de la exactitud y buscar la mera correlación. Si consideramos solamente éstos. a partir de 64. errores absolutos importantes en investigadores con muchas citas.Bloque A · Capítulo 5 · El retrato de Google Scholar pre amigable). Figura 23. no controlado y tan dinámico.000 documentos altamente citados en Google Scholar. En el trabajo realizado por Martin-Martin et al (2014). la correlación entre el número de citas obtenidas en WoS y Google Scholar es total (R2= 0.89). de identificar la excelencia y la mediocridad. es decir. Nuestros estudios empíricos indican que podemos asumir una tasa de error no superior a 10% en la contabilización de citas. como se puede observar en la figura 23. los autores observan que sólo el 51% de estos documentos están incluidos en Web of Science. Dejamos en el aire si importa la normalidad.

.

un AND en lógica booleana). la búsqueda avanzada. el sistema devolverá un conjunto documental de registros que en teoría satisfacen la consulta efectuada. En la figura 24 podemos observar un ejemplo de búsqueda básica (en este caso mediante dos keywords. Finalmente se describirá de forma pormenorizada los elementos del registro bibliográfico que Google Scholar proporciona para cada uno de los resultados generados ante una consulta específica. el número de resultados es un valor redondeado y que supone tal vez una burda aproximación. Por defecto. el sistema entiende que los dos términos deben aparecer obligatoriamente en los documentos (es decir. Búsqueda básica Google Scholar Una vez introducimos una consulta determinada en el cajetín de búsqueda de la página de inicio de Google Scholar y pulsamos en el adictivo botón de buscar. 133 . Como se ha dicho ya con anterioridad. Además.04 segundos).000) así como del tiempo que ha tardado en realizar la consulta (0. Solamente en ese momento el sistema mostrará las funcionalidades de filtrado. este valor puede ir variando ligeramente conforme nos vamos desplazando por las distintas páginas de resultados. En la zona inferior al cajetín de búsqueda el sistema nos informa de la cantidad total aproximada de registros que cumplen con los criterios de búsqueda (156. la configuración del sistema y los servicios de valor añadido. a partir de un menú lateral en la zona izquierda de la pantalla. Para ello se describirá la búsqueda sencilla o básica.Bloque A · Capítulo 6 · El proceso de búsqueda en Google Scholar Capítulo 6 El proceso de búsqueda en Google Scholar: Prestaciones y servicios En este capítulo vamos a analizar el proceso de búsqueda en Google Scholar. “ultrasound” y “dispersion”).

escrito mal una palabra o simplemente haber usado una forma menos correcta. El tercer bloque de elementos está centrado en la ordenación de los resultados. el sistema ofrece recomendaciones de búsqueda. Se ofrecen dos alternativas. similar al PageRank. podemos utilizar un selector personalizado donde se puede indicar la búsqueda para un intervalo específico (por ejemplo. Figura 24. aunque podemos seleccionar la posibilidad de recuperar solamente aquellos publicados uno. Debajo de estos elementos se ofrece acceso al gestor bibliográfico (Librería). El sistema de forma automática sugiere otra búsqueda alternativa. no indica nada respecto al término “dispersion” cuando en la literatura especializada el término más correcto debería ser “scattering”. Búsqueda básica en Google Scholar <https://scholar. a partir de un algoritmo de ordenación. supone una ayuda en ocasiones muy válida y oportuna para refinar la búsqueda inicial.com/scholar?q=ultrasound%20dispersion> En la parte izquierda se ofrecen los elementos de filtrado. En un primer bloque de opciones se ofrece la posibilidad de elegir la colección de documentos donde se desea efectuar la búsqueda (artículos o disposiciones legales). El segundo bloque lo constituye el filtro temporal. En todo caso. En ocasiones el usuario puede haberse confundido. que no son completamente sinónimos. El valor por defecto es mostrar todos los documentos. Adicionalmente. Por otro lado. que se comentará más adelante. desde 2005 al 2015) o un año concreto (por ejemplo. En el ejemplo de la Figura 24 el sistema recomienda “ultrasonic” (ultrasónico) en lugar de “ultrasound” (ultrasonido).134 La revolución Google Scholar Debajo de esta información. pero . 1995). dos o cinco años atrás.google. Esta selección también se puede realizar desde la página de inicio antes de efectuar ninguna búsqueda. bien ordenar por relevancia (es decir.

135 . o bien ordenar por fecha de publicación. En último lugar aparece la funcionalidad de las alertas. el sistema ofrece dos particularidades: —— Muestra únicamente los artículos “añadidos” durante el último año. independientemente de disponer o no del texto completo. Informa además de los días transcurridos desde su indización en el sistema. Buscar textos con la frase exacta indicada. —— Permite visualizar todos los documentos recuperados o solamente aquellos que posean una página específica con el resumen. el resultado aparece sin ningún hipervínculo. que será comentada posteriormente. aunque su fecha de publicación original pudiera ser anterior. mientras que las patentes están alojadas exclusivamente en la colección de artículos. podemos especificar distintos tipos de búsqueda avanzada: —— —— —— —— Buscar textos con todos los términos indicados. En este último caso. actualizaciones personalizadas.Bloque A · Capítulo 6 · El proceso de búsqueda en Google Scholar cuyo funcionamiento exacto se desconoce). El cuarto bloque de elementos permite la inclusión o exclusión de ciertas tipologías documentales contenidas en la colección seleccionada: —— Patentes: documentos procedentes de Google Patents. servicios derivados (Google Scholar Metrics y Google Scholar Citations) y búsqueda avanzada. —— Citaciones: referencias bibliográficas localizadas en los documentos incluidos en la base de datos (cited references). Búsqueda avanzada Google Scholar Se puede acceder a la búsqueda avanzada tanto desde el desplegable situado en la parte superior derecha. Buscar textos con al menos uno de los términos indicados. Si el sistema es incapaz de vincularlas a una entrada principal (por algún error técnico o simplemente porque no exista en el sistema). incrustados en la colección de artículos (ver Figura 18). como pulsando en la flecha situada en la parte derecha del cajetín de búsqueda (Figura 25): De esta forma. Buscar textos en los que no aparezca un término indicado. Las citaciones están incluidas tanto en la colección de artículos como en la de disposiciones legales. En la parte derecha de la pantalla el sistema permite el acceso a la configuración del sistema.

En la figura 26 se puede observar el resultado de esta consulta. también presente en la búsqueda básica.google. —— Buscar textos publicados por un determinado autor. en la revista Scientometrics. podemos seleccionar la siguiente consulta: buscar textos publicados por el autor Mike Thelwall desde el año 2010. —— Seleccionar el filtrado temporal. Búsqueda avanzada desde la caja de búsqueda general (mayo 2015) Por ejemplo. —— Buscar textos publicados por una determinada editorial. y no aparezca el término “Bornmann”. que se concreta en dos registros recuperados: Figura 26.136 La revolución Google Scholar —— Determinar el lugar de aparición del término indicado (en cualquier parte del texto o en el título del documento). donde aparezcan los términos “altmetrics” o “links” en el título. Figura 25. Ejemplo de búsqueda avanzada <https://scholar.com/scholar?as_q=&as_epq=&as_oq=altmetrics+links&as_ eq=bornmann&as_occt=title&as_sauthors=%22M+Thelwall%22&as_ publication=scientometrics> .

se permite incluir o no los enlaces al servicio del gestor bibliográfico. lo que implica tanto una mejora continua de la experiencia de usuario como un mayor control sobre su actividad. Cuenta Desde este apartado el usuario puede o bien cerrar sesión o cerrar su cuenta en Google Scholar (que habilita.Bloque A · Capítulo 6 · El proceso de búsqueda en Google Scholar Como se puede observar. Finalmente. Todas las consultas realizadas durante la sesión activa implican que el sistema sea capaz de monitorizarlas para aprender y comprender las necesidades e intereses informacionales de los usuarios. se puede elegir tanto el idioma de la interfaz de búsqueda como el idioma de los resultados. de la siguiente forma: allintitle: altmetrics OR links -Bornmann author:”M Thelwall”. Idioma En el caso de los idiomas. el idioma y los enlaces de bibliotecas. que se detallarán en el bloque B). por ejemplo. si un resultado seleccionado se abrirá en la misma ventana o en ventana nueva o si la búsqueda se realizará por defecto en la colección de artículos o de disposiciones legales (esta opción aparece únicamente en la versión inglesa). a través de un desplegable. En este último caso. Endnote. 137 . el enlace a un gestor por defecto a elegir entre BibText. la restricción por revista no puede ser introducida directamente). el sistema ha transformado la consulta en un conjunto de términos. RefMan y RefWorks. Veamos cada uno de ellos a continuación. el usuario puede determinar. de las búsquedas. Esto significa que los usuarios más avanzados pueden llegar a controlar los términos específicos de una consulta avanzada e introducirlos directamente en el cajetín de búsqueda sin necesidad de acceder a la interfaz de la búsqueda avanzada. aunque esto no sirve para todos los comandos (por ejemplo. En caso de querer visualizar esta opción. Búsqueda El usuario puede seleccionar el número de resultados que desea visualizar en cada página de resultados (10 ó 20). Se incluye la configuración general de la cuenta. que se comentará en la siguiente sección. la creación de los perfiles personalizados. Configuración del sistema Desde este apartado el usuario puede realizar algunas configuraciones básicas del sistema.

si entre los resultados obtienen un recurso que está accesible a través de los fondos contratados por su biblioteca. denominados “Library links” (más orientado a los registros electrónicos) y “Library search” 1 (más orientado a los registros impresos).google. Enlace de bibliotecas (Library support) Aparte de las editoriales. Adicionalmente. Este aspecto se comentará nuevamente en la sección dedicada a describir la anatomía del registro bibliográfico en Google Scholar.com/intl/en-US/scholar/libraries . tras analizar 948 campus universitarios norteamericanos entre 1 https://scholar. De ese modo. se establecieron dos programas paralelos. Posteriormente Neuhaus. sección Evolución). Para ello. de forma que al navegar por Google Scholar. sabedores de que los catálogos en línea proporcionaban un acceso organizado y controlado a una cantidad ingente de recursos a lo largo y ancho de todo el planeta. gracias a un reciente acuerdo de colaboración entre WoS y Google Scholar. a fecha de mayo de 2005. Oder (2005) detecta un crecimiento en el número de bibliotecas que utilizan esta tecnología (25 instituciones a fecha de febrero de 2005). a los usuarios que navegan a través de una dirección IP institucional se les asigna de forma automática un perfil institucional. las bibliotecas también fueron desde el principio uno de los frentes importantes de negociación por parte del equipo de Google Scholar. proporcionando de este modo un filtro de calidad extraordinario. El programa “Library links” permite a los usuarios asociados a una institución (principalmente universidades) acceder al texto completo de los fondos electrónicos de pago a través de la tecnología del link resolver (descrita en el capítulo 1. Neuhaus y Asher (2008). podrán acceder igualmente a estos servicios. podrán acceder directamente al texto completo. se podrá visualizar en cada registro el número de citas que ese documento tiene en Web of Science. informa de la existencia de más de 100 Escuelas que trabajan con Google con el fin de acelerar el acceso de los usuarios a los recursos bibliotecarios. No existe ningún listado oficial en el que se pueda consultar las instituciones que tienen activada esta funcionalidad.138 La revolución Google Scholar el usuario puede elegir entre realizar la búsqueda independientemente del idioma en el que un documento esté escrito o por el contrario buscar solamente en aquellas páginas escritas en un determinado idioma (a elegir entre 13 posibles). mientras que Young (2005). pero tengan activado algún mecanismo de autenticación. Los usuarios que naveguen fuera del entorno laboral.

En la figura 27 se puede observar cómo el usuario final puede activar o no la opción. como por ejemplo SFX (Ex Libris). 2 El funcionamiento de este sistema (válido tanto para instituciones como para usuarios que dispongan de link resolvers en servidores individuales) es sencillo. similar al anterior. Estos catálogos dejan disponibles los registros bibliográficos para que sean indizados automáticamente por los robots de Google Scholar. detectan que la tecnología del link resolver es utilizada por el 73% de todas las Research institutions y por una tercera parte de las Master’s Colleges and Universities.rebiun. El proveedor del link resolver deberá disponer de la siguiente información: rango de IPs de los usuarios y el texto de los enlaces. Programas de “Library link” y “Library search” en Google Scholar En la figura 27 se observa igualmente el acceso al catálogo Rebiun de la Red de Bibliotecas Universitarias en España 3.org 139 . No obstante. según informa el propio equipo de Google Scholar en la página de ayuda. y éste con el acceso al texto completo final. 2 La clasificación de las instituciones en este trabajo sigue la llamada Carneggie Classification. y ya es éste quien enlaza con los catálogos individuales de las diversas instituciones. pero enfocado a los catálogos tanto internacionales (como WorldCat) como nacionales o regionales. que deberán ser proporcionados por la biblioteca o centro al vendedor. Google únicamente enlaza con el catálogo federado. Este acceso corresponde al programa “Library Search” de Google Scholar. Se debe disponer de un link resolver compatible con OpenURL.Bloque A · Capítulo 6 · El proceso de búsqueda en Google Scholar 2003 y 2004. En este caso están activado el link resolver de la Universitat Politècnica de València.carnegiefoundation. Figura 27. utilizada en los Estados Unidos: http://classifications. desde donde se ha accedido para realizar la captura de pantalla. Link Source (Ebsco) o Webbridge (Innovative interfaces).org 3 http://catalogo. una vez la institución madre ha implementado el sistema. 360 Link (Serials solutions).

140 La revolución Google Scholar Anatomía del registro bibliográfico En la figura 28 podemos observar un registro bibliográfico estándar en Google Scholar. Figura 28. aunque aplicaciones como Publish or Perish sí lo muestran. se describen cada uno de estos elementos: Rank (rango) Es la posición de un determinado registro en la página de resultados (Search Engine Results Page) de Google Scholar ante una consulta determinada. pueden por tanto influir positiva o negativamente en el rango final obtenido ante determinadas búsquedas. han comenzado a generalizarse prácticas de posicionamiento en buscadores (clásicas en los motores de búsqueda generales en un entorno comercial) aplicadas al entorno académico. Factores como la longitud de los artículos. Elementos de un registro bibliográfico en Google Scholar A continuación. dando lugar a un nuevo concepto denominado Academic Search Engine Optimization (ASEO). qué palabras utilizar o no utilizar en el título. aunque se incide en el hecho de que depende de la consulta realizada al no ser un valor intrínseco del registro. El valor no es marcado explícitamente por el buscador. aparecen los siguientes sub-elementos en la parte derecha de la pantalla: .000 primeros resultados para cada consulta. Full text (texto completo) Este elemento solamente aparece cuando Google Scholar dispone de una versión a texto completo de la versión del registro analizada. Gipp y Wilde (2010) lo definen como “la creación. publicación y modificación de la literatura académica de forma que facilite a los motores de búsqueda su recolección e indización”. En ese caso. y considerando el efecto negativo en términos de visibilidad que supone para un documento no encontrarse entre ellos. Marca por tanto la relevancia del registro. Beel. Dado que Google Scholar sólo muestra los 1. resumen y palabras clave o en qué plataformas depositarlo.

el registro bibliográfico o el resumen podrían estar en la página de una editorial (lugar al que nos redirigiría este hiperenlace) y el texto comple- 141 . HTML: indica que el documento original está en formato HTML. pues la información bibliográfica del registro y el texto completo pueden estar en lugares diferentes. que aparece entre corchetes justo delante del título. En cualquier caso. que podría ser el resumen o la descripción bibliográfica del documento.Bloque A · Capítulo 6 · El proceso de búsqueda en Google Scholar —— Format (Formato de fichero): se indica entre corchetes el fichero en el que está disponible el texto completo (PDF). Adicionalmente. BOOK: el registro corresponde a una monografía. edu>). Brackets (corchetes) En este campo se indica la tipología documental del registro en cuestión. Title (título) Se muestra el título del documento. pero que ha sido localizado en las referencias bibliográficas de algún otro documento (por ejemplo: [PDF]) sí indizado en Google Scholar. CITATION: el registro hace referencia a un documento no indizado en Google Scholar. Por ejemplo. no se debe confundir este fichero con el campo “Format” del texto completo visto anteriormente. En este caso se refiere al fichero del registro. Como se puede observar. —— Link (enlace): hipervínculo al texto completo. se remarcan en negrita las palabras que guarden alguna condordancia con los términos de búsqueda. incluso en un formato diferente al que esté el texto completo. Este lugar no tiene por qué guardar concordancia con el campo “Domain” del texto completo. en unas ocasiones sí se hace referencia a tipologías documentales (como los libros) pero en otras se especifica únicamente el fichero en el que está contenido. Los elementos más comunes son los siguientes: —— —— —— —— PDF: indica que el documento original está en formato PDF. Title link (enlace del título) Hipervínculo que apunta al sitio web donde el registro ha sido localizado. —— Domain (Dominio): dominio web en el que Google Scholar ha localizado la versión del documento a texto completo (en este caso <wustl.

Las palabras que concuerdan con los elementos de búsqueda aparecen marcadas en negrita. En aquellos casos en los que el autor dispone de un perfil académico público en Google Scholar Citations. . información descriptiva (volumen. en algunos casos. Este elemento tiene la peculiaridad de que no toda la información se muestra de igual forma en todos los registros. el nombre aparece en forma de hipervínculo directo hacia dicho perfil. número. podrían no aparecer. —— Publication source (publicación): aparece el nombre de la fuente donde el documento ha sido publicado y. Éste no tiene por qué corresponder con el campo “Domain” del texto completo. paginación). GS Citations link (enlace a citas recibidas) Hipervínculo que dirige al usuario al listado de documentos citantes correspondiente. y sólo para las grandes editoriales. año y editorial: —— Authors (autores): se muestra la lista de autores del documento. Elsevier). Abstract (resumen) Se muestra a modo de snippet sólo las primeras líneas del resumen del documento. —— Year (año de publicación). Bibliographic description (descripción bibliográfica) Este elemento está formado por cuatro campos. lo que limita la utilidad de este campo en la descarga de datos.142 La revolución Google Scholar to ser una versión disponible en un repositorio (la versión completa de la editorial podría ser inaccesible al ser de pago). que contienen información relativa a los autores. El sistema está diseñado para mostrar esta información en una sola línea. Adicionalmente. ciertos campos. en el caso de publicaciones con muchos autores. GS Citations (citas recibidas) Se muestra el número de citas que el documento ha recibido según Google Scholar. fuente de publicación. incluso el nombre de algunos autores. puede aparecer el nombre de la editorial (por ejemplo. —— URL Domain/Publisher (dominio web/editorial): aparece el URL donde el documento ha sido localizado. Por tanto. pues éste tiene un espacio límite. sumando las correspondientes a todas las versiones correctamente vinculadas por el sistema.

Bloque A · Capítulo 6 · El proceso de búsqueda en Google Scholar

Related link (enlace a documentos relacionados)

Enlace que dirige al usuario a un listado limitado de documentos que
Google Scholar ha considerado similares o relacionados con el registro
consultado y, por tanto, de posible interés para el usuario.

Versions (versiones) y Versions link (enlace a versiones)

Imaginemos un artículo científico escrito por tres autores; una vez
aceptada su publicación la editorial podría depositar inmediatamente
un registro bibliográfico en su sede web (incluyendo resumen y acceso
previo pago); el primero de los autores podría depositar posteriormente
un preprint autorizado (o no) en su repositorio institucional; el segundo
autor haría lo propio pero en otra institución diferente; el tercer autor,
que podría no trabajar en una universidad, lo depositaría en una plataforma online (como por ejemplo ResearchGate) así como en su página
personal.
Un mismo trabajo puede estar depositado en multitud de plataformas online. Google Scholar afronta este problema mediante una funcionalidad patentada que le permite identificar y mostrar todas las posibles
versiones de un mismo documento, así como facilitar su localización y
acceso 4. Pulsando en el elemento “Versions link” se accede a un listado
de todas las versiones que Google Scholar ha sido capaz de localizar para
el documento correspondiente. En este caso podemos observar hasta 29
versiones (Figura 29).

Figura 29. Versiones para un registro bibliográfico en Google Scholar

Como se puede observar en la figura 29, las versiones aparecen ordenadas por relevancia. El sistema nos informa de que ha localizado
4 https://www.google.com/patents/US8589784

143

144

La revolución Google Scholar

aproximadamente 29 versiones (12 de ellas sin acceso al texto completo). Como su propia palabra indica, esto significa que es una aproximación. En documentos con una alta cantidad de versiones (en ocasiones
pueden superar el centenar), esta cifra podría no corresponder exactamente con la cantidad de registros mostrados.
La información de citas únicamente aparece en el registro situado en
primer lugar. A este registro se le denomina la versión principal. Según
Google Scholar, cuando hay diversas versiones para un mismo documento, se selecciona como versión principal el texto completo publicado por
la editorial, siempre que esto sea posible. Y esta versión principal es la
que aparece asimismo en la página de resultados del buscador.
Sin embargo, esta declaración de buenas intenciones no siempre se
cumple, pues podemos detectar registros correspondientes a publicaciones en revistas cuya versión principal es aquella depositada en un
repositorio u otra plataforma online, quedando la versión de la editorial relegada a una versión secundaria. Esto puede tener un importante
efecto negativo en la visibilidad de algunas editoriales en Google Scholar.
Por ejemplo, en la figura 30 podemos comprobar cómo la versión principal para una gran cantidad de artículos antiguos en la revista Nature
corresponde con la copia depositada en ResearchGate.

Figura 30. Versión principal no correspondiente a la versión editorial
<https://scholar.google.com/scholar?q=protein+site%3Aresearchgate.net>

Este efecto sucede especialmente en las revistas que, por alguna u
otra razón, no publican inmediatamente los artículos a texto completo. Los autores realizan su autoarchivo en distintas plataformas y estas

Bloque A · Capítulo 6 · El proceso de búsqueda en Google Scholar

primeras versiones son las que pasan a ser las principales en Google
Scholar. La versión en abierto de la editorial podría no llegar nunca y, en
el caso de hacerlo, podría no sustituir al registro que funcionara como
versión principal hasta ese momento. Por tanto, parece que la primera
versión en abierto identificada tiene muchas probabilidades de constituirse como la versión principal estable del registro.
Aparte de las distintas copias de un mismo documento, en ocasiones nos podemos encontrar con verdaderas versiones. Por ejemplo, informes técnicos anuales en los que el título y los autores pueden ser
los mismos y el contenido tener un grado de solapamiento importante,
pero ser documentos independientes documentalmente. En esos casos, el sistema de agrupación de versiones agrupa todas las versiones
que estima son variaciones de un mismo documento. En la figura 31 se
muestra el ejemplo de “The STM Report”, elaborado por M. Ware y M.
Mabe. Podemos comprobar cómo el sistema ha agrupado las distintas
ediciones de este informe.

Figura 31. Ejemplo de distintas ediciones agrupadas en una misma versión

Aunque no faltan argumentos a favor de esta agrupación, debemos
advertir del efecto que esto puede tener en estudios cuantitativos. En

145

146

La revolución Google Scholar

algunas ediciones podrían no coincidir todos los autores y, todavía peor,
las referencias bibliográficas podrían ser bien diferentes. Por tanto, la
consideración de “The STM report” como documento citante es compleja
de resolver si las distintas ediciones aparecen agrupadas bajo una misma obra.

WoS Citations (citas en WoS)

Se muestran las citas recibidas por el documento correspondiente
según la Web of Science. Este campo solamente aparece si la consulta
se ha realizado desde una computadora conectada en un rango de IPs
autenticadas para su acceso a la plataforma Web of Science.
Aunque no se muestra en la pantalla, cuando el registro es descargado aparece un campo adicional, denominado WoS accession number (UT),
un número de identificación del documento dentro de la WoS.

WoS Link (enlace a citas en WoS)

Hipervínculo al listado de documentos citantes en la Web of Science.

Bonus track: servicios de valor añadido

Finalmente, en esta sección se incluyen diversos servicios extra disponibles desde la interfaz de Google Scholar, y que aportan un valor
añadido a los usuarios en sus procesos de búsqueda de información
científica.

Referencias bibliográficas

Entre los elementos que conforman un registro bibliográfico, descritos en la sección anterior, se encuentra el elemento “Cite”. Si se pulsa
sobre este enlace en cualquiera de los registros de una página de resultados, el sistema nos muestra un cuadro de diálogo flotante en el que
aparece la referencia bibliográfica completa del registro seleccionado en
cinco estándares diferentes (MLA, APA, Chicago, Harvard y Vancouver),
que pueden ser copiados y pegados en cualquier otro documento. En la
figura 32 se muestra un ejemplo del sistema de referencias bibliográficas de Google Scholar.
Adicionalmente, el sistema permite la generación de la referencia bibliográfica en diversos gestores bibliográficos (BibText, Endnote, RefMan
y RefWorks), para poder ser exportados de forma sencilla. En el caso de
que en la configuración de la búsqueda hubiésemos activado la opción
de gestor bibliográfico, entonces el enlace “Cite” sería sustituido por el
gestor seleccionado.

Bloque A · Capítulo 6 · El proceso de búsqueda en Google Scholar

Figura 32. Sistema de referencias bibliográficas en Google Scholar

Mi biblioteca

Junto al elemento “Cite” (Citar) aparece otro útil elemento que proporciona acceso a un recurso de interés. Se trata del elemento “Save”
(Guardar). Y al pulsar sobre éste, el sistema guarda el registro seleccionado en “My Library” (Mi biblioteca), una suerte de biblioteca personal
donde el usuario registrado puede almacenar colecciones de documentos. Este servicio apareció el 19 de noviembre de 2013 5 y trata de competir con otros gestores populares como Zotero o Mendeley. Sin embargo,
sus prestaciones, aunque interesantes, son todavía limitadas como para
competir con estas aplicaciones 6.
El acceso a la biblioteca personal se encuentra tanto en la página
de inicio de Google Scholar (menú superior) como en el menú de opciones que aparece en la parte izquierda de la pantalla cuando se realiza
cualquier búsqueda en la base de datos. Y su utilización requiere de la
activación o habilitación previa del usuario.
En el momento de la activación, el sistema vuelca automáticamente
todos los artículos que el autor tuviera incluidos en su perfil académico
en Google Scholar Citations. Así mismo, se le consulta la posibilidad de
incluir adicionalmente los artículos que el autor haya podido citar, identificados en las publicaciones del perfil. La apariencia de la biblioteca es
prácticamente idéntica a la interfaz de búsqueda Google Scholar (Figura
33), y se puede distinguir por la aparición de un icono de carpeta justo
5 http://googlescholar.blogspot.com.es/2013/11/google-scholar-library.html
6 https://scholar.google.com/intl/en/scholar/help.html#library

147

148 La revolución Google Scholar en la parte izquierda del registro bibliográfico. El usuario conforme navega por Google Scholar puede localizar un registro de interés. en el caso de que se hubiese activado la opción en el momento de la activación. “Mis citas” (que corresponde a los artículos importados automáticamente del perfil académico del usuario) y “Citado por mí”. el producto proporciona una herramienta de etiquetas. Figura 34. Figura 33. En todo caso. El funcionamiento es el que sigue: . Pulsando posteriormente el enlace “My Library”. esta colección de documentos puede habilitarse en cualquier momento (Figura 34). Importación de referencias citadas en “Mi biblioteca” Con el fin de facilitar la organización de contenidos. Por defecto “Mi biblioteca” muestra dos colecciones. indicando que el artículo se encuentra almacenado en la biblioteca. el sistema mostrará los documentos almacenados. el funcionamiento del sistema es muy sencillo. accesible desde el menú lateral izquierdo de la biblioteca. y simplemente pulsando en el elemento “Save” (Guardar) el registro se añadirá a la colección. Ejemplo de colección en “Mi biblioteca” Una vez activado. en la que se incluyen los artículos citados por el autor en los artículos incluidos en el perfil.

—— Pulsar en el artículo que se desee etiquetar. y notificarlos automáticamente al usuario mediante un correo electrónico. —— Acceder a cualquier colección (por defecto “Mi biblioteca”. algún asunto muy particular o de una selecta selección de publicaciones. se está en el proceso de realización de un trabajo académico de envergadura (como una tesis doctoral) o simplemente se desea estar al día. al pulsar en el menú “Libros”. 149 . “Mis citas” y “Citado por mi”. Figura 35.Bloque A · Capítulo 6 · El proceso de búsqueda en Google Scholar —— Acceder a la gestión de etiquetas: “Administrar etiquetas”. La solución que plantea Google Scholar es la creación de Alertas que automaticen la identificación de nuevos registros incluidos en la base de datos que cumplan unos criterios de búsqueda. como puede suceder cuando se están realizando tareas de vigilancia tecnológica. por ejemplo “Libros”. Todo ello exige la creación de comandos de consulta que en ocasiones pueden ser complejos y laboriosos si deben realizarse además con cierta frecuencia. Al crearla. aparecerán todos los documentos etiquetados en esta categoría. Etiquetado de contenidos en “Mi biblioteca” Alertas Las tareas de seguimiento en Google Scholar pueden ser realmente tediosas. creado anteriormente. Conocer los últimos artículos de un autor. —— Pulsar en “Labels” y etiquetar la referencia correctamente (Figura 35). Tras esto. —— Crear una etiqueta nueva. las últimas aportaciones en alguna determinada materia. el nombre de la carpeta aparecerá en el menú lateral derecho (Figura 34).

etc. qué revistas. es decir. Actualizaciones El sistema de actualizaciones es un sistema de recomendación automático de artículos. El usuario deberá incluir un correo electrónico para recibir las notificaciones. el sistema copiará la consulta efectuada en el campo “Consulta de alerta”. Creación de alertas en Google Scholar Las alertas pueden dividirse en dos tipos. lo que puede ser útil a la hora de fijar una alerta ante una consulta que ha demostrado ser útil al usuario. Se puede destacar igualmente que las alertas no pueden editarse una vez creadas. mientras se está buscando material académico. solamente pueden ser eliminadas. Adicionalmente. Si el usuario hace clic en el icono una vez ha realizado una consulta. La consulta de alerta debe corresponder con la ecuación de búsqueda que debería realizarse en el cajetín de búsqueda de Google Scholar. En este caso. cuando el usuario realiza una consulta básica. según provengan de Google Scholar (aparecen entre corchetes en el panel de alertas) o las provenientes de Google Scholar Citations (aparecen sin corchetes). qué autores consultamos. así como el número máximo de resultados que desea recibir en cada notificación.150 La revolución Google Scholar El icono de “Alertas” se encuentra situado en el menú superior de la página de inicio de Google Scholar. el usuario puede comprobar la eficiencia de los resultados de la consulta realizada a través del botón “Actualizar resultados”. Las alertas pueden además crearse en vivo. Figura 36. Si se pulsa en el enlace. el sistema muestra una interfaz desde la que se pueden crear las alertas de consulta (Figura 36). Google Scholar registra todos los movimientos que los usuarios realizamos dentro del sistema. palabras clave identificando . a qué documentos accedemos a texto completo. el sistema le muestra siempre el icono de alertas en el menú lateral izquierdo (Ver Figura 24). El perfil académico es tal vez la mayor fuente de datos pues describe completamente a un autor (afiliación institucional.

Bloque A · Capítulo 6 · El proceso de búsqueda en Google Scholar áreas de interés. Para acceder a esta colección de documentos recomendados basta con pulsar el botón “Actualizaciones”. a partir de un icono en forma de campana. al igual que funcionan los sistemas de recomendación de música o de parejas sentimentales. Toda esta información es acumulada para ofrecer una recomendación basada en nuestros gustos e intereses académicos. Figura 37. donde podemos consultar todo el histórico o bien las últimas incorporaciones (figura 37). situado en la parte superior derecha de la interfaz de búsqueda. artículos publicados e información de a quién cita y por quién es citado). Sistema de recomendación de artículos en Google Scholar I Figura 38. El sistema nos avisa igualmente en el momento en que se ha incorporado una novedad. situado en el menú superior de la página de inicio de Google Scholar. Sistema de recomendación de artículos en Google Scholar II 151 .

por ejemplo. y nos encontramos con un texto que no es accesible. lista para ser usada. Botón de referencias En ocasiones. nos aparecerá un pequeño icono en la parte derecha de la barra de navegación del buscador. y cuya última actualización es del 7 de mayo de 2015) permite realizar esa consulta de forma inmediata. bajo). podemos observar cómo el sistema ha localizado el artículo seleccionado en Google Scholar (que no se encuentra en acceso abierto). Una vez instalada. Sin embargo.152 La revolución Google Scholar En el momento en que existen nuevos documentos que el sistema cree poder recomendarnos. En el ejemplo mostrado en la Figura 39. A veces. el sistema realizará la búsqueda de esa cadena de caracteres seleccionada directamente en Google Scholar. pero nos interesa. Un proceso que se puede hacer engorroso si se realiza con frecuencia. . cuando navegamos por algún sistema de información o página web. Imaginemos que estamos consultando un repositorio (Figura 39). el icono se ilumina en rojo y en su interior aparece un número representativo del número de documentos nuevos recomendados (Figura 38. podemos llegar a localizar una referencia bibliográfica que nos interese y deseemos entonces acceder al artículo correspondiente. de acceder al texto completo (en este caso accesible desde la plataforma de ResearchGate) o bien abrir definitivamente Google Scholar para refinar la búsqueda. Si con el ratón seleccionamos el título de la obra y a continuación pulsamos en el icono del botón. arriba). para ello deberemos abrir en una pestaña nueva el buscador (si no lo teníamos ya abierto) y copiar/pegar el título u otra información de dicha referencia para realizar la consulta. La forma es a través de una extensión del navegador web Chrome al que se puede acceder desde esta sección de la configuración y que puede ser instalada en el navegador directamente a través de la Chrome Web Store. en el caso de que sea necesario. buscando en Google Scholar. El botón de Google Scholar (lanzado en abril de 2015. ofreciéndonos la posibilidad de exportar la referencia normalizada. estos nuevos documentos aparecen en la página de inicio listados justo debajo del cajetín de búsqueda (Figura 38.

Ejemplo del botón de referencias de Google Scholar 153 .Bloque A · Capítulo 6 · El proceso de búsqueda en Google Scholar Figura 39.

.

tanto empíricos como descriptivos. sino que argumentan que los errores (imposibles de negar por otra parte) no influyen demasiado en las conclusiones generales a obtener en un proceso de evaluación de impacto académico. Google Scholar no deja indiferente a nadie. muestran su desagrado al poco o escaso control de calidad de los datos. como fuente absolutamente obligatoria. sus características distintivas principales. A lo largo de la última década. Los detractores. Los defensores y los detractores (recordando en ocasiones a los apocalípticos e integrados de Umberto Eco) han tenido tradicionalmente posiciones claramente diferenciadas y contrapuestas. Por el contrario. así como el impacto de su lanzamiento tanto en el mercado de los buscadores como posteriormente en la evaluación de la actividad académica. que lo invalidan como herramienta a emplear en procesos de evaluación académica. en la diversidad de opiniones vertidas. debilidades y peligros A lo largo de los capítulos anteriores hemos descrito el nacimiento de Google Scholar. Inciden en que su uso debería generalizarse como fuente complementaria a los resultados ofrecidos por bases de datos bibliométricas como WoS o Scopus y. su facilidad de uso y el gran papel que juega como puerta de entrada a la búsqueda de información científica. aun con el peligro de resultar demasiado densos. Desde el inicio se ha hecho especial hincapié.Capítulo 7 Google Scholar en la balanza: Fortalezas. En un plano intermedio nos atrevemos a situarnos a nosotros mismos. aunque no niegan algunas de sus principales bazas como su amplia cobertura. tanto académicos como divulgativos. los entusiastas del producto no sólo inciden en las ventajas del buscador. a la inclusión de material de dudosa calidad y a los errores en la contabilización de citas. en algunas áreas y disciplinas. desde el Grupo EC3 (Evaluación de la Ciencia y de la Comunicación Científica) hemos realizado una gran cantidad de estudios y análisis. en los que hemos pretendido de algún modo . las intenciones y objetivos iniciales de sus creadores.

su más insigne virtud es indudablemente la amplia y diversa cobertura. todos los aspectos importantes de la base de datos. extraidos de los innumerables trabajos y estudios recopilados durante la elaboración de este libro. tanto las buenas como las no tan favorecedoras o incluso las directamente malas. que se concentra en tres puntos clave: idiomas. Sin entrar en estos puntos y ya concentrándonos en sus prestaciones en tanto que herramienta para la realización de estudios bibliométricos. Ventajas Los principales valores de Google Scholar. cobertura general y precio). quienes estructuran la evaluación del buscador en seis apartados (control de la información.org/manifesto/ . la tarea de analizar Google Scholar no es sencilla. desde una óptica integral. interfaz.156 La revolución Google Scholar mostrar todas las caras de Google Scholar. Ruiz-Pérez y Delgado López-Cózar (2009). contribuyendo de ese modo a poner un granito de arena en la mejora del conocimiento sobre Google Scholar tanto a investigadores como a profesionales. Llegados a este punto parece conveniente realizar una parada en el camino con el propósito de recopilar. en su gratuidad. 1 http://altmetrics. Sin embargo. búsqueda y resultados. ya comentados en la introducción. sí cumplen la misión de abordar. En la tabla 6 se resumen los principales puntos de debate en este apartado. categorizar e incluso discutir las principales ventajas e inconvenientes de este buscador. además contemplando prácticamente a todos los posibles usuarios. junto a las posibles amenazas y peligros a los que debe hacer frente en la actualidad. disciplinas y tipologías documentales. cobertura de revistas científicas. Aunque la evolución y dinamismo del buscador hacen complicada la utilización de este tipo de modelos de análisis. residen en la fascinante sencillez de su uso en las búsquedas y. El creciente uso de Google Scholar y el movimiento de las Altmetrics 1 supondrán a buen seguro un cambio de tendencia en la utilización de este buscador en tareas y análisis tanto bibliométricos como cibermétricos. por supuesto. Uno de los paneles de evaluación más completos es quizás el elaborado por Torres-Salinas. Con ello crecerá la necesidad de conocer sus principales limitaciones y problemas en aras a extraer el máximo partido al enorme potencial que esta base de datos contiene.

Esta mayor diversidad lingüística se puede observar en el estudio llevado a cabo por Orduña-Malea y Delgado López-Cózar (2014). el inglés constituye aproximadamente el 90% de los documentos indizados. Ventajas. Según Orduña-Malea et al (2014). En el caso de Google Scholar es complicado realizar este cálculo pues no existen comandos de búsqueda específicos para filtrar por idioma (aunque sí por dominios web geográficos) y existe además un número máximo de resultados por consulta (1.Bloque A · Capítulo 7 · Google Scholar en la balanza Tabla 6. a partir de un análisis sobre estudios empíricos previos. dato que habla por sí mismo. en el que se observa de forma comparada la cantidad de registros por idioma 157 . solamente podemos trabajar con estimaciones. inconvenientes y amenazas de Google Scholar VENTAJAS INCONVENIENTES AMENAZAS Idiomas Calidad Manipulación Disciplinas Transparencia Control Tipologías Prestaciones Googlelización Amigabilidad Gratuidad Idiomas El sesgo hacia el idioma inglés por parte de las bases de datos bibliométricas es ampliamente conocido. estiman que el inglés puede representar aproximadamente el 65% de los registros en Google Scholar.000) que imposibilitan el cálculo manual. considerando los artículos indizados en Web of Science en el período 1900-2014. Por ello. Orduña-Malea et al (2015).

eliminando el abultado sesgo anglófono que poseen Scopus y WoS.158 La revolución Google Scholar en Web of Science. o en las de Library and Information Science (Delgado López-Cózar et al. así como el trabajo seminal de Kousha. por ejemplo) han aprovechado precisamente esta potencialidad para desarrollar productos orientados a conocer el rendimiento individual de investigadores españoles en estas disciplinas. A parecidas conclusiones se llega en los estudios dirigidos a analizar la lengua y procedencia geográfica de las revistas indizadas en Google Scholar Metrics comparadas con las vaciadas en Web of Science o Scopus. Thelwall y Rezaie (2011). De este modo. sorprendentemente mejor cubierta en WoS y Scopus en el momento del estudio. 2013). Scopus y Google Scholar. Los resultados reflejan una representación de ciertos idiomas (especialmente el italiano. con especial relevancia los llevados a cabo por Anne-Wil Harzing en las áreas de Administración y dirección de empresas y Economía. sociales y jurídicas. Los trabajos reseñados a lo largo de este libro. en GSM no alcanzan el 60%. 2013) como en las de Enfermería (Reina. Repiso-Caballero y Delgado López-Cózar. quienes abarcan las principales áreas humanas. chino y japonés) mucho más elevada en Google Scholar. francés. Por otra parte. dan sobrada muestra de la potencialidad de Google Scholar para ser utilizado en la evaluación del impacto académico en dichas disciplinas. si las revistas en inglés representan en Scopus y WoS entre el 85 o 90% de los títulos. Este y otros productos similares serán descritos con mayor detalle en el Bloque B del libro (capítulo 10). GSM cuenta con revistas publicadas en 13-15 lenguas. es lógico pensar que una mayor diversidad lingüística pueda conllevar necesariamente una mayor y mejor representación de estas disciplinas. Disciplinas Dado que el uso del idioma vernáculo es una de las características antropológicas clave en la comunicación científica en ciertas disciplinas. con la excepción del alemán. esencialmente en las Ciencias Humanas y parte de las Ciencias Sociales. 2012). Tanto en las revistas de Comunicación (Delgado-López-Cózar y RepisoCaballero. Productos derivados (como H-Index Scholar. mientras que Scopus y WoS sólo registran revistas publicadas en 7-9 idiomas diferentes. español. GSM se ajusta mejor al uso real que tienen los distintos idiomas en las revistas científicas existentes en el mundo. .

tanto para localizar de una forma sencilla. Únicamente se requiere de acceso a Internet. a día de hoy. Estas características convierten a Google Scholar especialmente útil en estudios y análisis a nivel micro. presentaciones (tanto docentes como de conferencias o eventos) y especialmente monografías y tesis doctorales. completamente gratuito. por utilizar canales de comunicación diversos en los que el artículo publicado en una revista es una tipología claramente minoritaria. el artículo científico era la tipología más presente en Web of Science (57%) durante el período 1700-2014 mientras que. Google Scholar recopila documentos académicos sin importar la tipología documental (los documentos solamente deben cumplir unos requisitos técnicos y de estructura). fácil y directa documentos a texto completo como para identificar las citas únicas a sus trabajos independientemente de su procedencia. Según el análisis de Orduña-Malea et al (2014). por ejemplo. Actas de congresos. Ruiz-Pérez y Delgado López-Cózar. patentes. Inconvenientes A pesar de todas las indudables ventajas descritas anteriormente el sistema no está exento de ciertas limitaciones e inconvenientes. y no por ello menos importante. editoriales o asociaciones no gubernamentales. las actas de congreso suponían solamente el 10. capítulos de libro o monografías son formatos usados con mucha frecuencia y que no están recogidos en las bases de datos bibliométricas clásicas. proporcionan a Google Scholar no sólo una base de datos única donde localizar información sino un corpus de documentos citantes de incalculable valor (imaginemos la cantidad de citas perdidas que puede suponer simplemente excluir las tesis doctorales de los análisis de citas). revistas secundarias no incorporadas en la corriente principal de la ciencia. Por tanto.2% y los capítulos de libro un exigüo 1. pueden disponer de una herramienta no sólo complementaria sino necesaria para obtener un dibujo completo de su impacto académico.1%. idioma o tipología documental (Torres-Salinas. Por último. capítulos de libro. Por tanto. investigadores en áreas sociales y humanas o de ingeniería. 2009). Ni siquiera se precisa disponer de una cuenta de correo de Gmail para usar los servicios de Google. aparte de por usar los idiomas vernáculos.Bloque A · Capítulo 7 · Google Scholar en la balanza Tipologías documentales Las disciplinas sociales y humanas se caracterizan. no hemos de olvidar que el producto es. que se 159 . informes. la presencia a texto completo de actas de congresos.

los especialistas en información tienen la obligación profesional de evaluar las prestaciones de los buscadores. de cobertura global y con poco personal no puede seguramente dedicar demasiado tiempo a controlar la precisión de los datos bibliográficos aportados. sirven y guían como apoyo para la correcta toma de decisiones tanto en instituciones académicas como en organismos de financiación. La calidad de la información ofrecida (entendiendo con ello los datos descriptivos de los registros indizados) no fue una prioridad por tanto en el proyecto de Google Scholar. funciones de búsqueda y precisión para realizar su trabajo de forma profesional (buscar y localizar información de calidad para sus usuarios). opacidad en su funcionamiento y la poca amigabilidad para poder analizar los datos recuperados. En 2005 (tan sólo un año después del lanzamiento del buscador). especialmente durante sus primeros años de vida. por ejemplo. Conclusiones que. más cuando esto va a tener una incidencia tal vez mínima en la satisfacción de un alto porcentaje de sus usuarios. Un producto sencillo de utilizar. La prioridad por tanto radica en disponer de información (cuanta más. al igual que otros productos y servicios desarrollados por Google. mejor). por otra parte. sigue la filosofía del laissez faire laissez passer. mejor) y de manera intuitiva (cuanto más fácil. que afectaban especialmente a la hora de localizar las contribuciones de un determi- . Por otro lado. los especialistas en bibliometría y cibermetría deben contar con registros sin errores para que sus análisis tengan el suficiente rigor científico y sus conclusiones puedan tener validez.160 La revolución Google Scholar pueden resumir en una falta de control de calidad de los datos. rápido. mejor). Una base de datos actualizada de forma dinámica. en ofrecerla de forma inmediata a los usuarios (cuanto más rápido. mejor) y dando preferencia a los documentos más influyentes (cuanta más relevancia. Desarrollado con la perspectiva de satisfacer las demandas de los usuarios a la hora de localizar y acceder a información científica. Los bibliotecarios y documentalistas deben conocer a fondo su cobertura. Control de calidad Google Scholar. Peter Jacsó ha sido quizás el investigador que más tiempo ha dedicado a identificar y criticar las deficiencias de Google Scholar (aspecto ya comentado ampliamente en el capítulo 2). A pesar de ello. de cobertura mundial y que además es gratuito. ya denunciaba la existencia de importantes limitaciones en los resultados proporcionados. así como para formar a sus usuarios.

los parsers eran incapaces de reconocer los metadatos bibliográficos. 2007). Igualmente. Jacsó (2010) describe cómo en ocasiones los años de publicación de los registros eran tomados de los datos del volumen y número de la publicación o de parte de números de teléfono o fax. Pese a ofrecer un acceso sin precedentes a cientos de editores académicos (quienes ofrecen al buscador millones de registros bibliográficos a texto completo). Por ejemplo. 2008a. Jacsó es especialmente crítico en este asunto. muy especialmente. en la mala utilización de los metadatos proporcionados por las editoriales. este procedimiento no podía funcionar igual de bien en la búsqueda de ítems conocidos a partir de la combinación de nombres de autores. Los errores identificados generaban millones de registros con atribuciones de autoría y de citas erróneas (que provocaban la existencia de autores y citas fantasmas). este procedimiento planteaba un error de base. de la afiliación profesional o incluso de la dirección postal. Igualmente. era imposible entonces distinguir dos autores con el mismo apellido y misma inicial. en la aplicación de algunos comandos de búsqueda avanzada y. debido a importantes problemas en la desambiguación de nombres (Jacsó. Sin embargo. se detectaban errores tales como la existencia de duplicados (y triplicados). Sin embargo. de los descriptores. enlazado a textos completos que no correspondían a los registros. años de publicación o nombres de revistas (Jacsó. 2008b). Emplea asimismo términos como “under-trained and inferior web crawlers”. errores en las búsquedas filtradas por año. según palabras de Jacsó. los documentos con estructuras no bien definidas podían provocar que el sistema no recuperara de forma correcta las citas de muchos documentos citantes (Meho y Yang. Este método había resultado exitoso en el buscador general de Google para crear conjuntos de resultados que fueran relevantes para consultas “tipo” de los usuarios (basadas generalmente en una o dos palabras clave). La recuperación e indización de la Web por parte de Google se basaba en la identificación de URLs y títulos en el código HTML. El software empleado era. 161 . Como consecuencia. En ocasiones ciertos datos eran tomados por error de las opciones de menú de las páginas web. los desarrolladores de Google Scholar habían depositado toda su confianza en el desarrollo de un software propio para extraer automáticamente los metadatos de los archivos a texto completo en lugar de utilizar los metadatos creados por los bibliotecarios y las editoriales (Jacsó. 2010). patético. 2005b).Bloque A · Capítulo 7 · Google Scholar en la balanza nado autor.

Zadpoor y Dodou (2014) identifican por ejemplo un 1% de falsos positivos en citas y un 5% de duplicados para una muestra de 56 artículos en diversas disciplinas analizadas en 2013. especialmente en trabajos a media y gran escala. Se evidenciaba que Google Scholar era un producto ambicioso desde el punto de vista de su cobertura. pero mal resuelto en el plano del procesamiento de la información. Cabe admitir no obstante una importante evolución y mejora del producto. Winter. En todo caso. el peso de otros indicadores (como podrían ser la calidad de la editorial. Aunque parece ser que el número de citas es uno de los indicadores clave en este proceso de posicionamiento (Beel y Gipp (2009). porcentajes asumibles. así como en su presentación (TorresSalinas. Localizar . Conocer las razones por las que un registro aparece por delante de otro. se desaconsejaba su utilización como única fuente de información para la evaluación de la ciencia. 2009). y constituye por tanto una importante limitación a remarcar en este apartado. es vital. por lo que resultaba claramente inapropiado en la realización de búsquedas bibliométricas para la evaluación del rendimiento e impacto científico de investigadores y revistas. Ruiz-Pérez y Delgado López-Cózar. la concordancia de palabras en el título. institución o editorial el hecho de no aparecer entre los resultados a una consulta pertinente es un asunto nada trivial. los autores advierten de la falta de fechas de publicación en el 9% de los datos. aunque su influencia específica no se puede calcular con exactitud. en un producto que muestra un máximo de 1.162 La revolución Google Scholar Todos estos errores impedían un uso académico de los datos albergados en el sistema. Opacidad Una de las principales críticas que suelen realizarse a Google Scholar es la falta de transparencia a la hora de detallar públicamente el funcionamiento del buscador. Así mismo. Este hecho puede explicar los errores en los filtros temporales del buscador. especialmente en el proceso de ranking de resultados ante una consulta determinada (algoritmo de posicionamiento). La pérdida de visibilidad que puede suponer tanto para un autor.000 resultados por consulta. resumen o texto o el PageRank del dominio web donde se ha depositado el texto completo) es igualmente importante. más teniendo en cuenta la escala de su cobertura y la ausencia de control de calidad en su mantenimiento.

lo cite en futuros trabajos propios. pues son clave para mantener su posición en el mercado de los buscadores frente a las empresas de la competencia. por ejemplo. en el sentido de que favorecen la localización de artículos pioneros. lo descargue. La influencia del número de citas en el ranking de resultados puede traer problemas adicionales. tal y como ya se ha comentado en diversas ocasiones a lo largo del libro. aunque es gratuito. con fortuna. 163 . se encuentran descritos en las patentes publicadas por el equipo de trabajo de Google Scholar). las fuentes privadas (como editoriales) que han llegado a un acuerdo específico con Google Scholar para que éste indexe el texto completo de sus contenidos sí deberían ser notificadas. La tendencia a citar artículos antiguos en Google Scholar fue estudiada por Verstak et al (2014). que un usuario acceda al texto completo. especialmente en aquellas búsquedas no restringidas temporalmente. Esto puede tener un efecto negativo al favorecer a los artículos más antiguos frente a los nuevos. En ocasiones podemos olvidar que Google Scholar. por ejemplo. Lógicamente. los artículos con más citas son por lo general artículos más antiguos (han tenido tiempo suficiente como para reunir muchas citas). éstos no mencionan explícitamente la influencia directa que puede tener el uso del número de citas como elemente clave de posicionamiento web en su producto. localizar posibles colaboradores y generar interés por tu línea de investigación. Este hecho puede justificar que no revelen sus algoritmos de búsqueda y posicionamiento. es un producto elaborado por una empresa privada. En cambio.Bloque A · Capítulo 7 · Google Scholar en la balanza un texto entre los resultados de búsqueda puede suponer. lea y. es la total falta de transparencia acerca de la cobertura de la base de datos (más exactamente qué fuentes indiza) y su actualización. el segundo punto importante respecto a su opacidad. a través de un listado online actualizable anualmente. que se realiza de forma irregular e inconsistente (Walters. como la identificación automática de versiones. El algoritmo del ranking es un secreto comercial. Igualmente puede servir para dar a conocer tu trabajo. 2007). Las fuentes en abierto constituyen un número demasiado elevado (y con un dinamismo muy elevado) como para poder disponer de una master list de las mismas. Aunque los autores atribuyen este efecto a las nuevas tecnologías y al uso de los motores de búsqueda. Más allá de revelar los procesos de ordenación de resultados y otros procedimientos internos (algunos de ellos.

Respecto a las capacidades del buscador. Ni siquiera se puede realizar esta operación en la Biblioteca de Google Scholar. entre muchas otras: —— Los operadores booleanos y el filtro temporal no funcionan con precisión (Jacsó. —— No existe la posibilidad de restringir los resultados a enlaces que proporcionen acceso al texto completo. pero es insuficiente como para trabajar con ella de forma sistemática. el límite de 1. típicamente incluidas en otros productos de información. Respecto a la exportación y tratamiento de los resultados. se destacan los siguientes puntos: La exportación de registros bibliográficos (a través de la opción “Citar”) es útil para copiar una referencia bibliográfica en un formato estándar en un documento de trabajo. 2005) 2.000 resultados por búsqueda limita la realización de estudios métricos dada la imposibilidad práctica de recopilar todos los resultados existentes ante una determinada consulta. Por otro lado. pues no se permite la selección de más de un ítem a la vez. Aunque existen diversos métodos como el query splitting (basado en la combinación especial de diversos términos de búsqueda). —— No existe la posibilidad de ordenar los resultados en función de diversos parámetros. . 2006). En ese sentido. desarrollado 2 El producto Google Scholar Citations ha elaborado un control de autoridades en agosto de 2015. pero únicamente operativa en los perfiles académicos. el sistema muestra claramente una preferencia por la sencillez e inmediatez de las búsquedas a costa de limitar las opciones avanzadas.164 La revolución Google Scholar Prestaciones documentales El último punto importante a destacar respecto a las limitaciones de Google Scholar es el relativo a las escasas prestaciones documentales del sistema. Las únicas opciones son por relevancia o fecha de indización). se destacan las siguientes limitaciones. y no en la interfaz de búsqueda de Google Scholar. —— Carencia total de términos controlados y control de autoridades (Giustini y Barsky. —— No se permite la búsqueda por tipo de publicación o metodología de investigación (esencial por ejemplo en medicina). tanto en la búsqueda avanzada de información como en las capacidades para exportar y tratar los resultados de las búsquedas efectuadas. Esto hace que el proceso de exportación de referencias sea tedioso.

permiten consultar y recuperar datos en Google Scholar. el tiempo requerido para la recolección y procesamiento de datos en WoS (100 horas). el control sobre el usuario y la excesiva dependencia en los productos de Google. ya se introdujo el término de ASEO (Academic Search Engine Optimization) al discutir acerca de la posición de los registros en la página de resultados ante una consulta concreta. Es decir. aportando adicionalmente datos de interés para el análisis bibliométrico (por ejemplo.com/pop.ac. La falta de disponibilidad de una API (Application Programming Interface) en Google Scholar obliga a realizar descargas de datos de una forma manual desde la pantalla de resultados a una hoja de cálculo (u otra aplicación similar para el tratamiento de datos).wlv. A lo largo de los últimos años se han desarrollado aplicaciones que. Todas estas limitaciones llevan a que la recopilación y procesamiento de resultados de búsqueda sea un proceso costoso. no trabaja sobre ninguna API. tedioso y definitivamente poco amigable (Bar-Ilan. diversas variantes del h-index).htm 165 . Entre estas aplicaciones destaca por encima de todas Publish and Perish 4. Meho y Yang (2007) incluso lo cuantifican mostrando. Amenazas Tras describir las principales ventajas e inconvenientes de Google Scholar. durante la descripción del registro bibliográfico en Google Scholar. Y en este mismo capítulo 3 http://lexiurl.Bloque A · Capítulo 7 · Google Scholar en la balanza por el equipo de Mike Thelwall en la University of Wolverhampton e incluido en la aplicación Webometric Analyst 3.uk 4 http://www. Manipulación En el capítulo 6. La razón por la que el equipo de Google Scholar no habilita una API es debida a los contratos privados firmados con las editoriales u otras fuentes. esta última sección del capítulo 7 se centra en las principales amenazas en torno a este buscador. esta limitación invalida la realización de estudios bibliométricos con datos masivos. para una misma muestra. 2010). Este hecho ya fue advertido por Jacsó (2008a). que se concretan en su facilidad de manipulación. Scopus (200 horas) y Google Scholar (300 horas). que les impide proporcionar contenidos estructurados a terceros. a través de una interfaz amigable.harzing. Aunque su funcionamiento queda igualmente delimitado por los requisitos técnicos de Google Scholar.

que al autocitarse entre ellos de forma masiva terminaron por convertir a este autor en el más citado de la historia. Gipp y Wilde. los autores indizaron un conjunto de documentos en Google Scholar con cierto texto invisible. Sin embargo. como una ayuda para comprender mejor el contenido de los artículos y trabajos académicos y mejorar así su precisión. provocando que estos documentos aparecieran en búsquedas para las que no eran relevantes. En la sección de bibliografía se incluyeron adicionalmente de forma masiva referencias bibliográficas reales a diversos autores. El investigador francés Cyril Labbé (2010) dio un paso más allá en el estudio de la manipulación de citas en Google Scholar utilizando la aplicación SCIgen para generar de forma automática una gran cantidad de artículos falsos firmados por un autor inventado (Ike Ankare). Los autores indican cómo lograron incrementar la posición de documentos científicos manipulando artificialmente el número de citas. Google Scholar detectó los seis artículos y atribuyó las citas falsas a los autores reales. Estos experimentos demuestran que la manipulación de citas y otros indicadores bibliométricos. el ASEO debería ser considerado. Los autores depositaron seis documentos falsos en un repositorio institucional. desde el punto de vista de los motores de búsqueda académicos. Con el fin de determinar si la manipulación de los motores de búsqueda académicos podría ser efectivamente una amenaza. Robinson-García y Torres-Salinas (2014) realizaron un experimento para analizar la capacidad de Google Scholar para detectar la manipulación de citas. sin demasiado esfuerzo. sin la necesidad además de disponer de conocimientos informáticos excesivamente profundos. que aparecieron instantáneamente en sus perfiles académicos. desde el punto de vista del investigador. 2010). una de las principales amenazas de las técnicas de ASEO es que puede ser tomado como una guía sobre cómo engañar y manipular a los motores de búsqueda (Beel. Beel y Gipp (2010) realizan diferentes pruebas en Google Scholar. Los resultados muestran que esta manipulación es. firmados por un autor inexistente. Delgado López-Cózar. como una forma de hacer sus contenidos más amplia y fácilmente disponibles y. mejorando de esta forma los indicadores bibliométricos asociados al impacto de sus trabajos. en este caso en los perfiles académicos (éstos serán descritos en el bloque B).166 La revolución Google Scholar ha vuelto a ser comentado durante la discusión acerca de la opacidad de Google Scholar en el posicionamiento de los resultados. posible. Para ello. así como la posición en los resultados de búsquedas es posible en Google Scholar. Idealmente. De forma similar. Este hecho puede tener un efecto devastador en procesos de evaluación y .

Sin embargo. entonces su credibilidad profesional desaparecerá y la comunidad científica lo expulsará del sistema. dejan entrever en parte la filosofía de Google en el sentido de que el propio sistema se autoregule. pues el número de citas es relevante . según se mire. desde qué computador. habrá que observar cómo se desarrollan los acontecimientos a corto y medio plazo para valorar con mayor tino la magnitud de esta importante amenaza. que significarían tiempo y dinero. Y la imposibilidad de realizar un control humano de los contenidos albergados en Google Scholar dificulta enormemente la tarea de control. En palabras de Anurag Acharya (Van Noorden. Control personal Si recordamos algunas de las funcionalidades descritas en el capítulo 6 (como las alertas o las recomendaciones) así como algunos de los productos que describiremos en el siguiente bloque (Google Scholar Citations y Google Scholar Metrics). pudiendo conocer todo tipo de datos. la posible manipulación de datos es entendida simplemente como spam. Google Scholar recopila una importante cantidad de información del usuario. aunque ciertas relativamente (el spam científico es mínimo y la comunidad científica se controla). La recopilación de toda esta información . Por ese motivo. Conocer sus gustos para poder servirle mejor o para poder equivocarse menos en sus recomendaciones (especialmente en las no gratuitas). 167 .y en ocasiones definitivo . Un investigador que manipule sus datos de citas será tarde o temprano descubierto. financiación de proyectos o promoción institucional en los que se pueda utilizar Google Scholar como fuente complementaria.en la toma de decisiones. 2014). qué sistema operativo utiliza y qué es lo primero que lee cuando llega a la oficina. tanto los relacionados con sus búsquedas como con las horas a las que se conecta. el sistema puede recopilar y combinar las actividades del usuario en todas las interfaces. al menos por el momento. Si el usuario además inicia la sesión en Google Chrome y tiene Google GMail abierto.Bloque A · Capítulo 7 · Google Scholar en la balanza selección de personal académico. Es posible que el poco personal dedicado a Google Scholar impida desarrollar prácticas anti-spam. para el equipo de Google Scholar. Acharya no cree necesario realizar ningún tipo de acción específica.en principio .va dirigida a poder ofrecer servicios completamente personalizados al usuario. el sistema confía completamente en la honestidad del mundo académico. Estas afirmaciones. Y el porcentaje de spam es todavía lo suficientemente reducido como para tener que tomar acciones concretas. En todo caso.

el hecho de ser un motor de búsqueda académico sin publicidad incorporada impide de alguna forma la pérdida de excesivo control sobre la información personal que el usuario pudiera tener en el buscador general.com 6 https://www. Lamentablemente. existen pocos sistemas que realmente lo permitan. Aunque el resto de bases de datos bibliométricas (productos pertenecientes a empresas privadas como Thomson Reuters o Elsevier) no están exentas de este mismo problema. las plataformas que salvaguardan nuestros datos de navegación suelen ser utilizadas en un alto porcentaje por personas que están realizando tareas de dudosa legalidad. como pueden ser Mendeley o ResearchGate. En el caso de Google Scholar. entre otras. No obstante.168 La revolución Google Scholar Aunque es cierto que existe la posibilidad de navegar de forma segura (los navegadores van incorporando esta opción). que se rige además por la legislación del Estado de California. La excesiva dependencia en un solo producto puede ser negativa. no podemos más que aplaudir tanto el desarrollo de nuevos motores de búsqueda (como Semantic Scholar) 8 como de otras plataformas sociales académicas.com/googlegraveyard/google-graveyard 8 https://www. por ejemplo) 7 no permite ser muy optimista al respecto. razón por la cual no desean dejar rastro alguno de su navegación por la Web.org .semanticscholar.pinterest. la dependencia en Google es tal vez excesiva hoy en día. más si tenemos en cuenta el tamaño del equipo de trabajo. Además. no debemos olvidar que Google es una compañía privada.org 7 https://www. minúsculo dentro de un gigante como Google. Googlelización Aunque Google Scholar es un producto gratuito. que pueden aportar información complemen 5 https://duckduckgo. Hoy día destacan por ejemplo DuckDuckGo 5 o sistemas más complejos como Tor 6. la gran cantidad de servicios y productos que Google ha deshabilitado a lo largo de los últimos años (baste recordar a iGoogle o Google Reader. Nada asegura la pervivencia del buscador. en los Estados Unidos de América. si no tomara ciertas precauciones. ¿Qué ocurriría si Google Scholar dejara de existir? ¿Y si pasara a ser un servicio de pago. Por ello. total o parcialmente? Cuestiones que debemos tener siempre presente a la hora de depositar nuestra plena confianza en un sistema.torproject. la recopilación incluso por parte de Google Scholar de tanta información sobre los usuarios debería concienciarnos acerca del posible uso que la compañía privada pudiera hacer de ellos.

los repositorios institucionales deberán dar un paso adelante para proporcionar igualmente datos científicos de valor añadido en abierto. para no convertirse en auténticos cementerios de PDFs. aunque existen rumores oficiales acerca de su reaparición a lo largo de 2016 9. El sistema FUTUR 10.microsoft. de la Universitat Politècnica de Catalunya.edu 169 . es un fantástico modelo a seguir en el “futuro”. y Microsoft Academic Search (http://academic. 2014). 9 Los rumores finalmente se confirmaron. Del mismo modo se lamenta la desaparición silenciosa de Microsoft Academic Search (Orduña-Malea et al. 10 http://futur. Finalmente.upc.Bloque A · Capítulo 7 · Google Scholar en la balanza taria y que debemos tener igualmente en cuenta como herramientas de análisis y evaluación. research.com) volvió a nacer en marzo de 2016.

.

Bloque B La familia Google Scholar: Productos derivados oficiales e independientes .

.

GSM es una herramienta distinta tanto en su concepción (producto híbrido [bibliométrico y bibliográfico] frente a JCR y SJR. que son puramente bibliométricos) como en su materialización (diferente política. el capítulo 10 mostrará nuevos productos independientes. los análisis del producto no tardaron en aparecer. cobertura. y que pasó a conocerse como Google Scholar Metrics (GSM). los criterios de indización que se siguen y sus principales características y servicios. 2012a) y Jacsó (2012a. indización. 2000c. 2012b). El producto se presentaba con una serie de características y funcionalidades que lo hacían único a cualquier otro ranking de revistas previamente conocido. accesible desde la opción “Metrics” del menú superior de la página de inicio del buscador. Un nuevo servicio bibliométrico en acceso abierto El 1 de abril de 2012 Google Scholar sorprende a la comunidad bibliométrica con la aparición de un nuevo producto. 2000d. 2000b. Este segundo bloque está dedicado en exclusiva a la descripción de los principales productos derivados de Google Scholar. Se trataba de un ranking de publicaciones científicas ordenado en función del h-index a partir de los datos de citaciones de Google Scholar. arquitectura y presentación formal). Por esta razón. De ese modo hemos hablado de su origen y evolución. Finalmente. . destacando especialmente los trabajos de Cabezas-Clavijo y Delgado López-Cózar (2000a. del impacto en el mercado de los buscadores académicos y en el de la evaluación de la investigación. En este capítulo 8 nos centraremos en Google Scholar Metrics mientras que el Capítulo 9 estará dedicado a Google Scholar Citations. Igualmente hemos descrito su funcionamiento interno.Capítulo 8 Google Scholar Metrics: El impacto de las revistas científicas El bloque A de este libro ha estado dedicado a la descripción de Google Scholar.

original sin duda. el sistema mostraba a su vez el conjunto de artículos que habían contribuido a ese valor. Finalmente. japonés.174 La revolución Google Scholar La cobertura de Google Scholar Metrics se basaba en los siguientes criterios: —— Revistas con al menos 100 artículos publicados en el período 20072011. Las revistas se encontraban categorizadas por idiomas (inglés. sencillo. de forma que Google Scholar se decantaba por el uso de este indicador. simple y robusto frente a los errores.2011. el sistema mostraba un listado de las 100 revistas con mayor h-index. pulsando en el título de cada artículo se podía acceder al texto completo (si estaba disponible). coreano. algunas de ellas heredadas de los errores de Google Scholar y otras propias del nuevo producto: —— La categorización por idiomas no tiene precedentes en la bibliometría. Esta decisión. francés. —— Revistas con al menos 1 cita recibida para los artículos publicados en el período 2007 . Estas restricciones pretendían potenciar las publicaciones activas con una productividad media-alta (20 artículos al año) en un período reciente de 5 años. En este caso. chino. a pesar de sus conocidas limitaciones. alemán. incluía la posibilidad de ordenar por el h-index median (mediana del número de citas que contribuyen al h-index calculado). El usuario podía de este modo localizar una publicación. ordenados por el número de citas recibidas por artículo. se mostraban un máximo de 20 resultados por consulta. aunque ésta no estuviera incluida en el Top 100 de su idioma. y se podía acceder igualmente a los artículos que contribuían al h-index Tanto Jacsó como Cabezas-Clavijo y Delgado López-Cózar detallan algunas de las importantes limitaciones del sistema. tal y como remarcan Cabezas-Clavijo y Delgado López-Cózar en su informe de urgencia de 2012. el sistema proporcionaba un buscador interno mediante el cual el usuario podía buscar directamente por palabra clave. Al seleccionar un idioma cualquiera. holandés e italiano). Así mismo. Por otra parte. Pulsando en el h-index correspondiente. . español. dejaba relucir el escaso conocimiento del equipo de Google Scholar del mundo de la bibliometría y de las publicaciones académicas. portugués. el criterio de ordenación se basaba en el h-index (relativo a los últimos 5 años). De forma complementaria a la categorización por idiomas.

Los autores advierten que el 89% de los documentos de la muestra depositados en los repositorios habían sido previamente publicados en revistas. Arxiv. Google Scholar Metrics diferencia entre la versión de un artículo publicada en una editorial y la versión depositada en un repositorio. que aparecen mezclados junto con las revistas. aunque con diferente descripción bibliográfica. el artículo se incorpora como documento citado tanto a la revista como al repositorio. 2012). así como el papel que puede jugar en la evaluación de revistas en Ciencias Sociales y Humanidades y en el fomento de una sana competitividad en el mercado de los productos de evaluación de revistas. —— Cobertura: el sistema incorpora una variedad de tipologías documentales que difícilmente son comparables. Social Science Research Network y NBER). comparar en una misma dimensión ambos productos carece de validez científica. Por otra parte. Este último punto. Por tanto. —— Control de calidad: los errores bibliográficos en los registros de Google Scholar no se habían corregido (identificación de autores. En el caso de los repositorios. —— En algunos casos. por una parte. 175 . la adopción del h-index. Manteniendo el mismo número de citas recibidas. revistas y otros datos bibliográficos como la fecha de publicación). y no en el de los repositorios. Este importante hecho es indicado tanto por Jacsó (2012b) como por Ortega (2014). que lo convierten en una herramienta inadmisibile para propósitos evaluativos. generando errores en el h-index obtenido.Bloque B · Capítulo 8 · Google Scholar metrics —— Falta absoluta de estandarización: las publicaciones aparecen duplicadas bajo diferentes nomenclaturas y variantes e incluso en diferentes idiomas. Estas importantes limitaciones llevan a Delgado López-Cózar y Cabezas-Clavijo (2012) a definir el producto como inmaduro. de indudable interés metodológico. como son los repositorios temáticos o series de monografías o informes técnicos (Delgado López-Cózar y Robinson-García. con graves problemas en su configuración y funcionamiento. Sin embargo. plantea a Delgado LópezCózar y Robinson-García (2012) la realización de un análisis exploratorio a partir de una muestra formada por los 40 artículos más citados que contribuyen al h-index en cuatro repositorios incluidos en Google Scholar Metrics (RePec. reconocen la singularidad del producto. los datos mostrados no son reproducibles manualmente. las citas recibidas por dichos artículos deberían influir en el impacto de las revistas.

en la que destaca la inclusión de la posición de una revista en las diferentes categorías temáticas en las que puede estar incluida (figura 40 b). En concreto 8 grandes áreas temáticas (Business. y no para el resto. . aparte de la inclusión de nuevas revistas. esta categorización se proporcionaba (y sigue proporcionando en la actualidad) únicamente para las revistas en inglés. Y para cada una de estas categorías y subcategorías. apenas siete meses y medio después de la primera versión. Health & Medical Sciences. Physics & Mathematics. La principal novedad de esta nueva versión (que mantenía el intervalo temporal. la polijerarquía está aceptada en el sistema. que ahora se incluían segmentados en distintas colecciones ofreciendo así una visión menos sesgada de su impacto. pero actualizaba las citas recibidas hasta el 15 de noviembre). el sistema visualizaba las primeras 20 publicaciones. y arXiv Cosmology and Extragalactic Astrophysics en Physics & Mathematics – Astronomy & Astrophysics). arXiv Digital Libraries quedaría clasificada en Social Sciences – Library & Information Science. La respuesta de Google Scholar a las críticas siempre constructivas que se han realizado desde los numerosos informes técnicos y documentos de trabajo elaborados por el grupo de investigación EC3 ha sido siempre tan inmediata como silenciosa. la clasificación lingüística predomina frente a la temática. En la figura 40 se observa la interfaz en la actualidad (septiembre 2015).176 La revolución Google Scholar Pero Google Scholar no había dicho todavía la última palabra. especialmente en el caso de repositorios que engloban a una gran cantidad de disciplinas (por ejemplo. Finalmente. contestando de este modo a las críticas previas recibidas. Life Sciences & Earth Sciences. Engineering & Computer Sciences. se anunciaba una actualización de la base de datos en la que se eliminaban algunas de las deficiencias apuntadas en los estudios anteriormente citados. Fiel a su filosofía empresarial. Economics & Management. y Social Sciences) y 313 disciplinas. es decir. Literature & Arts. Humanities. una misma revista puede estar integrada en diferentes categorías o subcategorías. entre las que se destaca la clasificación más granular de los repositorios. Arxiv). es que introducía una clasificación temática de las revistas. Delgado López-Cózar y Cabezas-Clavijo (2012b) desgranan esta nueva versión identificando adicionalmente una serie de mejoras. las distintas colecciones podían clasificarse en distintas categorías o subcategorías (por ejemplo. Es decir. el 15 de noviembre de 2012. Chemical & Material Sciences. muy similar en prestaciones a la existente en 2012. Lamentablemente. De este modo.

Los autores observan cómo en apenas siete meses el h-index de las revistas incrementa un 15%. Listado de revistas por idioma (a) y de artículos por revista (b) La existencia de dos versiones en un mismo año presentaba la oportunidad a Orduña-Malea y Delgado López-Cózar (2014) de medir la estabilidad de los indicadores bibliométricos entre las fechas correspondientes (abril y noviembre de 2012). aunque con una tasa de crecimiento diferente por idioma. de una forma mucho más sencilla y rápida que antaño. 2012d) donde 177 . Interfaz de Google Scholar Metrics (versión 2015).Bloque B · Capítulo 8 · Google Scholar metrics Figura 40. Esta segunda versión mejorada de Google Scholar Metrics abría pues el camino a posibles estudios por disciplina y por tanto a facilitar de este modo la comparación de los indicadores proporcionados (básicamente h-index) con los correspondientes a otras bases de datos. En esa línea se sitúan los trabajos de Cabezas-Clavijo y Delgado López-Cózar (2012c.

aunque todavía con importantes limitaciones. Delgado López-Cózar y Repiso (2013) analizan 277 revistas en el área de Comunicación.html . llevan a Delgado López-Cózar y Cabezas-Clavijo (2013) a definir Google Scholar Metrics como una herramienta de indudable ayuda tanto para autores como editores a la hora de localizar las revistas nucleares de un área o de conocer el impacto de una publicación específica en una ventana de citación de 5 años (más adecuada para las ciencias sociales). El 24 de julio de 2013 llegaría la tercera versión del producto 1. 1 http://googlescholar. aunque los distintos errores y limitaciones denunciados con anterioridad seguían vigentes. En este caso.es/2013/07/2013-scholar-metrics-released. se constataba que las actualizaciones de datos suponían un borrado de las versiones anteriores. Cabezas-Clavijo y Delgado López-Cózar (2013) realizan una comparativa para las revistas en biomedicina observando cómo Google Scholar (a través de los ojos de Google Scholar Metrics) obtenía unos valores de h-index un 30% superiores a los obtenidos por WoS y Scopus. doblar la cobertura general de la misma así como reducir el sesgo hacia el idioma inglés. Con ello Google dejaba claras sus intenciones de mostrar datos relativos a los últimos 5 años (Cabezas-Clavijo y Delgado López-Cózar. por lo que resultaba imposible la realización de estudios evolutivos si con anterioridad no se habían almacenado los datos. 2013).html 2 http://googlescholar. los autores observan cómo Google Scholar Metrics proporciona un h-index en promedio 47% y 40% superior que Scopus y WoS respectivamente.es/2014/06/2014-scholar-metrics-released. podrían constituir un desafío futuro para otros productos ya establecidos en el mercado. Los autores destacan la capacidad de Google Scholar Metrics para identificar las revistas principales de la disciplina. su gratuidad y sus criterios alternativos de ranking (como la mediana del h-index en el período). duplicados.blogspot. incapaz de recuperar todas las revistas pertinentes a través de una consulta con la raíz de palabras comunes (por ejemplo “cardiol”). De forma similar. Por otra parte. cuya principal novedad sería la actualización del marco temporal (2008-2012).178 La revolución Google Scholar se demuestra como los criterios de indización adoptados por GSM dejan fuera a casi un 40% de las revistas indexadas en Google Scholar (635 revistas de 1038 identificadas en GS). Se detectaban artículos sin enlace al texto completo. Por otra parte. en la que se volvía a ajustar el marco temporal (2009-2013).blogspot. El 26 de junio de 2014 aparecía la cuarta versión de Google Scholar Metrics 2. Así mismo. Las mejoras del producto.com. con errores en el título o problemas graves en el buscador interno.com.

Circadian Rhythms & Sleep. European Studies.3% (232) son conferencias y el 2.418 el número de publicaciones únicas.338) están clasificadas en más de una categoría. el 93. Adicionalmente. lo que fija en 5.5% de los registros corresponden con revistas académicas. simplicidad) pero una serie de limitaciones importantes si se compara con las prestaciones de otros productos comerciales.435). Esta nueva versión es descrita y analizada de forma completa por Martin-Martin et al (2014). Lipids.100 revistas). lo que supone aproximadamente un 45% del número total de publicaciones en España. Finalmente. Martin-Martin et al (2014) no dudan en calificar Google Scholar Metrics como un producto “low cost”. Los autores estiman que el número total de revistas incluidas en Google Scholar Metrics (versión 2014) es probablemente superior a 40. en lo que supone el trabajo seguramente más exhaustivo realizado hasta la fecha. cobertura. el informe contabiliza el número de publicaciones que pueden ser visualizadas en la versión 2014 sin necesidad de utilizar el buscador interno (un total de 7. and Cryogenics & Refrigeration). aunque su cálculo preciso es imposible de llevar a cabo debido tanto a las limitaciones del buscador interno como a las restricciones impuestas en la visualización de resultados. Dadas las características del producto.7% (1. se estiman sobre las 1.000.Bloque B · Capítulo 8 · Google Scholar metrics caracterizándose por la continuidad con la versión anterior. de las que el 24. Real-time & Embedded Systems. Back & Spine Health. Los autores proponen finalmente una serie de propuestas de mejora con el fin de eliminar la etiqueta “de bajo coste” (Tabla 7): 179 .000 publicaciones. el inglés domina claramente con el 89% de las publicaciones (4. mostrando únicamente 983 revistas escritas en otros idiomas (lógico si tenemos en cuenta que las categorías solamente están habilitadas para las revistas escritas en inglés). con una serie de ventajas (como la gratuidad. En el caso español.2% (118) son repositorios temáticos. mientras que el 4. sin mayor novedad que la desaparición de algunas subcategorías (Microscopy. Entre este número de publicaciones.

tanto por disciplina como por consulta específica. etc. que el equipo de Google Scholar sigue los análisis que sobre sus productos se realizan para mejorarlos y corregirlos. Personalización del período de citación por categoría Los diferentes patrones de publicación y citación entre las diferentes categorías aconsejan a utilizar diferentes ventanas de citación por disciplina. Master list de publicaciones Proporcionar la lista detallada de publicaciones. Opciones de búsqueda Permitir la consulta. el índice de inmediatez o las citas normalizadas. en la medida de lo posible. Exportación de resultados Permitir la descarga y exportación de resultados. así como por la eliminación de muchos de los errores constatados y descritos en el informe de Martin-Martin et al (2015). Esta versión destaca fundamentalmente por la continuidad con las versiones anteriores. Ordenación de resultados Permitir ordenar los resultados por título de la publicación. especialmente para las revistas de ciencias sociales y humanas Versiones previas Permitir el acceso y consulta de las versiones previas. enlaces incorrectos. Tiempo real Actualizar a tiempo real los indicadores (tal y como sí hace Google en los perfiles académicos) Opciones de navegación Permitir la navegación. país. para conocer la evolución del impacto de las publicaciones en el tiempo. valor de indicadores. por país y editorial.). Este hecho muestra. en la que el marco temporal se actualiza a 2010-2014. una vez más. idioma y editorial. incluyendo aquellos con 0 citas. Por ejemplo. en el anuncio de esta nueva . Recomendaciones de mejora para Google Scholar Metrics PROPUESTA DETALLE Indicadores bibliométricos Incluir otros indicadores como la tasa de autocitación de las revistas. por idioma. La posibilidad de seleccionar diferentes marcos temporales según la categoría ofrecería una visión más justa del impacto de las publicaciones. Master list por publicación Incluir el número de documentos por publicación. títulos erróneos. fundamental para verificar los datos proporcionados por Google Transparencia en la clasificación Definir los criterios seguidos para la creación de las categorías y subcategorías. país y editorial Ampliar límite de resultados No restringir o ampliar el límite de 100 resultados por idioma y 20 resultados por categoría/subcategoría y por búsqueda manual. Comunicación con los usuarios Permitir a los usuarios una opción para informar acerca de errores (duplicados. además de por idioma. especialmente el número de conferencias y repositorios incluidos. además de por título de revista. La última versión hasta la fecha de Google Scholar Metrics data del 25 de junio de 2015.180 La revolución Google Scholar Tabla 7.

sin duda significativo. constatan la existencia de 9. viene definitivamente a demostrar la dificultad de realizar un control automático sobre un conjunto dinámico de revistas y publicaciones en un producto gratuito realizado por pocas personas. constituyendo en la actualidad un servicio más completo y de mayor calidad que el ofrecido en su primera versión. el equipo de Google Scholar advierte de los problemas existentes con el control y normalización de los títulos de revistas. advierten hasta 959 formas de referirse a la revista PNAS (Proceedings of the National Academy of Sciences). El problema de la normalización ha estado no obstante presente desde el lanzamiento del producto. en este caso para la subcategoría de Library & Information Science: Figura 41. En cualquier caso. por ejemplo. Este dato. Interfaz de Google Scholar Metrics (versión 2015) 181 . aunque algunas de sus limitaciones más importantes (especialmente el número de revistas mostrado por categoría y la restricción del uso de categorías al idioma inglés) impiden la generalización de su uso. En la figura 41 se puede observar la interfaz actual de Google Scholar Metrics (versión 2015).000 formas diferentes de referirse a la Conference on Computer Vision and Pattern Recognition. la corrección de errores y la robustez del producto han ido mejorando paulatinamente.Bloque B · Capítulo 8 · Google Scholar metrics versión. en el que ya advierten de la enorme cantidad de variantes existentes para referirse a una publicación. Por ejemplo.

2013. Ayllón. Delgado López-Cózar. H-index por idioma en Google Scholar Metrics IDIOMA H-index H-index Median Inglés 377 130 Chino 57 27 Portugués 45 15 Alemán 24 10 Español 34 13 Francés 22 9 Italiano 11 4 Japonés 12 6 7 2 Holandés Pese al enorme sesgo mostrado hacia el inglés (no en el sentido de impacto sino en el de la aplicación de subcategorías). Ruiz-Pérez 2013. . Tabla 8. la combinación de distintas disciplinas en este ranking invalida cualquier tipo de comparación seria. desde el Grupo EC3 se viene realizando un informe anual de las revistas científicas españolas según Google Scholar Metrics (Delgado López-Cózar. a modo de ilustración. Nature ocupa la primera posición con un impresionante valor de h-index igual a 377 en los últimos 5 años. constituyendo un esfuerzo de gran utilidad para conocer la presencia e impacto de las revistas españolas en este buscador. Le sigue en segundo lugar The New England Journal of Medicine (328) y Science (316) en tercer lugar. Ayllón et al 2014. 2015) en el que las publicaciones se clasifican por áreas temáticas y se ordenan en función del h-index. Ruiz-Pérez. portugués y español. ocultas en primera instancia.182 La revolución Google Scholar En lo que respecta al ranking general de revistas para el idioma inglés. así como la mediana de las 100 primeras publicaciones mostradas por idioma. No obstante. En torno a 1. Ayllón. En la Tabla 8 se muestra.000 revistas son listadas cada año (Figura 42). seguido por el chino. el h-index más elevado para cada idioma. el buscador interno ha permitido la localización de revistas. siendo la revista con mayor puntuación en Google Scholar Metrics. En este sentido. Los datos reflejan claramente el predominio del inglés.

se ha explorado la capacidad de GSM para cubrir revistas en disciplinas como la comunicación (Repiso-Caballero. 2014) o la enfermería (Reina. 183 . Número de revistas científicas españolas indizadas en Google Scholar Metrics En la misma línea. 2013. 2014). en más idiomas. Y en ambos casos se obtienen las mismas conclusiones: GSM identifica más revistas. Delgado López-Cózar.Bloque B · Capítulo 8 · Google Scholar metrics Figura 42. Repiso-Caballero. Delgado López-Cózar. 2013. de más países y en más lenguas que los productos tradicionales de revistas patrocinados por Thomson Reuters y Elsevier.

.

Se pueden encontrar desde plugins específicos para gestores de contenidos web como Wordpress que permiten la construcción de una página personal académica. Academia. Estas plataformas permiten la creación online del perfil de cada usuario en el que éstos pueden depositar sus trabajos científicos así como remarcar sus habilidades. algunos repositorios (tanto temáticos como institucionales) han comenzado a generar perfiles académicos a par- . que se fundamentan en las interacciones entre académicos (el sistema les permite compartir material. Así mismo han proliferado las llamadas redes sociales académicas (como ResearchGate. En la actualidad existe una amplia variedad de aplicaciones que permiten a un académico la construcción de su currículum investigador en la Web.Capítulo 9 Google Scholar Citations Los perfiles académicos en la Web Completamente sumergidos en la segunda década del Siglo XXI. la Web se ha integrado en nuestras actividades. Y no hablamos de la simple utilización de un procesador de textos para crear un CV (esto supondría volver a la época en la que los ordenadores se utilizaban como sustitutos de la máquina de escribir).edu o Mendeley). experiencia y actividades. Instrumentos tan aparentemente sencillos y perennes como un currículum académico han sufrido igualmente una transformación justo delante de nuestros ojos. pues éstos tenderán a establecer algún tipo de interacción con otros usuarios con interereses comunes. hasta pequeños widgets que permiten la incorporación en una página de un listado de publicaciones generado en otras aplicaciones externas. que sirven al fin y al cabo de reclamo para facilitar la interacción entre usuarios. sino de los perfiles académicos en la Web. discutir de forma privada o pública y seguir las publicaciones de algún autor determinado). Aunque menos usuales. tanto cotidianas y personales como profesionales. transformando la forma y modo en que nos comunicamos los unos con los otros.

como por ejemplo la búsqueda asistida de material académico relevante. funcionamiento. creación de alertas. podemos distinguir una última categoría de perfiles académicos que son creados de forma automática (o asistida) por un motor de búsqueda académico. el servicio de perfiles académicos creado por Google Scholar. Tras unos meses de prueba. En este caso podemos destacar el proyecto FUTUR. incluido en el producto CitEc (Citations in Economics).186 La revolución Google Scholar tir de los datos disponibles en sus plataformas. con el fin de generar estadísticas de índole bibliométrica a nivel de autor. ya abierto para todos los usuarios. Estos perfiles se caracterizan por hacer uso de la amplia cobertura mundial de la que disponen (los repositorios están limitados a una institución o temática). Entre éstos destacan los perfiles personales de Microsoft Academic Search (desactualizado) y Google Scholar Citations. y c) otros servicios adicionales. ya mencionado con anterioridad. así como de las potencialidades del motor de búsqueda que los sustentan para ofrecer servicios de valor añadido. el servicio de perfiles académicos que pre- . o el servicio Author Citation Profiles. Sin embargo. describiendo sus principales características. Tal y como indica Ortega (2014) en su obra dedicada a los motores de búsqueda académicos. b) la posibilidad de interaccionar con los “currículums” de otros investigadores. Introducción a los perfiles académicos de Google Scholar El 20 de julio de 2011 Google Scholar anuncia la creación de este nuevo servicio de perfiles académicos a través de su blog oficial. aunque el servicio estaba limitado a un pequeño número de usuarios con el fin de testar sus funcionalidades. el producto fue lanzado definitivamente el 16 de noviembre de ese mismo año. sino que el sistema proporciona a) métricas de producción e impacto. Tanto las redes sociales académicas como los perfiles académicos de los repositorios se nutren de los documentos que los propios investigadores (o en quien éstos deleguen) han depositado en la plataforma o repositorio. ventajas y limitaciones. etc. se puede observar la existencia de una tendencia clara hacia la creación de un currículum académico online y multiplataforma en el que no sólo aparecen listadas las publicaciones de un autor como en un CV clásico o una página web personal simple. Por tanto. de la Universitat Politècnica de Catalunya. En este capítulo abordaremos el servicio de Google Scholar Citations. dentro del conglomerado de servicios del repositorio RepEC.

Además. El usuario debía activar personalmente el servicio. El sistema detecta automáticamente que existe un perfil público (este concepto será explicado más adelante) cuyo nombre coincide con la cadena de caracteres buscado. Aunque la utilización de los perfiles personales (y la ulterior explotación de sus datos) ha servido posteriormente a los investigadores para conocer innumerables aspectos acerca de la producción e impacto de los autores.Bloque B · Capítulo 9 · Google Scholar Citations sentaba Google Scholar difería sustancialmente de los existentes hasta la fecha. Al igual que se ha señalado en capítulos anteriores. el sistema lo incorpora en la página de resultados. Estar al día mediante la configuración de alertas personalizadas. Estas tres características juntas dotaban a Google Scholar Citations (GSC) de unas propiedades únicas en el mercado de los perfiles académicos online. Saber quién cita. Conocer y dar a conocer algunos indicadores bibliométricos. En la figura 43 se ha realizado una búsqueda libre por nombre de autor (baeza-yates) en el cajetín general de Google Scholar. cuándo y a qué documentos de un perfil. Este sistema de recomendación de resultado permite que los usuarios interesados en localizar una o varias obras de este autor (pero tal vez sin una idea exacta de qué obras desea localizar. Difundir las publicaciones científicas y otros trabajos académicos. Las principales ventajas que el uso de GSC puede aportar son las siguientes: —— —— —— —— —— Mejorar la visibilidad e impacto de un autor. el perfil se encontraba completamente vacío a la espera de que el usuario fuera rellenándolo con sus publicaciones (en principio solamente aquellas indizadas en Google Scholar). Una vez activado. los objetivos de Google Scholar se dirijen hacia la localización de material académico y no al posible uso posterior de los datos albergados. resaltándolo de éstos y mostrando los datos más importantes (adscripción y citas recibidas). De este modo. La integración de los perfiles académicos en las páginas de resultados ante determinadas búsquedas (Figura 43) proporciona suficientes pistas acerca de la utilidad de estos perfiles en los procesos de búsqueda de información. la idea original de Google Scholar distaba de esa finalidad métrica. no necesariamente el propio. puede que algunas que traten un determinado tema) puedan filtrar su búsqueda al entrar 187 . el servicio era lo suficientemente abierto y permisivo como para permitir al usuario la creación de cualquier perfil. Todo ello sin contar la plena disponibilidad de la base de datos de Google Scholar como telón de fondo para alimentar los perfiles.

pues sí exigirá un mayor trabajo y cuidado por parte de los usuarios. deberemos pulsar en la opción de menú denominada “My citations”. Integración de perfiles académicos en Google Scholar <https://scholar. Acceso al perfil Una vez disponemos de una cuenta de correo electrónico.google. El principio bastará con tener una cuenta de Gmail creada. ya habremos iniciado sesión). .com>. El mantenimiento y la calidad de los datos contenidos en el perfil ya será harina de otro costal. debemos iniciar sesión registrada en Google (si hubiéramos iniciado sesión previamente en algún producto o servicio de Google. acceso al perfil y creación del perfil).com/scholar?hl=en&q=baeza-yates> Creación de un perfil académico en Google Scholar La creación de un perfil académico es sencilla y consiste en tres pasos (creación de la cuenta. rápido y seguro localizar y. acceder al documento deseado. se describen estos pasos de forma más detallada: Creación de la cuenta La creación de un perfil académico exige una cuenta de correo electrónico. Seguidamente. En la figura 44 se muestra este paso de forma gráfica. En este punto. si es posible.188 La revolución Google Scholar en el perfil académico correspondiente. A continuación. Se aconseja por otra parte que sea una cuenta personal y no institucional. como Gmail o Chrome. Este paso es absolutamente obligatorio. en el que les será más cómodo. accederemos a la siguiente dirección: <scholar. Figura 43.google.

Figura 45. al pulsar en “My Citations” accederemos al formulario de registro del perfil formado por tres pasos: perfil. afiliación institucional. y estemos por tanto en el proceso de creación del mismo. artículos y actualización. áreas de interés y página personal (Figura 45). Registro de un perfil en Google Scholar Citations Veamos estos campos más detenidamente: En cuanto al campo “Name”.Bloque B · Capítulo 9 · Google Scholar Citations Figura 44. Acceso a Google Scholar Citations Creación del perfil En el caso de que sea la primera vez que accedemos al perfil. Se aconseja siempre utilizar el estilo de firma normalizado (independientemente de todas aquellas variantes de firma que el autor o 189 . email de verificación. el usuario deberá incluir su nombre completo. Perfil Los campos que debemos cumplimentar en este primer paso son los siguientes: nombre.

. empresa. por ejemplo 1. Este correo no tiene por qué ser necesariamente el mismo con el que el autor se ha registrado en el sistema. Nótese que no existe restricción alguna para introducir el campo nombre. por lo que se aconseja no extenderse demasiado. el equipo de Google Scholar Citations incorporó un servicio de afiliación institucional controlada (que será comentado en secciones posteriores). si todavía tenemos espacio. éste podrá 1 Cuidado en todo caso con esta práctica. El nombre incluido en este campo será tanto el nombre que aparecerá posteriormente en el perfil como la cadena de caracteres que se utilizará como búsqueda por defecto para localizar trabajos a incluir en el perfil. El campo del correo electrónico es obligatorio. su institución (universidad. Si el perfil es privado. se recomienda incluir la posición o cargo ocupado por el investigador. Con el fin de que este sistema de control de autoridades funcione con mayor precisión. El sistema enviará automáticamente un correo a la dirección indicada con el fin de validar la creación de la cuenta (pues cualquier usuario podría incluir una dirección de correo falsa o simplemente de otra persona sin su consentimiento). instituto de investigación. Es decir. etc.190 La revolución Google Scholar autora hayan podido utilizar a lo largo de su carrera) para evitar variantes que puedan impedir una localización completa de contribuciones y citas a éstos. su unidad (grupo de investigación. podría incluirse el nombre de una persona (que será lo más usual) pero también el de otros agentes de investigación. El sistema tiene una longitud limitada de caracteres. organización. de una editorial o de algún grupo de investigación. la validación solamente será necesaria para convertir el perfil en público. lo que permite que un usuario pueda utilizar otro correo distinto o incluso cumplimentar el perfil de otra persona.) y finalmente. Así mismo se recomienda a las instituciones que desarrollen políticas específicas para estimular el uso de formas estandarizadas. pues Google Scholar detecta que el perfil no es de usuario y limita su visibilidad. como por ejemplo el nombre de una revista. Así mismo. Sin embargo. facultad o departamento). el país. no mostrándolo en ocasiones en la página principal de resultados tal y como veíamos en la Figura 42. El campo “Affiliation” debe servir para que los autores incluyan su institución. con el fin de que todos los autores de una misma institución puedan ser localizados y recuperados bajo este campo de forma normalizada. se aconseja a los autores que incluyan en este campo siempre la forma estandarizada de su institución (o al menos la variante adoptada por Google Scholar) en su lengua original (sin traducir). centro de investigación. Durante julio de 2015.

keywords o email verificado. En todo caso. siempre se recomienda tomarse el tiempo necesario para cumplimentarlos con el mayor rigor. organización. lo usuarios podrán acceder a la página personal. Pese a ello. aunque nunca se valide el correo enviado a la dirección de correo electrónica incluida en este campo. en caso de que dispongan de ella.es/citations?user=fd_7rQ4AAAAJ> no posee datos de afiliación.). Finalmente. el campo “Homepage” está destinado a que los autores incorporen el URL de su página personal académica. Así mismo. los posibles contenidos académicos incorporados a este sitio web podrán ser incluidos en el perfil. y el correo institucional que sirve para validar la cuenta. el perfil público <https://scholar. En este caso. mejorando su visibilidad) y. Por tanto. Pese a los distintos controles de seguridad indicados en este apartado (como el del correo electrónico).Bloque B · Capítulo 9 · Google Scholar Citations existir. En este caso el sistema recomienda que se utilice una cuenta de correo electrónico institucional (universidad. etc. El sistema permite la incorporación de hasta 5 keywords. esta página será indizada por los robots de Google Scholar e incorporada dentro del espacio académico web. empresa. como por ejemplo el Derecho. en la actualidad existen perfiles públicos que los incumplen 2. excepto en temas muy locales y específicos. Si se desea una mayor proyección o visibilidad internacional. centro de investigación. una vez el perfil esté creado. sí se recomienda en este caso la adopción del término en inglés.google. lo más importante. 191 . empresa u organismo en el que trabajen. En este caso se aconseja igualmente la utilización de términos estandarizados y en la forma y género adoptados por la mayoría de los usuarios. se separa el correo electrónico personal de control del perfil. cualquier otro sitio web creado de forma independiente será de gran utilidad. Todos estos campos podrán ser posteriormente editados. institución. De este modo. El campo “Areas of interest” sirve a los autores para incluir palabras clave que describan sus intereses académicos o sus principales líneas de trabajo e investigación. se recomienda incorporarla. si los autores disponen de una página oficial creada dentro del dominio académico de la universidad. 2 Por ejemplo. pues de ello dependerá en una parte importante el buen comportamiento del sistema a la hora de localizar la producción y citas correspondientes con las que se alimente el perfil académico. pues aparecerá en el perfil público (por tanto. recomendamos encarecidamente cumplir con las normas indicadas por el equipo de Google Scholar.

192

La revolución Google Scholar

Artículos
Una vez tengamos cumplimentados todos los datos descriptivos podremos seguir al siguiente paso del proceso de creación del perfil, los
artículos. Esta segunda pantalla está dividida en cuatro zonas: el tipo
de búsqueda (por artículos o por grupos de artículos), el buscador, los
resultados y las métricas asociadas a los resultados (Figura 46).

Figura 46. Búsqueda de artículos en un perfil en Google Scholar Citations

El sistema permite la búsqueda tanto de artículos individuales como
de grupos de artículos (agrupados por autor). Por defecto, en el cajetín
de búsqueda aparecerá la cadena de caracteres que hayamos introducido en el campo “Name” del paso anterior. Por ejemplo, si seleccionamos
la opción de añadir artículos, el sistema devolverá todos aquellos artículos relevantes ante esta búsqueda. Al lado de cada resultado tendremos
disponible una casilla para seleccionar un artículo e incluirlo en el perfil.
Una vez se añada un artículo, los datos correspondientes se actualizarán en la parte izquierda de la pantalla, mostrando tanto el número
de artículos incorporados al perfil hasta ese momento como el número
total de citas recibidas por dichos artículos.
El cajetín de búsqueda está totalmente habilitado para que podamos
realizar distintas búsquedas, y no sólo la correspondiente al nombre del
autor. Aunque las opciones no son tan extensas como las disponibles en
Google ni en Google Scholar, puede servir para filtrar más adecuadamente las búsquedas. En este momento de la creación del perfil se recomienda realizar una búsqueda muy general e incluir algunos pocos registros
al perfil, con el fin de finalizar el proceso de creación del mismo.
Más adelante ya tendremos tiempo para volver a esta pantalla de
edición y dedicar una buena parte de nuestro tiempo a ir probando con

Bloque B · Capítulo 9 · Google Scholar Citations

paciencia nuevas consultas, identificando artículos y mejorando la cobertura y precisión de los datos de nuestro perfil. En la sección dedicada
a la gestión del perfil volveremos por tanto a este importante punto.
Actualizaciones
Finalmente llegamos al último paso para la creación del perfil. En este
caso el sistema nos solicita que decidamos el proceso de actualización
del perfil. Se puede optar por una actualización automática o manual
(Figura 47).

Figura 47. Modos de actualización de un perfil en Google Scholar Citations

La actualización automática supone que el sistema se autoregula.
Dados los artículos incluidos en el sistema, los intereses incorporados
como keywords y el nombre del perfil, el sistema es capaz automáticamente de identificar nuevas aportaciones e incorporarlas automáticamente al sistema, actualizando con ello los datos bibliométricos pertinentes.
Por el contrario, la opción manual implica que el sistema no introduce ningún registro sin el consentimiento previo del autor. Para ello se
envía un correo electrónico a la dirección marcada por el usuario cada
vez que un nuevo recurso tiene altas probabilidades de corresponder
con una contribución a ser incluida en el perfil. De este modo el usuario
puede validar o no dicha inclusión.

193

194

La revolución Google Scholar

En términos generales, el sistema automático se recomienda a usuarios que tengan el perfil muy cuidado y pulido (las incorporaciones serán
más fiables y acertadas) y que lo revisen con cierta periodicidad. De esta
forma, ante la incorporación de un registro equivocado, podrían darse
cuenta y eliminarlo manualmente a la mayor brevedad. Por el contrario,
para aquellas personas que no actualicen demasiado el perfil, se recomienda una actualización manual, pues la incorporación de muchos registros equivocados y la no edición o eliminación de éstos por el usuario
podría dar lugar a una mala imagen pública del perfil.
Una vez elegida la modalidad de actualización del perfil, el usuario
ya podrá finalizar el proceso y acceder al perfil académico creado. En la
figura 48 (arriba) se muestra la pantalla de un perfil ficticio creado para
un investigador. Como podemos observar, el perfil está completamente
vacío (no se ha incorporado ningún artículo en la fase de creación) y
es privado. En la figura 48 (abajo), se muestra el perfil completamente
creado y público.

Figura 48. Perfil privado (arriba) y público (abajo) en Google Scholar Citations

Bloque B · Capítulo 9 · Google Scholar Citations

Un perfil privado significa que solamente podrá ser visible por el
usuario que lo haya creado, a partir de su pantalla de inicio en Google
Scholar una vez ha iniciado sesión en el navegador. Nadie más podrá acceder a este perfil ni a la información que contiene. Del mismo modo, no
aparecerá en los resultados de ninguna búsqueda. Por el contrario, un
perfil público podrá ser accedido libremente por cualquier usuario sin
necesidad alguna de haber iniciado sesión. Este perfil aparecerá igualmente en los resultados de búsqueda. Además, Google Scholar nos marcará la existencia de un perfil público subrayando el nombre del autor
correspondiente en el registro bibliográfico de un resultado.
Los perfiles permanecen privados por diversas razones. Por ejemplo,
puede que estén en plena construcción y sus responsables no deseen
hacerlos públicos hasta que estén completamente construidos. Es asimismo posible que se estén realizando pruebas o ejercicios con fines de
formación (como el ejemplo de la figura 48). En otros casos, algunos investigadores desean mantenerlo únicamente para un uso personal (conocer su impacto), pero no desean que otras personas puedan acceder a
él, bien porque no deseen entrar en un juego de comparaciones o competencia con colegas o simplemente porque los datos tal vez son peores
de los esperados y no se desea dar una mala imagen académica pública.
En cualquiera de los casos, creemos con sinceridad que los profesores de universidades e instituciones públicas deberían mantener estos
perfiles públicos en aras a ofrecer una mayor transparencia hacia los
ciudadanos acerca de su quehacer como investigadores, y que estas instituciones deberían establecer las actividades necesarias tanto de formación como de difusión para que sus investigadores mantuvieran un
perfil actualizado, con el fin de aumentar la visibilidad académica de la
institución.

Gestión de un perfil académico en Google Scholar

Una vez el perfil está creado correctamente, el siguiente paso consiste en su edición, gestión y mantenimiento. Con el propósito de ilustrar
este proceso, utilizaremos un perfil académico real, en este caso perteneciente a uno de los autores (Figura 49). De este modo podremos
ilustrar todo el proceso de edición personal sin necesidad de recurrir a
perfiles de otras personas o perfiles no existentes.
En la figura 49 se puede observar la composición de un perfil público
cuando se accede a éste como usuario registrado. Se pueden distinguir
las siguientes cinco áreas:

195

196

La revolución Google Scholar

—— Área personal: información descriptiva del perfil, correspondiente
principalmente a un/a autor/a, aunque podría pertenecer, tal y como
se comentó anteriormente, a otras entidades como revistas, editoriales o grupos de investigación.
—— Buscador interno: este buscador permite localizar perfiles académicos a partir de la búsqueda directa por palabras clave. Es por tanto
diferente al buscador de Google Scholar.
—— Información bibliométrica: se proporcionan diversas métricas de impacto académico.
—— Área de información: contiene los registros incluidos en el perfil.
—— Área de co-autores: muestra los autores que han colaborado con el
autor en las publicaciones incluidas en el área de información.
A continuación desgranaremos cada una de estas áreas con el fin de
conocer al detalle los distintos servicios y opciones de los perfiles académicos de Google.

Figura 49. Perfil público en Google Scholar Citations

Bloque B · Capítulo 9 · Google Scholar Citations Información personal Si pulsamos en el botón de editar situado en el área de información personal. 197 .es). la afiliación institucional y las etiquetas correspondientes a las palabras clave. con el propósito de no ofrecer información personal y de validar la afiliación institucional. Por otra parte. podemos acceder a la edición manual de esta información (Figura 50). siendo este proceso siempre reversible. existen tres campos que aparecen como hiperenlaces en el perfil público: la web personal. sino únicamente el dominio (en este caso upv. arriba). Podemos observar cómo el email de verificación no aparece en su forma completa en la versión pública (figura 50. la información que aparece es la que el autor introdujo en el proceso de creación del perfil (concretamente en el primer paso). Información personal en Google Scholar Citations Por defecto. Figura 50. Igualmente tenemos la opción de convertir el perfil en privado o público de forma sencilla.

Por último. Este servicio fue incluido por el equipo de Google Scholar Citations durante el verano de 2015. las cinco keywords que el sistema permite como máximo incluir en el campo de áreas de interés se transforman automáticamente en hiperenlaces que permiten reunir en una nueva página de resultados a todos los perfiles que compartan una misma etiqueta. Aparte de las innumerables ventajas que supone disponer de un control de autoridades para las instituciones. el sistema redirije a una pantalla de resultados en la que se recopilan todos los perfiles en los que Google Scholar ha sido capaz de identificar esta misma afiliación (Figura 51). incluyendo diversas variantes recogidas por el sistema. Estas limitaciones se deben fundamentalmente a que el control institucional se realiza a partir del cumplimiento de dos criterios: introducción de una variante aceptada de la institución en el campo de afiliación y la inclusión de un correo electrónico institucional que concuerde con esta afiliación. el autor debe incluir un único URL válido (no se pueden incluir dos sitios web). tales como errores metodológicos. Es importante mencionar que la etiqueta del hiperenlace es siempre “homepage”. no reconocimiento de instituciones con pequeños errores de escritura. El análisis pormenorizado del mismo se puede localizar en un informe realizado por OrdunaMalea et al (2015). ordenados por . Esta práctica sin duda penaliza el posicionamiento web de estas páginas. Respecto a la afiliación personal. podemos observar cómo en la parte inferior de la figura 50 se ha introducido el término “Universitat Politècnica de València”. títulos uniformes erróneos. Cualquier otro sitio web similar (como el perfil público de Mendeley) o página web personal podrán ser incluidos. en el momento de redactar estas líneas este sistema adolece de una serie de limitaciones. En la figura 50 se ha optado por incluir la dirección correspondiente a otro perfil académico (en este caso ResearchGate) con el propósito de que Google Scholar índice bien esta plataforma.198 La revolución Google Scholar En cuanto a la web personal. por el momento. En la parte superior de la figura se muestra como esta afiliación (y sólo esta parte de toda la información contenida en este campo de afiliación) se ha transformado en un hiperenlace. de identificar más de una afiliación por perfil o las unidades internas de una institución (facultades o escuelas. de gran importancia especialmente en el mundo anglosajón). pues es un lugar donde el autor puede controlar la información que deposita en la web académica. Al pulsar sobre éste. diversos problemas en la desambiguación de instituciones y acrónimos o la incapacidad. y no el nombre del sitio web o el URL.

660 etiquetas extraidas de un total de 26.google. el sistema permite la búsqueda directa por etiqueta a través del comando especial “label” (figura 51). En este sentido cabe destacar los trabajos de Ortega y Aguillo (2012). Adicionalmente.682 perfiles observan que la etiqueta más frecuentemente utilizada en la muestra era “Machine learning” (1. Figura 51.es/citations?view_op=search_authors&hl=es&mauthors=label:altm etrics> El análisis del uso de las etiquetas puede dar lugar a interesantes análisis temáticos en Google Scholar. quienes a partir de un total de 6. Esta opción es muy útil para navegar por intereses temáticos y localizar a los expertos en diversas disciplinas. Búsqueda y navegación por etiquetas en Google Scholar Citations <https://scholar.Bloque B · Capítulo 9 · Google Scholar Citations número de citas totales recibidas. seguida de “Artificial Intelligence” (998) y “Computer vision” (989).243 usuarios). confirma las etiquetas 199 .397 etiquetas. a partir de un total de 521. Este estudio es posteriormente ampliado por Ortega (2014) quien.

al dividirse en función del término por el que hayan optado a la hora de configurar el perfil. no funcione adecuadamente. y al igual que ocurre con las afiliaciones temáticas. . seguida de “Artificial Intelligence” (4. Se aconseja el término en plural e inglés para la mayoría de las disciplinas. no la de generar rankings competitivos. pequeños errores tipográficos (por ejemplo. en solitario. en algunos casos. siempre se recomienda tomarse un tiempo prudencial para elegir los mejores términos y asegurarse de su corrección y funcionamiento.219).661 usuarios). especialmente en las humanidades y ciertas ciencias sociales como las jurídicas. por tanto. Por todo ello. Esta opción debe evitarse en la medida de lo posible. incorporan asimismo una serie de limitaciones. la libertad a la hora de elegir términos provoca que los usuarios utilicen términos no adecuados (enseñanza-aprendizaje). Por un lado. o bien precisan de otro término más ajustado (tal vez en este caso “international economic law”). En otros casos. De la misma forma.176) y “Computer vision” (3. empleados por tanto por menos usuarios y donde puedan por tanto aparecer en mejor posición o. a excepción de aquellas con importante carga local. incluir “almetrics”) puede significar que el sistema no detecte el error y que la etiqueta. En ocasiones esto se debe a que los usuarios buscan cierta exclusividad.200 La revolución Google Scholar más usadas: “Machine learning” (4. en cierto desuso (análisis documental) o simplemente inventados (curriculum en ciencias de la información). utilizar términos poco comunes. pues las etiquetas cumplen la función de agrupar perfiles bajo intereses comunes. no sólo por la utilización de sinónimos o expresiones similares sino por variantes de género (data analytic vs data analytics) o de idioma (bibliometria vs bibliometrics). Esto puede provocar inevitablemente una indeseada dispersión de la comunidad científica presente en Google Scholar Citations. Si bien el uso de etiquetas proporciona un valor añadido de indudable interés práctico. Se deben utilizar preferentemente las etiquetas ampliamente aceptadas por la comunidad correspondiente. la falta de control terminológico produce la existencia de variantes indeseadas. Es decir. Valga como ejemplo la utilización de los términos “derecho internacional privado” y “private international law” para observar cómo en ciertas áreas los términos en inglés no resultan los más adecuados. permitiendo la generación de listados temáticos y propiciando la fácil localización de perfiles a los que tal vez deseemos realizar un seguimiento especial.

Limitaciones funcionales de las etiquetas en Google Scholar Citations Herramientas de gestión Las principales herramientas de gestión de los perfiles se encuentran localizadas en la zona cuatro. acústica o derecho internacional público. como zoología. Figura 52. El sistema además incluiría al autor en dichos rankings temáticos con el número total de citas del autor.Bloque B · Capítulo 9 · Google Scholar Citations Finalmente. —— Combinar: permite fusionar dos o más referencias. habiendo obtenido el grueso de sus citas en otras disciplinas. Nada impide que en el perfil de la figura 50 se puedan introducir por ejemplo las áreas temáticas que se deseen (siempre que no se superen los cinco términos). en la que se muestran los tres primeros autores para la etiqueta “scientometrics”. y son las siguientes: —— Añadir: permite incluir nuevas publicaciones (en Google Scholar o bien manualmente) —— Exportar: permite exportar resultados seleccionados. el tercer gran problema es la falta de verificación. Este problema puede observarse en la figura 52. donde dos de ellos han publicado en esta área de forma esporádica. 201 . correspondiente al área de información.

En la cabecera del listado podemos localizar los dos principales botones de edición. En la figura 53 se observa . el sistema nos dirige a una pantalla prácticamente idéntica a la obtenida en el paso dos de la creación del perfil (Ver figura 46). la cantidad de publicaciones puede ser enorme. borrar la cuenta o ver la papelera de artículos. Figura 53. Grupos de artículos Para ciertos investigadores senior. pero con la novedad de que las opciones de ingreso de nuevos documentos se han ampliado. Este listado puede ser ordenado por título. Google Scholar ofrece la posibilidad de añadir grupos de artículos de una sola vez. por fecha de publicación o por el número de citas totales recibidas. Por tanto. En la figura 53 observamos la pantalla de ingesta de documentos en Google Scholar Citations. El botón “More” es un desplegable que muestra las opciones de actualizar el perfil. Al pulsar en el botón de añadir registros. —— Papelera: lugar donde se depositan los artículos eliminados. —— Actualización: permite actualizar el perfil. Veamos con mayor detenimiento cada una de estas opciones. la adición individual puede resultar muy laboriosa. Añadir grupos de artículos en Google Scholar Citations El producto ofrece tres posibilidades para añadir nuevos recursos al perfil: grupos de artículos. artículos individuales y entrada manual.202 La revolución Google Scholar —— Eliminar: elimina los artículos seleccionados. Por otro lado. Para solventar este problema. En el área de información encontramos el listado de contribuciones añadidas al perfil durante el proceso de creación del mismo. el botón “Add” nos abre la posibilidad de incluir nuevos registros al sistema. que pueden ser recuperados posteriormente.

incluir el comando “author” para delimitar que deseamos buscar a un autor. y posteriormente incluir un comando OR para realizar combinatorias para distintas variantes de nombre. Por tanto. Un mismo autor podría aparecer en distintos resultados si el sistema lo hubiera detectado con diversas variantes de nombre. para poder seleccionar solamente aquellos pertinentes y rechazar el resto. y el sistema devuelve conjuntos de artículos agrupados bajo un nombre de persona. Cada resultado corresponde con una forma normalizada de un autor dentro de Google Scholar. no modificables. Adicionalmente. Es decir. La página de resultados está delimitada a 10 resultados por página. En el ejemplo de la figura 53.Bloque B · Capítulo 9 · Google Scholar Citations la interfaz correspondiente. De esta forma. El número máximo de páginas de resultados son 100. como sucede en el caso de los grupos. se podría realizar la siguiente búsqueda: <author:”a Alonso arroyo” OR “Adolfo Alonso”>. los términos de la búsqueda han sido “Emilio Delgado”. El cajetín de búsqueda permite la utilización de diversos comandos para filtrar mejor la consulta. El usuario puede realizar una búsqueda en el cajetín general situado en la parte superior de la pantalla. el usuario debe marcarlo y a continuación pulsar en el botón de añadir al perfil 203 . ofreciendo por tanto un máximo de 1. cada una de ellas con su correspondiente conjunto de documentos.000 resultados por consulta. que coincide aproximadamente con los términos usados para la búsqueda. el usuario puede elegir incorporar todos estos artículos de golpe a su propio perfil. En el momento en que se localiza un artículo pertinente. el proceso de localización y navegación resulta tedioso y poco amigable. Por ejemplo. otros comandos como “filetype” o la combinación de varios de éstos no proporcionarán resultados precisos. Artículos individuales La opción de artículos individuales implica la búsqueda directa de contribuciones y no de autores. se le da la oportunidad de revisar cada uno de los artículosque conforman el conjunto. El sistema devuelve un conjunto de autores. Igualmente se podrán realizar consultas por términos específicos (keywords) o utilizando comandos especiales como “site” (para delimitar el espacio web en el que deseamos realizar la búsqueda) o “allintitle” (para delimitar la búsqueda en el título del documento). al que el sistema le ha asignado automáticamente una serie de artículos como autor.

no localizable en el buscador interno). . Para cada tipo se ofrecen los campos de descripción oportunos de forma que el usuario mismo los cumplimente (figura 55). por tanto. patente. libro. que por diversas razones no haya sido indizado en el sistema. otras). Podría tratarse de artículos publicados en revistas en papel no digitalizadas. tesis que no han sido incorporadas a Google Scholar o cualquier tipo de informe técnico.204 La revolución Google Scholar (figura 54). El usuario puede asimismo seleccionar más de un documento a la vez. y los datos bibliométricos se actualizarán automáticamente. mientras que otras no. Figura 54. El sistema devuelve una serie de contribuciones. algunas de las cuales ya están añadidas en el perfil. tesis doctoral. En estas últimas se ofrece la posibilidad de seleccionarlas e incluirlas en el perfil. Automáticamente el registro se incorporará a la zona de información del perfil. Esta opción se ofrece para aquellos casos en los que el usuario desee incorporar un registro que no esté indizado en Google Scholar (y. capítulo de libro. En este caso. Entrada manual La última opción para incluir nuevos registros es la entrada manual. Adición de nuevos registros en Google Scholar Citations En la figura 54 se puede observar un ejemplo para la búsqueda “Delgado López-Cózar”. casos judiciales. conferencia. el servicio ofrece la posibilidad de elegir la tipología documental correspondiente (artículo de revista.

esta opción puede ser útil a los usuarios que deseen dar a conocer la existencia de una obra realizada a los seguidores de su perfil o comunidad. los botones de edición situados en la cabecera de la tabla se modifican para proporcionarnos opciones complementarias (figura 56). Es decir. Si volvemos al listado de documentos en el área de información del perfil. pero en ningún caso significará que el documento esté indizado en Google Scholar. Figura 56. no existirá ningún hipervínculo al documento a texto completo. Edición del listado de registros en Google Scholar Citations 205 . A pesar de esta limitación. Cuando éste se activa. podremos observar que en la parte izquierda de cada registro aparece un casillero.Bloque B · Capítulo 9 · Google Scholar Citations Figura 55. Entrada manual de registros en Google Scholar Citations En este punto es importante remarcar que el hecho de describir un nuevo documento en esta interfaz implica que su referencia bibliográfica aparecerá en el perfil del autor. simplemente aparecerá su descripción bibliográfica.

El proceso de comprobación de duplicados y la correcta fusión es un paso necesario para la creación de un perfil sin errores. resumen y citas recibidas). Adicionalmente podemos ver un gráfico evolutivo del número de citas recibidas por año. al pulsar sobre éste. La opción de combinación de registros (Merge) solamente aparece cuando se activan como mínimo dos casillas. Endnote. así como las versiones que el sistema tiene agregadas para ese registro. junto con las citas totales recibidas. sí permiten la mejora del sistema a largo plazo. y el resto se eliminan. en aquellos casos en los que el sistema haya sido incapaz de agrupar correctamente las distintas versiones. permitiendo eliminar el registro del perfil o exportar la descripción bibliográfica del mismo a diferentes formatos (BibTex. volumen. editorial. es el método que está utilizando Google Scholar para poder detectar versiones no agrupadas. fecha de publicación. el sistema permite fusionar distintos registros duplicados. de forma que. Al registro resultante se le computan todas las posibles citas recibidas por cada una de las versiones. Edición de registros Una vez un registro ha sido incluido en el perfil mediante la opción de añadirlo a la colección. El área de edición nos muestra una ficha descriptiva de la publicación.206 La revolución Google Scholar En el caso de seleccionar uno o varios registros. las opciones de borrado (Delete) y exportación (Export) se activan. Ciertamente. éste aparecerá en la zona de información del perfil. se nos muestra la información bibliográfica (autores. respectivamente. . Así mismo. el usuario accederá a la zona de edición de registros bibliográficos. RefMan y CSV). En la figura 57 se muestra a modo de ejemplo un registro tal y como aparece al pulsar su título en el listado del área de información bibliográfica. A continuación. El título de cada registro constituirá un hiperenlace. ¿quién mejor que el propio autor para indicar cuándo dos registros son realmente distintas versiones o copias del mismo? Aunque estos cambios no se aplican automáticamente a los datos de versiones de los registros en los resultados de búsqueda en Google Scholar (sólo se aplican al perfil donde se aplican. si siquiera a los perfiles de los posibles co-autores). El usuario decide cuál de los documentos fusionados es el principal (cuya descripción bibliográfica se mantiene). En este caso. el título nos dirige directamente hacia la fuente original del documento. En primer lugar.

Edición de registros en Google Scholar Citations En la parte superior de la pantalla. Figura 58. podremos reasignar la tipología documental. desde la cual podremos editar el contenido de los campos. eliminar el registro o editarlo. accederemos a una interfaz similar a la obtenida en la figura 55. pudiendo eliminar o desunir versiones específicas (Figura 58).Bloque B · Capítulo 9 · Google Scholar Citations Figura 57. En este caso. Si pulsamos sobre esta última opción. corregir algún dato descriptivo que el sistema hubiera capturado de forma errónea o gestionar las versiones del registro. el sistema nos ofrece tres posibilidades: exportar los datos descriptivos. Edición de registros en Google Scholar Citations 207 .

Google Scholar Citations muestra tres: número de citas recibidas. Este valor de citas es un hipervínculo . las métricas y el gráfico de evolución de citas por año (Figura 59). En el caso de los indicadores. De esta forma. Indicadores bibliométricos en Google Scholar Citations Debajo de la información métrica se muestra un gráfico de barras. extensible al pulsar sobre éste.208 La revolución Google Scholar Indicadores bibliométricos El área de indicadores bibliométricos está compuesta por dos elementos. La información métrica aparece igualmente en el área de información bibliográfica. Esta funcionalidad sirve de gran ayuda para ver la proyección e impacto en el tiempo de un/a autor/a. útil para observar el impacto de los autores emergentes. h-index y el i10-index (métrica propuesta por Google Scholar mediante la que se cuantifica el número total de artículos que han recibido al menos 10 citas). que pueden ser infravalorados en los indicadores totales. donde se muestra el número de citas totales recibidas por registro. Estos datos se muestran tanto a nivel total como para los cinco años anteriores al año actual. en el que se muestra el número de citas por año al pasar el ratón por la barra correspondiente a cada año. Figura 59. Google Scholar adopta en primer lugar el número de citas totales y el h-index como indicadores clave en el rendimiento investigador y hace hincapié en el rendimiento reciente.

como ya hemos visto con anterioridad (ver Figura 57). filtrado temporal. para el perfil de autor determinado. así como el número de citas de cada una de ellas.). versiones. esta información se encuentra de forma más amigable en la interfaz de información bibliográfica del registro. En este caso. Si se pulsa en el asterisco. pulsando en “View all”. Exactamente lo mismo que ofrece la pantalla general de resultados de Google Scholar. Aunque el filtrado temporal permitiría conocer el número de resultados (y por tanto de citas) por año.Bloque B · Capítulo 9 · Google Scholar Citations tal que. Esta información de sugerencias sólo se visualiza cuando un autor accede a su perfil iniciando sesión. etc. pero dentro de un conjunto limitado de registros que constituyen los documentos citantes del registro seleccionado previamente en el perfil. de esta forma. el sistema muestra una ventana emergente en la que se puede visualizar un listado con todas las versiones unidas para ese registro. De éstos. exportación de información bibliográfica). Una vez el autor ha aceptado la inclusión de aquellos autores con los que efectivamente ha publicado conjuntamente. especialmente si el autor ha realizado cualquier modificación fusionando registros o deshaciendo versiones. el sistema identifica automáticamente los autores que han publicado conjuntamente con este autor. al pulsar sobre él. al pulsar en cada nombre el usuario puede acceder al perfil público correspondiente. esta información aparece en la parte pública del perfil (Figura 60). Co-autores La última zona identificable en la página principal del perfil académico de Google Scholar Citations es la información de co-autores. aquellos que tienen un perfil creado y público se muestran como sugerencias para añadir como co-autores. Aunque por defecto únicamente aparece un número limitado de coautores en la pantalla (por razones de espacio). el sistema permite acceder a una página de resultados en la que se reco- 209 . Este símbolo aparece cuando el sistema tiene dudas acerca de la contabilización realizada. Esta pantalla ofrece las prestaciones de búsqueda de Google Scholar (búsqueda por palabra clave. mientras que para cada documento citante se ofrece el registro bibliográfico completo (citas recibidas. En algunos registros podemos observar un asterisco justo al lado de la indicación del número total de citas recibidas. El nombre de estos co-autores aparecen como hipervínculos. el sistema nos dirije a una pantalla de resultados en la que se listan todos los documentos citantes.

210 La revolución Google Scholar pilan todos los co-autores aceptados por el autor en su perfil. adscripción institucional. Para cada uno de ellos aparece la información básica (fotografía. que no parece seguir ningún patrón lógico (citas totales recibidas o apellidos. el sistema permite la posibilidad de eliminar a algún co-autor (en el caso de que no deseemos que figure en el listado por cualquier motivo). queda comentar el servicio de alertas personalizadas de Google Scholar Métrics. nombre. La única pega de esta página de co-autores es el orden en el que aparecen. número de citas totales recibidas y palabras clave). que está sincronizado internamente con el servicio de alertas de Google Scholar visto en el capítulo 6. Inclusión de co-autores en Google Scholar Citations Si a esta pantalla de co-autores se accede como usuario registrado. el sistema sugiere nuevos co-autores para añadir al perfil. Alertas Por último. . En este caso. por ejemplo). Adicionalmente. Figura 60. en la parte inferior de la página.

el propio usuario debe pulsar sobre el icono “Follow” que aparece en la parte superior de la zona del área personal. efectuar un autoseguimiento. Y por otro lado se puede realizar el seguimiento de autores de interés. recibir notificaciones en el momento en el que se produzca alguna modificación en el perfil personal. En el primero de los casos. Alertas personalizadas en Google Scholar Citations (I) Figura 62. es decir. Sin embargo. Figura 61. En el segundo caso. Por un lado. seleccionar la alerta deseada y notificar el correo electrónico donde se desea recibirla (Figura 62). basta con acceder al perfil público que deseemos seguir. existe la condición de que el perfil deba ser público para poder habilitar esta alerta (Figura 61). pulsar en el botón “Follow”.Bloque B · Capítulo 9 · Google Scholar Citations el sistema de alertas puede realizarse de dos formas complementarias. Alertas personalizadas en Google Scholar Citations (II) 211 . La alerta puede cubrir tanto la notificación de nuevos artículos como de nuevas citas recibidas.

laissez passer”. como la del número de seguidores de un perfil (Delgado López-Cózar. editar.212 La revolución Google Scholar En las primeras versiones de Google Scholar Citations se contabilizaba el número de seguidores que tenía un autor a partir de este botón de “Follow”. algunos más importantes (mostrar el número exacto de citas totales recibidas por año. En cualquier caso. comentado en la sección anterior. los cambios siempre han ido orientados a la creación de un producto que como ya comentamos responde a la filosofía del “laissez faire. el cambio más importante hecho público se produjo el 21 de agosto de 2014. Explotación de los perfiles académicos en Google Scholar Google Scholar Citations ha ido mejorando el producto desde su lanzamiento hasta nuestros días. mostrando de ese modo un interés en el seguimiento de perfiles que no correlaciona necesariamente con el impacto científico. Probablemente. aunque de una manera irregular y. otros investigadores con carreras científicas más cortas. Aunque el cambio fue fundamentalmente estético (mejorando el diseño y disposición de los elementos en la pantalla). aparecido en agosto de 2015 sin notificación alguna. Pequeñas mejoras en la edición de los registros o en las opciones de visualización han ido apareciendo paulatinamente. Se deja total libertad a los autores para que puedan configurar el perfil a su entero gusto y beneficio desde su identificación personal. menos importantes o con una mayor carga profesional (por ejemplo Comunicación) recibían mucha más visibilidad. incluso invisible. 2014). y eliminar los registros bibliográficos tal como le venga en gana. cuando el producto dio un lavado de cara a los perfiles. En cualquier caso proporcionaba información interesante. Google Scholar se despreocupa de la posible veracidad y precisión de los datos y deja en manos del autor toda la responsabilidad sobre lo mostrado. aunque esta funcionalidad fue eliminada en 2014. pues ilustraba cómo investigadores con largas trayectorias científicas y amplio impacto podían ser seguidos por un número escaso de seguidores (o ninguno en la mayoría de los casos) y por el contrario. se introdujeron algunos cambios. El autor puede añadir. pasando por el modo de actualización del perfil (automático o no). en algunos casos. pues en la versión anterior solamente se mostraban datos aproximados) y otros menos (la creación de una versión imprimible amigable). profesional y temática hasta la vinculación de la producción bibliográfica que estimen pertinente. Igualmente desaparecieron algunas funcionalidades. Un claro ejemplo de ello es el control de las afiliaciones institucionales. .

“gendermetrics gender studies scientometrics”. esto ocurre para uno de los mayores investigadores sobre Google Scholar amplia e intensamente citado en este libro. quien a fecha de septiembre de 2015 dispone de dos perfiles públicos creados (Figura 63). como es Peter Jacsó. —— Que vinculen a sus perfiles publicaciones que no les pertenecen. pues la ambigüedad de ciertos nombres y la no depuración del perfil puede hacer que se incluyan contribuciones de otras personas con el mismo nombre y apellidos. como ya discutimos en el apartado de información personal de este capítulo. etc. cada uno de ellos con un número distinto – aunque similar – de citas y de palabras clave 3. <https://twitter. Figura 63. un mismo autor puede crearse varios perfiles (cada uno de ellos con una cuenta de correo electrónico diferente) o varias personas diferentes podrían haber creado un mismo perfil. Duplicación de registros en Google Scholar Citations —— Que escojan palabras clave inadecuadas para describir su orientación temática. o tan peculiares y singulares que sólo les representan a ellos mismos (por ejempo “tetons”.com/torressalinas/status/701683372935008258/ photo/1> 213 .). Esto puede suceder por descuido. Por ejemplo.Bloque B · Capítulo 9 · Google Scholar Citations Esta completa libertad a los usuarios puede generar situaciones tan extravagantes como las siguientes: —— Que puedan existir autores con varios perfiles creados. Esto se debe a que el sistema no controla la duplicidad de nombres en los perfiles. Por tanto. “vocabularios controlados”. que 3 La duplicación de perfiles públicos está comenzando a ser controlada por Google Scholar desde marzo de 2016.

2014).com/citations?user=D1EHFZQAAAAJ> —— Que se manipulen las citas e indicadores bibliométricos (Delgado López-Cózar. Este punto ya fue comentado en el capítulo dedicado a las amenazas de Google Scholar. Robinson-García y Torres-Salinas. Durante el proceso de construcción de perfiles académicos seguido en este capítulo.com/citations?user=D1EHFZQAAAAJ> 4 http://retractionwatch.214 La revolución Google Scholar Google Scholar no desambigüa correctamente (Figura 64). Perfil falso Google Scholar Citations <http://scholar. en cuyo caso estaríamos ante un claro caso de fraude.google. Esto ha permitido la generación tanto de citas falsas 4 como de perfiles falsos (Figura 65). Figura 65. Figura 64. o bien puede suceder a propósito. ya hemos podido advertir de la facilidad con la que se puede engañar al sistema ante la carencia total de control y libertad total del usuario para introducir la información que estime oportuna.com/2014/11/17/fake-citations-plague-some-google-scholarprofiles .google. Asignación errónea de registros en Google Scholar Citations <http://scholar.

Una inteligente manera no sólo de reducir costes de tratamiento y gestión de la información sino de hacer que el usuario trabaje para el sistema.8% y el 6. estén comenzando a ser objeto de análisis métricos para caracterizar la ingente cantidad de información contenida. Esta amplia autonomía que Google concede al autor trasluce la filosofía desde la que se ha diseñado este producto: un sistema de información orientado al usuario. Por ejemplo. Este hecho ha permitido que estos perfiles. concluyen que aunque los perfiles producidos por Microsoft Academic Search eran más óptimos para ser analizados desde un punto de vista bibliométrico al disponer de un servicio más balanceado temáticamente. Hemos de pensar que Google Scholar Citations supone pasar la descontrolada base de datos de Google Scholar bajo un prisma que permite distinguir las contribuciones de autores. Ortega y Aguillo (2014). y cuya distribución por países e instituciones es muy desigual. así como ciertas características de los autores que disponen de perfil público creado. más allá de la utilidad que tienen para Google Scholar (ayuda en el filtrado de información en las búsquedas. creado por y para él. Ortega (2014). cooperación de los autores para detectar y corregir errores bibliográficos) y para los propios autores (ayuda en la visibililidad y difusión de su trabajo). como Universidade de Sao Paulo (3. En ese sentido. Google Scholar Citations contenía más materiales académicos que generaban una mayor cantidad de citas. en disciplinas relacionadas con las ciencias de la información y tecnología. temas e instituciones. en su análisis comparativo de los perfiles de Google y Microsoft. infiere a partir de una muestra que Brasil posee aproximadamente el 5. fundamentalmente. queda claro que la responsabilidad última es del autor y no alcanza a Google: el perfil retrata a quien lo elabora.4% respectivamente). con datos de diciembre de 2013. principalmente debido a la enorme cantidad de perfiles creados para algunas instituciones brasileñas. con el 24. por lo que era más adecuado para estudios a nivel individual e institucional. lo que genera un importante sesgo en la distribución de la población de investigadores con perfil creado.Bloque B · Capítulo 9 · Google Scholar Citations En cualquier caso.764 perfiles) y Universidade Estadual Paulista 215 . lo que impide que pueda ser representativa de la población científica real. necesarias para calibrar el impacto total de autores. Ortega (2015) muestra que la mayoría de usuarios son jóvenes investigadores.2% de todos los perfiles existentes (tras Estados Unidos y Reino Unido. Este modo de funcionamiento ha permitido a Google Scholar Citations distanciarse del resto de servicios de perfiles académicos.

los estudios sobre la base de datos de Google Scholar Citations pueden proporcionar información de indudable interés si son convenientemente filtrados y contextualizados. entre países e instituciones. ciertas políticas de evangelización hacia el producto pueden provocar la excesiva visibilidad de ciertas instituciones y la infravisibilidad de otras. En esta línea destacan los trabajos de Ortega y Aguillo (2013).216 La revolución Google Scholar (1.320 perfiles. .912 perfiles de Google Scholar Citations. concluyen que Google Scholar Citations es una herramienta apropiada para los estudios de colaboración científica a nivel macro. A pesar de estos sesgos de población y de cobertura temática. Los autores. ocupa la cuarta posición global).636). con el fin de descubrir y caracterizar las colaboraciones científicas a nivel de país e institución. que son de hecho las dos instituciones con más perfiles asociados en todo GSC (la Universidade Estadual de Campinas. 1. quienes analizan los datos proporcionados por el servicio de co-autores en un total de 19. Es decir. quienes identifican propiedades de fractalidad y redes de escala libre en las relaciones institucionales por país (donde Estados Unidos domina el mapa científico mundial).

Journal Scholar Metrics) pretenden aportar una respuesta empírica (y no teórica u opinática) a todas nuestras dudas iniciales. y a las ciencias sociales y humanas en España en particular. un propósito fundamentalmente investigador: conocer. En este último capítulo deseamos introducir una serie de productos independientes que han sido diseñados y elaborados por el Grupo de investigación EC3 a partir de la información contenida en Google Scholar. revistas. Los productos desarrollados (H-Index Scholar. Por otro lado. la propuesta y aplicación de toda una nueva metodología de análisis basada en Google Scholar a nuestra propia disciplina (tanto a la Biblioteconomía y Documentación como a la Bibliometría) sirve de excelente colofón no sólo para mostrar las enormes posibilidades y potencial de Google Scholar sino para aflorar la eviden- . el equipo de trabajo ha dedicado gran parte de sus esfuerzos en los últimos años a cuantificar diversos agentes y canales de investigación (autores. El objetivo de estos productos ha sido doble. libros. Fruto de estos propósitos. Por un lado. Finalmente. un propósito empírico y práctico. propiedades. Proceedings Scholar Metrics.Capítulo 10 Productos derivados independientes A lo largo de los capítulos anteriores (8 y 9) hemos descrito los dos principales productos derivados de Google Scholar. que denominamos bajo la etiqueta de oficiales al haber sido desarrollados directamente por el equipo de Google Scholar e integrados en su interfaz de búsqueda. y bajo el firme convencimiento de la importancia y valor de la empresa emprendida. Diseñar productos que pudieran ser de utilidad a la comunidad investigadora en general. Publishers Scholar Metrics. estudiar y analizar Google Scholar como un objeto de estudio en sí mismo. errores y limitaciones. Analizar por tanto sus características. congresos y editoriales) para comprobar si Google Scholar era o no era capaz de proporcionar resultados coherentes (y por tanto útiles) que cubrieran con dignidad una importante laguna en el panorama de la evaluación del impacto académico en las ciencias sociales y humanas. ventajas.

el software permitía editar los resultados obtenidos.218 La revolución Google Scholar te necesidad de un cambio de paradigma en la evaluación del impacto académico en las ciencias sociales y humanas. y visualizarlos en una interfaz sencilla.1 (a fecha de 17 enero de 2016). Publish or Perish Tan solo dos años después de la creación de Google Scholar (noviembre de 2004) nacía la primera versión de Publish or Perish (PoP). la aplicación era capaz de obtener los datos correspondientes directamente de Google Scholar (a través de sus prestaciones de búsqueda avanzada. conviene recordar que Google Scholar no proporciona ningún tipo de API). A ello se unían las inexistentes prestaciones para exportar los datos para ser tratados estadísticamente fuera del entorno de Google Scholar. ofrecía una serie de indicadores bibliométricos. Tal y como ya se ha comentado de forma extensa a lo largo de esta obra. Sin embargo. la información comenzaba y terminaba en este punto. exportarlos en un fichero estructurado. Efectivamente. permitía la realización de búsquedas directamente sobre la base de datos de Google Scholar y. junto a Google Scholar. ya bien adentrados en el hiperconectado Siglo XXI. deseamos en primer lugar rendir un merecido tributo a un par de productos pioneros en la extracción y tratamiento de datos procedentes de Google Scholar: Publish or Perish (elaborado por Anne-Wil Harzing) y Scholarometer (elaborado por el equipo liderado por Fil Menczer). No es de extrañar que este software permitiera. Así pues. una democratización . Por si no fuera poco. fusionar duplicados e incluso exportar los datos finales a una hoja de cálculo. de forma que ante una determinada consulta. a pesar de que Google Scholar ofrecía datos de citas recibidas para cada registro indizado. a partir de los resultados obtenidos. antes de pasar a describir los productos elaborados por los autores (productos bibliométricos derivados). Esta sencilla pero potente aplicación (disponible tanto para entorno Windows como OS X o GNU/Linux). entre otras muchas funcionalidades. realizar análisis bibliométricos y estadísticos sobre los datos obtenidos (tanto a nivel de autor como de revista).25. lanzada oficialmente en octubre de 2006. la gran ventaja de Google Scholar es su impresionante cobertura aunque una de sus principales limitaciones es la total ausencia de mecanismos profesionales para gestionar la información que proporciona. Publish or Perish servía de interfaz entre el usuario y Google Scholar. y de la que ya circula actualmente la versión 4.

1). tal y como expresa Harzing en el prólogo de esta obra. En el caso de la búsqueda por autor. En la figura 66 se puede observar un ejemplo de búsqueda de autor y los resultados obtenidos a través de la aplicación. Interfaz de búsqueda de Publish or Perish Observamos cómo la aplicación permite tres tipos de consultas (general. Una pantalla flotante nos informa del estado de la evolución de nuestras consultas.Bloque B · Capítulo 10 · Productos derivados independientes del análisis de citas. el sistema lanza la consulta directamente a Google Scholar. y en uno de sus principales y más citados trabajos (Harzing y Van der Wal. por tanto. Se debe recordar que Google Scholar devuelve un máximo de 1000 resultados por query. Aunque no se recomienda su utilización (al menos entre 2010 y 2016). Se debe re- 219 . Aparte de Google Scholar. ese será el número máximo de resultados que obtendremos ante cualquier búsqueda. Adicionalmente se pueden excluir determinados coautores o delimitar el año de publicación. Figura 66. zona 2). por autor y por revista). se recomienda introducir entre comillas el nombre de la persona buscada (en el ejemplo mostrado “Corma A”). Publish or Perish permite seleccionar Microsoft Academic Search (desde la versión 4. zona 1) el usuario puede configurar los campos de consulta correspondientes (Figura 66. En función de la búsqueda seleccionada (Figura 66. En el ejemplo de la figura 66. debido a la ya comentada desactualización de esta base de datos. 2007). el sistema se encuentra analizando el resultado número 920 de los 1000 obtenidos. Adicionalmente se puede seleccionar la base de datos. Una vez se ha perfilado la búsqueda.

El símbolo “h” en azul y delante del número de citas recibidas por cada resultado aparece para todos aquellos artículos que contribuyen al núcleo del h-index. La consulta por revista simplemente ofrece la posibilidad de localizar artículos publicados por una determinada revista. e-index. Por último. Los ficheros de exportación de estas bases de datos pueden se importados a PoP desde la opción (File/ Import external data). hl annual y multiauthored h-index). este símbolo aparece para los 131 artículos con mayor número de citas. número de citas recibidos. Título. donde conforme se van procesando los hits de respuesta en Google Scholar ante la consulta efectuada. Esto se puede observar en la zona de resultados (Figura 66. . AR-index. de tal forma que podamos repetirlas en el futuro sin tener que volver a elaborarlas. para ello permite la búsqueda por título e ISSN. Por último. La consulta general por su parte simplemente incorporar todos los campos (tanto de la búsqueda por autor como por revista) en una consulta. como indica su propio nombre. generalized h-index. De forma que podemos utilizar las funcionalidades del análisis bibliométrico de los datos a partir de registros obtenidos en estas dos bases de datos. se ofrece el valor tanto del h-index obtenido como de una amplia cantidad de variantes del h-index (g-index. se van calculando de forma automática una serie de indicadores tanto simples (número de documentos. Multi-query center es el espacio destinado a almacenar las consultas efectuadas en la aplicación. La limitación de los 1000 resultados es. Editorial y Tipo. crítica especialmente en el caso de búsquedas masivas o susceptibles de generar una gran cantidad de resultados. Año. Adicionalmente se ofrecen los siguientes datos para cada resultado: Citas por año. Autores. intervalo de publicación) como promedios (citas por artículo. En el caso de la figura 66. Rank (posición en la página de resultados).220 La revolución Google Scholar cordar igualmente que cada resultado es tratado por el programa como un documento. artículos por autor. Los resultados localizados se muestran ordenados por defecto según el número de citas totales recibidas. como el h-index obtenido es de 131. citas por autor. Publicación. En ese caso se recomienda restringir la consulta a partir de los límites temporales. se destacaría la opción de importar resultados tanto desde Web of Science como desde Scopus. general. que conforman el núcleo de Hirsch para el autor. hlnorm. zona 3). autores por artículo). al igual que en la interfaz de Google Scholar.

En la actualidad. obteniendo los datos solicitados 1 http://www. con 34. 2014).indiana. que pueden ser posteriormente computadas para permitir la comparación de métricas de impacto a nivel de autor entre disciplinas. plataforma creada en la School of Informatics and Computing de Indiana University–Bloomington en noviembre de 2009 (Kaur et al.000 autores y 2. Aunque la aplicación podría haber funcionado con cualquier otra base de datos. la cobertura especial de este buscador hizo que la balanza se inclinara finalmente hacia Mountain View.Bloque B · Capítulo 10 · Productos derivados independientes Los aspectos concretos del funcionamiento del programa pueden ser consultados directamente tanto en la página web personal de Anne-Wil Harzing 1 como en el manual oficial del software (Harzing.000 autores.0) pretende reunir en una sola herramienta dos funcionalidades que generalmente se encuentran separadas: el análisis estadístico de la información bibliográfica de la literatura científica por una parte.400 disciplinas (Kaur et al. 2013b). 39. A fecha de 2009. los datos habían aumentando considerablemente: 2.com/pop. firmados por 21. Scholarometer La filosofía de Scholarometer 2. existen versiones compatibles tanto con Google Chrome como con Firefox. El desarrollo de la aplicación presenta igualmente particularidades. pues Scholarometer se instala simplemente como extensión del navegador.htm 2 http://scholarometer.4 millones de artículos. el programa había recopilado cerca de 1.harzing. como no podía ser de otra forma. Scholarometer se presenta como una herramienta social que pretende facilitar el análisis de citas así como favorecer que los usuarios puedan expresar relaciones entre elementos a partir de la inclusión de anotaciones.8 millones de artículos. 2012). Google Scholar. Scholarometer (actualmente en su versión 4.1. La base de datos sobre la que funciona Scholarometer es.000 anotaciones en cerca de 900 disciplinas (datos depurados tras aplicar procesos de filtrado). Esta característica le permite convertirse en una interfaz que carece de las limitaciones de acceso al servidor de Google Scholar (la plataforma es independiente y se ejecuta en el navegador del usuario).edu 221 . Bajo esta premisa. y las tareas de social tagging por otra. es diametralmente opuesta a la propuesta por Publish or Perish. A fecha de marzo de 2014. El usuario puede confeccionar una ecuación de búsqueda que el sistema lanza a Google Scholar.

Finalmente. El resto de opciones permiten la búsqueda de un autor (Name) o un grupo de autores (Group) en Google Scholar. fusionar distintas versiones de un mismo documento. Name. CSV. XLS y BibJSON. RefMan (RIS). Group y Advanced). El sistema ofrece cuatro pestañas de consulta (Google Scholar ID. Del mismo modo. disciplina. variantes aceptadas de nombres.222 La revolución Google Scholar a través de un scraping de los resultados de Google Scholar. Esta funcionalidad requiere de manera obligatoria que el usuario introduzca una etiqueta temática en la búsqueda (opción tag this query). Interfaz de búsqueda de Scholarometer El usuario puede. EndNote (ENW). tal y como funciona cualquier navegador. desagregar artículos escritos por autores diferentes pero que comparten el mismo nombre o filtrar los datos por año de publicación. se ofrecen facilidades para exportar los datos en diferentes formatos: BibTex (BIB). de manera adicional. El sistema permite de este modo la descarga de todas las publicaciones contenidas en el perfil y ofrece. El etiquetado de los autores en determinadas disciplinas permite a Scholarometer el cálculo del hs-index (normalización del h-index a partir . entre otras operaciones. la posibilidad de analizarlas estadísticamente. En la figura 67 se puede observar el modo de funcionamiento de Scholarometer. útil esto último por ejemplo para el análisis de grupos de investigación. La primera de estas opciones permite la búsqueda directa en Google Scholar Citations a partir del código identificador de cada perfil (código de 12 cifras incluido en el URL público de cada perfil). la opción Advanced incorpora diversas funcionalidades de búsqueda avanzadas Figura 67.

html 5 http://hindexscholar. 2014) 5 es un índice bibliométrico que pretende medir el rendimiento de la producción académica de los profesores e investigadores de universidades públicas españolas de Humanidades y Ciencias sociales a partir del recuento de sus publicaciones y de las citas bibliográficas que éstas han recibido a través de Google Scholar (Figura 68). que permite la consulta a la base de datos de Scholarometer 3. Por último.edu/data. propuesto por Kaur. invisibles a las tradicionales bases de datos por sus peculiares hábitos de publicación. Radicchi y Menczer (2013). así como de funcionalidades de visualización de redes tanto de autores como de disciplinas 4. 3 http://scholarometer.html 4 http://scholarometer. Página de inicio de H-Index Scholar Los objetivos que pretende cubrir son los siguientes: —— Comprobar la capacidad de Google Scholar para recuperar la producción científica y académica de científicos adscritos a los ámbitos de Humanidades y Ciencias sociales.indiana.Bloque B · Capítulo 10 · Productos derivados independientes del promedio del h-index de los autores en una misma disciplina).com 223 . H-index Scholar El H-Index Scholar (Delgado López-Cózar et al. se destaca la disponibilidad de una API.edu/explore. Figura 68. que facilita la comparación de autores pertenecientes a disciplinas diferentes.indiana.

basados en información suministrada por Google Scholar. Los índices se presentan por áreas de conocimiento agrupados en disciplinas.500. Datos que hablan por sí mismos de la magnitud del trabajo realizado. En los distintos listados por áreas figuran sólo aquellos profesores que se encuentran en el núcleo de mayor rendimiento. De este modo. para detectar el núcleo de académicos de mayor influencia en las distintas disciplinas humanísticas y sociales. En algunos casos. se calculó el índice h y g de cada autor. Sin embargo. Los datos de rendimiento son relativos a 2012. Para adscribir a los profesores a sus áreas de conocimiento respectivas se consultaron los sitios web de todos los departamentos de las universidades públicas españolas de Humanidades y Ciencias Sociales. En la figura 69 se muestra a modo de ejemplo el ranking experimental obtenido para el área de Documentación (top 5). las ciencias jurídicas en 14 áreas. dadas las carencias de información en algunas de estas fuentes universitarias (especialmente departamentos). y finalmente las bellas artes en 4 áreas. no siempre se pudo realizar esta tarea de forma exitosa. Para ello se ejecutó una búsqueda para cada profesor que contemplaba las principales variantes de su nombre a fin de identificar todas sus posibles publicaciones y las citas enlazadas a las mismas.224 La revolución Google Scholar —— Examinar su idoneidad para identificar la producción de entornos geográficos nacionales distintos al mundo anglosajón. tomando como umbral de corte el primer tercio de los profesores con mayor índice h de un área de conocimiento. las ciencias humanas en 10 disciplinas y 35 áreas. Tras un proceso manual de depuración de resultados (eliminación de duplicados y unión de citaciones). aunque en cada área la fecha de toma de datos puede variar sensiblemente (según el mes en el que se hicieran las búsquedas). El cálculo de los índices h y g se realizó a partir de la producción científica y las citas asociadas a la misma localizadas en Google Scholar. . Por tanto. El número de profesores con el que se trabajó en la master list del proyecto superaba los 41. de los que se visualizaban cerca de 14. se llegó igualmente a rastrear los sitios web de Facultades. las ciencias sociales se estructuraban en 9 disciplinas y 35 áreas de conocimiento. no se contemplan ni las contribuciones realizadas ni citas recibidas con posterioridad.000 en el sitio web público. y que usan lenguas de expresión distintas al inglés —— Determinar la fiabilidad y validez de los índices h y g. Escuelas e Institutos Universitarios.

visibilidad. aunque tienen una especial predilección por las monografías publicadas en su lengua vernácula y en editoriales nacionales. De entre los distintos criterios que pueden emplearse para evaluar el rendimiento de las editoriales (pervivencia y antigüedad. reputación e impacto 6 http://www. en el ámbito de las Humanidades y Ciencias Sociales. calidad editorial. no es de extrañar que este tipo de publicaciones ocupen una parte importante en el curriculum de los investigadores y que cuando se les pregunte cuáles son los medios de publicación que deben ser utilizados preferentemente en la evaluación de su actividad científica. Por consiguiente. Los libros constituyen uno de los principales medios de comunicación científica en Humanidades y en buena parte de las Ciencias Sociales. producción/especialización. sean las monografías las destacadas en primer lugar. Ranking de profesores del área de Documentación según H-Index Scholar Publishers Scholar Metrics Publishers Scholar Metrics 6 es un índice bibliométrico que pretende medir el impacto de las editoriales de monografías científicas a partir del recuento de citas de los libros publicados por los profesores e investigadores de universidades públicas españolas indizados en Google Scholar hasta 2012.publishers-scholarmetrics. por encima del resto.info/ 225 .Bloque B · Capítulo 10 · Productos derivados independientes Figura 69. Todos los estudios bibliométricos que han analizado los hábitos de publicación y citación en las distintas disciplinas que conforman las Ciencias Humanas y Sociales destacan cómo los investigadores de estos campos publican en una amplia variedad de medios. así como una inclinación a citar fundamentalmente este tipo de documentos.

en España las agencias de evaluación de la actividad científica (Comisión Nacional Evaluadora de la Actividad Científica . Para paliar estos problemas tanto Thomson Reuters.ANECA 9) han contemplado como criterios preferentes: el número y la calidad de las citas recibidas. Constatadas la falta de adecuación de las bases de datos actuales para la evaluación de monografías a partir de las citas recibidas.CNEAI 8.gob. la colección en la que se publica la obra. la aparición de Google Scholar significó una auténtica revolución en los sistemas de búsqueda de información científica.aneca. como Elsevier con su programa “Titles Expansion Program”. Lamentablemente no existen herramientas que puedan medir de manera más o menos objetiva estos criterios.handle.net/10481/32117 8 http://www.html 9 http://www. los editores. han intentado ampliar la cobertura de libros. han quedado relegadas las más importantes editoriales científicas de carácter nacional de países de honda tradición investigadora en estas áreas como Francia. son totalmente inadecuadas pues cubren casi exclusivamente artículos de revistas.226 La revolución Google Scholar científico) y de los libros que éstas publican 7. así como otras de carácter internacional (Torres-Salinas. Robinson-García y Delgado López-Cózar. Pero los resultados han sido desalentadores: el sesgo idiomático hacia los documentos en inglés (98% de los libros indizados) y los países anglosajones (más del 50%) es aplastante.mecd. Desde el punto de vista bibliométrico. tanto en Web of Science como en Scopus (Torres-Salinas y Delgado López-Cózar.es/ . Scopus). por lo que no resultaban adecuadas dados los hábitos de publicación y citación de los investigadores en ciencias humanas y sociales. España o Alemana. 2012). Italia. que son usadas con efectos evaluativos para contabilizar publicaciones y citas (Web of Science. En el caso del Book Citation Index. Agencia Nacional de Evaluación y Prospectica ANEP. con su Book Citation Index. las reseñas en las revistas científicas especializadas. se orientan fundamentalmente a las disciplinas científico-técnicas y poseen un marcado sesgo anglosajón en cuanto a la procedencia e idioma de los documentos que indizan. que es el proyecto más ambicioso. tratando de ofrecer respuesta a la primera variable contemplada anteriormente: el número y la calidad de las citas. el prestigio de la editorial. Agencia Nacional de Evaluación de la Calidad y Acreditación . las bases de datos tradicionales.es/ministerio-mecd/organizacion/organismos/cneai. las traducciones o su inclusión en bibliografías. Este proyecto nace directamente con la vocación de satisfacer dicha demanda. 2013). pero especialmente afectó 7 Véase : http://hdl.

libros.249 citas. Es por lo que los objetivos de este producto son fundamentalmente dos: —— Determinar la fiabilidad y validez de la información suministrada por Google Scholar para detectar el núcleo de editoriales científicas de mayor influencia en las distintas disciplinas humanísticas y sociales en España. Todos los estudios realizados hasta la fecha. 227 . —— Comprobar la capacidad de Google Scholar para recuperar la producción científica y académica de científicos adscritos a los ámbitos de Humanidades y Ciencias Sociales. que es la peor controlada por los sistemas de información dominantes en el mundo académico. informes. comunicaciones a congresos…).985 documentos. pues controla como nadie lo ha hecho hasta ahora la literatura no anglosajona y aquella transmitida por medios distintos a las revistas científicas (especialmente los libros). clasificados según el área de conocimiento al que figuraran adscritos.Bloque B · Capítulo 10 · Productos derivados independientes muy positivamente a aquellas disciplinas cuyos hábitos de publicación no se constreñían únicamente a las revistas científicas. La primera tarea se dirigió a elaborar un censo de los profesores que trabajaban en 2012 en las universidades públicas españolas. que recibieron un total de 2. Se recuperaron un total de 1. invisibles a las tradicionales bases de datos por sus peculiares hábitos de publicación. documentos en todos los idiomas sin restricción y recupera un porcentaje muy elevado de citas. Pero es especialmente de utilidad para los científicos de Humanidades y Ciencias sociales. que fueron ya detallados en el capítulo 3 del libro al tratar la diversidad de documentos citantes en Google Scholar.378. Para calcular el impacto de las editoriales científicas donde publican los profesores e investigadores de universidades públicas españolas a través de Google Scholar se siguió el siguiente procedimiento: Identificación de los libros publicados por los profesores e investigadores de universidades públicas españolas. comentado previamente. Para ello se partió de los resultados obtenidos en el producto H Index Scholar. tesis. indiza mayor variedad de géneros documentales (artículos de revistas. han puesto de relieve que este buscador cubre muchísimos más documentos que cualquiera de los sistemas de información científica tradicionales.020.

5%).523). Estos 7.978 citas.7% de los documentos válidos de la muestra y el 43. El total de libros identificados. Para conseguirlo se diseñaron varios filtros que fueron decantando las monografías que conformaron la muestra definitiva.203 libros fueron repasados individualmente a fin de identificar de forma fiable y unívoca la editorial que los había producido. Dado que Google Scholar no proporciona de manera exhaustiva ni la tipología del documento (libro. lo que restringió el número de documentos a analizar a 280. fue de 26.776.3% del total de libros identificados.3%). En términos de citación representa el 17. Por consiguiente. En primer lugar.228 La revolución Google Scholar Selección de documentos fuente: identificación de los libros altamente citados. documentos erróneos (documentos producidos por profesores ajenos a nuestra unidad de análisis) y documentos ajenos a la temática del área de conocimiento). era lógico que documentos escritos en coautoría estuviesen duplicados).6% de los documentos recuperados.123 documentos que serían examinados a fin de averiguar qué porcentaje de ellos eran monografías (esta muestra concentraba el 74. nuestro objetivo ha sido identificar el núcleo de monografías científicas más influyentes publicadas por los profesores españoles de universidades públicas.203 libros más citados. la muestra de libros altamente citados sobre los que se construyen estos rankings representa el 2. En definitiva. se eliminaron los documentos no citados (740.628 (43. es preciso verificar manualmente la editorial referenciada por Google Scholar o insertarla directamente en caso de que no figure.3% . Se excluyeron 16. congreso) ni una descripción bibliográfica completa y fiable. Sobre el total de documentos analizados se eligió una muestra de 78. y que se basa en las leyes bibliométricas que determinan que un número relativamente pequeño de documentos son los que concentran la mayor atención de los científicos. que recibieron un total de 417.678 documentos por diversas razones: duplicados (dado que las búsquedas se hicieron por profesor. artículo. Sobre este conjunto de libros se seleccionó una muestra que contenía los 7.454 documentos válidos analizados. y no de toda la población de monografías publicadas por los profesores universitarios españoles. si se mide la repercusión en términos de citas.153 citas. Los rankings de editoriales se elaboraron a partir de una muestra de libros. tras el análisis de los 61. el 11. libros que recibieron 625.218 citas). Esta es una práctica ya extendida en diversos productos bibliométricos como los Essential Science Indicators de Thomson Reuters.462 (27.7% de las citas (1.

Finalmente.4% del total de libros identificados. el 30. Proceso de identificación muestra de libros altamente citados Cálculo de indicadores Los tres indicadores empleados (libros.8% de los documentos válidos de la muestra y el 66. tal y como 229 . En la figura 70 se muestra un resumen del mismo. —— Número total de citas de los libros de una editorial que figuran entre los libros altamente citados de la muestra. El proceso aquí descrito de forma general se ha realizado por área de conocimiento. entendiendo por tales las áreas de conocimiento a las que están adscritos los profesores universitarios españoles. Los datos brutos se normalizaron tanto para los libros como las citas en una escala que fluctúa entre 0 y 100 tomando como referencia la editorial que ha alcanzado el valor más elevado. citas e índice global) se han basado en los siguientes datos: —— Número de libros de una editorial que figuran entre los libros altamente citados de la muestra. así como el número de documentos trabajados en cada fase.Bloque B · Capítulo 10 · Productos derivados independientes del total de citas de los documentos recuperados. se calculó un índice global que no es más que la multiplicación de las dos dimensiones contempladas. Figura 70. Visualización de resultados Los rankings de editoriales se presentan por disciplinas y especialidades científicas.

Proceedings Scholar Metrics 10 es un ranking que muestra reuniones científicas (conferencias.13140/RG. Este hecho constituye un valor en sí mismo. 10 http://arxiv. en el período 2009-2013 (actualizado posteriormente a 2010-2014) 11.230 La revolución Google Scholar se mostraban en el H Index Scholar. en las áreas de Informática. simposios. Por tanto. Ranking de editoriales en Psicobiología según Publishers Scholar Index Conviene subrayar que en los listados sólo figuran aquellas editoriales que han conseguido publicar libros altamente citados en cada una de las especialidades. talleres. Ingeniería eléctrica y electrónica y Comunicaciones. En la figura 71 se muestra como ejemplo el ranking obtenido para Psicobiología. medida ésta a través del recuento de citas en Google Scholar.4504.9681 .org/abs/1412. Proceedings Scholar Metrics En este caso.) indizadas en Google Scholar Metrics. no deben interpretarse estos rankings como unos listados de todas las editoriales científicas que pueden publicar libros sobre una especialidad.2. etc. encuentros.org/10. Figura 71. sino de aquellas que han conseguido con alguna de sus obras una cierta influencia.1.7633 11 http://doi.

electrónica y telecomunicaciones. De hecho. esta ha sido una de las razones por las que han existido distintos intentos de crear clasificaciones que identificaran y/o clasificaran esta tipología documental. Internet constituye un entorno casi natural para estas disciplinas. Proceedings Scholar Metrics. Las diversas bases de datos que han sido tradicionalmente utilizadas con propósitos evaluativos (Web of Science y Scopus) cubren este tipo de publicaciones con diferentes grados de exhaustividad. y especialmente las de Informática. La creación de Google Scholar. De hecho. descrito en profundidad en el capítulo 8. Además. Por tanto. como hemos visto a lo largo de los capítulos previos. informática. Dadas las limitaciones en la visualización de los datos que Google Scholar Metrics posee (categorías únicamente aplicables al idioma inglés. toma Google Scholar Metrics como fuente de datos. espléndidamente representadas en la Web. con la única condición de haber publicado al menos 100 documentos y recibido al menos una cita en los últimos 5 años. 100 registros por categoría y 20 registros por búsqueda directa). no sorprende que las actas de los congresos ocupen un lugar prominente en el currículum de los investigadores en estas áreas y que sean consecuentemente objeto de una consideración especial en los programas de evaluación del rendimiento académico de los investigadores. cubre tanto revistas como repositorios y actas de congresos. pero en ninguno de los casos de forma óptima. las conferencias y congresos han cumplido históricamente este rol. 231 . Este producto derivado. La elevada velocidad con la que el conocimiento es generado en estas áreas requiere de la creación de un sistema más dinámico para comunicar y publicar resultados de investigación que los sistemas tradicionales de revistas.Bloque B · Capítulo 10 · Productos derivados independientes Es un hecho ampliamente conocido que las conferencias y congresos juegan un papel importante como medios de comunicación científicos en todas las áreas técnicas relacionadas con la computación. la interfaz definitivamente no permite determinar la cantidad de actas de congresos indizadas en el sistema. en lugar de basarse directamente en Google Scholar (tal y como hacen H Index Scholar o Publishers Scholar Metrics). como son las ingenierías en general. ha revolucionado no sólo al mundo de las ciencias sociales y humanas. Eléctrica y Electrónica y Telecomunicaciones. sino que tuvo adicionalmente un efecto positivo en todas las disciplinas en las que los hábitos de publicación no estaban ceñidos a la publicación de artículos en revistas. de ahí que Google Scholar sea especialmente útil en estos campos.

journal-scholar-metrics. Finalmente. —— Se realizó un proceso manual de limpieza de datos para filtrar entradas irrelevantes (revistas. el indicador bibliométrico disponible en Google Scholar Metrics. con un h-index de 118.232 La revolución Google Scholar Precisamente. repositorios o congresos que estuviesen fuera de los temas objeto de análisis). Así mismo. Los resultados dieron como conferencia con mayor impacto a la “IEEE Conference on Computer Vision and Pattern Recognition. Journal Scholar Metrics 12 es una herramienta bibliométrica que pretende medir el rendimiento de las revistas en las 12 http://www. —— Los resultados de cada búsqueda fueron descargados (incluyendo el nombre de la conferencia. and Communications) en el período 2009-2013. Electrical & Electronic Engineering. se ha utilizado el h5-median para desempatar la posición. se incluye para cada conferencia el cuartil y la subcategoría temática en la que la conferencia había sido asignada en Google Scholar Metrics. El proceso de trabajo se describe a continuación: —— Se recopilaron todas las actas de conferencias mostradas en las subcategorias pertenecientes a las siguientes categorías (obviamente en inglés. se obtuvieron un total de 1. CVPR”. el objetivo de Proceedings Scholar Metrics es compilar un inventario de todas las conferencias incluidas en Google Scholar Metrics en los campos de conocimiento indicados anteriormente (Computer Science. que se muestran completos en el informe final de esta investigación (MartinMartin et al. con este producto llega el turno al análisis de las revistas. and Communications. único idioma en el que se aplican las categorías): Computer Science. el h5-index y h5-median. en este caso a partir del h-index. —— Se realizaron búsquedas directas utilizando keywords específicas descriptivas para localizar conferencias adicionales.infoec3. y los duplicados fueron eliminados.es . Electrical & Electronic Engineering.208 actas de congresos. y posteriormente ordenarlas en función de su impacto científico. El proceso de recolección de datos tuvo lugar a finales de diciembre de 2014. seguida de “Proceedings of the IEEE” con h-index igual a 85 y las “International World Wide Web Conferences (WWW)” con h-index igual a 83. Las actas están ordenadas por su h-index. Journal Scholar Metrics Tras el análisis de autores y editoriales. 2015). En caso de igualdad.

800. se utilizó el buscador directo de Google Scholar Metrics para realizar diversas búsquedas a partir de términos relacionados con las áreas de interés. 233 . El objetivo de este producto es identificar al subconjunto de revistas indizadas en Google Scholar Metrics relativas a las áreas de estudio anteriormente mencionadas y ofrecer posteriormente una batería de indicadores basados en citas para cada publicación. clasificación y visualización). “Social Sciences”. Humanidades y Ciencias Sociales.Bloque B · Capítulo 10 · Productos derivados independientes áreas de Arte. en los informes anuales de revistas científicas españolas en Google Scholar (reseñados anteriormente). fuimos capaces de localizar hasta 1069 revistas que cumplían con dichos criterios. es justo indicar que el objetivo último del producto es asimismo calibrar el grado en que Google Scholar Metrics cubre las revistas en Arte. Economics & Management”) ascendía aproximadamente a unas escasas 1. y “Business. Por una parte. las revistas no aparecen ordenadas ni agrupadas por país. las categorías temáticas únicamente aparecen para las revistas en inglés (independientemente del país). Como botón de muestra. Es evidente que esta cantidad de revistas representa a una porción muy reducida del número total de revistas existentes en esas áreas. Con el fin de solventar estas limitaciones (similares a las encontradas durante la confección del Proceedings Scholar Metrics). Literature & Arts”. Buscando de manera manual en el resto de idiomas se pudieron localizar unas 300 publicaciones más. Humanidades y Ciencias Sociales. procesado. dadas las limitaciones en la información aportada por este producto. En el caso de las Artes. Por tanto. La realización de un producto de estas características a través de Google Scholar Metrics se antojaba complicada. se describen las principales características del producto (cobertura y funcionalidades de búsqueda) así como el proceso de realización del trabajo (identificación de revistas. el número de revistas localizadas bajo las categorías ofrecidas por Google Scholar Metrics (“Humanities. indizadas en Google Scholar y que cumplan los criterios de Google Scholar Metrics. Humanidades y Ciencias Sociales a través de la contabilización del número de citas bibliográficas que sus artículos han recibido a través de Google Scholar. A continuación. Por otro lado.

—— Web of Science Master Lists. por una parte. 13 http://www. Humanidades y Ciencias Sociales. Google Scholar (cuyos robots indizan la web académica aparentemente sin sesgos geográficos o lingüísticos). y Scopus y Journal Metrics 13 por otra).com . Se recopiló el listado de revistas científicas (academic/scholarly) indizadas en las 162 categorías (subjects) relativas a las áreas de Arte. Respecto a la cobertura geográfica. Journal Scholar Metrics muestra las revistas de todo el mundo y en todos los idiomas. Las Ciencias naturales y experimentales quedan por tanto fuera de este producto pues éstas ya disponen de productos adecuados que cubren sus necesidades evaluativas (Web of Science y Journal Citation Reports. dado que esas son las áreas que han presentado tradicionalmente más dificultades en la evaluación bibliométrica. coreanos o japoneses han sido excluidas. para comunicar sus resultados.journalmetrics. cirílicos. En estas disciplinas. chinos. idiomas y países Journal Scholar Metrics se centra exclusivamente en las revistas pertenecientes a las Artes. donde las investigaciones se orientan con frecuencia a intereses locales y donde las distintas peculiaridades culturales son determinantes. las revistas escritas en caracteres árabes. los investigadores generalmente utilizan canales de comunicación científicos locales (y en sus idionas nativos). Por ello. siempre y cuando el nombre de la revista aparezca en caracteres latinos en Google Scholar Metrics. Se recopilaron las publicaciones indizadas en las 84 categorías incluidas en Arts & Humanities Citation Index y the Social Science Citation Index. se consultaron previamente las siguientes bases de datos de revistas: —— Ulrichsweb: Global Serials Directory. Humanidades y Ciencias Sociales. Es considerado el más extenso y actualizado directorio de publicaciones periódicas del mundo. Identificación y búsqueda de las revistas en Google Scholar Metrics Con el fin de identificar todas las revistas potencialmente susceptibles de ser incluidas en el producto. no sesgadas geográfica o lingüísticamente. Por este motivo. es el motor de búsqueda más apropiado para localizar evidencias de impacto para estas revistas. y para las que existe una mayor falta de herramientas de cobertura internacional.234 La revolución Google Scholar Cobertura: tipologías documentales.

—— International disciplinary-based databases. Se consultaron las siguientes bases de datos: Library and Information Science Abstracts. “Social Sciences” y “Business.454 revistas. Historical Abstracts. Communication & Mass Media Complete y Anthropological Online. indicando en 235 . portugués. Economics & Management”. dando como resultado una base de datos exhaustiva de 66. Psychinfo. español. A partir de la información recopilada de las bases de datos mostradas anteriormente. se desarrolló una Master list de revistas. Social Work Abstracts. —— Información bibliográfica de los documentos citantes a los artículos que contribuyen al h5-index de cada una de las publicaciones. Es importante indicar que la información bibliográfica proporcionada por Ulrichs fue considerada como prioritaria en el caso de cualquier discrepancia con la información contenida en el resto de bases de datos. se aplicaron búsquedas temáticas a partir de keywords pertinentes en cada uno de los siguientes idiomas: inglés. se procedió a descargar los siguientes datos para cada una de ellas: —— Nombre de la revista e indicadores bibliométricos asociados (h5-index y h5-median). Cada revista localizada en Google Scholar Metrics fue asignada posteriormente al menos a una categoría temática (Tabla 9). Se recogieron las publicaciones incluidas en las 64 categorías relacionadas con las áreas de Humanidades y Ciencias Sociales. Literature & Arts”. —— Información bibliográfica de los artículos publicados por las revistas anteriores que contribuyen al h5-index. se desarrollaron dos estrategias de búsqueda para localizar las revistas en Google Scholar Metrics. A partir de la master list obtenida. alemán. donde los títulos fueron normalizados y unificados y los duplicados eliminados. —— Google Scholar Metrics: toda las revistas incluidas en las categorías “Humanities. Procesamiento de datos y clasificación de revistas Una vez se identificaron las revistas en Google Scholar Metrics. En primer lugar. italiano. polaco y checo. Sociological Abstracts. Econlit. francés. MLA. se buscaron las publicaciones a partir de una búsqueda por nombre.Bloque B · Capítulo 10 · Productos derivados independientes —— SCImago Journal Rank. En segundo lugar (y con el propósito de localizar revistas no incluidas en la master list).

Tabla 9. La decisión de asignar una revista a una categoría. Web of Science. mientras que las relacionadas son aquellas vinculadas con una categoría debido a un conjunto específico de artículos publicados.236 La revolución Google Scholar cada caso si podía ser considerada nuclear o relacionada a dicha categoría. así como tras analizar sus patrones de citación entrantes (citas recibidas) y salientes (citas proporcionadas). Indicadores bibliométricos Los indicadores bibliométricos que se ofrecen para cada una de las revistas incluidas en Journal Scholar Metrics se recogen en la Tabla 10. etc. así como de considerarla nuclear o relacionada se realizó por tanto tras examinar a qué categorías había sido asignada por otras bases de datos. pero no a la mayoría.). Clasificación temática en Journal Scholar Metrics Social Sciences Arts & Humanities: Anthropology Archaeology & Prehistory Communication Arts Economics & Business History Education Literature Geography & Urbanism Language & Linguistics Law Philosophy Library & Information Science Religion Political Science Psychology Social Work Sociology Sports Science Las revistas nucleares (core) son aquellas publicaciones consideradas como esenciales en una categoría. Con el fin de realizar estas distinciones con precisión. . se confió en las clasificaciones realizadas por las bases de datos consultadas (Ulrichs. el uso de determinadas palabras clave en los artículos y la afiliación de los autores de dichas publicaciones. Scopus.

Por una parte. Indicadores bibliométricos en Journal Scholar Metrics INDICADOR ALCANCE H5-index h-index construido a partir de los artículos publicados por la revista en los últimos 5 años (período 2009-2013) H5-median Mediana del número de citas para los artículos que contribuyen al h5index H5-citations Suma del número de citas recibidas por todos los artículos que contribuyen al h5-index H5-index (sin autocitas) h5-index en el que se excluyen las citas procedentes de la misma revista H5-citations (sin autocitas) h5-citations en el que se excluyen las citas procedentes de la misma revista Journal self-citation rate Porcentaje de citas a una revista que provienen de artículos publicados en esa misma revista Visualización de datos Los rankings se presentan por categorías temáticas. ordenadas por defecto a partir del h5-index. las revistas nucleares se marcan en negrita para diferenciarlas de las relacionadas). Cada listado puede ser ordenado por cualquiera de los seis indicadores bibliométricos mostrados en la Tabla 10. Así mismo la búsqueda por continente y la global están igualmente disponibles. así como la búsqueda directa por palabra clave. Al pulsar sobre una categoría determinada. En la figura 73 se ilustra el ranking de las revistas nucleares pertenecientes a la categoría “Library & Information Science” en el Reino Unido. se permite el filtrado por país.Bloque B · Capítulo 10 · Productos derivados independientes Tabla 10. 237 . mientras que las relativas a Artes y Humanidades aparecen simplemente pulsando en el menú correspondiente. se informa del total de revistas nucleares incluidas en la categoría correspondiente. Por defecto aparecen desplegadas las categorías relativas a las Ciencias Sociales. Por último. En la parte superior de cada listado se ofrece información de valor añadido. Adicionalmente se puede habilitar la visualización de revistas relacionadas en el listado final (en este caso. el producto muestra directamente el ranking obtenido (un máximo de 20 resultados por página). El acceso a las publicaciones puede realizarse directamente pulsando en el país correspondiente del mapa situado en la parte derecha de la pantalla. En la figura 72 se muestra la página de inicio del producto y la selección de categorías del menú principal.

journal-scholar-metrics. Página de inicio de Journal Scholar Metrics Figura 73.238 La revolución Google Scholar Figura 72.infoec3.es/layout. que muestra un área sombreada mayor cuanto mayor es la tasa de autocita. .php?id=rank&subject=library_and_information_science> El indicador relativo a la tasa de autocitación de la revista (%) se muestra gráficamente a partir de un gráfico circular tipo tarta. Ranking de revistas inglesas en la categoría “Library & Information Science” en Journal Scholar Metrics <http://www.

marcando en negrita las categorías que corresponden con la categoría nuclear asignada en Journal Scholar Metrics. Perfil de la revista Online Information Review en Journal Scholar Metrics <http://www.journal-scholar-metrics. Finalmente. En el caso de ser listada únicamente en el ranking “all journals”. —— Categorías temáticas en las que la revista ha sido asignada. —— Lista de bases de datos en las que la revista ha sido indizada. el usuario podrá acceder a la página correspondiente al perfil de la revista. implica por tanto que la revista es solamente relacionada para la categoría en cuestión. —— Indicadores de impacto: se recopilan los mismos indicadores mostrados en la página del ranking.infoec3.es/layout. que incluye tanto revistas nucleares como relacionadas). automáticamente podrá obtener el porcentaje de autocita.php?id=journal&j_name=Online+Infor mation+Review&subject=library_and_information_science> 239 . si pulsamos sobre cualquier título de revista listada en cualquiera de los rankings. Figura 74. así como la posición y cuartil que ocupa en cada una de ellas.Bloque B · Capítulo 10 · Productos derivados independientes Si el usuario se sitúa encima de cada gráfico. en la que se muestra la siguiente información: —— Nombre y país de la publicación. así como la categoría temática en la que ha sido clasificada en cada una de ellas. tanto si contamos únicamente las revistas nucleares (ranking “only core journals”) o todas (ranking “all journals”.

se obtiene una radiografía bastante fiel de lo que es toda una disciplina o especialidad. Dado el impacto que este listado tuvo y la discusión generada en torno al mismo y a su metodología. que es la base de datos de información científica más exhaustiva que existe a día de hoy.html 15 http://www.es . se procedió a realizar un listado actualizado y ampliado de “Los autores españoles de Biblioteconomía y Documentación según Google Scholar Citations”.infoec3. El resultado de este ejercicio fue “La Biblioteconomía y Documentación española según Google Scholar Citations” 15. que fue publicado en diciembre de 2014 en el blog Google Scholar’s Digest 14. ampliara sus objetivos. los autores nos dispusimos a diseñar un nuevo producto que. Scopus).blogspot. confeccionados exclusivamente a partir de indicadores basados en el impacto de las revistas en las que publican y que figuran indizadas en determinadas bases de datos (Web of Science. Este listado pretendía ser un mero ejercicio dialéctico acerca del impacto científico e influencia académica de las distintas especialidades que anidan en la Biblioteconomía y Documentación española. a 14 http://googlescholardigest. en general. fundamentalmente) y de autores. de instituciones (universidades. a la par de exhaustivo y metódico. las revistas y las editoriales en las que se publican y las instituciones donde laboran los autores).biblioteconomia-documentacion-española. Respondemos con ello a las llamadas públicas realizadas tanto por especialistas en bibliometría y evaluación científica como. Con este producto iniciamos un proceso de deconstrucción de los tradicionales rankings de revistas.com. los documentos que producen.es/2014/12/los-autores-espanoles-de. Aquí es donde precisamente radica la originalidad de esta propuesta pionera: a partir de la producción científica de la comunidad académica de la Biblioteconomía y Documentación que cuenta con un perfil público en Google Scholar Citations. Se trata de una aproximación bottom-up que parte del trabajo realizado por los autores vinculados a una disciplina tal como se muestran en Google Scholar.240 La revolución Google Scholar La biblioteconomía y documentación española según Google Scholar Citations Tomando como base el listado de autores del área de Documentación obtenido durante el desarrollo del H-Index Scholar. Con ese fin diseñamos un original y novedoso procedimiento para conocer el impacto de toda una disciplina científica (la Biblioteconomía y Documentación). de una comunidad científica-profesional concreta (la española) así como de los principales agentes que la vertebran (los científicos y profesionales.

sustantiva y mayoritariamente sobre Biblioteconomía y Documentación. esto es. autores cuya producción no verse sustancial. organización. Tras el proceso de búsqueda (realizado el 27 de febrero de 2015). grupo de investigación. se empleó el listado de profesores españoles de ByD utilizado previamente para otros productos (en este caso el H Index Scholar). Asímismo. Los objetivos de este producto son fundamentalmente tres: —— Testar la exhaustividad. Búsqueda e identificación de autores La unidad de análisis del producto fueron los autores con perfil público en Google Scholar Citations. en este caso la Biblioteconomía y Documentación. dominio temático) en lugar de seguir evaluando a los científicos e instituciones a partir del impacto de los medios o canales de difusión en los que éstos publican sus resultados. La fuente de datos utilizada fue Google Scholar Citations. pero cuya producción no se correspondía a la temática de nuestra disciplina. documentos. cuya producción científica versara sobre Biblioteconomía y Documentación. revistas y editoriales más influyentes en la Biblioteconomía y Documentación española. se excluyeron a aquellos autores que habían publicado esporádicamente sobre ByD. —— Comprobar la capacidad de Google Scholar Citations para gestar rankings que detecten el núcleo de los autores. Para la búsqueda e identificación de los autores españoles se realizaron diversas búsquedas por palabras clave representativas de los temas cubiertos por la Biblioteconomía y Documentación (ByD). fiabilidad y validez de la información suministrada por Google Scholar Citations para radiografiar bibliométricamente una disciplina.Bloque B · Capítulo 10 · Productos derivados independientes una corriente de pensamiento que recorre todos los ámbitos científicoacadémicos. Se excluyeron por tanto a aquellos autores que empleaban palabras clave propias del campo de la ByD para etiquetar su perfil. El criterio de inclusión fue el siguiente: dos tercios de la producción que contribuyera al h-index debían tratar de 241 . —— Probar nuevas formas de construcción de clasificaciones y rankings científicos utilizando los recuentos de citas producidos por Google Scholar. donde se reclama medir directamente el impacto real de las diversas unidades de análisis científica (individuo. Asimismo. a fecha de 27 de febrero de 2015. se realizó una revisión sistemática del listado de autores a fin de detectar falsos positivos.

editoriales e instituciones. pero tuvimos que desistir de ello por varias razones: en primer lugar. A partir de una muestra final de 493 documentos altamente citados. En caso de discrepancia en el número de citas. Por otra parte. Se realizó una última revisión de estos documentos a fin de excluir aquellos que no guardaran vinculación temática con la ByD (39). Se realizó un proceso de eliminación de duplicados. Una vez depurado el listado de documentos se ordenaron por número de citas y se seleccionó el 10% de los documentos altamente citados (percentil 90). Procesamiento de datos Una vez descargados los perfiles de los 336 incluidos en nuestro listado. se extrajeron los 100 documentos más citados de cada autor. debido a la problemática en la búsqueda de autores en Web of Science. el sistema ofrece datos bibliométricos de dos fuentes externas. se identificaron los documentos indizados en esta base de datos para los 336 autores que figuraban en nuestro listado y las citas que estos documentos habían recibido. Para la adscripción institucional de los documentos se siguió el recuento múltiple. porque el 32% no tenían perfil. Advertimos que. asignándose el documento a todas las instituciones firmantes. Datos adicionales a Google Scholar Aparte de Google Scholar.242 La revolución Google Scholar asuntos relativos a la ByD. Estos listados contienen el número de documentos altamente citados publicados en las revistas científicas. como son Web of Science y ResearchGate: Para los datos de la Web of Science. se optó por elegir el que contaba con la cifra más alta. en segundo lugar porque la mayoría de los perfiles o bien carecían de información bibliográfica o bien estaba desactualizada. Inicialmente pretendimos utilizar los perfiles de ResearcherID para obtener los datos. se podrían haber cometido algunos errores en el cálculo de estos . editoriales e instituciones que se mencionan. la filiación institucional que figura en el ranking de autores es la declarada expresamente por los autores en sus perfiles de Google Scholar Citations. se construyeron los rankings de revistas. Se ejecutaron búsquedas bibliográficas para cada autor contemplando las principales variantes de su nombre a fin de identificar todas sus posibles publicaciones y las citas enlazadas a las mismas. tarea necesaria pues muchos documentos al ser firmados en colaboración aparecían en los perfiles de cada autor.

animamos a los investigadores a que creen su perfil en ResearcherID y a que lo mantengan actualizado para evitar posibles errores en próximas ediciones. Visualización de resultados El producto se presenta en los siguientes cinco rankings complementarios: —— Autores españoles que publican en Biblioteconomía y Documentación con perfil público en Google Scholar Citations. editoriales e instituciones se utiliza el porcentaje de documentos altamente citados (incluidos en el percentil 90) y el de citas que acumulan dichos documentos.Bloque B · Capítulo 10 · Productos derivados independientes datos. Aquellos que no disponían de un perfil en Google Scholar Citations fueron incluidos en un listado independiente. De ResearchGate se han utilizado dos indicadores: el RG Score y el Total Impact Points. se identificaron los perfiles de los autores españoles que investigan en Biblioteconomía y Documentación en ResearchGate. —— Documentos altamente citados (percentil 90) por los autores incluidos en dichos perfiles. Por otra parte. Indicadores bibliométricos Para clasificar a los autores se ha empleado el número total de citas recibidas y el h-index (tanto total como el relativo a los últimos cinco años. El primero se edifica a partir de las publicaciones que figuran en los perfiles. en el período 2010-2014). tanto en Google Scholar como en Web of Science Core Collection (en aquellos casos en que el documento esté indizado en dicha base de datos). Para clasificar los documentos altamente citados de los autores cuyo perfil ha sido objeto de análisis. 243 . —— Revistas que contengan documentos altamente citados (percentil 90). Para clasificar las revistas. se utilizó el número de citas. así como el número total de citas recibidas y h-index según esta base de datos. Adicionalmente se incluyeron el número de documentos publicados en Web of Science Core Collection. El segundo es el sumatorio del factor de impacto de las revistas indizadas en los Journal Citation Reports donde se han publicado los artículos. Por ello. de cómo éstas son recibidas por los científicos de la red y del nivel reputacional de los científicos que interactúan con los perfiles y los documentos asociados a ellos.

Google Scholar. en definitiva. revistas. más académico) y diferentes patrones de publicación. documentos. que permite acceder a los cinco rankings. En la parte superior se dispone del menú general. ResearchGate. y otras que puedan incorporarse en el futuro). A conocer mejor las carreras científicas y académicas de los autores incluidos y. En la figura 75 se muestra el ranking obtenido para los documentos altamente citados. a valorar de una forma quizá más justa y completa la madurez y desarrollo de la disciplina en un país. Figura 75. observando diferentes tipos de impacto (más profesional.244 La revolución Google Scholar —— Editoriales que contengan documentos altamente citados (percentil 90). en el que se muestra tanto el año de publicación como las citas obtenidas en WoS y Google Scholar. —— Instituciones que contengan documentos altamente citados (percentil 90). editoriales e instituciones) como de fuentes de datos (WoS. permiten obtener una radiografía completa del entramado de una disciplina. Ranking de documentos en La Biblioteconomía y Documentación española según Google Scholar Metrics El análisis complementario tanto de diversas unidades (autores. .

se presenta en Scholar Mirrors 16 el impacto de una especialidad científica completa. a partir de sus agentes principales: autores (tanto académicos como profesionales). Webometría y Altmetrics). Figura 76.infoec3. Informetría. independientemente de la nacionalidad de sus autores: la Bibliometría y áreas afines (Cienciometría.scholar-mirrors. Humanities and Social Sciences Finalmente. y siguiendo el modelo desarrollado anteriormente en La biblioteconomía y documentación española según Google Scholar. documentos. Scholar Mirrors – Author general overview Deconstrucción de rankings y espejos académicos El desarrollo de este producto parte de la identificación de los miembros de la comunidad bajo estudio a partir de los autores que han creado un perfil público en Google Scholar Citations (los autores sin perfil o con perfil privado han sido excluidos).Bloque B · Capítulo 10 · Productos derivados independientes Scholar Mirrors: Arts. Una vez se conoce la población de autores que GSC ofrece de la especialidad. revistas y editoriales (figura 76). ésta se confronta a la fotografía que proporciona ResearcherID (sistema de identificación de autores científicos elaborada por Thomson Reuters) así como a las imágenes proyectadas por nuevas plataformas 16 http://www.es 245 .

Cienciometría. organizaciones. Webometría y Altmetrics. como son ResearchGate (red social académica) y Mendeley (gestor de referencias bibliográficas con prestaciones de red social académica). como no podía ser de otra forma. a fecha del 24 de julio de 2015. autores. el primer paso consistió en la identificación de todos los miembros de la comunidad analizada. dominios temáticos) en lugar de continuar evaluando a los autores de forma restrictiva a través del impacto del medio o canal de comunicación en el que difunden sus resultados de investigación. se incorporan al producto las páginas personales de los autores (en tanto que primera ventana que los investigadores dispusieron en la Web para mostrar sus actividades académicas) y Twitter (el popular servicio de microblogging). elaborados a partir de las métricas generadas exclusivamente por el impacto de una colección de revistas elitistas en las que los autores publican (aquellas indizadas en las bases de datos tradicionales: Web of Science y Scopus).246 La revolución Google Scholar provenientes del mundo de la Web social que permiten actualmente a los autores la construcción de perfiles personales. Este producto responde por tanto a una corriente actual de pensamiento que clama por la medición directa del impacto real de las diversas unidades de análisis científico (documentos. Búsqueda e identificación de autores relevantes Tal y como se ha comentado. permitiendo la visualización de los distintos espejos en los que la actividad de los académicos se está reflejando hoy día. y que dispusiesen de un perfil público en Google Scholar Citations. Finalmente. en el que los datos hablan por sí mismos y la interpretación. Scholar Mirrors permite por tanto la apertura de un proceso de deconstrucción de los rankings tradicionales de revistas y autores. en este caso de los autores que habían publicado en las áreas de Bibliometría. De esta forma se desarrolla una perspectiva exhaustiva y multifacetada (tanto en agentes de investigación como en canales de comunicación) de la disciplina de la Bibliometría (y áreas métricas afines). Y es en este contexto en el que aparece el concepto de Scholar Mirrors. haciendo posible una comparación tanto del uso de las plataformas sociales como de la huella que éstas producen de una forma sencilla e intuitiva. Informetría. queda en el observador individual. Para la localización de los perfiles se siguieron tres estrategias complementarias: Palabras clave .

se procedió asimismo a buscar términos alternativos (por ejemplo: ‘bibliometrics’.nl. pero que no incluían entre sus áreas de interés los términos utilizados en la primera estrategia. Research Evaluation. Cybermetrics.000 documentos (entre ellos. —— Clasificar a los autores en dos categorías: 247 . ‘bibliometry’. todos los artículos publicados por las revistas nucleares indicadas previamente). etc. Este proceso permitió la recopilación de cerca de 15.). science-metrix. ISSI Proceedings) con el objetivo de extraer un conjunto de términos ampliamente utilizados y representativos de la disciplina (un total de 18 keywords). con el doble propósito de: —— Detectar falsos positivos: autores cuya producción científica está completamente alejada de la disciplina evaluada. a partir de las cuentas de correo electrónico verificadas en los perfiles (por ejemplo cwts. Journal of informetrics.com. ‘bibliometrics methodology’. Filtrado y clasificación de perfiles de autor En esta fase se llevó a cabo un proceso de revisión manual sistemática. ver figura 50). Búsquedas adicionales Finalmente se llevaron a cabo búsquedas adicionales en el buscador general de Google Scholar con el fin de localizar autores con perfiles públicos creados en GSC. sin control o filtro alguno). Dada la falta de normalización de los términos. ‘bibliometric’. Posteriormente se buscaron los perfiles académicos que contuvieran dichos términos entre las áreas de interés manifestadas por los autores (se recuerda que GSC permite un máximo de 5 términos por perfil.Bloque B · Capítulo 10 · Productos derivados independientes Se realizó una búsqueda en un conjunto de revistas nucleares de la disciplina (Scientometrics.). aunque éstos hayan incorporado etiquetas pertinentes en sus perfiles personales (debemos recordar que Google Scholar proporciona control absoluto a los autores para incorporar los términos que ellos deseen.leidenuniv. a partir de los cuales se identificaron autores no incluidos en los pasos anteriores. Afiliación institucional Se buscaron manualmente los perfiles asociados a centros de investigación dedicados a la Bibliometría. etc.

autores relacionados. se utilizó el servicio WoS’s Cited Reference Search. 4 en Mendeley. En el caso de que el documento no estuviera indizado en esta base de datos. se procedió a extraer los 100 documentos más citados de cada autor según su perfil académico. Related (relacionados): autores que de forma esporádica han publicado estudios bibliométricos o su área de especialización está muy relacionada (estudios sociales. aparte de las 6 métricas extraídas de Google Scholar Citation (Citas recibidas. Esta búsqueda se realizó durante las dos primeras semanas de septiembre de 2015. se trató de localizar sus perfiles en las plataformas seleccionadas: ResearcherID. Tras la eliminación de duplicados se obtuvo una muestra de 41. Mendeley y Twitter.248 La revolución Google Scholar Core (nucleares): autores cuya producción científica pertenece en su mayor parte al campo de la Bibliometría. para los 813 autores seleccionados con anterioridad. En cada una de las plataformas seleccionadas se extrajeron los principales indicadores disponibles. La página personal de los autores se extrajo de la información proporcionada por los autores en su perfil académico en GSC (Ver figura 50).000 documentos. . políticos o económicos sobre Ciencia). que se ordenaron en función del número de citas recibidas. tanto totales como las relativas a los últimos 5 años). 9 en ResearchGate. de los que 397 se consideraron nucleares y. un total de 24 métricas (5 en ResearcherID. h-index i10-index. y 6 en Twitter). Tras aplicar los procesos anteriores. Aproximación multifacetada I: unidades de análisis científico Una vez obtenida y caracterizada la muestra. se extrajo la información bibliográfica básica (especialmente las fuentes: revistas y editoriales) así como el número de citas en Web of Science. Aproximación multifacetada II: espejos en la web social Finalmente. los 416 restantes. Para los 1.000 documenos más citados de este listado. ResearchGate. se seleccionaron finalmente un total de 813 perfiles públicos en GSC.

han supuesto la popularización y democratización de la búsqueda y evaluación de la información académica. acceso y evaluación de la información científica (Google Scholar y su familia así como los productos derivados de los mismos que son objeto de este libro). han penetrado en el tejido científico a toda velocidad. En primer lugar. convirtiendo al PC (Personal Computer) en un electrodoméstico de consumo. gracias a la . y si Google significó la búsqueda fácil y rápida de información (bastaba con asomarse a una simple ventana alejada de las complejas pantallas de búsqueda de las bases de datos y catálogos bibliotecarios). En segundo lugar. así como de acceso libre y gratuito. las nuevas herramientas de búsqueda.Conclusiones Google Scholar: la caja de pandora académica Si el ordenador lanzado al mercado por IBM a principios de los 80 del siglo pasado supuso la entrada de la informática en nuestra vida cotidiana. si los programas de tratamiento de textos (WordPerfect. Word) sacaron el arte de la tipografía de las imprentas llevándola a nuestras mesas de escritorio. creó una auténtica aldea global al conectar el mundo y la sociedad derribando las fronteras espaciales e incorporó a los circuitos del saber a toda la población dando voz a los que no la tenían y altavoz a los que ya la poseían. debido a la proliferación de páginas web personales e institucionales (grupos de investigación. La irrupción de Internet a partir de la década de los noventa del siglo XX supuso un hito extraordinario pues revolucionó las formas de comunicación humana. Simples y sencillos de entender y usar . El número de documentos científicos circulantes en Internet y en acceso abierto crece de manera exponencial gracias a la conjunción de distintos fenómenos. Desencadenó una serie de cambios tecnológicos y metodológicos que han derivado en la creación de una serie de herramientas que han abierto enormes posibilidades para la búsqueda de información académica y medición del rendimiento científico.la divisa de estas nuevas herramientas -. si Internet. departamentos. a través de las cuales los científicos y las entidades en que éstos trabajan intentan difundir los productos de su actividad académica. A saber: —— Espectacular crecimiento de la literatura académica en acceso abierto en Internet. institutos).

nacidos al calor del movimiento open access. capítulos. indiza mayor variedad de géneros documentales (artículos de revistas. recuperación y acceso universal a las publicaciones científicas. A lo largo de todos los trabajos y estudios comentados en esta obra se ha puesto de relieve que Google Scholar cubre muchísimos más documentos que cualquiera de los sistemas de información científica tradicionales. repertorios bibliográficos y directorios de publicaciones científicas de todas clases. informes. Desde un primer momento Google Scholar se convirtió en un buscador de documentos académicos y de las citas que éstos reciben. recoge documentos en todos los idiomas sin restricción y recupera un porcentaje muy elevado de citas. el tratamiento y la medición de la información bibliográfica indizada por Google Scholar. informes…) y al hacerlo en todos los países e idiomas. comunicaciones a congresos…). por la presencia en la Web de catálogos de editoriales. —— Extraordinario crecimiento y mejora en la indización de la literatura científica a través de los buscadores. artículos de revistas científicas. —— Creación de índices bibliométricos (h-index) simples y sencillos de construir y entender. muchas de las cuales proceden de las fuentes de referencia académica para el universo de las Humanidades y Ciencias Sociales. tesis. bibliotecas. deviene en una herramienta de suma utilidad para medir la producción y el impacto académico en el sentido más amplio del término. . Al rastrear en la Web toda la variopinta tipología de documentos de corte académico generados por los profesores e investigadores en su actividad cotidiana (libros. ponencias y comunicaciones en congresos. Y en tercer lugar. Pero es especialmente de utilidad para los científicos de Humanidades y Ciencias Sociales porque controla como nadie lo ha hecho hasta ahora la literatura no anglosajona y aquella transmitida por medios distintos a las revistas científicas. y capaces de sintetizar las dos dimensiones de la actividad científica: producción e impacto. de los cuales el programa “Publish or Perish” es el más representativo. Google Scholar se ha convertido ya (y teniendo en cuenta su ritmo de crecimiento vertiginoso lo será más en el futuro inmediato) en una mina de información científica prodigiosa. —— Creación de nuevas herramientas para la búsqueda masiva.250 La revolución Google Scholar multiplicación de repositorios institucionales y temáticos. El nacimiento a finales de 2004 de Google Scholar marcó una auténtica innovación en la búsqueda. material docente. tesis. libros. que es la peor controlada por los sistemas de información dominantes en el mundo académico.

casi imposible dada la naturaleza universal de la empresa). actas de congresos o editoriales de monografías. por otra parte. es tan masiva y rica la información académica que procesa que no podemos mirar hacia otro lado. bien sean revistas. No podemos ignorar o menospreciar ni mucho menos desaprovechar esta oportunidad para indagar en el análisis métrico de la información científica y académica de campos inéditos hasta el momento. Gracias a Google Scholar se puede llegar a lugares antes insospechados para ofrecer retratos que. trabajos publicados en su lengua nativa y en medios nacionales. 251 . aunque tienen una especial predilección por las monografías (libros y capítulos de libros). todos ellos ampliamente discutidos en el capítulo 7. Las peculiaridades de los investigadores de Humanidades y Ciencias Sociales en sus prácticas de comunicación científica hacen inservibles las bases de datos bibliográficas tradicionales que ofrecen tanto recuentos de publicaciones como de citas (Web of Science. —— Publican fundamentalmente en medios nacionales. son mejores que la nada. como son las Humanidades y Ciencias Sociales. aunque a veces sean de brocha gorda. y a que desconozcamos con precisión y no controlemos sus entrañas (algo. en las Humanidades y Ciencias Sociales quedaron relegados a un segundo plano cuando no abiertamente rechazados. Las razones no fueron otras que la propia idiosincrasia de la investigación en estos campos: —— Publican en una amplia variedad de medios. Google Scholar y los productos gestados en su interior abren posibilidades insospechadas y que debemos explorar. Google Scholar puede ayudar a abrir definitivamente la caja de Pandora académica. —— Citan fundamentalmente monografías.Conclusiones · Google Scholar: la caja de pandora académica A pesar de los problemas técnicos y metodológicos que pueda actualmente presentar Google Scholar como fuente de información (errores en la identificación de documentos y citas. —— Utilizan su lengua vernácula como principal medio de expresión. Psychinfo…). carencia de control y normalización de sus registros). falta de transparencia en la selección de fuentes. Pues bien. Dichas bases de datos cubren casi exclusivamente artículos de revistas. Conviene recordar que mientras que los indicadores bibliométricos fueron adoptados inmediatamente como herramientas evaluativas en las disciplinas científico-técnicas. A efectos evaluativos ofrece luz donde antes había sombras. Scopus. se orientan fundamentalmente a las disciplinas científico-técnicas y poseen un marcado sesgo anglosajón en cuanto a la procedencia e idioma de los documentos que indizan.

No hay que olvidar por otra parte el carácter experimental de todos los productos mostrados en el segundo bloque del libro. cuyas características bibliográficas (en tanto documentos citantes y/o citados) están destinadas a modificar ciertos axiomas y prejuicios en la evaluación académica. colocando el impacto de sus trabajos en órdenes de magnitud similares a los de otras disciplinas. reclamado por unos pocos y confinado en el mejor de los casos en resultados de investigación. . Por el contrario. manifiestamente perjudicados (o directamente olvidados) en las bases de datos bibliométricas tradicionales. observemos y describamos esos nuevos paisajes y decidamos entonces si preferimos quedarnos solamente con la superficie. sin olvidar por supuesto las importantes amenazas que su uso y abuso pueden implicar. Quizás todo ello permita por fin replantear ciertos sistemas de evaluación y promoción.252 La revolución Google Scholar La apertura definitiva de esta caja liberará a tipologías documentales (especialmente monografías. es una de nuestras divisas). aportando para ello datos empíricos (contra data non argumenta. programas de financiación o incluso estructuras y políticas de investigación. tesis. Esperamos por tanto contribuir y ayudar de este modo a la comunidad científica a dudar acerca de la supuesta verdad de un mundo académico visto exclusivamente desde la punta de un elitista iceberg. que se dirigen complementariamente a comprobar el grado de aceptación de productos de esta naturaleza en comunidades académicas. pero sin aplicación ni repercusión práctica. Por todo ello. Permitirán desvelar y aflorar el rendimiento de investigadores hasta ahora infravalorados. propias de otras actividades profesionales no científicas. tan alejadas de ejercicios y prácticas bibliométricas de este calibre. Un investigador tiene el deber de dudar. evitando en la medida de lo posible las meras opiniones o prejuicios. inaccesibles e inexpugnables. Exploremos al menos las profundidades. El reciente informe “The Metric Tide” (Wilsdon et al. informes y capítulos de libro) hasta ahora ocultas. como son las de los científicos de los campos humanísticos y sociales. con mayor o menor impacto. deseamos que esta obra pueda servir de ayuda tanto para comprender el funcionamiento de Google Scholar como para vislumbrar las enormes posibilidades que su uso promete. hasta ahora protegidos por la ausencia de instrumentos y prácticas de evaluación. confirmará el bajo cuando no nulo rendimiento de otros investigadores. 2015) comienza de hecho a dejar entrever esta corriente de cambio desde una posición institucional y no meramente como un ejercicio intelectual.

Cabrerizo. D. Glover.... A. Scopus and Web of Science. E.. E. E. computation and standardization for different scientific fields. Landry. Usage Stalled. 3(1). Martín-Martín. Isidro F. L. M. (2015). C. (2011). Orduña-Malea. Scopus and Google Scholar: A content comprehensiveness comparison. Counting citations in the field of business and management: why use Google Scholar rather than the Web of Science.. Arlitsch. (2006). 55(5). 7. (2007). Amara. Journal of Informetrics.M. Bakkalbasi.M. M. Anders.. Is Google Scholar useful for bibliometrics? A webometric analysis. Scientometrics.S. (2010). Respiratory care. Martín-Martín. S. N. 13. (2009). J.M. 60-81. 91(2)..J.E. (2012). R. Scientometrics. Bauer. Baggett. Comparison of PubMed and Google Scholar literature searches. E. H-Index: A review focused in its variants. Scopus and Google Scholar. 273-289. Rensleigh. Biomedical digital libraries. F. (2012). Bar-Ilan. (2010). Which h-index? — A comparison of WoS. R. J... L. R. (2014). J. 74(2). Herrera. 727744. E. K. Índice H de las revistas científicas españolas según Google Scholar Metrics (2009-2013).Bibliografía Adriaanse. Ruiz-Pérez. J. 31(6).. EC3 Reports.. Something’s Gotta Give! En Proceedings ofthe Charleston Library Conference. S.. . Invisible institutional repositories: Addressing the low indexing ratios of IRs in Google Scholar. N. Evans. Ruiz Pérez. 3(4). Alonso. A. EC3 Reports. (2013). Budgets Stretched. P.. 7. Web of Science.. 257-271. 93(3). (2012). Delgado LópezCózar. EC3 Reports. Scientometrics. 553-581. Three options for citation tracking: Google Scholar. Índice H de las revistas científicas españolas según Google Scholar Metrics (2010-2014). Bar-Ilan. Williams. Delgado López-Cózar. J. Ayllón. Library Hi Tech. Orduña-Malea. O’Brien. Scopus and Google Scholar.. The Electronic Library.. (2013). Scientometrics. Wang. Índice H de las revistas científicas españolas según Google Scholar Metrics (2008-2012).. J. Ayllón. Citations to the ‘Introduction to informetrics’ indexed by WOS.. K.. 82(3). 343-351.. Herrera-Viedma. F. 30(1). Ayllón.S. Aguillo. 578-583.P. 495-506. Staff Stressed. Delgado López-Cózar. E.. 17.

Comparison of the Research Effectiveness of Chemistry Nobelists and Fields Medalist Mathematicians with Google Scholar: The Yule-Simon Model Blankenship. Sc. H. Google Scholar as replacement for systematic literature searches: good relative recall and precision are not enough. Schier. 2(1). Journal of electronic publishing.. Gipp. Wilde. (2009). M. London: Routledge Boeker. P.J. Pellen (Ed. R. (2010). J. Rahm. A.. 41 (2). Science Citation Index.M.. 13(3). Gipp. Marx. Thor. Anderson. Some measures for comparing citation databases. D. S. (2005). Lin. Sage. Katz. Beel. Science Direct-ly into Google.K. J.. A. and Google Scholar (GS) citations: a test of their relationship with economics Nobelists. 3(1). Kramer. Daniel. Academic Search Engine Spam and Google Scholar’s Resilience Against it.D. Marx. H.. Bornmann. Bakkalbasi. Brantley. Journal of Scholarly Publishing.J. Bornmann. (2015). (2010). Journal of Informetrics. L.. A.M....J. En Proceedings of the 12th International Conference on Scientometrics and Informetrics (ISSI’09).. M. W. Systematic reviews. Academic Search Engine Optimization (ASEO): Optimizing Scholarly Literature for Google Scholar and Co.. (2009). Smolinsky. Smolinsky. B. L. J.. H. Vach.. Sage.. Bensman. Bauer. Google Scholar’s ranking algorithm: an introductory overview. (2005). 26-34. Beel.. Belew. J.. E. L. Schier. (2014). W. D... K. 54-65).. 11(9). (2013). using Google Scholar. . Convergent validity of bibliometric Google Scholar data in the field of chemistry—Citation counts for papers that were accepted by Angewandte Chemie International Edition or rejected but published elsewhere.. BMC Medical Research Methodology. 176-190. B. 230-241. Who Holds the Keys to the Web for Libraries? En Willian Miller y Rita M. L.S. Journal of Informetrics. S. 13(131).R.J.F. The application of bibliometrics to research evaluation in the humanities and social sciences: an exploratory study using normalized Google Scholar data for the publications of a research institute. D. Bensman. the h-index. N. D-Lib magazine. 27-35. A.). Giustini. J. Thor. (2007). Beel. Powerlaw distributions.S. B. Scientific impact quality and quantity: Analysis of two sources of bibliographic data. W..254 La revolución Google Scholar Bar-Ilan. (2013). Tools of change for publishing.. An examination of citation counts in a new scholarly communication environment. P. Gipp.. 115.S. E.. (3 July 2007). Bramer. (2009). Daugherty. Googlization of Libraries (pp. The comparative recall of Google Scholar versus PubMed in identical searches for biomedical systematic reviews: a review of searches used in systematic reviews. Motschall. 1. 1(1)... W. (2014). E. B. E.F. Levene.

A. E. (2012a). (2012). A. Google Scholar. Science searches shift up a gear as Google starts Scholar engine. Page.. Delgado López-Cózar. 57(6). EC3 Working Papers. Brown. just an amusement or a valid scientific tool? EC3 Working Papers. Reprint of: The anatomy of a large-scale hypertextual web search engine. Bawden. Vaughn. 1. Delgado-López-Cózar. D. Swan. Researchers’ use of academic libraries and their services: a report commissioned by the Research Information Network and the Consortium of Research Libraries. 498-512. 98(4). E. The future of library resource discovery. 56(18). NISO whitepapers. (2010). Cabezas-Clavijo. Cabezas-Clavijo. Delgado López-Cózar. A. Cabezas-Clavijo. (2012). (2004). Superficiales: ¿Qué está haciendo Internet con nuestras mentes? Madrid: Taurus. E. (2006). A. 343-354.Bibliografía Breeding. A. Las revistas españolas de Ciencias Sociales y Jurídicas en Google Scholar Metrics. Chen. N. Researchers of Tomorrow: The research behaviour of Generation Y doctoral students. Delgado López-Cózar.. (2011).. 12 [English version]. J. 37(5). 255 . Information Services and Use.. Cathy De Rosa et al. D. Internet Reference Services Quarterly. E. B. Brophy. Cabezas-Clavijo. Carpenter. Library Scholar: Testing the Performance of Schoogle. N. EC3 Working Papers. Medicina intensiva. X. Google Scholar e índice h en biomedicina: la popularización de la evaluación bibliométrica. Butler D. ¿están todas las que son? EC3 Working Papers. RIN & CURL.. 2. E. 413-427. (2013). College Students’ Perceptions: Libraries & Information Resources.. 432(7016). (2005). Online Information Review 30(4). 3-17. OCLC: Reports. 10(3). S. (2005). (2012). Google Scholar vs. A. Callicott. (2012c). S. Webfeat. Nature. 32(1). Carr. (2007). Computer networks. Aslib Proceedings. 3. Metalib. 3825-3833. Cabezas-Clavijo. L.. Brin. (2015). Is Google Enough? Comparison of an Internet Search Engine with Academic Library Resources. Google Scholar Metrics 2013: nada nuevo bajo el sol. ¿Es posible usar Google Scholar para evaluar las revistas científicas nacionales en los ámbitos de Ciencias Sociales y Jurídicas? El caso de las revistas españolas.. Cecchino. and Google: the strenghs and weaknesses of federated search engines compared with Google. 320-321.. 423. Delgado-López-Cózar. Scholar Metrics: the impact of journals according to Google. Baltimore: NISO. (2005). (2013). J. Journal of the Medical Library Association. 71-88. M.

. J. D. Disponible en: Cusker. (2009). limitations and its relation with other bibliometric indicators at the micro level. E. E. 2014).. Google Scholar’s Dramatic Coverage Improvement Five Years after Debut. Google Scholar Metrics revisado: Ahora empieza a ir en serio... paper 2. Serials Review. Google da un lavado de cara a sus Google Scholar Profiles = Google Scholar Citations. (2012b). Orduña Malea. Thomson. F.. (49). 2011-2013. (2007). A. 293301. Journal of Library Administration. 26(2).M. R. (2009). R. E. Ruiz Pérez. 101-114.. Learned publishing. 39(3). Ayllón. M. (2010). Christianson. (2013). T. Google Scholar acceptance and use among graduate students: A quantitative study. (2012a). (2008). Delgado López-Cózar. Disponible en: Cooke. R. E.. F. (2012). 193-203... Bordons. 8. 21(4). Pesquita. Thinking Inside the Box: Comparing Federated Search Results from Google Scholar. Delgado López-Cózar. 2ª edición. Live Search Academic. 36(4).. Grego... 13(1). J. B. P. 31-42. EC3 Informes. Davis. Costas. Cothran. Cybermetrics. 221-226. C. X.256 La revolución Google Scholar Chen. Journal of Academic Librarianship. A. R. E... JOURNAL SCHOLAR: Una alternativa inter- . Library and Information Science Research.. M. E. (2007). Delgado López-Cózar. Índice H de las revistas científicas españolas según Google Scholar Metrics (2007-2011). Delgado López-Cózar. A. Verissimo. ETDEWEB versus the World-Wide-Web: A Specific Database/Web Comparison (No. (2010). T. TN (United States). G. Handling self-citations using Google Scholar. 1(3).. Oak Ridge. M. Cabezas-Clavijo. (2011).M. Cabezas-Clavijo. (2013). Issues in Science and Technology Librarianship. Journal of Informetrics. Cutler. Marcos Cartagena. Ruiz-Pérez.. 4. (2013). Heath. The h-index: Advantages. E. 33(4). LibQual+ 2009 Survey. D. 46(3).. El profesional de la información. Couto. EC3 Working Papers. R. Jiménez Contreras. Delgado López-Cózar. Google Scholar Metrics: An unreliable tool for assessing scientific journals. and Central Search. Kyrillidou. (23 agosto. Ecology articles in Google Scholar: levels of access to articles in core journals. Ranking journals: could Google Scholar Metrics be an alternative to Journal Citation Reports and Scimago Journal Ranks. Cook. Donlan. M. Cabezas-Clavijo.. Roebuck. 419-427. Energy Technology Data Exchange (ETDE Operating Agent). USDOE/OSTI (Office of Scientific and Technical Information). C. 3. E. ETDE/OA--237). Delgado López-Cózar. Association of Research Libraries. Elsevier Compendex and Google Scholar: A Quantitative Comparison of Two Resources for Engineering Research and an Update to Prior Comparisons.

Repiso-Caballero. 41. Theory and practise of the g-index. Google Scholar and more: new Google applications and tools for Libraries and Library users. Egghe. 5. L. 360-384.Bibliografía nacional. H Index Scholar: el índice h de los profesores de las universidades públicas españolas en humanidades y ciencias sociales. D. Accuracy and completeness of publication and citation records in the Web of Science. R. El profesional de la información. and Google Scholar: A case study for the computation of h indices in Psychology.. Scientometrics. Detlor. M. (2009). 333-349. 83(1). W. (2010). Jiménez-Contreras. E. Franceschet. 478-484. R. Scientometrics. Google Scholar versus PubMed in locating primary literature to answer drug-related questions. Robinson-García.. (2010). E. M.. (ed. 69(1). 82(2).A. Use of Scopus and Google Scholar to measure social sciences production in four major Spanish universities. 43(3). Dubicki. M.K. 23(1). Ettinger. 65(3). Annals of Pharmacotherapy. 251-258.. 131-152. D. Journal of the American Society for Information Science and Technology.G. (2013). E. Journal of Library Administration. Robinson-García.. (2008). Delgado López-Cózar. G.. 2070-2085. paper 4. Humanidades y Ciencias Sociales. The Triumph of Expediency: the impact of Google Scholar on Library instruction. 46(3-4). EC3 Working Papers. Research behavior patterns of business students. Ettinger. Reference Services Review. Gomez-Uranga. Scientometrics.). (2014). N. Pellen. Web of Science and Scopus. 45-52. Journal of the American Society for Information Science and Technology. (2012).. The triumph of expediency: The impact of Google Scholar on library instruction. García-Pérez. En Miller.. Lauderdale. M. S..W. 243-258. Delgado López-Cózar. E. E. 87-94.A. Etxebarria. 61(10). gratuita y de libre acceso para medir el impacto de las revistas de Arte. D. Orduña-Malea.. V. (2006). Kendrach. Torres-Salinas. Repositories in Google Scholar Metrics or what is this document type doing in a place as such? Cybermetrics. Woolley. Academic library web sites: current practice and future directions. PsycINFO. (2009). 446-454. B. (2014). N. A comparison of bibliometric indicators for computer science scholars and journals on Web of Science and Google Scholar. 65-72. Lewis.. 16(1).. Journal of Academic Librarianship. (2006). The Google Scholar Experiment: how to index false papers and manipulate bibliometric indicators. Delgado López-Cózar. Comunicar. E. New York: Routledge. M. 38(3). E. R. Delgado-López-Cózar. Ruiz-Pérez. T. 257 . (2010). Freeman.. (2009). 32(3). The Impact of Scientific Journals of Communication: Comparing Google Scholar Metrics.

Metalib and Google Scholar: A user study. Barsky. Harzing. Van der Wal. A. Brophy. Google Scholar and academic libraries: an update. (2013). (2005). Inger. 8(1). . 53(4). and Scirus: comparisons and recommendations. 52. (2013a). Journal of the Canadian Health Librairies Association. A look at Google Scholar. Gardner. (2013b). Online journal of public health informatics. S. Online Information Review. 94(3). PubMed. Darmoni.N. E. 42-45. A. L. Haglund. The publish or perish book. Google Scholar is not enough to be used alone for systematic reviews. 109(5/6). Scientometrics. Library Hi Tech News. Eng. D.. Widmark. A. Google Scholar as a new source for citation analysis.. A. 211-222. 8(1). Ethics in science and environmental politics. Karen A. 61-73. Scientometrics. Giustini.. Gaga over Google? Scholar in the Social Sciences. Abindon... R. How Google is changing medicine. (2008). Jillian R. Comparing the Changing User Behaviour between 2005 and 2012 and its Impact on Publisher Web Site Design and Function. 565-575. (2005). (2008). T. 1549-50. W... Google Scholar. W. A. Library Trends. Gehanno.... Google Scholar: A Source for Clinicians? Canadian Medical Association Journal. Harzing. 98(1). (2013). 1487-1488.F.W. Olsson. (2007). E. Journal of Academic Librarianship. M. (2005). P. S.W. 438(7068).. The Impact on University Libraries of Changes in Information Behavior among Academic Researchers: A Multiple Case Study. Renew Training. S. Harzing. L.. P. 26(3). J. Science in the web age: start your engines. J. 1057-1075. A preliminary test of Google Scholar as a source for citation data: a longitudinal study of Nobel prize winners. (2005). Henderson. (2005). 31(3). Tarma Software Research [HTML edition]. 545. 365-375. 5(2). 554555. (2008). 331(7531). (2014). 13(7). Is the coverage of Google Scholar enough to be used alone for systematic reviews. New Library World. BMJ.258 La revolución Google Scholar Gardner. Nygren. S. 214. Harzing... Bowering Mullen. Hartman. Giles. Wikipedia. Van der Wal. 61-73. Rollin.W. 34(1). A longitudinal study of Google Scholar coverage between 2012 and 2013. D.K. R. Griffiths. (2005). D. L. BMC Medical Informatics and Decision Making. Boulos. (2013).W. G. (2007). Nature. Haya. J. Harzing. Giustini. 172(12). 85-89 Giustini. Ethics in Science and Environmental Politics. Google Scholar: the democratization of citation analysis. 22(8). How Readers Discover Content in Scholarly Journals. Student Searching Behavior and the Web: Use of Academic Resources and Google.

T. Lancaster. Online Information Review. Google Scholar lead engineer. P. (2005a). 89(9). Online Information Review. and Google Scholar. Živković. too late?. J. Jacsó. How scholarly is Google Scholar? A comparison to library databases. C. T. An interview with Anurag Acharya. Howland. R. (2013). Google Scholar: the pros and the cons. 227-234. Deflated. R. C. Online Information Review. Online information review. L. P. 57(4).. inflated. Google Scholar Author Citation Tracker: is it too little. Disponible en: Jaćimović. 29(2). I. Wulfson. (2004). P. (2008b). Google Scholar and its competitors: accessing scholarly resources on the web. 259 . Google hit with trademark suit over ‘Scholar’. Google Librarian Central. and PubMed. Online Information Review. Jacsó. Hsieh-Yee. Using Google Scholar for journal impact factors and the h-index in nationwide publishing assessments in academia – siren songs and airraid sirens. Google Scholar revisited. C. P. Jacsó. 175-191. 36(4). Scopus and Google Scholar. P. Current Science. 297-309.Bibliografía Herrera. Web of Science. P. (2012c). P. Schonfeld. Itaka S+R. (2010). (2011). 32(3).. Wright.. Metadata mega mess in Google Scholar. JISC & RLUK. B. Jacsó. (2015). 32(1). Jacsó. and phantom citation count. 72(4). (2008c). M.. Hightower. and Web of Science for F. 63(4). Stomatoloski glasnik Srbije. (2012a). S. Roberts. UK Survey of Academics 2012. 604-619. Boughan. (December 2006). 34(1). (2010). 70 (3). Online Information Review. Online Information Review.. 102-14. (2006). CNET News. 56(4). 126-141. A citation analysis of Serbian Dental Journal using Web of Science. Jacsó. 784815.. (2010). Testing the Calculation of a Realistic h-index in Google Scholar. Issues in Science and Technology Librarianship. Jacsó. As we may search–comparison of major features of the Web of Science. G. 36(3). College & Research Libraries. Google Scholar Users and User Behaviors: An Exploratory Study. A. Scopus. Oxford: Chandos. Housewright. Google Scholar Metrics for Publications: The software and content features of a new open access bibliometric service. (2012b). P. 208-214. 1537-1547. Jacsó. Hines. K. 201-211. W. (2009). Scopus. (2005b). P.. 437-452. 329. R. J.. Jacsó. Caldwell. The pros and cons of computing the h-index using Google Scholar. Online Information Review. P. Hughes. (2008a). 36(1). Roger C. College & Research Libraries. 30(3). Jacsó. Shifting Sands: Science researchers on Google Scholar. with implications for library collections budgets. Petrović. C. Library Trends. 462-478.

An Evaluation of Google Scholar and Scirus Search Engines Using Turkish Search Queries. Kousha. Radicchi. Kilgour. 285-286. Nabavi. 140-157. Şenol. Open access and sources of full-text articles in Google Scholar in different subject fields. Journal of Academic Librarianship. Jones.. M. 273-294. An automatic method for extracting citations from Google Books. Assessing the citation impact of books: The role of Google Books. (2005). 1092-1096. 7(4). (2011). Menczer. and Scopus. 5053. Thelwall. M.. M. M. En: Proceedings of the 2014 ACM conference on Web Science. J. (2009). Kaur. Scholarometer: a system for crowdsourcing scholarly impact metrics. e43235. E. F. Google Scholar. (2010). 38(6). G. 309-320. 302(10). Yanar. Library Journal. Radicchi. MALIS Praxisprojekte 2013: Projektberichte aus dem berufsbegleitenden Masterstudiengang Bibliotheks. Comparisons of citations in Web of Science. Shams. PloS one... Issues in Science and Technology Librarianship. Ike Antkare one of the great stars in the scientific firmament. J. (2012).... Scholarometer: A social framework for analyzing impact across disciplines. JAMA. F. 9(1). Thelwall. (2012). Journal of the Association for Information Science and Technology... 370-379. Kousha.. B. JafariAsbagh. F. and Google Scholar for articles published in general medical journals. Patil. X. Kaur.. Sources of Google Scholar citations outside the Science Citation Index: A comparison between four science disciplines. Kousha.. Scopus. 6(2). R. Biology Article Retrieval from Various Databases: Making Good Choices with Limited Resources. Journal of Informetrics.W. F. Busse. (2008). J. Scientometrics. C. D. K.. (1989). Kaur. Sun. 7(9). Lasda Bergman. A. F.V. Kulkarni. Menczer. J. 114(19). JafariAsbagh. 1635-1651.. 105(3). M. Y. (2015). Rezaie. H. I. International Society for Scientometrics and Informetrics Newsletter. or Google Scholar. Google Scholar versus EBSCO Discovery Service : ein vergleichender Retrieval-Test. 44. 74(2).M. Possamai.. 62(11). 924-932. (2015). (2013). K. (2014). Labbé. Z. Kesen. 59-79. S. Scopus. H.. L. Thelwall. K.. Hoang. 48-52. C. S. Journal of the American Society for Information Science... Kaluza. S. (2008). (2013). Aziz. Scientometrics. F. T...260 La revolución Google Scholar Jamali. 66(2). Finding Citations to Social Work Literature: The Relative Benefits of Using Web of Science. Toward 100-percent availability. M.und Informationswissenschaft der Fachhochschule Köln. . 2147-2164. Menczer. Universality of scholarly impact metrics. Information World Bilgi Dunyasi..

Conkling. 131. Coverage and up-to-dateness of the Google Scholar index. Mayr. Meier John J. 57(3).. S. A. 21052125. Science & Technology Libraries. Leslie M.. College & Research Libraries. Martín-Martín.. P. Mastrangelo. (2014). (2015). (2008). Cegolon. Yang. Zamprogno.. E. E. A Citation Analysis of College & Research Libraries Comparing Yahoo. 32-46... Electrical & Electronic Engineering.L. (10 Diciembre.. Journal of Business & Finance Librarianship. (2010). G. Ayllón. E. Levy. Kraus. Information Wissenschaft und Praxis. Levine-Clark. Science. (2007). 34(5). Google Scholar trademark case ends. “Back channel” on Medium.Bibliografía Lercher. 14(1). Google Scholar. A survey of attitudes about digital repositories among faculty at Louisiana State University at Baton Rouge. 2006). Journal of Academic Librarianship. 2004). J. E. Online Information Review. Finding Chemistry Information Using Google Scholar.. Gil. Lewandowski. BMC research notes.. M. Literature search on risk factors for sarcoma: PubMed and Google Scholar may be complementary sources. L.. Delgado López-Cózar. (July 19. C. 814-830.. A Comparative Citation Analysis of Web of Science. 70(5).. Buja. Levine-Clark. Scopus. Rossi.K. EC3 Working Papers. 306(5702). ACS takes legal action against Google: Google search service is said to infringe SciFinder Scholar trademark. A Google for academia. (2004).. E. McCullagh. Google Scholar Metrics 2014: a low cost bibliometric tool. Impact of data sources on citation counts and rankings of LIS faculty: Web of Science versus Scopus and Google Scholar. Walter. 250-262. Martín-Martín. Orduña-Malea. (2007). Google Scholar’s Coverage of the Engineering Literature: An Empirical Study. 201. Proceedings Scholar Metrics: H Index of proceedings on Computer Science. C. 31(6). 3-17. Journal of Academic Librarianship. Meho. and Google Scholar. Walter. Martell. E. Orduña-Malea. (2008). 12.R. An Exploratory Study of Google Scholar. Metha. 460-472. A. L. Chemical & Engineering News. CNET News.. Google Scholar as a tool for discovering journal articles in library and information science. A. D. J. 17. EC3 Reports. (2010). D.M. and Communications according to Google Scholar Metrics (2009-2013). Fadda. Mayr.K. 1661-1663.. Thomas W. Google. (2007). M. 261 . Delgado López-Cózar. A.I. 3(1). Journal of the American Society for Information Science and Technology.M. 34(2). Online Information Review. A. 58(13). A. (2009). A. K. The gentleman who made Scholar. Ayllón. (2006). 408-415. E.. (2008). and ISI Web of Knowledge with Implications for Promotion and Tenure. J. A. 27(4). (2015).. P. 34(3).

A. Do open-access journals in library and information science have any scholarly impact? A bibliometric study of selected open-access journals using Google Scholar. 581-594. Finding open access articles using Google. Library Journal. A. M. Asher.E. Oder. Croft. Neuhaus. K. Google Scholar Links with Libs. H. (ed.. Nourbakhsh. 60(3). 127-141. 32(3). New York: Routledge. W. 931-949. Citations and the h index of soil researchers and journals in the Web of Science. R.. Noruzi. C. . 34(1). N. B. Measuring our relevancy: comparing results in a web-scale Discovery tool. (2015). C. C.. (2006). Google Scholar. 709-715.. Cevik. Comparing Google Scholar and ISI Web of Science for Earth Sciences. Google Scholar: The New Generation of Citation Indexes. 29(4) 39-41. Martín-Martín. G. E. (2009). Nugent. H. (2005). E. 6(2). 32(6). Discovery layers and the distance student: Online search habits of students.. Medical literature searches: a comparison of PubMed and Google Scholar. Health Information & Libraries Journal. Norris. Google Scholar and more: new Google applications and tools for Libraries and Library users. 39-51 Neuhaus. A qualitative study of the impact of electronic journals on scholarly information behavior. J. Online Information Review. Journal of Academic Librarianship. Mukherjee. Miller. A. Libri: International Journal of Libraries & Information Services. 221-228. The depth and breadth of Google Scholar: an empirical study. Neuhaus. M. Ayllón. Scopus. C. (2008). Minasny. Portal: Libraries and the Academy. Young. A.. S.. Delgado López-Cózar. 7(1-2). C. Pellen. 29(3). Borrego. Scientometrics.. Christal A.) (2009). Notess... Oregón (Estados Unidos). 25-28 marzo. (2012).. (2009). OAIster and OpenDOAR. 82(2). 17-18. (2013). A. Google Scholar Goes to School: The Presence of Google Scholar on College and University Web Sites. C. Hartemink. and Google Scholar. J.. 104(3). En ACRL Conference 2015. PeerJ. (2013). Orduna-Malea. (2015). 18-39. Neuhaus.... Library & Information Science Research. E. R. Methods for estimating the size of Google Scholar. Online. 214-222.. (2005). 321-331. (2010). 130.. E. Scientometrics. McBratney. Jang. 174. R. B. Google & Google Scholar. (2005). Journal of Library & Information Services in Distance Learning.262 La revolución Google Scholar Mikki.. F. E. Wang. e183. E.. Ollé. Nugent. 55(4). Scholarly Web Searching: Google Scholar and Scirus. A. Wrede. 1. Oppenheim. Asher. Rowland. A... (2008). Namei. Mussell. Journal of the American Society for Information Science and Technology.

Ortega..0: New metrics of scholarly impact on the social Web. Ethics in Science and Environmental Politics. 25(2). Ortega. J. First Monday. J. Lloret-Romero. Oxford: Chandos. Academic search engines: A quantitative outlook. 15(7). El Profesional de la Informacion. Costas. Ayllon. Prins. Institutional and country collaboration in an online service of scientific profiles: Google Scholar Citations.. EC3 Reports.Bibliografía Orduna-Malea. J. (2006). 1-18. Delgado López-Cózar. Repiso-Caballero. EC3 Reports.. (2014). 52-56. 7(2). Martín-Martín. 33-35. Scientometrics 2. R. (2009). L. E. T. (2014). (2005). Stergiou. Isidro F. (2012).. Information Technology and Libraries. (2013). Equivalence of results from two citation analyses: Thomson ISI’s citation index and Google’s scholar service. J.. 493-500. 63(12). E. R. (2013). (August 27. A. How is an academic social site populated? A demographic study of Google Scholar Citations population. E. 65(6).M. Google Scholar and 100 percent availability of information. (2014).H.M.M. Ortega.. Science is all in the eye of the beholder: Keyword maps in Google scholar citations. (2010). Google Scholar Metrics evolution: an analysis according to languages. Microsoft academic search and Google scholar citations: Comparative analysis of author profiles. Hemminger. 5. E. Delgado López-Cózar. N. Scopus Comes of Age. En: STI 2014 Proceedings (pp. Reina Leal. Journal of the American Society for Information Science and Technology.L..L. J.. Aguillo. (2014). Pauly. Van Leeuwen. 104(1).L. Online Information Review. Wouters. 98(3). Aguillo. Las universidades públicas españolas en Google Scholar: presencia y evolución de su publicación académica web. Isidro F.. 1149-1156. 18(5). E.L. Reed Elsevier (2004). Ortega. Delgado López-Cózar. J. (2014). Orduna-Malea. 434-433). The silent fading of an academic search engine: the case of Microsoft Academic Search. L. with a comparison with Web of Science data. 8. J. Delgado López-Cózar. 2007). (2015). 936-953..I. Quint. 2353-2367. P.. H Index of scientific Nursing journals according to Google Scholar Metrics (2007-2011). Journal of Informetrics... 394-403. B... Scientometrics. 38(7). Using Google Scholar in research evaluation of social science programs. Pomerantz. A.. J. Repiso-Caballero. Orduna-Malea. Changes at Google Scholar: A Conversation with Anurag Acharya. Journal of the Association for Information Science and Technology. Infotoday. B. K. 2370-2377. Isidro F. Serrano-Cobos. J.. Ortega.. Aguillo. (2014). 263 . D. Reina Leal. R. E. E. Priem. Scientometrics.L. H Index of scientific Nursing journals according to Google Scholar Metrics (2008-2012).

Comparing test searches in PubMed and Google Scholar.. EC3 Reports. Ithaka S+R. 7. Delgado López-Cózar. 139-144. Withey. Rowlands.. T. 71-80.. H Index Communication Journals according to Google Scholar Metrics (2009-2013). Hamid R. Petrak. Journal of medical internet research. Garg. Benchmarking Google Scholar with the New Zealand PBRF research assessment exercise. M. A. M. Nicholas. The utility of Google Scholar when searching geographical literature: comparison with three commercial bibliographic databases.. Haynes. S. M. (2010).. 10. Faculty Survey 2009: Key Strategic Insights for Libraries. B. B. Torres-Salinas. Gunter.. Roger C. R.. and Societies. E. Schmitz. (2007).. Retrieving Clinical Evidence: A Comparison of PubMed and Google Scholar for Quick Clinical Searches. Bejaimal. 290-310. Mary L.. R. Šember. Utrobičić. Journal of Academic Librarianship. Scopus.. R. Croatian Medical Journal. G. Tober. Schroeder. ScienceDirect... J. 51(2). Portal: Libraries and the Academy. Putting Google Scholar to the Test: A Preliminary Study. 60(4). C. S. Scopus or Google Scholar – Which is the best search engine for an effective literature research in laser medicine?. S. (2008). M. (2009). Shultz. D.X. Delgado López-Cózar. Medical Laser Application. PubMed. Publishers. (2007). S. Fieldhouse. Iansavichus.M. 99-103. R... A.. R. 442-445. Housewright. (2013). (2007). Haesbroeck. Cobertura de las editoriales científicas del Book Citation Index en ciencias sociales y humanidades: ¿la historia se repite? Anuario ThinkEPI. Smith. D. 15(8). Journal of the Medical Library Association. Williams. 7(2). Croatian Medical Journal Citation Score in Web of Science. 74(2). 6. A.. M. Pointing users toward citation searching: using Google Scholar and Web of Science.264 La revolución Google Scholar Repiso-Caballero. Hamid R.G..A. (2007). H Index Communication Journals according to Google Scholar Metrics (2008-2012).. Wusteman. Wooliscroft.. Weir. Aslib Proceedings. 41(1).D. Program: Electronic Library and Information Systems. Repiso-Caballero. EC3 Reports.A. 110-113. Schonfeld. E. Thirion.. D. (2013). 227-239. Sontrop. Greco. Dobrowolski. N.. Measuring the impact of accounting journals using Google Scholar and the g-index.. . The Google generation: the information behaviour of the researcher of the future. P. (2011). Scientometrics.B. (2015)... 95(4). J.Z. JMLA. (2013). J. 41(4). 41(3). Shariff. R. 309-316. Huntington. 23-248.. A. (2010).. P.. E.V. Tenopir.. P. (2014). 26(3). 322-329. Robinson. Delgado López-Cózar. The British Accounting Review. and Google Scholar. Rosenstreich. Știrbu. I.

. 6(2). N.. Waltman. On the Shoulders of Giants: The Growing Impact of Older Articles. 387-400. B. J. S. Van Eck. Walters. Acharya. Delgado-López-Cózar... E. Vine. Suzuki.. Shetty. Curry. Belfiore. Kain. 126-169. Google Scholar como herramienta para la evaluación científica. Google Scholar Pioneer on search engine’s future. Campbell. N. a computer program for bibliometric mapping. Sitelines-Ideas about Web Searching. C. H. Cabezas-Clavijo. Johnson. N. Google Scholar Usage: An Academic Library’s Experience.. Journal Medical Library Association. S. W. Nature. Delgado López-Cózar. Wilsdon. 2014). (7 noviembre. (13 agosto.. Torres-Salinas. Educational Researcher. Van Aalst.. Iakhiaev. 97-99. Chiung. Verstak. 406-415. A.Bibliografía Torres-Salinas. Using Google Scholar to Estimate the Impact of Journal Articles in Education. Journal of the American Society for Information Science and Technology. N. Van Eck. P.. Viney. Analyzing the citation characteristics of books: edited books.. (2014).H. R. Wang. Scientometrics. The Metric Tide: Report of the Independent Review of the Role of Metrics in Research Assessment and Management. Hill. Y. First approach using the ‘Book Citation Index’. 84(2).. 63(2). Shaw. Henderson. Software survey: VOSviewer.. The inconsistency of the h-index. (2011).. book series and publisher types in the book citation index. Jones. 1121-1132. Portal: Libraries and the Academy. Waltman. (2010). (2010). Google Scholar coverage of a multidisciplinary field. 43. R. Online collaboration: Scientists and the social network.. L. El profesional de la información.J. L. Robinson-García. P. Tinkler.. (2012). P. 94-108. Towards a ‘Book Publishers Citation Reports’.. Emilio. (2015). S. Journal of Web Librarianship. EC3 Working Papers. R... (2009). 39(5). 317-330. (2005). (2014). Hill. Scientometrics. 7. R. L. Walters. R. A. I. Howard. Allen. Google Scholar is a full year late indexing PubMed content. E.. Van Noorden.. (2008).. M. Thelwall.. 2014). 98(3). J. Wouters. (2012). D. Google Scholar. 94(1). Robinson-García.. (2006).. A new look at evidence of scholarly citation in citation indexes and from web sources. J. 18(5). Jiménez-Contreras..H. Vine. 74(2). R. Van Noorden. D. UK: HEFCE. 512(7513). E.. W.. Torres-Salinas. A. Scientometrics.. Information Processing and Management. N. S.. M. 265 . D. Kerridge. (2012). 11(4).. L. (2007). Comparative recall and precision of simple and expert searches in Google Scholar and eight other databases.. J. D. 501-510. 2113-2127. Nature News. Lin. 971-1006.J. Y. 523-538.. Ruiz-Perez. Vaughan. R.

Proceedings of the American Society for Information Science and Technology.C. 118. Iranian Journal of Nuclear Medicine. L. 10(3/4). and Web of Science.. 20(1). R. 15471565. (2012a). A30. Iranian Journal of Nuclear Medicine. The Chronicle of Higher Education.. K. A. York. J. En Design. 1-4. Zhang. SCOPUS.266 La revolución Google Scholar De Winter. Mobile. 8015.F. Sadeghi. Young. and Usability.. J. (2005). 20(2). Scopus. 1-15. T. (2013). (2014). 98(2). (2006).. User-centered evaluation of a discovery layer system with google scholar. More than 100 Colleges Work with Google to Speed Campus Users to Library Resources. Meho.. Maurice C. Scientometrics. L. 50.I. Dodou. Citation Analysis: A Comparison of Google Scholar. L. Web. The expansion of Google Scholar versus Web of Science: a longitudinal study. R. (2012b). (2005). User Experience. Citation analysis of Iranian journal of nuclear medicine: Comparison of SCOPUS and Google scholar. and Google scholar h-indices of Iranian nuclear medicine scientists. Yang. Zadpoor. Zarifmahmoudi. . Zarifmahmoudi. 43(1). Calling the scholars home: Google Scholar as a tool for rediscovering the academic library. 1-7. Comparison of ISI web of knowledge. Sadeghi. D. and Product Design Lecture Notes in Computer Science. Internet reference services quarterly. 313-322.