La revolución Google Scholar
Destapando la caja de Pandora académica

Enrique Orduña-Malea · Alberto Martín-Martín
Juan M. Ayllón · Emilio Delgado López-Cózar
Prologado por
Peter Jacsó
Anne-Wil Harzing

La revolución Google Scholar
Destapando la caja de Pandora académica

Granada · 2016

.© LOS AUTORES © UNIVERSIDAD DE GRANADA La revolución Google Scholar. distribución. comunicación pública o transformación de esta obra sólo puede ser realizada con la autorización de sus titulares. Unión de Editoriales Universitarias Españolas Diseño de la edición: Francisco Vega Álvarez Cualquier forma de reproducción. salvo excepción prevista por la ley. Destapando la caja de Pandora académica ISBN: 978-84-338-5985-3 Edita: Editorial Universidad de Granada UNE.

75 Capítulo 4 Capturando la Web académica: Funcionamiento general........................................................................................................................ tamaño y evolución........................................ 41 Capítulo 3 Las dos caras de Google Scholar (II): La herramienta de evaluación........................... 25 Capítulo 1 Los orígenes.. 119 ..................Contenidos PREFACIO I La revolución de Google Scholar: destapando la caja de pandora académica. 27 Capítulo 2 Las dos caras de Google Scholar (I): El buscador académico........................................................................................................................................... 15 INTRODUCCIÓN21 BLOQUE A Google Scholar: el buscador académico universal................ 99 Capítulo 5 El retrato de Google Scholar: Cobertura......... 9 PREFACIO II Sacrificar un poco de precisión por una cobertura (mucho) más amplia....................................................

.....................................................................................Capítulo 6 El proceso de búsqueda en Google Scholar: Prestaciones y servicios.................................................................................... 155 BLOQUE B La familia Google Scholar: Productos derivados oficiales e independientes............................................. 249 BIBLIOGRAFÍA253 ....... 185 Capítulo 10 Productos derivados independientes.... debilidades y peligros................. 217 CONCLUSIONES Google Scholar: la caja de pandora académica..................................................... 171 Capítulo 8 Google Scholar Metrics: El impacto de las revistas científicas........................ 173 Capítulo 9 Google Scholar Citations: Los perfiles académicos en la Web........................................................... 133 Capítulo 7 Google Scholar en la balanza: Fortalezas..........

Prefacio I La revolución de Google Scholar: destapando la caja de pandora académica La caja de Pandora fue un regalo de Zeus que no debía ser abierto. Los desarrolladores de Google Scholar (GS) pusieron muchas cosas en su caja de almacenamiento. privando a los autores reales tanto de sus autorías como de sus citas. Los cuatro autores.000 ítems aproximadamente. hizo fácil que aceptara la invitación para escribir un prólogo a este libro. más cuando muchos de éstos se encuentran fácilmente disponibles tanto en fuentes de acceso abierto como de pago. libros… y en qué medida están cubiertos. que explica las ventajas y los inconvenientes de GS y demuestra la competencia de los autores y su experiencia (incluso cuando no estamos de acuerdo en algunos temas). revistas científicas. El hecho de estar familiarizado con sus artículos de revistas y conferencias.100 documentos y. profesores en diversas universidades en España. A los bibliotecarios y otros profesionales de la información les gustaría conocer el tamaño real aproximado de GS. El único punto en el que discrepo profundamente con los autores es cuando éstos empequeñecen las consecuencias “letales” de un ejemplo específico: cuando GS atribuyó a I INTRODUCTION la autoría de 40. libros. . capítulos de libro. artículos. por cuántos años. Se aprecia que para algunos de los asuntos controvertidos los autores citen artículos que critican y/o reconocen las “soluciones” de GS. realizaron una extensiva e intensiva serie de pruebas y análisis de resultados. actas de congresos. algunas de ellas buenas. el número de ítems (registros). magacines. escribieron un libro excelente sobre la base de sus investigaciones. en qué idiomas. dos años después. en las estanterías digitales de sus bibliotecas. algunas otras malas. a 700. siempre y cuando encuentren algunos buenos artículos de revistas. tesis doctorales y patentes. La mayoría de los usuarios no conocen lo que alberga la caja de GS y no se preocupan por aprenderlo. tanto en inglés como en español.

siguen produciendo miles de autores fantasma creados a partir de las palabras de los títulos de los documentos. añadiendo esa cadena sin sentido de caracteres. (2008) Incluso para un autor muy solitario. es simplemente el título de la sección II. Los trabajos citados. Un síndrome relativamente nuevo de GS es que éste sustituye el resumen/extracto original de los artículos de revista o actas de congresos. Resulta extraño por qué el título de la segunda sección fue el elegido por GS para generar el nombre falso de autor y no los títulos de la primera o la tercera sección. supuestamente llamado IIB STATISTICS según GS. Figura A1. El autor. sobre todo para las secciones acerca de la génesis de GS. GS añade contenido absurdo creado a través de un scraping de la plantilla de la pantalla de búsqueda. GS redujo esta autoría a cinco registros a fecha de septiembre de 2015. todavía de bajo nivel. Background Statistics. informes técnicos y comentarios acerca del bueno. cabeceras de secciones y etiquetas de las opciones de los menús de búsqueda (FigA2). Esto es como alabar al abusador de una mujer de que éste ha reducido considerablemente los golpes a su esposa e hijos. el feo y el malo de GS. entre ellos muchos de los artículos de los autores así como artículos de conferencias. Lo “bueno” es la amplitud de los documentos primarios en términos de tipologías documentales. Los tres autores auténticos se ven privados de su estatus de autor y de las cinco citas recibidas. sino muy común. son muy valiosos para comprender sus ventajas e inconvenientes. ante la cual indican los autores que “la mejora del sistema fue simplemente espectacular”. El malo es que los parsers (analizadores) de GS. En el caso de que no exista resumen. Extracto del famoso ejemplo de autor I INTRODUCTION Source: Bar-Ilan. idiomas y la habilidad para buscar el texto completo de documentos primarios.10 La revolución Google Scholar En efecto. . enriquecida por cientos de referencias a materiales primarios de investigación publicados acerca de GS durante los últimos doce años. otorgadas por GS al autor fantasma. J. Esto no es un síntoma raro o casual. tal y como se muestra en la siguiente captura de pantalla (Figura A3). la ventaja de agruparse en un cuarteto para escribir este libro es obvia.

Google Scholar añade un sumario a partir de las opciones en la plantilla de búsqueda en el sitio web de Wiley Online Library 11 . Ejemplo de autor fantasma (IIB STATISTICS) extraído de un título de sección Figura A3.Prefacio · Parte I · Peter Jacsó Figura A2.

El segundo bloque discute las ventajas e inconvenientes de Google Scholar Metrics for publications y de Google Scholar Citations. Las siete secciones dentro de este primer bloque dirigen a los lectores a través del proceso de cómo GS captura los datos. Esto refuerza la sensación de que. La columna vertebral de estos servicios de bases de datos son las referencias citadas y citantes (creadas manualmente por Garfield en tarjetas Hollerith. GS se las arregla para producir 552. Es decir. cuál es el tamaño y cobertura estimados. casi invisible. Microsoft Academic Search (que se ha ido desvaneciendo). a pesar del uso del adjetivo Scholar (o Académico en muchos países de habla hispana).12 La revolución Google Scholar En el caso de la colección digital del sitio web de John Wiley. la lista de revistas cubiertas y la cobertura temporal cubierta. Web of Science. exceptuando la decepcionante omisión de la fértil obra de Eugene Garfield desde mediados de los 1950 en adelante acerca de la indización de citas y la búsqueda basada en referencias citadas. actas de congresos. La cobertura del libro es excelente y completa. así como de . capítulos de libro y libros. mostrando el número de hits en el más brillante. predecesoras de los enlaces digitales). Como las prácticas de los médicos de vudú desde América del Norte a la India. Las cerca de 270 páginas del libro se componen de dos partes principales (bloques). que van desde los autores individuales e investigadores hasta los artículos. así como de los elementos del proceso de búsqueda a través del prisma crítico de los especialistas en búsquedas en bases de datos. Proquests. Su clásico trabajo publicado en la revista Science hace 60 años proporcionó la idea nuclear para la implementación de los índices de citas de ISI. La prestación “fea” más característica de GS es el secretismo relativo a la información esencial. La primera parte trata de la génesis de GS y sus características como motor de búsqueda (una herramienta de descubrimiento de recursos) así como de su uso como una herramienta de evaluación que pretende cuantificar la productividad científica y su impacto en diferentes niveles. Scopus.000 hits con el contenido que se ilustra a continuación. son muchas las fuentes no académicas. color gris. datos que son fácilmente disponibles en bases de datos hospedadas por EBSCO. el número de registros maestros. como por ejemplo el tamaño de la base de datos. Journal Citation Reports y Scimago. tal y como hacen los humanos cuando dicen algo en voz muy baja al ser conscientes de que lo que dicen no tiene sentido. del servicio de Scopus y de Google Scholar. el número de citas totales.

Hawaii 2016 April 5 13 . pero esto podría revelar demasiado acerca de las limitaciones de GS. junto a un listado sistemático de las ventajas e inconvenientes (a partir del listado de resultados de GS de los propios autores) podría contribuir al uso de esta obra como un libro de texto digital tanto para los estudiantes como para los profesores. El libro contiene ilustraciones muy informativas. objetivo y muy actualizado contenido del libro es muy necesario en tanto que las medidas basadas en métricas del rendimiento e impacto de la investigación son más y más ampliamente utilizadas por las relativamente objetivas evaluaciones del rendimiento a nivel individual de los investigadores y revistas. La edición digital puede ayudar con alta resolución e imágenes en color. lo cual no es precisamente el punto fuerte de GS. gráficos y tablas. La evaluación de la investigación a nivel institucional requerirá a Google Scholar la disposición de información relativa a la afiliación de los autores en un formato y contenido consistentes. aunque en la versión impresa utilizada para este prólogo no eran todas bien legibles. Professor Peter Jacsó Library and Information Science Program Department of information and Computer Sciences Honolulu. La navegación por todos los elementos de los metadatos será esencial. incluyendo el excelente y gratuito software Publish or Perish. La inclusión de búsquedas en las que se pueda clicar a la hora de generar los perfiles de autor de GS. El competente. podrían constituir una característica excepcional para este excelente libro. La incorporación de enlaces directos a las referencias citadas y la creación de consultas en las que se pueda hacer clic para poder repetir las pruebas de muestra.Prefacio · Parte I · Peter Jacsó algunas utilidades que ayudan en los procesos de input y output.

.

por ejemplo. la interfaz de Google Scholar no hacía muy sencilla la tarea de agregar métricas de citas de una forma accesible. de tal forma que éstas pudieran ser comparadas entre investigadores. Dedicándome al área del Comercio internacional. He estado siguiendo a Google Scholar desde su lanzamiento en 2004. debido en gran medida a que muchas de las revistas que las estaban citando no estaban (todavía) incluidas en Web of Science. la cita anterior sería un probable candidato. incluso las publicaciones no convencionales (como libros. aunque mi interés se incrementó en 2006. investigadores trabajando en disciplinas vecinas como la Economía o Psicología. Aquellas revistas que sí se encontraban incluidas tenían bajos factores de impacto. descubrí que en la Web of Science estaban indizadas muy pocas de las revistas en las que había publicado. mi expediente parecía inmediatamente mucho más brillante. capítulos de libro o incluso un ranking de revistas) tenían un fuerte impacto en términos de citas. Resultó que mi trabajo era realmente muy citado. Desafortunadamente. cuando necesitaba justificar el impacto de investigación en mi solicitud de promoción a Profesor Titular.Prefacio II Sacrificar un poco de precisión por una cobertura (mucho) más amplia Si me pidieran que resumiera mi “veredicto” sobre Google Scholar en tan solo diez palabras. hace diez años era muy difícil para un académico del área del Comercio internacional convencer a un tribunal de promoción de que había alcanzado tanto impacto como. Acceda a Google Scholar… y a publish or perish! Acceda a Google Scholar! Cuando realizaba búsquedas sobre mi obra en Google Scholar. A consecuencia de esto. . En esas disciplinas. una proporción mucho mayor de revistas académicas sí estaban incluidas en la Web of Science.

htm).harzing.7% Ciencias 64. 2016).0% 22. Una búsqueda en Google Scholar (incluyendo todas las palabras) para la expresión <Harzing “Publish or Perish”> genera cerca de 2000 resultados. debido en gran parte a que estas bases de datos no incluyen libros y.2% 65. Utiliza Google Scholar para capturar citas brutas. Publish or Perish (PoP) nació en Octubre de 2006 (http://www. Tal y como es evidente a primera vista. Como consecuencia. Para mí. Ciencias de la vida. Avances de Google Scholar durante la última década Google Scholar ha recorrido un largo camino desde sus primeros días. Comparando citas en Google Scholar con citas en Web of Science y Scopus La tabla B1 resume parte de los principales resultados de un reciente estudio sobre 146 investigadores en Ciencias. Ciencias sociales y Humanidades (Harzing y Alakangas.5% 66.com/pop. existen actualmente muchos estudios bibliométricos que confían en Google Scholar (generalmente a través de Publish or Perish) para realizar su investigación. en algunas disciplinas. 2016). esto representó además el comienzo de un nuevo “pasatiempo académico”. La mayoría de estos artículos han usado Google Scholar como fuente de datos. Journal of Informetrics o Journal of the Association for Information Science & Technology. PoP es una aplicación informática que recupera y analiza citas académicas. Desde entonces he publicado más de una docena de artículos en revistas como Scientometrics. cubren solamente una fracción de las revistas.5% 7. .16 La revolución Google Scholar Como consecuencia de ello.7% Ingenierías 57. Su cobertura ha mejorado de forma espectacular y en la actualidad es mejor que Web of Science o Scopus para cualquier disciplina (Harzing y Alakangas. tanto la Web of Science como Scopus pierden un gran número de citas en las Humanidades y Ciencias sociales.6% 45.6% Ciencias de la vida 70.8% Tabla B1. haciendo investigación en el campo de la Bibliometría. Ingeniería. Disciplina Citas en Scopus como % de citas en Google Scholar Citas en Web of Science como % de citas en Google Scholar Humanidades 11.0% Ciencias sociales 30. analizarlas y presentar posteriormente un amplio rango de métricas derivadas.

Google Scholar proporciona entre 1. Es particularmente gratificante observar que el software es ampliamente utilizado en universidades altamente posicionadas. Stanford. Ade- 17 . Ciencias y Ciencias de la vida. Tayikistán y Uruguay.CNRS en Francia) hasta laboratorios de investigación (por ejemplo. es incluso más satisfactorio ver su igualmente alta utilización en universidades con escasos recursos en países como Armenia. universidades que poseen un amplio acceso a otras alternativas comerciales. Así mismo existe un peligro nada despreciable a que. US Environmental Protection Agency o el US Agency for International Development). Grecia y Polonia. existen miles de bibliotecas por todo el mundo que listan el software como una alternativa gratuita a Scopus y la Web of Science. com/poptips/index. gracias a un acceso sencillo a las herramientas bibliométricas. tales como Harvard. Sin embargo. Países donde en muchas universidades no tienen acceso ni a Scopus ni a la Web of Science. Hewlett Packard o IBM).harzing. Microsoft. el US Department of Energy. Paraguay. 2015). No es de extrañar que el software sea usado en todo el mundo. Me parece particularmente agradable que tanto en Italia como en Grecia la aplicación haya sido regularmente utilizada para promover la transparencia y la meritocracia en nombramientos universitarios. http://www. Oxford o Cambridge. Sin embargo.htm). MIT. Botsuana. Google Scholar ha jugado desde mi punto de vista un papel fundamental en la democratización del análisis de citas (Harzing y Mijhardt. 2016. incluso en las ingenierías. desde investigadores y bibliotecarios particulares en más de 80 países hasta departamentos gubernamentales (por ejemplo.5 y 2 veces más citas que Web of Science y Scopus. tanto el software como Google Scholar son particularmente populares en Italia.Prefacio · Parte II · Anne-Wil Harzing Sin embargo. Mongolia. desde agencias de financiación (como el Social Sciences and Humanities Research Council . Google Scholar y Publish or Perish cubren claramente una necesidad! Más cerca de (mi) casa. se propicie un cierto nivel de uso inexperto o sencillamente ignorante.SSHRC en Canadá o el Centre National de la Recherche Scientifique . de las cuales las más importantes se encuentran resumidas en mi tutorial de Publish or Perish (Harzing. Mediante Publish or Perish cualquier persona con un ordenador y acceso a Internet puede ejecutar análisis bibliométricos. A nivel general. Google Scholar y Publish or Perish han democratizado el análisis de citas Soy la primera en reconocer que Google Scholar tiene importantes limitaciones.

De ahí mi cita de apertura: “Sacrificar un poco de precisión por una cobertura (mucho) más amplia”. recordado mi contraseña y accedido. he terminado prácticamente mis búsquedas en Publish or Perish! ¿Por qué necesitamos este libro? Aunque muchos investigadores han utilizado Google Scholar como fuente de datos. y que no discrimina las prácticas de publicación fuera del campo de las Ciencias (de la Vida) (Harzing. Por tanto. Sin embargo. como investigadora en el campo de las Ciencias sociales. En cualquier caso. estoy más que feliz por aceptar el error ocasional de Google Scholar a cambio de una cobertura que es muy superior a la de Scopus y Web of Science. esto es poco consuelo para las (pocas) personas a las que se les ha “robado” sus publicaciones más citadas porque Google Scholar no ha analizado gramaticalmente bien su nombre. especialmente en aquellos con elevados niveles de agregación o centrados en métricas robustas como el h-index. los investigadores que publican en sus idiomas locales en lugar de en Inglés necesitan confiar en Google Scholar si desean obtener una cobertura de su trabajo más que incidental. Google Scholar necesitaría siempre ser triangulada con otras fuentes de datos. 2015). los inevitables deslices de Google Scholar no influirán significativamente en los resultados. Lo único que lamento es que no esté (todavía) disponible en inglés! . Si se requiriera de una precisión del 99-100%. tanto en éstos como en otros países. A lo que podría añadir… “y una respuesta a la velocidad de un rayo”. ¿El veredicto? Utilizar Google Scholar significa sacrificar un cierto grado de precisión. también éstos podrían descubrir que la Web of Knowledge de Thomson Reuters no está particularmente bien versada en distinguir con precisión a los investigadores con nombres no anglosajones (Harzing. Para el momento en que he puesto en marcha el sitio web de la Web of Knowledge o de Scopus. 2013). Del mismo modo que los asiáticos del Este.18 La revolución Google Scholar más. ninguno de ellos ha sido tan diligente en sus esfuerzos para proporcionar una mejor imagen de Google Scholar que el Grupo de Investigación EC3. Desde 2008. estoy encantada de que su experiencia hasta la fecha se haya integrado ahora en una monografía. En la mayoría de los análisis bibliométricos. Emilio y su equipo han trabajado sin descanso para explorar el funcionamiento interno de Google Scholar.

“Health warning: Might contain multiple personalities.harzing.ece https://www. (2013).harzing. W.com/papers.com/poptips/index. Disponible en: http://www.thetimes. Disponible en: http://www.com 19 . 2334.com/papers. Scientometrics. A. harzing. (2015). (2016).W. A. Publish or Perish tutorial. Disponible en: http://www.htm#esi [Cobertura de prensa en: http://www. The problem of homonyms in Thomson Reuters Essential Science Indicators”.timeshighereducation.W. 102(1). Mijnhardt. 105(3). London 2016. (2015).com/papers.co.W.W.harzing. A. Scientometrics.harzing. A.Prefacio · Parte II · Anne-Wil Harzing Referencias Harzing.htm Harzing. Disponible en: http://www. “Document categories in the ISI Web of Knowledge: misunderstanding the Social Sciences?”. 93(1).co.htm#isi Professor Anne-Wil Harzing Middlesex University London Hendon. January 29 www. “Proof over promise: Towards a more inclusive ranking of Dutch academics in Economics & Business”.htm#top40 Harzing. 727-749.uk/tto/science/article4543774.uk/news/week-higher-education-%E2%80%93-3-september-2015 ] Harzing.. a collection of tips to introduce users to the program’s main functions in 80 easy chunks. Scientometrics. 2259-2270.

.

es por lo que la ponencia que presenté en el siguiente foro llevó ya por título “Google Scholar: ¿herramienta de evaluación científica?”. mis manuales de literatura dividían invariablemente el estudio de un autor en dos partes: la dedicada a desvelar la vida y la enfocada a conocer la obra. concluyendo con un relato de sus fortalezas y limitaciones. por lo que era importante no sólo conocer las creaciones literarias sino también sus entresijos. aparte de dar a conocer a una audiencia expectante en saber lo que era y prometía el nuevo buscador académico. en esa sesión. Venía yo de publicar una serie de artículos sobre la Web of Science y su universo de productos bibliográficos y bibliométricos. desde el primer momento. no se entiende la vida sin la obra. Añado yo que. y ahora vienen a mi memoria las figuras del padre Severino y de Don Francisco. nos recalcaban que no es posible entender la obra de un autor sin indagar sobre su vida. Llevó por título “Qué es y cómo utilizar Google Scholar” y. Pues bien. qué ofrecía. Todo empezó allá por el año 2008 cuando los organizadores del V Foro sobre evaluación de la calidad de la educación superior y de la investigación. y Google Scholar apareció ante mí. me encargaron la organización de una sesión docente sobre Google Scholar. en algunos casos como el de nuestro egregio premio nobel Ramón y Cajal. allá por los años setenta del siglo pasado. intenté por primera vez explicar qué cubría. pretende esta breve introducción explicar cuál es la tramoya vital que explica la concepción y ejecución de esta obra. Pero inmediatamente advertí de sus potencialidades para la evaluación de las publicaciones científicas. cómo funcionaba. A partir de ahí empecé a bucear y pes- . sabia máxima que no es más que una constatación existencial: en lo que hacemos está lo que somos. por qué podía ser interesante su uso.Introducción Cuando yo cursaba el bachillerato. Mis profesores. porque créanme hay casos en que la obra es la vida. Para empezar diré que es el resultado de siete años dedicados de forma intensa y extensa a descubrir las entrañas de Google Scholar. celebrado en San Sebastián. como una alternativa novedosa y extraordinariamente sugestiva para buscar y acceder a documentos científicos imposibles de recuperar con las bases de datos tradicionales.

laboriosidad y las brillantes habilidades técnicas de que hacen gala han sido el complemento perfecto para los resultados alcanzados por nuestro grupo. —— La publicación de 17 artículos en revistas. somos seguramente uno de los grupos que más saben acerca de los secretos que atesora el buscador. . Y a las pruebas me remito: un balance del trabajo desplegado durante estos años ha dado por fruto: —— La confección de 9 productos de evaluación bibliométrica (H Index Scholar. La tenacidad. Publishers Scholar Metrics. Enrique. compromiso y honestidad. La Biblioteconomía y Documentación española según Google Scholar Citations). Indice H revistas científicas españolas según Google Scholar Metrics (ediciones 20072011.com. después. comprensión. 2008-2012. becario FPI (2013). quedando atrapado en sus redes. como buscadores de información en la Web. Scholar Mirrors. después de los creadores de Google Scholar. En definitiva. becario FPU (2014).22 La revolución Google Scholar car en las vastas y cambiantes aguas por las que navegaba el buscador. Si feliz fue el encuentro con Enrique. que ya hizo unos primeros tanteos sobre el estudio de la presencia de las universidades españolas en Google Scholar. 2011-2015). 2009-2013.que. generosidad. 21 documentos de trabajo y 15 informes.y sin ánimo de ser pretencioso . más que dichosa y venturosa fue la incorporación al grupo de trabajo de Juanma. es) para dar cuenta de los resultados de investigación que se vayan publicando sobre Google Scholar como fuente de información y evaluación científica. desplegó en su excelente tesis un portentoso abanico de técnicas y herramientas webmétricas. Classics Scholar’ Profiles. la obra es el resultado inexorable de la vida.blogspot. La suma de habilidades diversas (siempre el todo es superior a las partes) es posible porque se asienta en personalidades caracterizadas por la bondad. 2010-2014. y todos los logros alcanzados se deben a la concordia. y Alberto Martín y Juan Manuel Ayllón. Pero el impulso decisivo para llevar a buen puerto toda nuestra labor fue el feliz encuentro con los otros firmantes de esta obra: Enrique Orduña. Proceedings Scholar Metrics. y Alberto. fraternidad y camaradería que reina entre nosotros. primero. fundamentales para conocer los intestinos de Google y Google Scholar. Sobre estas bases hemos construido un más que exitoso conjunto de resultados. Formamos un auténtico equipo. —— La edición de un boletín (http://googlescholardigest. Todo este trabajo entusiasta y prolongado en el tiempo permite que pueda afirmar con orgullo . Journal Scholar Metrics.

etc. la del buscador y la de la herramienta bibliométrica. esto es. sometiendo al tercer grado al buscador para desvelar sus virtudes y carencias. Y todo ello ofrecido de forma gratuita.Introducción · Emilio Delgado López-Cózar Y ahora que ya conocemos las mimbres y la urdimbre toca hablar del cesto. Hoy la simple Caja de búsqueda de Google. como no podía ser menos. el que lo ha hecho más inquisitivamente y con más acierto. Y hay que empezar necesariamente por sus prolegómenos. creadora de Publish or Perish. Se ha convertido. con estos prefacios se muestran esos dos rostros que conviven en Google Scholar. sin quererlo. resume sintéticamente todo lo que pensamos sobre GS: ha supuesto una auténtica revolución en la forma de buscar y de encontrar información científica y de acceder a ella de manera fácil y rápida. como herramienta de evaluación científica. un magnífico software que ha hecho factible el uso bibliométrico de Google Scholar. bases de datos bibliográficas de revistas en distinta disciplinas. se encarga por sí sola de traducir las palabras que se escriben en ella en numerosos y pertinentes resultados de búsqueda escritos en cualquier lengua. Dado que este es un libro con múltiples caras. sólo recalcar que lo hemos dividido en dos secciones. sin duda una manera de ayudar a transformar el mundo en la buena dirección… Subtitulamos la “caja de pandora académica” porque GS proporciona información que permite evaluar el interés y el impacto de los documentos. de este libro. la faz crítica frente a la faz loable… Respecto a la estructura del libro. el investigador que más ha escudriñado GS.). El título. y de los autores que los publican. y Anne-Wil Harzing. El libro viene precedido de dos prólogos firmados por dos de sus mejores conocedores: Peter Jacsó. Con ello se hace realidad el sueño de Anurag Acharya de poner a disposición de los que menos recursos tienen toda la información científica que cuelga de la Web. costosa (la mayoría de las bases de datos exigen cuantiosas suscripciones) y con complejas y poco amigables interfaces de búsqueda. Ahora ya queda lejana a la par que anacrónica la forma de buscar información científica anterior a la aparición de Google Scholar: dispersa en múltiples fuentes (catálogos de bibliotecas. de tesis. contribuyendo decisivamente al masivo uso del buscador y a la popularización de la propia bibliometría. en una valiosísima fuente de datos con múltiples usos bibliométricos. que constituyen todo un lujo. que se ha implantado como un estándar de facto. producidos en cualquier país. bajo cualquier formato y tipología documental. La sección A dedicada a describir minuciosamente 23 . de patentes.

así como el número de citas que cada uno de ellos ha recibido. Se traza su origen y evolución. Publishers Scholar Metrics. La sección B la hemos dividido en dos apartados. cobertura y crecimiento. H Index Scholar. se pormenorizan las prestaciones y servicios que proporciona como buscador y se apuntan sus fortalezas. De forma sintética hemos descrito sus características. la de buscador (razón por la que nació y que realmente lo identifica) y la de herramienta de evaluación (una aplicación sobrevenida y no buscada inicialmente por sus creadores). Dado que Google Scholar presenta una doble cara. señalando sus fortalezas y debilidades. que permitiera a los usuarios identificar las más influyentes revistas. debilidades y peligros. Scholarometer. el primero dedicado en exclusiva a la descripción de los principales productos derivados de Google Scholar. se realiza un repaso exhaustivo de toda la literatura científica que ha indagado empíricamente sobre el comportamiento de Google Scholar hasta hoy en esta doble faceta. Y Google Scholar Metrics (Estadísticas en español). 11 de marzo de 2016 . y que conforman lo que denominamos la familia Google Scholar: Google Scholar Citations (Mis citas. nacido en julio de 2011 como un servicio a los autores para que generen un perfil donde se muestren los documentos publicados y recogidos en Google Scholar. se examina su tamaño. En fin. Journal Scholar Metrics. se desmenuza su funcionamiento general. nacido en abril de 2012 como ranking de publicaciones científicas ordenado en función del h-index a partir de los datos de citaciones de Google Scholar. creo que este libro ofrece una revisión omnicomprensiva a la par que minuciosa sobre lo que es a día de hoy Google Scholar y sus derivaciones. funciones y prestaciones. en español). Proceedings Scholar Metrics y Scholar Mirrors. Emilio Delgado López-Cózar Profesor de la Facultad de Comunicación y Documentación Universidad de Granada Huétor Vega. En el segundo apartado hemos incluido aquellos productos independientes a la compañía y que se han gestado para ofrecer distintas herramientas bibliométricas: Publish or Perish. de manera que viene a ser un estado de la cuestión.24 La revolución Google Scholar las características y prestaciones de Google Scholar. congresos y repositorios. generando una serie de indicadores bibliométricos.

Bloque A Google Scholar: el buscador académico universal .

.

Por ejemplo. Scirus 3 (actualmente deshabilitado) destacaba por una interfaz de búsqueda superior mientras que Microsoft Academic Search 4 (que tras desactualizarse ha renacido de sus cenizas recientemente) por sus servicios de valor añadido.research. En la actualidad cohabitan diversos motores de búsqueda académicos.ist. con el fin de conocer cómo ha contribuido definitivamente a la popularización y democratización de la evaluación de la actividad científica. Podría ser considerado como un buscador especializado en localizar información académica en la Web.microsoft. este libro está dedicado exclusivamente a conocer su historia.psu. el motor de búsqueda académico desarrollado por Google Inc. es el que dispone de una mayor cobertura de material académico.edu 3 http://www. siendo ésta la aproximación seguida por Ortega (2014) en su completo y exhaustivo estudio comparativo de motores de búsqueda académicos. describir sus características y funcionamiento y presentar algunas de sus aplicaciones métricas más importantes. BASE 1 es quien aporta un mayor número de contenidos en acceso abierto. Finalmente. presentaciones.). etc. tal y como proponía Codina (2007). Dada la revolución que ha supuesto este buscador.sciencedirect.com/scirus 4 http://academic. cada uno con sus propias características y funcionalidades. que incorpora además ciertos elementos de valor añadido (indicadores de naturaleza bibliométrica como número de citas a los documentos académicos) que puedan ser utilizados para la evaluación científica y que estén finalmente abiertos a cualquier tipología documental (no sólo artículos sino patentes. material docente.base-search. Google Scholar. CiteseerX 2 destaca por sus prestaciones para la exportación de registros.Capítulo 1 Los orígenes No es sencillo encontrar una definición exhaustiva y globalmente aceptada de motor de búsqueda académico (academic search engine). 1 http://www. tanto en la búsqueda como en la evaluación de la actividad científica.net 2 http://citeseerx..com .

2014). Tal y como el propio Acharya ha reconocido en diversas entrevistas (Van Noorden. advertir que “existían” contenidos relevantes en algún lugar suponía un auténtico cambio en las reglas del juego. Crecer y estudiar en una zona en desarrollo implicaba. tales como la disponibilidad de las referencias bibliográficas de los registros en distintos estándares (permitiendo su posterior descarga a gestores de referencias). Está por tanto especializado en buscar e identificar material bibliográfico de carácter académico proporcionando además una serie de servicios adicionales de gran valor. si conocías la existencia de cierto artículo. informe o material académico. tipologías documentales e idiomas. procedimiento que el todavía estudiante Anurag utilizó en más de una ocasión. terribles dificultades a los estudiantes para poder costearse y tener acceso a materiales académicos que fueran realmente relevantes en sus estudios. Sin embargo. India). Aunque no se pudiera acceder a ella por diversos motivos. Estos y otros muchos servicios serán desgranados a lo largo de la presente obra con el propósito de facilitar una visión holística del entorno académico que Google Scholar supone en la actualidad. ya en su época de estudiante (a mediados de los 1980s) tuvo conciencia de la importancia que suponía el hecho de conocer la existencia de información “ahí fuera”.28 La revolución Google Scholar Google Scholar es un buscador web académico (Ortega. libro. actual distinguished engineer en Google. 2015). entre otras muchas cuestiones sociales y políticas. Para un estudiante medio indio esto era prácticamente imposible. el acceso directo a los textos completos (cuando esto es posible por cuestiones legales) o la indicación del número de citas recibidas por cada registro. Nacimiento No sería posible relatar la historia y los orígenes de Google Scholar sin indagar en la figura de Anurag Acharya. 2014) gratuito que indiza la literatura científica en un amplio abanico de disciplinas. donde se graduó en Computer Science & Engineering en el campus de Kharagpur del Indian Institute of Technology. un enfoque amplio que resulta necesario para comprender el verdadero impacto que este buscador especializado está generando en la sociedad académica de principios del siglo XXI. . co-creador y alma de este buscador. Acharya nació en Bikaner (Rajasthan. siempre cabía la posibilidad de escribir una carta al autor solicitándole una copia (Levy.

que el propio Anurag Acharya hacía accesible desde el blog oficial de Google Scholar. 2015) y que presumi- 29 .com. Ejemplo de postal de solicitud de artículo científico Fuente: Anurag Acharya (http://googlescholar. por ejemplo. Posteriormente tuvo la oportunidad de trabajar como investigador posdoctoral en la University of Maryland para finalmente obtener una plaza como Assistant professor en la University of California – Santa Bárbara (Giles.Bloque A · Capítulo 1 · Los Orígenes En la figura 1 se muestra a modo de ejemplo una postal típica de solicitud de artículo científico. el Dr.blogspot. que obtuvo en la Carneggie Mellon University en 1994. Figura 1. tras unos años de vida académica que podríamos etiquetar como estándar. Sin embargo. Acharya sintió la necesidad de dar un cambio de rumbo a su trayectoria y aplicar sus conocimientos en proyectos más complicados. todavía común hoy día. Sin embargo. transformando el modo en que se produce el intercambio de material académico entre pares. es no obstante fundamental para comprender parte del funcionamiento interno de Google Scholar para indizar la inmensidad de la Web académica en todo el planeta. Este recuerdo. todavía no existía). Acharya marchó a los Estados Unidos para realizar el doctorado en Computer Science.es) Los desarrollos en tecnologías de la información y comunicación han revolucionado la compartición mundial de material de todo tipo en la Red. que hoy día hace esbozar una sonrisa al Doctor Acharya (Giles. que definitivamente marcaran la diferencia (Levy. para un estudiante en India no era tan obvio en aquella época (la Web. 2005). Tras completar sus estudios universitarios. 2005).

Más allá de los éxitos de la compañía.30 La revolución Google Scholar blemente tuvieran un impacto más claro e intenso en la sociedad.comscore. el resultado todavía es más impactante. https://www.com/business/technology/googling-on-mobile-devicessurpasses-pcs-in-us-for-1st-time/2015/05/05/909a9c6a-f344-11e4-bca5-21b51bbdf93e_ story. que terminaron por quemar laboralmente a Acharya por completo. Según sus propias palabras. aspx?qprid=4&qpcustomd=1 . To organize the world’s information and make it universally accessible and useful. Google representa a fecha de junio de 2014 el 92. en la arteria vital de la compañía). denominada Google. como China o Rusia). período en que consiguieron dominar el mercado de los buscadores a escala global (a excepción de unos pocos países con gran aceptación y uso de motores de búsqueda nacionales. Un predominio realmente abrumador. Acharya se integró finalmente en el equipo de Google en 2000 (Van Noorden. La misión de esta empresa (organizar la información del mundo y hacerla universalmente accesible y útil) 5 tuvo un calado importante en la mente de Acharya.es/intl/en/about 6 http://www. Si el análisis lo exportamos a las búsquedas desde dispositivos móviles. seguido de Microsoft con el 19.google. Según datos de Netmarketshare 8. 2014). En 1999 tuvo la oportunidad de visitar a un colega que había comenzado a trabajar en una nueva startup en Palo Alto (California).html 8 https://www. también fueron años de mucho trabajo y demasiado estrés. Google (y todos sus sitios web asociados) supone el 67% del mercado de las búsquedas desde escritorio en los Estados Unidos. concretamente en el equipo de indización (es decir. Un predominio que siguen manteniendo en la actualidad.6% de cuota de mercado. debía dejar 5 Cfr.com/Insights/Market-Rankings/comScore-Releases-December2014-US-Desktop-Search-Engine-Rankings 7 http://www. Según datos de Comscore 6 a fecha de noviembre de 2014.netmarketshare. donde se mantuvo por cuatro años que a la postre resultaron vitales en la compañía californiana.2% del mercado mundial de los motores de búsqueda móvil (tableta + teléfono inteligente). gracias en parte a la amplia aceptación del sistema Android en los Smartphones.washingtonpost. precisamente en un momento en el que se cuestionaba su futuro profesional y académico. Google ha confirmado recientemente de forma oficial que las búsquedas que se realizan desde los teléfonos móviles inteligentes han superado por vez primera en número a las realizadas desde ordenadores portátiles y de sobremesa en los Estados Unidos 7. La terrible carga de trabajo llegó a tal punto de hacerle plantear una salida.com/search-engine-market-share.

2006). tanto Acharya como un compañero del equipo de indización (Alex Verstak).Bloque A · Capítulo 1 · Los Orígenes la empresa o hacer algo que fuera interesante para él. la idea que tenían en mente no era la de crear ningún Google académico. en su país y en muchos otros lugares. sino simplemente la de mejorar el ranking de documentos académicos en las búsquedas web (Van Noorden. presumiblemente. Existía una gran diferencia entre el usuario que realizaba la búsqueda de un material académico y el usuario que realizaba la búsqueda de cualquier otro tipo de información (como buscar una pizzería o un fontanero). El usuario que busca material académico sabe que está buscando material académico. de inspiración para su vida y obra? Y al mismo tiempo. but is lower pressure. fue entonces cuando Acharya pudo darse cuenta de lo valiosa que podría ser una herramienta dirigida a estudiantes y académicos que pudiera proporcionar información y acceso a la literatura científica y académica circulante. 2014). 2015) 9. el buscador les proporcionará documentos donde. ¿habría cambiado la vida de cientos de investigadores? A lo que podríamos añadir… ¿está efectivamente cambiando hoy día? 9 Cfr. El proyecto evolucionó y viró por tanto de dirección. simplemente buscan respuestas a sus preguntas. “Either I have to leave the company or I have to do something that can be interesting to me. como él en su juventud. ¿qué impacto podrían haber tenido ciertas obras si su distribución no hubiera sido tan limitada al no disponer de plataformas de difusión de este tipo?. Sin embargo. Algo que hubiera cambiado la vida a millones de estudiantes que. decidieron tomarse un año sabático. Ante esta situación de crisis. puedan estar las respuestas. En cambio. los dos ingenieros pronto se dieron cuenta de una circunstancia que a la postre devino fundamental en el desarrollo futuro del proyecto. pero con menor presión (Levy. no podían acceder a material académico de calidad. ¿En qué medida tal circunstancia había podido privar a grandes mentes. Una diferencia absurdamente sencilla. con el propósito de integrar estos resultados en el buscador general (Hughes. Es decir. por ello comenzaron a experimentar la extracción automática de metadatos y posterior posicionamiento y ordenación de la literatura científica. Los datos que manejaban Acharya y Verstak indicaban que los usuarios estaban enviando consultas puramente académicas a Google. el resto de usuarios no tienen ningún conocimiento o idea prefijada del tipo de resultado que van a obtener.” (Levy 2015)” 31 . Durante esta época de “descanso” ambos comenzaron a trabajar por su cuenta en la mejora de la indización del buscador.

los artículos científicos recibían citas de otros artículos publicados con posterioridad que mostraban o reflejaban una deuda científica con los textos pioneros. radicaba en la aplicación de la tecnología de Google a la hora de posicionar los artículos mostrados en los resultados de una determinada consulta.wikipedia. He aquí una bella paradoja en la historia de la búsqueda y recuperación de la información. Entre las características de este ya viejo algoritmo se encontraba la de imitar el comportamiento de las bases de datos bibliométricas (en aquella época. fundamentalmente Web of Science. 10 Cfr. To make the world’s problem solvers 10% more efficient. http://en. Este acto de citación podía entenderse como un “voto” a un documento (este concepto se debe entender de forma general y sin entrar en el arduo debate acerca de las distintas motivaciones de los científicos para citar o no citar). la materia y los autores eran y son las piedras angulares sobre las que bascula cualquier consulta de esta naturaleza. La mayor novedad. Cuantos más votos hubiera alcanzado un determinado artículo. propiedad de Thomson Reuters). El elemento que permitió a Google distinguirse del resto de competidores en el mercado de los buscadores web fue el PageRank (Brin y Page. 2012).32 La revolución Google Scholar Con esas ideas en mente. Ambos provenían del mundo académico por lo que conocían sobradamente las necesidades reales de los investigadores cuando éstos se enfrentan a la ardua tarea de localizar información científica: las fuentes. la inmediata reacción de éste fue: ¿por qué no está “vivo” esto todavía? Evolución Google Scholar nació finalmente el 18 de noviembre de 2004 con solo dos personas en su equipo (Acharya y Verstak). su relevancia sería mayor de entre aquellos otros textos que hubieran recibido apenas alguna o ninguna cita.org/ wiki/Google_Scholar . permitiendo un acceso más fácil y preciso al conocimiento científico 10. Verstak y Acharya estamparon el objetivo definitivo de Google Scholar: hacer que los problemas del mundo se resuelvan un 10% más eficientemente (Levy. así como en la identificación de las relaciones entre los distintos artículos (linking). Efectivamente. más allá de su enorme cobertura y dinamismo (aspectos que serán estudiados en capítulos posteriores). Cuando tras varias pruebas enseñaron finalmente el prototipo a Larry Page (co-creador de Google). 2015).

Un hecho es que el algoritmo funcionó. El éxito de Google Scholar como buscador (y como marca) fue inmediato pese a coincidir en el tiempo con el anuncio de una nueva base de datos bibliográfica (Scopus.Bloque A · Capítulo 1 · Los Orígenes Esta idea de los “votos” sugirió a Sergey Brin y Larry Page. presentada el 3 de noviembre de 2004 (Reed Elsevier. utilizando para ello la tecnología y el conocimiento del buscador general de Google. Ninguna otra base de datos bibliográfica o bibliométrica del momento proporcionaba esta funcionalidad más allá de posicionar los artículos según su número de citas (Giles. El sistema era asimismo capaz de acceder a una cantidad de artículos a texto completo cada vez mayor. 2004).com/google-algorithm-change 33 . El sistema era capaz de posicionar los artículos en función de su relevancia ante una determinada consulta. Por supuesto. creadores de Google. Esta analogía que la bibliometría había llevado a los motores de búsqueda volvía al mecanismo de Google Scholar para crear un sistema novedoso en el acceso a la literatura científica. La cantidad de factores que intervienen en la relevancia de una página web en la actualidad es enorme (se estima que existen más de 200 posibles factores) 11. A pesar de disponer de una interfaz sencilla y de pocas funcionalidades extra. y el resto ya es Historia. 2005). aunque acciones con innegables similitudes. de una variabilidad y dinamismo muy alto (se estima que Google realiza entre 500-600 modificaciones menores de su algoritmo durante un año y ocasionalmente modificaciones de gran envergadura) 12. en los inicios de Google el factor clave se basaba principalmente tanto en la cantidad de enlaces (considerados como citas o votos) que una página recibía como en el establecimiento de pesos en función del lugar donde provenía el enlace (es decir. y además la fórmula completa es secreto industrial. la posibilidad de posicionar los resultados ante una consulta determinada en función de los “votos” que tuvieran las páginas web que aparecían en la página de resultados (y que ya tenían por tanto una relación con la consulta realizada por los usuarios).com/google-ranking-factors 12 https://moz. Google Scho 11 http://backlinko. propiedad de Elsevier). el algoritmo era en realidad mucho más complejo pues determinar un “voto” y contabilizar una cita. apenas unas semanas antes. por lo que la precisión y relevancia de los resultados incrementaba sin cesar. A pesar de todo ello. no era lo mismo recibir un enlace del Washington Post que de la página personal de un estudiante de secundaria). tienen diferentes matices a la hora de contabilizarlos. mientras Web of Science y Scopus iniciaban una rivalidad como bases de datos bibliográficas de referencia en el mundo científico.

Y para ello Acharya tuvo que negociar duramente con las editoriales privadas desde el principio y durante años. quienes reclamaron que Google . Tanto Verstak como Acharya eran plenamente conscientes de que una base de datos académica sólo puede sobrevivir si los materiales más relevantes están incluidos en su catálogo. En cualquier caso. Antes de que el producto hubiera cumplido su primer año de funcionamiento. En concreto. Y eso marcaba la diferencia (de ahí la obligatoriedad de que los textos dispongan de un resumen para ser incluidos en Google Scholar.967). Las negociaciones de Google Scholar con las editoriales académicas más potentes fueron complicadas.336). como se verá en el capítulo dedicado a la indización). 2004) ya se habían hecho eco del impacto de este buscador. Pubmed central (9. Estos mismos datos a fecha de 2015 (para aquellos servicios que todavía siguen vivos) deben ser tan escalofriantes como privados. se comenzaba a detectar una tendencia que resultaría clave en las posteriores negociaciones de Google con los editores: Google Scholar aumentaba las visitas a las páginas web de las revistas.522). en el sentido amplio del término. Proporcionar información era la base fundamental sobre la que se sustentaban y con la que Acharya deseaba cumplir ese sueño que comenzó a imaginar durante sus años de estudiante.34 La revolución Google Scholar lar iba creciendo en otro sector básico: en la búsqueda y localización de información académica. aunque algunos manuscritos estuvieran detrás de una plataforma de pago (y por tanto no accesibles aunque aparecieran en los resultados de búsqueda).616). Pubmed-Medline (14.617) y MSN (2. El caso más mediático tal vez lo constituyó la American Chemical Society (ACS). simplemente el hecho de poder incluir una descripción o un resumen ya implicaba mostrar al usuario que ese contenido existía.185) son las dos fuentes desde donde se reciben más visitas. Highwire press (8. Giles (2005) ya informa que Google Scholar dirige más tráfico a las sedes web de Nature que cualquier otro motor de búsqueda académico multidisciplinar mientras que Giustini (2005) proporciona datos de visitas al British Medical Journal (noviembre de 2005). seguidas a cierta distancia de Yahoo! (57.756) y Google Scholar (105. informando que Google (345. Es más. 2004) como Nature (Butler. El acceso al texto completo de los artículos constituyó uno de los principales campos de batalla con los que el equipo de Google Scholar tuvo que lidiar durante los primeros años del producto. Butler señalaba que las primeras impresiones de Google Scholar por parte de los expertos (tanto bibliotecarios como informáticos) sugerían que el servicio era impresionante tanto en escala como en funcionalidad. tanto Science (Leslie.

Por ejemplo. pese a que Pubmed ya se encontraba indizada en 2005. Blackwell. cuyos términos no trascendieron a la luz pública y donde las partes se limitaron a firmar un acuerdo en el que se comprometían a costear los honorarios de los abogados. Es decir. Vine (2005) descubre que Google Scholar indiza sus contenidos con casi un año de retraso. En la revisión posterior realizada por Vine (2006). el acuerdo de acceso completo se refiere a Google Scholar y no a los usuarios finales. Nature Publishing Group. aunque no todos ellos en su completitud (Notess. Al parecer. así como de importantes archivos online como el de la NASA Astrophysics Data System o repositorios como Arxiv o Pubmed. hecho que dependerá de las posibles subscripciones que tengan contratadas los usuarios. Institute of Electrical and Electronic Engineers (IEEE). Pese a ello. 2004). siempre ha sido genuinamente complejo conocer los acuerdos específicos a los que había llegado con las distintas editoriales. District Court for the District of Columbia (Mehta. asuntos todos ellos que serán discutidos con mayor profundidad en el apartado dedicado a la cobertura). La demanda terminó con un acuerdo extrajudicial en Washington en 2006. 2005). en 2005 ya incluía en su catálogo a los principales editores. 2004). las instituciones que tienen acuerdos con 35 . En este sentido. autores o materias. En este punto se debe aclarar un tema de suma importancia y que generalmente suele dar pie a errores y malinterpretaciones. Google Scholar indiza los textos completos con el fin de que los resultados ante determinadas consultas sean los más pertinentes. entre otros: Association of Computer Machinery (ACM). hecho que limitaba ampliamente su uso para investigadores que precisaran información médica actualizada.S. Otra cosa bien distinta es que los usuarios finales puedan o no acceder a los textos completos proporcionados por las editoriales. Ingenta. tanto Elsevier como Highwire y la American Chemical Society no estaban todavía incluidas en los acuerdos para acceder al texto completo de los artículos publicados por estas importantes editoriales. permitiendo solamente ser indizadas por Google Scholar utilizando la información bibliográfica y el resumen. Springer o Wiley. Dado que Google Scholar no proporciona una lista detallada de las editoriales incluidas (ni tampoco de las revistas.Bloque A · Capítulo 1 · Los Orígenes Scholar ejercía una competencia desleal a su plataforma SciFinder Scholar (una aplicación de escritorio de pago que servía para indizar información almacenada en la base de datos de la ACS). La ACS interpuso una querella el 9 de diciembre de 2004 (menos de un mes después del lanzamiento del buscador) en el U. la demanda se centraba especialmente en el uso del término “Scholar” y no en la herramienta como tal (Hines.

jstor. La indización de la plataforma JSTOR 14 supuso otro importante hito en la evolución de Google Scholar. Esta biblioteca digital fundada en 1995 por William G. notifica que el buscador ya tiene acceso al texto completo tanto de Highwire como de la American Chemical Society.org .net 14 http://www. a la que seguramente no deseaban perjudicar en favor de Google Scholar (Scirus fue deshabilitada definitivamente en 2014). 2007). aunque sin duda éste facilita su descubrimiento. Cecchino (2010).researchgate. Acharya. Bowen (entonces Rector de la Princeton University) constituye en la actualidad la mayor plataforma de artículos online del mundo (Levy. pues no se precisa de Google Scholar para acceder a dichos contenidos. en su posterior análisis de Google Scholar. El acceso al texto completo gracias a la existencia de copias privadas de los autores depositadas en repositorios institucionales (en la forma de preprints o postprints) o en plataformas de intercambio de material académico (como ResearchGate 13) constituye igualmente un asunto aparte. podrían estar indizados en Google Scholar (aunque no a texto completo). El principal problema de JSTOR tenía para ser indizada en Google Scholar era que solamente ofrecía acceso de pago para artículos escaneados. De esta forma. en su faceta de negociador y evangelista de Google Scholar. podría deberse a que disponían de su propia plataforma web (Scirus). más allá de las posibles cuestiones legales o de competencia.36 La revolución Google Scholar las editoriales (bibliotecas académicas fundamentalmente) pueden configurar OpenURL Link resolvers (como SFX). Y disponer de un resumen en abierto (aparte de la información bibliográfica) es requisito obligatorio para ser indizado en el buscador académico. Una de las posibles razones de la renuncia inicial de Elsevier a ser indizados por Google Scholar a texto completo. 2015). para autenticar usuarios y proporcionar acceso a los textos completos en el caso de que estén disponibles a través de las distintas subscripciones institucionales. por lo que no tenían posibilidad de separar de forma efectiva los resúmenes de los artículos (tarea costosísima en tiempo y dinero). convenció a los responsables de JSTOR para ofrecer la primera página de cada artículo de forma gratuita (pues en la primera página suele estar incluido el resumen). Finalmente. No es hasta 2007 cuando las revistas de Elsevier comienzan a ser incluidas a través de Science Direct (Brantley. y esta primera página podía servir adicionalmente de aliciente a los usuarios para solicitar la compra de un artículo que pudiera ser de su interés tras leer 13 https://www.

2014). una reflexión que parece sonar más bien a una cortés excusa que a un argumento con sólidas raíces. una década después de su lanzamiento (Van Noorden. cuando Acharya es preguntado respecto a este asunto (Levy. En la actualidad se precisan hasta tres clics y un scroll (todo un mundo en la Web) para poder acceder al servicio. Este hecho puede deberse a que Google Scholar actualmente no genera beneficios a la compañía. Aunque 37 . que se incluye entre los “buscadores especializados” como Google Finance o Google Trends. hecho que pudo directamente observarse en 2011 cuando se eliminó el acceso directo al producto desde el menú desplegable de opciones de la página principal de Google. todos ellos productos portentosos pero alejados del usuario común. duramente criticados en sus inicios (Jacsó. Este hecho ha llevado en ocasiones a ser ligeramente discriminado dentro de la misma compañía de Mountain View. JSTOR tiene indizados alrededor de tres millones de registros en Google Scholar. Un número absolutamente ridículo si lo comparamos con las extensas plantillas de otros productos y servicios de Google (y de otros productos de la competencia). constituyendo uno de sus principales proveedores de contenidos. un esfuerzo digno de alabanza si consideramos que el equipo inicial estaba únicamente formado por Acharya y Verstak. y que ha ido poco a poco creciendo hasta las nueve personas que lo conformaban en 2014. Google Scholar ha ido paulatinamente ampliando la gama de servicios y prestaciones desde su lanzamiento. Pese a ello. el producto ha ido mejorando progresivamente durante sus primeros diez años de existencia no sólo en la calidad de sus resultados. Más allá de los distintos acuerdos alcanzados con diversas editoriales académicas. el distinguised engineer responde que este hecho no afectó a las visitas que el producto recibía (que siempre han ido en continuo ascenso) y que además aquellos usuarios que desean utilizar el producto no tienen mayor problema en encontrarlo. no sólo por la escasez de plantilla asignada sino por la publicidad y difusión del producto. En cualquier caso. La inclusión de publicidad o de resultados patrocinados (tal y como ocurre en el buscador general) se antoja de complicada aplicación en un entorno académico. 2015).Bloque A · Capítulo 1 · Los Orígenes el resumen. sino por la cantidad de nuevos servicios adicionales de gran utilidad. En la actualidad (septiembre de 2015). 2005b). tanto por parte de los posibles anunciantes como de los usuarios. Otros buscadores especializados como Google Patents todavía corren peor suerte al no estar siquiera incluidos en esta página de productos.

38 La revolución Google Scholar bien es cierto que estas mejoras han ido apareciendo de forma más bien irregular y sin apenas publicidad (Quint.org/ . La incorporación de Google Scholar Library (una biblioteca personal para gestionar y etiquetar artículos). las aportaciones más mediáticas hasta la fecha han sido indudablemente Google Scholar Citations (noviembre de 2011). prestación que ya incluía desde sus inicios. Por ejemplo. con los que Google Scholar ha comenzado a proporcionar indicadores de naturaleza bibliométrica más allá de los datos de citas recibidas a cada artículo. que ofrece listados de revistas académicas en función del h-index). En 2004 (figura 2a. desarrollada en asociación con Beijing Wan- 15 https://archive. funcionalidades de enlazado (linking) entre una amplia variedad de idiomas (de especial importancia el soporte a idiomas no europeos. así como una herramienta de preferencias del buscador (disponibles desde principios de 2005). En 2006 (figura 2b. la caja de búsqueda imitando al buscador general y simplemente un botón de información y de enlace directo a Google. Otras herramientas que se han ido incorporando a lo largo de los años han sido el botón “Artículos relacionados”. Sin embargo. En la figura 2 se puede observar a título ilustrativo la evolución de Google Scholar a partir de su página de inicio con diversas capturas de pantalla realizadas a través de Internet Archive y su Wayback machine 15. es preciso remarcar que la finalidad de las citas recibidas en Google Scholar era (y es) básicamente la de ordenar los resultados para presentar en las posiciones superiores a los “presumiblemente” más relevantes ante una consulta concreta (este asunto se tratará con mayor profundidad en el capítulo dedicado a las prestaciones de Google Scholar). 2007). y Google Scholar Metrics (abril de 2012). RefMan. en 2006 se incorporó una herramienta de exportación de referencias de forma que los resultados obtenidos ante una determinada consulta pudieran ser exportados a distintos gestores de referencias (RefWorks. accesible desde noviembre de 2013. superior derecha) ya se incluye la posibilidad de realizar una búsqueda avanzada. El año 2006 es igualmente importante pues aparece la versión de Google Scholar para China. japonés y coreano) o incluso proyectos de digitalización y almacenamiento de revistas académicas impresas. Endnote y BibTeX). donde destaca la declaración “beta” del producto. que permite la creación de perfiles individuales de investigadores. como el chino. ha pasado en cambio algo más inadvertida. superior izquierda) se observa la pantalla austera de Google Scholar en su lanzamiento. No obstante.

chinadaily. donde ya se permite seleccionar la búsqueda de artículos. El 2012 constituyó un año especialmente importante. se recoge el momento de la celebración del décimo aniversario. cada vez más completa. así como la incorporación en la parte superior izquierda de la pantalla del acceso a los perfiles personales. 16 http://www. donde ya se ha incluido el servicio de biblioteca personal. inferior derecha). en el que se destaca fundamentalmente la incorporación de filtros a los resultados a través tanto de un menú lateral izquierdo como superior (todavía presentes aunque con ciertos retoques y cambios).htm 17 http://googlescholar. aparte de la configuración del buscador. que ya no aparece en 2010 (figura 2d. “Noticias”. eliminada oficialmente a mediados de 2011). aparte de un botón de “Acerca de” y “Ayuda” específicos de Google Scholar. “Vídeos”. dedicado al proceso de búsqueda en Google Scholar).com. centro-izquierda) al integrar el antiguo menú de inicio de Google (“Google Imágenes”. inferior izquierda) se observa la desaparición de la declaración de beta. que sigue vigente en la actualidad (la búsqueda avanzada será descrita con mayor detalle en el capítulo 6. y el menú de opciones se ha movido desde la parte superior derecha hacia el centro superior de la pantalla. pues además de dejar definitivamente atrás la etiqueta de “beta” y lanzar productos derivados de gran impacto. La integración con Google sigue presente no sólo con el enlace al buscador sino con un enlace a la ayuda de Google. En 2012 (figura 2e. Esta integración se hace todavía más patente en 2008 (figura 2c. patentes y textos de jurisprudencia. “Mapas” y “Más servicios”).cn/english/doc/2006-02/21/content_522254. así como el acceso a la búsqueda avanzada a través de una pequeña pestaña situada a la derecha de la caja principal de búsqueda. mostrándose más cercana a la caja de búsqueda. fue el año en el que el sistema modificó gran parte de la interfaz interna de los resultados 17.com.html 39 .es/2012/05/our-new-modern-look. centro-derecha). Finalmente. en 2014 (figura 2f.Bloque A · Capítulo 1 · Los Orígenes fang Data y Chongqing VIP Information 16.blogspot. al ranking de revistas y a los sistemas de alerta.

superior derecha: noviembre 2006.40 La revolución Google Scholar Figura 2. medio derecha: noviembre 2010. . 2010. 2012 y 2014) Superior izquierda: noviembre 2004. inferior derecha: noviembre 2014. inferior izquierda: noviembre 2012. Evolución de Google Scholar (2004. 2008. medio izquierda: noviembre: 2008. 2006.

Capítulo 2 Las dos caras de Google Scholar (I): El buscador académico Al igual que Jano (Figura 3). Figura 3. Efectivamente. así como en la percepción de éste en sus diferentes usuarios. por otra parte. Este segundo capítulo se centra exclusivamente en el papel de Google Scholar como buscador de información académica hegemónico. Las dos caras de Google Scholar . Google Scholar es por una parte un buscador (facilita el inicio de la búsqueda de material científico) y. dios de los comienzos y los finales (de ahí que le fuera consagrado el primer mes del año). Google Scholar tiene dos caras que representan asimismo un comienzo en la búsqueda científica y un final en la evaluación de la actividad científica. Su papel hegemónico actual tanto en las búsquedas académicas como en la gestión de perfiles académicos personales es fiel reflejo de los tiempos de cambio que se viven actualmente en el mundo de la comunicación científica y la tendencia hacia la democratización bibliométrica. dios de la mitología romana que tenía dos caras mirando hacia ambos lados de su perfil. una herramienta susceptible de ser utilizada para evaluar la actividad científica.

compete. A día de hoy. Sin embargo.974. El objetivo de este capítulo es pues el de ofrecer un repaso histórico acerca de la reacción del mundo científico y profesional ante este producto.487.com/scholar. en ningún momento.com>. Boughan y Roberts. tratando de desvelar sus puntos fuertes y débiles. Aun considerando las limitaciones de este servicio para calcular las visitas reales al sitio (la metodología está basada en paneles de usuarios a partir de los cuales se realiza una inferencia estimada de las visitas). tenían en mente su creación como tal. este mismo indicador mostraba 2. Un proyecto menor para Google.google. Una definición de su significado se puede encontrar en el siguiente recurso: https://majestic. Y sin ninguna campaña de marketing especial por parte de la empresa matriz.com/support/glossary#TrustFlow . Las visitas al dominio general de Google Scholar (que corresponden exclusivamente a la versión estadounidense) deberían complementarse con las visitas a cada una de las versiones nacionales existentes (el URL de acceso al producto está conformado por un conjunto de URL alias. desde su publicación en 2004.42 La revolución Google Scholar El buscador académico hegemónico A pesar del relativo eco recibido tras su lanzamiento. otros servicios gratuitos con estimación de visitas (Quantcast o Alexa) no proporcionan información del sitio al constituir un subdominio dentro de Google 3 Trustflow es un parámetro similar al PageRank (pero de rango 0 a 100). creado a partir de la tecnología flow metrics de la empresa Majestic. se podría decir que el nacimiento de Google Scholar fue un tanto humilde. la visibilidad web del producto es incuestionable en todo el mundo. Evaluando tanto su gran potencial en el mercado de las búsquedas académicas como todas las posibles amenazas que su uso irresponsable o impreciso podrían suponer. la visibilidad es elevadísima 2.411 millones de usuarios únicos en el mercado norteamericano a fecha de marzo de 2015 para el sitio web <scholar. el número de sitios web desde donde se recibe al menos un enlace (Referring domains) 3 y la calidad del sitio (Trustflow) a partir de los datos obtenidos mediante Majestic Site Ex 1 https://siteanalytics.com 2 Los datos reales de visitas al servicio no son públicos. mostrando el número de enlaces externos que recibe cada uno (Inlinks).google. Compete 1 muestra la escalofriante cifra de 6. que dirigen a distintas versiones del producto). En la Tabla 1 se ofrece un ejemplo de los URLs de acceso a 30 países aparte de la matriz norteamericana. 2009). desarrollado por dos ingenieros durante su año sabático que. Wright. Google Scholar ha sido ampliamente analizado y cuestionado tanto por la Academia como por el mundo de los profesionales de la información (Howland.612 millones de usuarios únicos en marzo de 2014.

google. 6 de enero 2016) Inlinks Referring Domains Trustflow 614.google.tr Turquía 667. o porque a pesar de tener versión nacional.br scholar. están redondeados.com/researchtools/ose 6 https://ahrefs. algunos países no disponen de versión propia.634 2.co.se scholar.google. URLs alias de Google Scholar e indicadores web (Majestic Site Explorer. el caso de México).806 36 Australia 499.616 2.com.fi Finlandia 553.209 53 Reino Unido 4.148 39 2.google.344 22 URL PAÍS scholar.416 33 China 871. En todo caso.714 30 1.586 7.419 7.com 7 Además. y los países mostrados constituyen únicamente una muestra selectiva 7.be Bélgica 1.es scholar.136 188.google.kr Corea del Sur 1. los datos de esta tabla deben leerse obligatoriamente de forma ilustrativa y comparativa pues éstos poseen una enorme variabilidad (incluso diaria).302 5.hk scholar. bien por no disponer de versión nacional de Google (como Nigeria. una de las principales herramientas de indicadores web actuales.131 7.google.fr Francia scholar.google.google.de scholar.437.845 5.289 30 scholar.google.630 27 scholar.598 31 scholar.127 3.Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) plorer (historic index) 4. Google Scholar redirige a la versión norteamericana (por ejemplo.059 42 Alemania 3.088.711 1.co.com Estados Unidos scholar.uk scholar.co.nl Países Bajos scholar.435.530.210 1.030.google.413 17.google.google.367 31 España 762.634 4.336 31 Suecia 269.in 4 https://majestic.175 14.it Italia 503.com.115 1.628 24 scholar.com 5 https://moz. por ejemplo).164 30 826.no Noruega 853.google. Tabla 1.google.632 29 India 2.com. 43 .google.com.149.ca Canadá scholar.529 1. pueden ser muy diferentes a los obtenidos mediante otros servicios similares como OpenSiteExplorer 5 o Ahrefs 6.090 32 scholar.au scholar.google.475 21 scholar.278.183 5.google.022 26 Brasil 391.007.983 3.google.

no sólo frente al resto de motores de búsqueda académicos (Ortega. La facilidad de uso de Google Scholar. universal y sobre todo gratuito. pues en realidad pertenecen a dominios web independientes.co.jp Japón 39 11 11 Además.com.887 686 28 scholar.nz Nueva Zelanda 70.428 990 28 scholar. . Microsoft Academic Search) desde 2004 hasta la actualidad.google.co. sencillez.569 790 25 scholar.google.412 407 20 scholar.097 912 24 scholar.cl Chile 14. 2014) sino frente a otras bases de datos bibliométricas.google.293 473 19 scholar. en la figura 4 (superior) se muestra la evolución de las tendencias mundiales de búsqueda en Google de los términos asociados a diversas bases de datos (Google Scholar.google.311 688 31 scholar. Por ejemplo.351 1.google.google.at Austria 208. Es decir.google.google.google. las versiones más populares y utilizadas y la orden de magnitud de su impacto.uk> hacia <scholar.356 803 29 scholar. Pubmed.210 750 19 scholar.google.020 26 scholar.44 La revolución Google Scholar URL PAÍS Inlinks Referring Domains Trustflow scholar. han contribuido a su actual popularización. la asignación de enlaces no es restrictiva. Web of Science.ar Argentina 179.dk Dinamarca 63.330 29 scholar. rapidez.com> se cuentan como enlaces externos a este último.ru Rusia 421. Los más de 660 millones de enlaces desde más de 170 mil sitios web que recibe la versión norteamericana de Google Scholar constituyen un claro indicio de la amplia difusión y penetración de este motor de búsqueda académico. seguida sorprendentemente por Alemania.pt Portugal 262.il Israel 9. su simpleza. La versión inglesa es la segunda en visibilidad.co. aparte del hecho de ser multilingüe.513 1. Resultan no obstante datos útiles para conocer.gr Grecia 164.ch Suiza 22.co Colombia 24. a través de un rápido vistazo. los posibles enlaces desde <scholar. Como muestra de ello.co.471 988 31 scholar.google.google.za Suráfrica 19.google. el sistema no filtra los posibles enlaces que puedan dirigir de un alias a otro. Scopus.google.com.google.

Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) Figura 4. pero con una interfaz y funcionalidades distintas 45 . especialmente Microsoft Academic Search. sino que aparecen como accesos o visitas desde Google Scholar a Pubmed. Figura inferior izquierda: tendencias de búsqueda geográfica entre enero-julio de 2004. aunque el sistema seguía funcionando. Sin embargo. 2014). desactualizada durante años por Microsoft 8. terminen accediendo a Pubmed para consultar datos bibliográficos más completos o metaanálisis. Tendencias de búsqueda (Google Trends) Figura superior: azul: “Google Scholar”. verde: “Scopus”. los perfiles de usuarios son inaccesibles. estas visitas ya no se reflejan como consultas al buscador de Google. aunque la compañía de Redmond nunca indicó esta circunstancia oficialmente en la plataforma web (Orduña-Malea. en la figura 4 (inferior) se ofrecen los patrones de 8 La desactualización se detectó debido a la caída abrupta en la cobertura de la literatura reciente. Adicionalmente. Ayllon y Delgado López-Cózar. Nota: en marzo de 2016 el buscador volvió a funcionar. Figura inferior derecha: tendencias de búsqueda geográfica entre febrero-mayo de 2014 En la figura 4 (superior) se pueden destacar los caminos divergentes que han seguido Google Scholar (en color azul) y Pubmed (en color rojo). amarillo: “Web of Science”. El resto de bases de datos permanecen a una distancia considerable. rojo: “Pubmed”. En la actualidad el 100% de la cobertura de Pubmed está incluida en Google Scholar. Este hecho provoca que los usuarios tiendan a comenzar sus búsquedas en este último y. si la navegación lo requiere. Martín-Martín. En la actualidad (mayo de 2015). violeta: “Microsoft Academic Search”.

En un primer momento. Este hecho ya es detectado por Ortega (2015) en su estudio de la demografía de los perfiles creados en Google Scholar Citations. Jacsó (2006) usa los términos “shallowness” (superficial) y “artificial unintelligence” (desinteligencia artificial) para describir el programa. A estos dos importantes focos (profesional y académico general) se añadiría con cierta posterioridad un tercero (el sector de la Bibliometría). Aparte de las zonas anglófonas (Estados Unidos. Reino Unido y Australia. Su aceptación nunca fue (ni es) completa. A esta fase le sigue un período de estudio sistemático (Robinson y Wusteman. Su travesía podría definirse como un camino de rosas. China y sorprendentemente Brasil. Desde el sector académico las opiniones diferían fundamentalmente en función del usuario (investigador. El grado de cobertura de Google Scholar dependía en sus inicios fuertemente de los acuerdos con las editoriales y de su capacidad de rastreo de la web profunda (deep web) para localizar literatura gris. cada una de ellas con sus espinas correspondientes. Google Scholar es observado con curiosidad. el camino de Google Scholar no ha sido sencillo. 2007) donde recibe críticas durísimas. depresión y finalmente aceptación). principalmente).46 La revolución Google Scholar consulta geográficos a nivel mundial entre enero-julio de 2004 (izquierda) y febrero-mayo de 2015 (derecha). Desde el sector bibliotecario se pueden vislumbrar tres fases diferenciadas. 2006). ni siquiera inmediato. cuyos objetivos se centraron exclusivamente en el estudio del buscador con el propósito de analizar su capacidad como herramienta de evalua- . En cierto modo. se podría decir que las bibliotecas han ido cumpliendo las distintas fases clásicas del duelo (negación. negociación. se destacan las consultas desde los países escandinavos. Tanto desde el sector del profesional de la información (usuarios intermediarios) como desde el académico (los usuarios finales) el producto fue acogido con una amplia diversidad de opiniones y sentimientos: desde la más exagerada admiración hasta la más injustificada crítica. profesor. Finalmente. estudiante) y muy significativamente del área de conocimiento. donde Brasil ocupa un puesto prominente. A pesar del impacto actual del producto. aunque por supuesto la tarjeta de presentación de Google Scholar en 2015 no tiene comparación alguna con la de 2004. aunque escepticismo (Brophy y Bawden. 2005). lo que tenía un efecto negativo en las ciencias sociales y humanidades. se pasa a una tercera fase de cierto optimismo acerca del potencial de Google Scholar para lograr el 100% de la disponibilidad de la información online para una institución (Pomerantz. Por ejemplo. enfado.

a aquellos para los que Google Scholar es el propio objeto de investigación.6. Informática (42. Figura 5. En la figura 6 se ofrece el mapa de acoplamiento bibliográfico obtenido. por otra parte.2%) y Medicina (16.5%). Publicaciones por área de conocimiento (Scopus.Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) ción científica. Por tanto. Realizando una búsqueda en la base de datos Scopus 9.6%). 1. se han recogido hasta 472 trabajos publicados desde 2004 hasta 2014 en los que el término “Google Scholar” aparecía en el título o en las palabras clave. mientras que las áreas científicas desde las que se ha abordado el tema han sido las Ciencias sociales (46. 2004-2014) Estos datos se exportaron posteriormente con el fin de ser visualizados a través de la herramienta VOSViewer 10 (v. La literatura científica ha reflejado pues estos tres frentes de trabajo a lo largo de los últimos años. dentro del sector académico resultaría necesario distinguir por una parte a los investigadores que utilizaban Google Scholar como herramienta de búsqueda de información científica y. 10 http://www. Scientometrics (23) y Online Information Review (22) han sido las dos revistas científicas en las que se ha publicado la mayor cantidad de trabajos.1) (Van Eck y Waltman.com 47 .vosviewer. La distribución completa por área de conocimiento se ofrece en la figura 5. 9 Google Scholar no permite la exportación masiva y estructurada de registros bibliográficos. 2010).

Mapa de acoplamiento bibliográfico (Scopus 2004-2014) .48 La revolución Google Scholar Figura 6.

Mapa de conceptos (Scopus. 2007). superior). así como la relación entre éstos. Este mismo artículo recibe 483 citas en Google Scholar. Si se realiza un zoom a este núcleo (figura 6. se pueden observar con mayor detalle las conexiones establecidas entre estos documentos. a los análisis bibliométricos (cluster rojo) y finalmente a los métodos. procesos y estudios comparativos (cluster verde). siendo uno de ellos (redondeado en rojo) el núcleo de la literatura con mayor grado de similitud en función de las referencias comunes contenidas en cada documento. con 304 citas recibidas. el espinoso tema de la cantidad y calidad de estas citas será tratado más adelante. Pero no nos adelantemos a los acontecimientos. El análisis del corpus textual de estos registros bibliográficos permite la elaboración de un mapa de los principales conceptos o temas abordados.Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) Se puede observar por una parte la creación de dos clusters (figura 6. El documento más citado hasta la fecha (mayo 2015) es “Impact of data sources on citation counts and rankings of LIS faculty: Web of Science versus Scopus and Google Scholar” (Meho y Yang. inferior). 2004-2014) 49 . Figura 7. a la sazón los más importantes en la literatura científica relacionada con el estudio de Google Scholar. donde se pueden apreciar claramente tres grandes bloques: el orientado a la biblioteca (cluster azul). Este mapa se muestra en la figura 7.

realizan un amplio estudio . Una explicación razonable a estos resultados puede deberse a la popularización de los motores de búsqueda como herramienta entre los alumnos. comisionados por la Online Computer Library Center (OCLC). Griffiths y Brophy (2005) llevan a cabo uno de los trabajos pioneros en este ámbito al realizar un estudio de usuarios en el Reino Unido con el propósito de ampliar el conocimiento acerca del comportamiento de los estudiantes a la hora de utilizar recursos académicos.50 La revolución Google Scholar Tomando como punto de partida los datos obtenidos en las figuras anteriores.). concretamente para analizar su validez en la evaluación de la actividad académica. utilidad y grado de utilización ¿Qué piensan los estudiantes? La irrupción de Google Scholar en el mercado de los buscadores de información académica supuso una auténtica revolución en el comportamiento de los usuarios a la hora de comenzar sus procesos de búsqueda y recuperación de información científica. por otro lado. herramientas de descubrimiento. Dada su sencillez y potencialidad no es de extrañar que pronto surgieran los primeros estudios tratando de valorar el impacto de este nuevo buscador en los estudiantes. Por claridad expositiva. Los resultados de su trabajo muestran que el 45% de los estudiantes analizados había empleado Google como primera opción a la hora de localizar este tipo de información. ya sean estudiantes. las investigaciones orientadas a comparar las prestaciones de Google Scholar con otros productos de información bibliotecarios (catálogos. En ese sentido De Rosa et al (2005). profesionales o académicos) y posteriormente nos ocuparemos del frente de investigación que toma Google Scholar como objeto de estudio. a) Percepción de la calidad. Los usuarios y Google Scholar Entre los estudios que abordan el análisis de Google Scholar como buscador académico se pueden distinguir por un lado aquellos que pretenden conocer el grado de percepción de la calidad y utilidad del producto por parte de diferentes tipos de usuarios (estudiantes. etc. a continuación se van a desgranar los principales hallazgos y discusiones científicas en torno a Google Scholar. comenzaremos con la línea de investigación centrada en Google Scholar como buscador (desde el punto de vista de los usuarios. bases de datos bibliográficas. académicos y profesionales de la información) y.

En ese sentido. comprendiendo un amplio rango de edades (de 15 a 57 años). la British Library y el JISC (anteriormente Joint Information Systems Committee) financian un informe con el fin de identificar el modo en el que los investigadores del futuro (aquellos nacidos después de 1993) iban a acceder e interactuar con los recursos digitales en un margen de 5 a 10 años (Rowlands et al. Nótese que este fenómeno ya ocurría nada más y nada menos que en mayo-junio de 2005. del total de encuestados. El impacto de los motores de búsqueda . aunque las personas jóvenes demuestran una aparente facilidad y familiaridad con los aparatos electrónicos y los ordenadores. 396 eran estudiantes en activo (tanto de grado como de posgrado) de seis zonas geográficas diferentes (Australia. Singapur. ¿es capaz el usuario de distinguir los contenidos de calidad de los banales o incluso falsos? Efectivamente. transformando de ese modo los hábitos de consumo de información. el efecto de Google (buscador general o académico) va mucho más allá de un cambio de la herramienta usada como punto de partida de las búsquedas. Reino Unido y Estados Unidos). Los sorprendentes resultados del informe muestran que el impacto de las Tecnologías de la Información y Comunicación (TIC) en los jóvenes se había sobreestimado. Los resultados de este informe indican que el 89% de estos estudiantes en activo utilizaban los motores de búsqueda para comenzar sus procesos de búsqueda de información mientras que sólo el 2% utilizaba el sitio web de la biblioteca para este propósito. 2008). Este hecho no sólo confirma los estudios anteriores (que detectaban el amplio uso de estas herramientas como punto de partida de sus búsquedas informacionales) sino que trae a colación otro grave problema: ¿deben ser todos los resultados obtenidos a través de un motor de búsqueda considerados en la misma medida?.ya había superado un punto de no retorno en los usuarios. concentración en 51 . el virus Google había sido inoculado. los autores indican que. El principal objetivo del estudio era pues el de conocer el impacto de la transición digital en el comportamiento informacional de la llamada Generación Google y guiar a los servicios bibliotecarios para que éstos pudieran anticiparse y reaccionar de forma más efectiva ante los cambios emergentes en el comportamiento de los usuarios. Conscientes de ello.y en especial de Google . India.Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) a través de una encuesta a 3.348 usuarios para conocer las percepciones que los estudiantes tenían de los recursos bibliotecarios y de información. sino que está propiciando un notable cambio en la forma de trabajar en el sentido amplio. Canadá. confían excesivamente en los motores de búsqueda.

centrándose en esta ocasión en el comportamiento en la búsqueda de información e investigación de los estudiantes de doctorado pertenecientes a la Generación Y 11. Endnote y Mendeley). unos 17. mientras que las bases de datos bibliométricas e interfaces de búsqueda de revistas electrónicas eran más populares en los campos de la Biología y Ciencias biomédicas (el efecto de la cobertura de Google Scholar en las disciplinas se detallará en capítulos posteriores). 2011). los datos mostraban diferencias importantes en función de las distintas disciplinas académicas. Por tanto. En la investigación. Sin embargo. situación que. 2012). se reclutaron 60 estudiantes de 36 instituciones con los que se realizó un estudio cualitativo longitudinal. los recursos de Google eran preferidos especialmente en Artes y Humanidades (cerca del 30%). no se consideran “nativos digitales”. Este estudio comprende sin embargo solamente a los nacidos entre 1982 y 1994.52 La revolución Google Scholar el estudio y profundidad de lectura y pensamiento crítico. participaron hasta 72 instituciones de educación superior a través de la promoción y difusión de un cuestionario entre sus alumnos de doctorado. la British Library y el JISC financian un nuevo proyecto de investigación de tres años de duración (Carpenter. El catálogo de la biblioteca constituía uno de los recursos menos requeridos. En paralelo. los usuarios ven modificadas sus estructuras y rutinas de pensamiento al ser expuestos de una manera inmersiva (tanto a nivel profesional como personal) al funcionamiento de los motores de búsqueda. espe 11 También conocida como la generación del milenio. realizada entre 2009 y 2011. Los resultados generales obtenidos en los estudios mencionados anteriormente (uso predominante de los motores de búsqueda. abarca las fechas de nacimiento entre 1980 y comienzos de la década de 2000 aproximadamente. el 30% de los estudiantes utilizaba Google o Google Scholar como fuente principal para localizar literatura científica. Por ejemplo. puede llevarnos a una preocupante superficialidad intelectual (Carr. Ciencias Sociales (cerca del 40%) e Ingeniería e Informática (más del 40%). . siendo especialmente usado en Artes y Humanidades (con apenas el 13% de los usuarios) y Ciencias sociales (10%). pues habrían simplificado sus procesos y tareas de investigación durante sus estudios. de no revertirse. Si estos datos no fueran ya suficientemente reveladores por sí mismos. Con la intención de complementar los resultados obtenidos en este primer informe acerca de la Generación Google.000 estudiantes respondieron al menos a un informe anual. Debido a un efecto de neuroplasticidad. Del total de la muestra analizada. se podría añadir que una amplia mayoría de estudiantes indicaron que hubieran deseado haber conocido antes ciertas tecnologías y aplicaciones (especialmente Google Scholar.

el 75% había utilizado Google Scholar. guías temáticas. tal y como señalan el 42% de los encuestados (22% indican Google Scholar y el 20% Google general). entre los estudiantes en detrimento de los productos bibliotecarios.7% en el caso del catálogo de la biblioteca. EBSCOhost). igualmente. Cothran (2011) analiza por otro lado en qué medida los estudiantes graduados perciben Google Scholar como un recurso útil y fácil de utilizar. Los resultados obtenidos revelan que cuando los estudiantes comienzan la búsqueda de información. bases de datos de editores (por ejemplo. Wikipedia. facilidad de uso. el catálogo. quienes estudian los hábitos de investigación de los estudiantes de la Royal Roads University a partir de una encuesta a 1. el análisis estadístico revela utilidad percibida. Summon (herramienta de descubrimiento). De los 1.6% en el caso de Summon y al 39. en ese orden. las bases de datos de artículos y Wikipedia. El 14. en menor medida. Tutorial de Infoquest. especialmente el catálogo de la biblioteca) han sido posteriormente comprobados y ratificados en multitud de trabajos. los hallazgos más interesantes de este estudio se reflejen en las contestaciones proporcionadas ante la pregunta “Cuán útiles eran los resultados que encontraste en la búsqueda más reciente a través de las siguientes fuentes” 12. Bagget y Williams (2011) realizan igualmente una encuesta en este caso a 58 estudiantes de la Shenandoah University.988 estudiantes de posgrado en la University of Minnesota en 2009. más del 76% son propensos a usar Google.1% de los estudiantes indicó que no usaba Google Scholar. Tal vez. seguido de Google Scholar. En todo caso. Dubicki (2010) examina por su parte los hábitos de investigación de los estudiantes de grado y posgrado en el área de Negocios hallando que Google era el punto de inicio en las búsquedas de al menos el 50% de los estudiantes. se puede destacar el trabajo de Mussell y Croft (2013). este porcentaje ascendía al 20. posgrado (62%) y otros estudiantes que continúan estudios (12%). la percepción de Summon se encontraba fuertemente 12 Los usuarios disponían de las siguientes fuentes para evaluar: Google.141 (11.038 alumnos distribuidos entre estudiantes de grado (26%). 53 . Por ejemplo. Google Scholar. Nuevamente Google demuestra ser el lugar favorito para comenzar una búsqueda. ayuda específica de un bibliotecario. más del 25% de éstos nunca usaba las bases de datos bibliotecarias. Finalmente. 2009) concluye que los estudiantes norteamericanos utilizan los motores de búsqueda a diario. Para ello realizan una encuesta a 9. y “otras”. el catálogo de la biblioteca. lealtad y.4%) estudiantes que finalmente contestan el cuestionario. Las bases de datos bibliotecarias logran un porcentaje alto (26%) pero inferior a Google si combinamos los porcentajes de sus dos buscadores (general y académico).Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) cialmente Google. la encuesta LibQual+ 2009 (Cook et al.

54 La revolución Google Scholar polarizada (el 39. Como dato de interés. tenderían a utilizar otras herramientas más precisas y controladas.1%. Matemáticas. al menos desde un punto de vista teórico. En otro estudio similar. el recurso considerado “esencial” para un mayor porcentaje de alumnos era las bases de datos de los editores (64.4% de los alumnos). Es decir. 2013). mientras que Google Scholar era marcada en esta misma categoría por el 35. Lercher (2008) realiza una encuesta dirigida a los profesores de ocho departamentos en Louisiana State University (concretamente los de Química. según avanzamos en rangos de edad y nivel educativo. Filosofía y Ciencias políticas). posdoctorales y senior. Ingeniería eléctrica y computación. los datos empíricos que aportamos en este apartado vienen a demostrar todo lo contrario.4% de los estudiantes encuestados la marcaba como esencial. estos datos serían menores. adicionalmente se detecta un amplio uso de marcadores de páginas web en el navegador para acceder con mayor rapidez a los recursos o lugares de interés. Ciencias de los sistemas de información y decisión. La mayoría de los investigadores utilizan sólo ocasionalmente la página web de la biblioteca como punto de partida en sus búsquedas. Haglung y Olsson (2008) realizan un estudio observacional de los investigadores en Suecia de 2005 a 2006. Aunque en el momento del estudio Google Scholar es apenas conocido por los investigadores analizados. ¿Qué piensan los investigadores? Según los estudios vistos anteriormente acerca de la Generación Google y su confianza excesiva en los motores de búsqueda. el buscador general de Google domina como punto de partida a la hora de localizar información científica. Los investigadores lo usan tanto para buscar información metodológica como para localizar números de ISSN. Inglés. de una posible extensión del sistema académico a través del uso de reposito- . La preferencia de los motores de búsqueda sobre los recursos bibliotecarios se extiende desde los estudiantes a los estudiantes de posgrado. El propósito de la encuesta era conocer la utilidad. Y este argumento sería completamente lógico. que los investigadores predoctorales. en función de las necesidades de los investigadores. uno podría estar tentado a pensar que el uso de estas herramientas estaba más extendido entre los jóvenes y que. traspasando asimismo generaciones (Mussell y Croft. Historia. teóricamente más formados en el manejo de herramientas profesionales de búsqueda (imprescindibles para su trabajo) y con una mayor madurez intelectual y capacidad adquisitiva. Sin embargo. N= 755).

con académicos pertenecientes a diversas instituciones. Consorci de Serveis Universitaris de Catalunya) 13. Ollé y Borrego (2010) consideran una muestra algo más amplia. Aun así. Las principales diferencias 13 http://www. No obstante. Adicionalmente. Los autores obtienen 137 respuestas a su cuestionario (datos de 2007). gracias en parte a la velocidad y relevancia de los resultados que proporcionan. Sin embargo. el 90% indican que utilizarían Google Scholar en la búsqueda de material académico o científico. pero sí se comienza a percibir que para muchos investigadores los motores de búsqueda académicos han comenzado a “suplantar” a las bases de datos tradicionales. los datos por departamento no son representativos (la tasa más alta de respuesta por departamento corresponde a Filosofía. Hightower y Caldwell (2010) realizan una encuesta a 220 miembros de la University of California – Santa Cruz (principalmente estudiantes de posgrado. la muestra de este estudio es muy pequeña y desigual. El 83% de los investigadores había usado Google Scholar mientras que un 13% adicional mostraba una intención en probarlo.cat 55 .6%) seguida de Pubmed (21. Su objetivo principal no es el análisis de Google Scholar sino el estudio cualitativo del impacto de las revistas electrónicas en el comportamiento informacional de los investigadores de las universidades que pertenecen al Consorcio de Bibliotecas Universitarias de Cataluña (Consorci de Biblioteques Universitàries de Catalunya). la base de datos preferida era WoS (seleccionada por el 41. solamente con el 36%). Se debe reconocer no obstante que no existe una coincidencia plena en todos los estudios realizados hasta la fecha (algunos resultados son incluso contradictorios). el 86% indica que utilizan los motores de búsqueda para localizar trabajos no publicados (unpublished) en sus campos de especialidad.csuc. De las 72 respuestas obtenidas (de un censo de 347 profesores). integrado actualmente en el CSUC (Consorcio de Servicios Universitarios de Cataluña. donde se refleja que tanto Google como Google Scholar son explícitamente citados por casi una cuarta parte de los encuestados a pesar de que en el cuestionario no se menciona explícitamente a ninguna base de datos o motor de búsqueda concreto. el resultado quizás más interesante se produce cuando el 67% de los profesores indican que enviarían un trabajo a una colección web (se entiende dentro del repositorio) si el trabajo se pudiera encontrar así de forma más sencilla a través de Google Scholar. por lo que los resultados deben considerarse con cierta cautela.7%). profesores e investigadores) acerca de las preferencias de éstos en el uso de bases de datos.5%) y Google Scholar (18.Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) rios.

el tamaño muestral es excesivamente reducido y centrado en instituciones concretas. aquellos que preferían WoS se sentían más confiados acerca de la calidad de los resultados. mientras que los resultados de OpenDOAR y OAIster eran desalentadores. De los 2. mientras que Google Scholar por el 40%. resulta obligado mencionar el Informe Ithaka 2009 (Schonfeld y Housewright. hasta 967 disponían de versiones en acceso abierto. El estudio concluye que los investigadores de Ciencias. Por ejemplo. Oppenheim y Rowland (2008) quienes se proponen demostrar el grado de efectividad de diversas herramientas (Google. Mientras que Google Scholar era elegida principalmente por su facilidad de uso y rapidez. Afortunadamente. El uso de fuentes específicas de acceso a material en Open Access fue igualmente estudiado por Norris.56 La revolución Google Scholar detectadas por los investigadores radicaban en las razones detrás de las preferencias. también se disponen de estudios más amplios con un mayor número de instituciones analizadas y en diferentes países. Manejando datos empíricos de 2. Google es utilizado “frecuentemente” por el 65% de los investigadores encuestados. los autores observan que tanto Google como Google Scholar son herramientas frecuentemente utilizadas por los investigadores (61% y 35% respectivamente).519 artículos considerados. En cualquier caso. Brown y Swan (2007) llevan a cabo un estudio financiado conjuntamente por la Research Information Network (RIN) y el Consortium of University Research Libraries (CURL) con el objetivo de conocer la forma en la que los investigadores interactúan con las bibliotecas académicas en el Reino Unido. OAIster y OpenDOAR) a la hora de localizar versiones en acceso abierto de artículos científicos (peer-reviewed) en las áreas de Ecología. Ciencias sociales y Humanidades han abandonado las . es necesario disponer de muestras mayores para analizar este fenómeno con mayor precisión. 2010).025 profesores tanto en colegios como en universidades. Todavía resultan más impactantes los datos acerca de las fuentes utilizadas específicamente para localizar contenidos en acceso abierto. en el que se encuestaron a 3. y al igual que Lercher (2008).250 investigadores y 300 bibliotecarios. Google Scholar. Y prácticamente el 70% de los usuarios no usan “nunca” los repositorios institucionales. Google y Google Scholar eran capaces de localizar el 76. Windows Live Academic (versión anterior de Microsoft Academic Search) no es usado “frecuentemente” por ningún investigador (más del 90% no lo utiliza “nunca”). Economía y Sociología. Si nos transportamos desde el Reino Unido hacia los Estados Unidos. destacando levemente en Economía.84% de éstas.

están fuertemente influidos por la distinta cobertura de Google Scholar en las distintas áreas. en esta nueva edición hasta el 40% indican que comienzan sus procesos de investigación a través de un motor de búsqueda de propósito general. como ya se ha comentado anteriormente. parece demostrada la tendencia creciente hacia el uso de motores de búsqueda en detrimento de los productos bibliotecarios. 2013). mientras que un porcentaje menor (en torno al 15%) indica que comienzan sus búsquedas mediante el catálogo de la biblioteca o alguna base de datos o catálogo nacional o internacional.498 científicos británicos. seguido de los motores de búsqueda (en torno al 25%). Con todo. sólo el 2% de los profesores manifiestan que comienzan la búsqueda mediante una visita física a las instalaciones de la biblioteca. que constituyen e integran el llamado movimiento de las Altmetrics (Priem y Hemminger. En Artes y Humanidades el uso de las bases de datos específicas se reduce y aumenta el uso de los catálogos. tema que se detallará y desarrollará con mayor amplitud en el apartado 1. En Medicina el uso de las bases de datos específicas es mayor (40%). En noviembre de 2012 se tomaron datos para la elaboración de una nueva edición de esta encuesta (Housewright et al. Academia. 2010). Un tercio de los encuestados indica que comienzan la búsqueda en una base de datos o recurso electrónico específico.4. los datos varían por disciplina. En cualquier caso. Si bien es cierto que estos porcentajes. En agosto de 2014 la revista Nature publica los resultados de una encuesta realizada con el fin de conocer el conocimiento. 2015). y que tanto Google como Google Scholar se encuentran entre los métodos preferidos para localizar información en las revistas académicas.edu) productos bibliográficos plenamente adaptados al mundo web (Mendeley) o el uso de otros canales sociales para difundir y consumir contenidos académicos o de apoyo a la investigación (Mas-Bleda y Aguillo. excepto en Medicina. cobertura que ha ido evolucionando a lo largo de los años. Por lo tanto. uso y visitas a 57 . los motores de búsqueda constituyen el recurso más utilizado en todas las áreas. manejando en esta ocasión una muestra de 3. Esta tendencia todavía se acentúa más con la aparición de redes sociales académicas (ResearchGate.Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) instalaciones bibliotecarias y los recursos de búsqueda tradicionales (catálogos y bases de datos) para utilizar motores de búsqueda. Si en el Informe Ithaka 2009 el descubrimiento de contenidos a través de Google y Google Scholar ocupaba el tercer lugar cuando se les preguntaba a los usuarios con qué frecuencia utilizaban diferentes métodos para localizar información en revistas científicas. no sólo entre los estudiantes sino también entre los profesores e investigadores.

2014). Estos autores se proponen comprender cómo los lectores (en sentido amplio. tanto estudiantes como investigadores o profesionales) descubren. Probablemente Gardner e Inger (2013) son los que han realizado el estudio más amplio hasta la fecha. Para ello realizan una amplia encuesta a lectores (n=19. Google Scholar no sólo predomina respecto a los productos bibliotecarios más tradicionales o respecto a las plataformas sociales orientadas a la Academia. El ranking de relevancia de Google Scholar (basado principalmente en el número de citas). Las conclusiones del estudio vienen a reflejar que cuando los lectores buscan contenidos. Como aspecto digno de ser mencionado. favorece ligeramente a los artículos más antiguos. cubriendo todas las regiones del mundo y todos los sectores profesionales. pretendidamente su máxima competencia en la tecnología de los motores de búsqueda académicos (Orduña-Malea et al.58 La revolución Google Scholar diversas plataformas y sitios de redes sociales por parte de los investigadores (Van Noorden. se estima que en el área de Ciencia e Ingeniería aproximadamente el 60% de los encuestados (n=3. especialmente los investigadores (50% de los encuestados) y estudiantes (20%).064) entre mayo y julio de 2012. sino que predomina respecto a otros motores de búsqueda académicos: el 80% de los encuestados ni siquiera conoce Microsoft Academic Search. acceden y navegan por el contenido de las revistas científicas. para lo que usan preferentemente los sistemas de alertas o la navegación por la propia página web de la publicación. Estudios más recientes. los motores de búsqueda académicos son el segundo recurso más popular como punto de partida de la búsqueda (solamente superados por las bases de datos bibliográficas especializadas). 2014). Esto constituye un verdadero inconveniente para la utilización y visibilidad de los propios repositorios insti 14 http://omniupdate. como los E-Expectations research reports 14. aunque este aspecto será tratado en capítulos posteriores.com/resources/research. utilizado regularmente por cerca del 50%). por lo que estos datos resultan lógicos en cierta medida.000) conoce y visita regularmente Google Scholar (sólo se le acerca en uso ResearchGate.html . señalan igualmente que los usuarios encuentran información de una forma mucho más sencilla a través de Google que a través de las propias páginas web de las universidades. Arte y Humanidades (n=480). Este factor asciende al 70% en Ciencias sociales. Aunque los datos específicos acerca del procedimiento seguido en esta encuesta no se dan a conocer. los autores observan que los motores de búsqueda son considerados con una menor importancia cuando los lectores desean descubrir artículos más recientes.

un auténtico jarro de agua fría al producto que realmente está proporcionando los contenidos al motor de búsqueda. ¿debe estar plenamente integrado entre las colecciones y servicios a través de su presencia en la web de la biblioteca? Con el propósito de conocer precisamente el grado de integración de Google Scholar como recurso en las bibliotecas. cuantificando si Google Scholar aparece enlazado desde la página de inicio del OPAC (Online Public Access Catalog) o en diversos listados de bases de datos y guías temáticas. Muchos de ellos comienzan a evaluar la utilidad de este nuevo buscador. En 2005 sólo el 24% de las instituciones (27) listaban a Google Scholar en los índices alfabéticos de bases de datos y en el 14% de los listados de bases de datos organizados por materia. aunque los usuarios acaben accediendo a un documento alojado en un repositorio. la sospecha a que Google Scholar pueda reemplazar a corto plazo a otras herramientas de búsqueda más establecidas (y caras) existe entre el colectivo de profesionales de la información (Giles. 2008). De hecho. Hartman y Mullen (2008) realizan un amplio y detallado estudio para conocer la presencia del buscador como recurso de información entre los productos de las bibliotecas. 2005).Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) tucionales pues. así como su potencial como servicio de valor añadido a los recursos que la biblioteca ofrece (Hartman y Mullen. que estudiantes y profesores están empezando a emplear masivamente los motores de búsqueda. en este caso tomando como muestra las sedes web de las 113 instituciones pertenecientes a la Association of Research Libraries (ARL). 59 . revelando que la aceptación e integración del buscador como recurso en las páginas web de las bibliotecas pertenecientes a la ARL había crecido. 2012). Las autoras realizan el estudio en dos momentos temporales (2005 y 2007) y comparan los resultados. En 2007 estos porcentajes habían ascendido al 68% y 32% respectivamente. basándose tanto en los estudios empíricos mostrados en los apartados anteriores como en su propia experiencia diaria. éstos no han iniciado la búsqueda desde la página web del repositorio. El gran reto en esos momentos para las bibliotecas académicas es planificar qué hacer con este nuevo producto gratuito. ¿Qué piensan los profesionales de la información? Tras la aparición en escena de Google Scholar muchos bibliotecarios comienzan a informar. la visita directa desde Google Scholar al texto completo alojado en un repositorio institucional puede no reflejarse en las estadísticas de visitas del repositorio (Arlitsch y O´Brian. si no se realizan los ajustes oportunos.

Un producto que llegó al mercado de las búsquedas de súbito. se trata de una expresión metafórica que hace referencia a un problema obvio que nadie quiere afrontar. 2007). hecho que explicaba la utilización masiva de los buscadores por un amplio abanico de usuarios. 2005). desde estudiantes jóvenes a investigadores senior. Quizás una de las principales reticencias del sector bibliotecario proviniera del hecho de que las bibliotecas nunca habían formado parte del desarrollo de Google Scholar (Walters. . Sin embargo. 132 Research institutions. usándose en ocasiones “elefante” o “gorila”. y no las bibliotecarias. el miedo a que los usuarios se acercaran a Google Scholar y se alejaran de la biblioteca ya se respiraba en el ambiente. aunque el sentido es el mismo. pero inesperadamente encuentran que son las sedes web de las facultades y de los estudiantes. pero de una forma muy cautelosa. a los que sí introducían el producto a los usuarios. 256 Master’s institutions. Neuhaus. identificándose por un lado a los “puristas” (aquellos que deseaban proteger a los usuarios de contenidos no estrictamente académicos) y. “Trying to come to terms with the new 800-pound dragon in their living room” (York. Los autores comprueban que las instituciones de investigación enlazan con mayor frecuencia a Google Scholar que las instituciones de menor tamaño.60 La revolución Google Scholar En un estudio similar. 2005). La posición además de los bibliotecarios respecto al uso de Google Scholar se polarizó muy rápidamente (York. que nadie espera 15 Cfr. 2009). El término en ingles suele variar. sin previo aviso. un total de 948 universidades y colleges. Neuhaus y Asher (2008) analizan el grado de adopción de Google Scholar en instituciones y centros universitarios (en concreto. York utiliza muy acertadamente el término “intentando manejarse con un elefante en la habitación” 15. donde un mensaje del tipo “Scholar está bien. distinguiendo por una parte las sedes web institucionales y por otra las bibliotecarias. por otro lado. Era absolutamente comprensible que la irrupción en el mercado de un producto de las características de Google Scholar supusiera un importante reto y una gran preocupación en el sector bibliotecario. desde donde se enlaza a Google Scholar con mayor frecuencia. 267 Baccalaureate institutions y 293 Associates institutions) a partir de un análisis webmétrico para determinar el número de sitios web desde los que se enlaza a Google Scholar (a fecha de 2007). 2005). Primero Internet y posteriormente la Web (junto con el desarrollo de los motores de búsqueda gratuitos) habían provocado que la inmensa mayoría del conocimiento residiera por primera vez en la historia fuera de la biblioteca física (Blankenship. pero todavía nos necesitas a nosotros y a nuestras bases de datos exhaustivas” comenzaba a hacerse pervasivo en la mayoría de guías bibliotecarias (York.

Este sentir se refleja en el informe “The future of library resource discovery” (Breeding. Ettinger (2008). un producto en el que los profesionales de la información no habían sido tenidos en cuenta para su diseño. en el que se confiesa que las bibliotecas tienen muy poca influencia en Google Scholar en comparación con los servicios de descubrimiento que producen las empresas del sector (por ejemplo. se percibe por tanto como un desarrollo ajeno e invasivo al sector de la información. por si esto fuera poco. tras realizar una búsqueda básica 16. no se tenía una idea clara de los requisitos técnicos que se debían cumplir para poder incluir nuevos contenidos. que podía provocar comprensibles dificultades a los usuarios para determinar si los resultados eran o no académicos. y que. Por ejemplo. Y para más inri. Google Scholar no participó en el NISO Open Discovery Initiative). Aparte de la razonada crítica relativa al grado de academicidad de los contenidos (debido al filtro automático desarrollado por Google). pero no para la amplísima mayoría de usuarios (Google Scholar no es un producto orientado a los profesionales de las búsquedas sino a los usuarios finales).Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) ba. existía cierta incomprensión en torno a un producto del que no se conocía su cobertura. A esto debe unirse un cierto desconocimiento inicial acerca del funcionamiento real del buscador. Giustini y Barsky (2005). elaborado por la National Information Standards Organization (NISO). Una definición que no es del todo precisa (el algoritmo PageRank en ningún caso decide qué es o no académico). los artículos de 1990 son listados primero. de forma acertada. A esto nos debemos preguntar lo siguiente: ¿ilógico para quién? Probablemente sea ilógico para un bibliotecario. pero con una penetración mundial imparable). utilizaba un sistema de ordenación de resultados diferente cuyo funcionamiento era secreto. y no los artículos más recientes”. y que ilustra a la perfección las dudas e intensos debates que surgen a mediados de la primera década del 2000 entre los profesionales de la información. Los autores clarifican posteriormente este conflictivo punto al lector: “el algoritmo PageRank hace una conjetura calculada acerca de lo que él cree que es académico. que precisa controlar o filtrar la ordenación de resultados. una caja negra. y lista los artículos en función de lo relevantes y populares que son”. indican que “ilógicamente. sostiene que más que lamentarnos del uso de herramientas como Google Scholar (con sus virtudes e inconvenientes. 2015). ni siquiera habían sido consultados como expertos. las bibliotecas deben pensar ineludiblemente en formas de asimilarlo estra 16 “common cold” and “vitamin c” 61 .

62

La revolución Google Scholar

tégicamente. Hartman y Bowering Mullen (2008), conscientes de que
Google Scholar supone un lugar familiar en el que comenzar los procesos
de búsqueda de información ya difícilmente sustituible, resaltan la habilidad de éste para conectar a los usuarios afiliados a una biblioteca con
los contenidos disponibles por las suscripciones a través del servicio de
link resolvers 17, circunstancia igualmente señalada por Giustini y Barsky
(2005), quienes muestran a Google Scholar como una pasarela gratuita
hacia información científica para los usuarios no afiliados a una universidad u hospital, o que simplemente realizan sus búsquedas fuera de los
dominios de estas instituciones (pensemos igualmente en los estudiantes que puedan realizar búsquedas desde su hogar).
La tecnología del link resolver ofrece adicionalmente la posibilidad
de cuantificar el número de usuarios que llegan a la biblioteca a través
de enlaces desde Google Scholar y conocer por tanto el tráfico que éste
está proporcionando o redirigiendo a los contenidos contratados por
las bibliotecas (Detlor y Lewis, 2006), aunque los productos y bases de
datos bibliotecarias no hayan sido utilizados para localizar y acceder a
estos contenidos. Esta circunstancia permite a Herrera (2011) conocer
el número de clics (a través del link resolver de Google Scholar) que habían terminado en visitas web a los contenidos alojados en la University
of Mississipi Library. Para ello realiza un análisis longitudinal (de 2006 a
2009) constatando un crecimiento del porcentaje de clics procedentes
de Google Scholar desde el 4% en 2006 hasta el 27% en 2009. Así mismo
observa un crecimiento del porcentaje de clics procedentes de la Web of
Knowledge (del 2% al 11%).
El producto que más porcentaje de visitas proporcionaba a la biblioteca (EBSCO) no había cambiado durante el período de análisis, aunque
el porcentaje de visitas que proporcionaba sí había bajado considerablemente (del 61% al 52%). Otro resultado importante de esta investigación
es que se observaban más clics desde Google Scholar a los recursos bibliotecarios (10.522), que desde los usuarios del sitio web de la biblioteca
a Google Scholar (801). Estos apabullantes datos tal vez contesten por sí
mismos a las dudas iniciales de los bibliotecarios acerca de la posible
integración de Google Scholar entre las colecciones y servicios de la bi 17 Link resolver (o link-server): es una aplicación que permite conectar de forma especial la
fuente y el destino de un hipervínculo. En este caso, la fuente tiene la forma de un OpenURL (enlace estandarizado que contiene información bibliográfica). Cuando un usuario
hace click en el enlace, la aplicación comprueba, basándose en la información bibliográfica del OpenURL, si la biblioteca de una determinada institución ha adquirido o suscrito
el acceso al texto completo del recurso solicitado. Si es así, lo recupera si el usuario es
capaz de autenticarse como miembro de dicha institución.

Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I)

blioteca a través de su página web. Nos guste o no, esta cuestión resulta
hoy en día indiferente a los usuarios; éstos encuentran Google Scholar
con cierta facilidad (esté o no enlazada desde el sitio web de la biblioteca) y comienzan sus búsquedas desde su austera pero sencilla y efectiva
página de inicio.
Posteriormente, Wang y Howard (2012) analizan los datos de uso de
Google Scholar desde 2006 a 2011 desde tres herramientas (SFX link resolver, Web Access Management proxy server y ILLiad interlibrary loan server)
de la San Francisco State University. Los datos indican una preferencia de
Google Scholar respecto a la herramienta de búsqueda federada de la
universidad (Metalib), convirtiéndose en una importante fuente de solicitud de préstamos interbibliotecarios.

b) Estudios comparativos con otros productos bibliotecarios

Entre los estudios dedicados a Google Scholar en su faceta de buscador destacan por una parte aquellos orientados a la comparación con las
tradicionales bases de datos bibliográficas y, por otra parte, a su comparación con otros productos más modernos, como son las herramientas
de descubrimiento.
Bases de datos bibliográficas
La literatura pronto comprueba el efecto de dos importantes variables externas a la hora de realizar comparaciones entre Google Scholar y
otras bases de datos bibliográficas:
—— La disciplina y área de conocimiento: los distintos acuerdos con editoriales o el cumplimiento de ciertos requisitos técnicos en las sedes
web de éstas influyen en los contenidos que finalmente son indizados. Y esto a su vez influye en la precisión y amplitud de los resultados ante consultas determinadas.
—— El tipo de consulta: la precisión del buscador varía significativamente
de consultas con términos generales y amplios a consultas con términos concretos y específicos.
Veamos con mayor detalle cada uno de estos enfoques:
Tipo de consulta:
Dado el carácter multidisciplinar de Google Scholar (aunque su cobertura fuera muy desigual en sus inicios), muchos profesionales se planteaban la necesidad de evaluar las prestaciones de Google Scholar a la
hora de localizar información relevante en una disciplina y comparar los

63

64

La revolución Google Scholar

resultados con los ofrecidos por distintas bases de datos bibliográficas
especializadas, que eran entonces tradicionalmente adquiridas bajo licencia por las bibliotecas universitarias y de centros de investigación.
Obviamente, los resultados obtenidos eran diferentes en cada disciplina
(lo que se traducía en mensajes contradictorios a la comunidad respecto
a las prestaciones y cobertura del buscador), pero todas incidían en la
facilidad de uso, gratuidad y amplia cobertura general.
Por ejemplo, Cutler (2010), compara los resultados de búsqueda de la
Energy Technology Data Exchange – World Energy Base (ETDEWEB) con Google y Google Scholar con el propósito de determinar si ésta todavía era capaz de proporcionar resultados únicos no contenidos en los buscadores
web. Los resultados muestran que ETDEWEB proporciona resultados únicos en el 86.7% de las 15 consultas realizadas en el ensayo. Sin embargo,
más allá de este resultado, el autor descubre diferencias en la tipología
y enfoque de los resultados obtenidos: Google proporciona resultados
para no especialistas; Google Scholar por su parte proporciona resultados académicos, pero de propósito más general, mientras que ETDEWEB
proporciona resultados específicos en Energía, Tecnología y Desarrollo.
Con ello, Cutler concluye que Google y Google Scholar aportan o añaden
valor en el proceso de descubrimiento de literatura en tecnología.
Es probable que este hecho convirtiera a Google Scholar más eficiente
en áreas con mecanismos de comunicación científica diferentes a los tradicionales, como por ejemplo las ingenierías, en las que el uso de Google
Scholar estaba creciendo, como ya indicaba el informe Ithaka 2009 (Housewright et al, 2013). Meier y Conkling (2008) comparan Google Scholar y
Compendex en ocho áreas de la ingeniería, concluyendo que el buscador
académico es una herramienta útil tanto para localizar literatura en esta
disciplina (especialmente por su cobertura en los últimos 10-15 años)
como para servir de punto de partida en los proyectos de investigación
de los estudiantes. Sin embargo, Cusker (2013), quien también compara
Google Scholar y Compendex, pone de relieve las grandes prestaciones de
esta última respecto a Scholar, especialmente a la hora de reordenar artículos por fecha de publicación, autor y relevancia. Igualmente reclama
que el buscador ofrece un número de resultados relevantes realmente
amplio, pero que no ofrece en cambio medios suficientes para organizarlos y combinarlos de manera eficiente y útil. A pesar de todo, el autor
se decanta, como balance final entre ambas bases de datos, por Google
Scholar, pues ofrece sus limitadas prestaciones, ciertamente inferiores,
de forma gratuita.

Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I)

Más recientemente, Stirbu et al (2015) se centran en el área de la
Geografía, comparando los posibles beneficios de Google Scholar frente
a tres bases de datos (WoS, FRANCIS y GeoRef), pero poniendo el énfasis
en la evaluación de los resultados obtenidos y no tanto en las prestaciones de las bases de datos. Para ello, aplican búsquedas bibliográficas
idénticas a todas las bases de datos analizadas restringiendo los resultados a la literatura más reciente (2005 a 2009). Google Scholar muestra un
amplio grado de solapamiento con el resto de las bases de datos, pero
ofrece además un importante número de resultados únicos (independientes del año de publicación, campo o palabra clave buscada). Aunque
el resto de productos permiten localizar ciertamente información más
especializada, los autores indican la utilidad de Google Scholar a la hora
de localizar distintos tipos de literatura relacionada con la Geografía humana y física.
Esta complementariedad y capacidad de localizar información útil no
recogida en otros productos es igualmente recogida por Tober (2011),
quien compara Pubmed/MEDLINE con ScienceDirect, Scopus y Google Scholar para evaluar qué producto es más efectivo en el área de medicina
láser, mediante la aplicación de una serie de criterios de evaluación
(recuperación, precisión e importancia). Mientras que Pubmed aparece
como el producto más excepcional, Scopus destaca en efectividad y Google Scholar en importancia.
Tipo de consulta:
Los estudios anteriores confirman a Google Scholar como un producto con una cobertura amplia y complementaria a las bases de datos
bibliográficas especializadas, aunque de comportamiento desigual en
función de la disciplina estudiada. Sin embargo, independientemente
del área de conocimiento, el tipo de consulta efectuada en el buscador
es vital a la hora de valorar los resultados. Una cuestión es realizar consultas generales y amplias con el objetivo de localizar artículos y material
académico de calidad acerca de una disciplina y otra bien distinta localizar material específico y especializado a partir de consultas concretas y
búsquedas sistemáticas. Y en este sentido, los resultados obtenidos son
ciertamente contradictorios.
Por ejemplo, Callicott y Vaughn (2005) confeccionan cinco búsquedas
con las que pretenden reflejar temas típicos de estudiantes universitarios en sus trabajos de investigación. Cada una de las búsquedas son
posteriormente aplicadas a los siguientes buscadores: Google Scholar,

65

66

La revolución Google Scholar

el catálogo en línea del College of Charleston, EBSCO’s Academic Search
Premier, y a una base de datos suscrita con acceso a diversos recursos
(MLA International Bibliography, Business Source Premier, Environmental
and pollution management, Art full text, y America: History and Life). Los
resultados de las búsquedas realizadas en Google Scholar resultaban, en
la mayoría de las ocasiones, mejores en comparación con el resto tanto en cantidad como en calidad de los resultados, aunque los autores
constatan diferencias importantes en función de cada una de las cinco
búsquedas analizadas.
Gardner y Eng (2005) comparan los resultados ante una consulta sobre el tema “homeschooling”, tanto en Google Scholar como por PsycINFO, Social Science Citation Index y ERIC; las bases de datos se comparan
en función del contenido, actualización, relevancia y solapamiento de
los resultados. Los autores confirman que Google Scholar es el producto
que mayor número de resultados proporciona, así como en una mayor
variedad de tipologías, fuentes y relevancia, aunque se observa una menor actualización de los resultados. El estudio concluye que la carencia
de control de calidad y la imposibilidad de dejar al usuario organizar los
resultados lo hacen menos efectivo que las bases de datos de pago a la
hora de encontrar material académico en ciencias sociales.
Cambiando de disciplina, Jones (2005) se propone testar las capacidades de diversos buscadores a la hora de recuperar información en Biología; para ello utiliza el término “Nodilittorina” 18 y observa que Google
Scholar recupera un mayor número de registros relevantes que a través
del resto de bases de datos de su análisis (BasicBIOSIS, ArticleFirst, ECO,
ProQuest, WilsonWeb, SciFinder Scholar, HighWire y MEDLINE). Sólo BIOSIS
previews obtiene una mayor tasa de recuperación en la búsqueda; así
mismo, Jones informa que la cobertura de literatura reciente en el buscador es impresionante, más allá de los criterios de ordenación y relevancia, demostrando así la fortaleza de Scholar en búsquedas específicas.
Por otra parte, Robinson y Wusteman (2007) diseñan ocho búsquedas con el propósito de examinar la relevancia de los 10 primeros resultados de búsqueda tanto en Google Scholar como en los buscadores
generales Google, Ask.com y Yahoo!; las ocho búsquedas se dividen en
cuatro consultas específicas sobre Ciencias de la vida y ambientales (denominadas consultas científicas) y en cuatro consultas generales (denominadas consultas no científicas) 19. Los resultados indican que Google
18 Género de molusco gasterópodo marino, de la familia de los caracoles.
19 La nomenclatura de consultas científicas y no científicas (scientific queries and nonscientific queries en el original), se consideran poco apropiadas y susceptibles de generar confusión, pero son los términos usados por los autores.

no permite la búsqueda booleana.76% de resultados relevantes) que para las generales (algo menos del 20% de resultados relevantes). Los autores concluyen que Google Scholar devuelve más resultados para búsquedas de temas (gracias a que las búsquedas se hacen a texto completo). especialmente críticos en la medicina basada en la evidencia. a pesar de que Google Scholar no está especialmente diseñada para la búsqueda exhaustiva acerca de cuestiones clínicas. Otro estudio de gran interés es el realizado por Levine-Clark y Kraus (2007). carece de límites para las tipologías documentales y no permite beneficiarse de la extraordinaria indización que proporciona la National Library of Medicine.1%.Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) Scholar proporciona resultados más relevantes para las cuatro búsquedas específicas (38. mientras que el solapamiento (registros en ambas bases de datos) es solamente del 10. una mejor disposición ante consultas sobre temas específicos por palabra clave. De los 702 registros recuperados. quienes comparan la cobertura de Google Scholar con Chemical Abstracs Service (CAS) ante seis búsquedas diferentes.9% están únicamente en CAS. aunque no para revisiones exhaustivas de literatura científica. lo que la hace excesivamente dependiente del tipo de consulta realizada. en términos generales. Desde entonces las comparaciones entre Pubmed y Google Scholar han sido frecuentes en la literatura a la hora de valorar sus prestaciones para ser utilizados en consultas clínicas. Anders y Evans 67 . 2005). CAS devuelve más resultados para compuestos químicos y búsquedas de nombres personales (gracias a la búsqueda avanzada). Google Scholar carece de todas las prestaciones importantes de MEDLINE: no trabaja con las Medical Subject Headings (MeSH). Sin embargo. los autores hallan que el 55% están indizados únicamente en Scholar y el 34. Esta excesiva dependencia de los resultados en función de las búsquedas específicas no es aceptable en áreas sensibles como la Medicina. donde además puede suponer un riesgo que la interfaz de búsqueda simple y básica de Google pueda comenzar a modificar los patrones y procesos de búsqueda de información científica (Giustini. Por ejemplo. Giustini (2005) concluye finalmente que. Pese a la amplia variedad de resultados. los estudios anteriores vienen a confirman una amplia cobertura de Google Scholar y. constituye una herramienta de búsqueda útil para el descubrimiento de contenidos por navegación o serendipia. en algunos casos contradictorios (por ejemplo en el caso del grado de actualización de los resultados). gracias a la indización del texto completo de los contenidos de las revistas y editoriales con las que ha llegado a algún tipo de acuerdo comercial.

Estos términos se introducen tanto en Pubmed como en Google Scholar y se analizan los primeros 40 resultados (denominada consulta rápida) para comparar las prestaciones de relevancia y precisión de ambos buscadores. Los resultados indican que Pubmed tiene una mejor precisión y parece superior a la hora de realizar búsquedas validadas. para guiar en el cuidado de pacientes individuales o en propósitos educacionales. Google Scholar: 69%). usando para ello el filtro “clinical queries” en Pubmed y la búsqueda avanzada en Google Scholar. aunque la precisión es similar en ambos (8% para Google Scholar. Los resultados más controvertidos son probablemente los obtenidos por Gehanno. Google Scholar recupera el doble de artículos relevantes (22% frente al 11% de Pubmed) y proporciona un mayor número de artículos en acceso abierto que Pubmed (14% frente al 5%). aunque el porcentaje de recuperación de resultados es similar en ambos buscadores (Pubmed: 71%. y recomiendan finalmente su utilización siempre en combinación con Pubmed. Este hecho es debido presumiblemente a la influencia del número de citas recibidas en los criterios de ordenación de los resultados (unido al hecho de que Scholar proporciona un mayor número de citas totales recibidas). El 67.6% de los artículos recuperados en Pubmed son considerados como “posiblemente” relevantes. 6% para Pubmed). haciendo de Google Scholar una mejor herramienta para consultas “rápidas”. Los resultados indican que. La relevancia de los resultados es abordada igualmente por Nourbakhsh et al (2012). eficientes y útiles para informar sobre protocolos de cuidado de pacientes basados en la evidencia. Los investigadores participantes proporcionan posteriormente los términos de búsqueda que ellos introducirían en un recurso bibliográfico para recuperar estudios relevantes que permitieran resolver la consulta clínica que habían recibido.68 La revolución Google Scholar (2010) comparan los resultados sobre tres temas clínicos relacionados con cuidados respiratorios. quienes realizan un estudio con el . a cada investigador que acepta participar en el estudio se le proporciona una consulta clínica aleatoria centrada en terapia renal (obtenida previamente de una revisión sistemática). Rollin y Darmoni (2013). Shariff et al (2013) contactan a través de una encuesta con un conjunto de nefrólogos canadienses. mientras que ese porcentaje asciende al 80% en el caso de Scholar. Los autores demuestran la importancia de Google Scholar en los procesos iniciales de búsqueda de literatura sobre cuestiones clínicas. quienes comparan los resultados obtenidos en Pubmed y Google Scholar a través de cuatro consultas basadas en cuestiones clínicas. evaluando posteriormente los resultados en función de la relevancia y calidad de éstos.

Por tanto. Los resultados muestran que los 738 estudios originales contenidos en las 29 revisiones sistemáticas eran localizables en Google Scholar. mejorando las opciones de búsqueda para incrementar la precisión.org/cochrane-reviews 69 . Igualmente evalúan la precisión de un test de diagnóstico para una condición dada en un grupo de pacientes específicos. dado que no es lo mismo buscar artículos para los que ya conoces su título (método utilizado por Gehanno).Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) firme propósito de evaluar la cobertura de Google Scholar específicamente en las revisiones sistemáticas sobre ensayos clínicos. por lo que Google Scholar no debería ser utilizada como fuente única en las búsquedas de revisiones sistemáticas. Se investigan los efectos de intervenciones para la prevención. de algoritmo y de su estructura de la base de datos no la hacen idónea para estos fines. quienes indican que Google Scholar no puede ser usada de forma única en revisiones sistemáticas pues los continuos cambios de contenido. Se publican online en la Biblioteca Cochrane: http://community. sino de forma conjunta con Pubmed.000 resultados. 20 Las revisiones de Cochrane son revisiones sistemáticas de investigación primaria en salud y política sanitaria. Estas conclusiones son fuertemente criticadas por Giustini y Boulos (2013). tratamiento y rehabilitación. y que son reconocidas internacionalmente con los más altos estándares salud basada en la evidencia. y ser usada en revisiones sistemáticas.000 ítems).cochrane. el buscador podría convertirse en una base de datos bibliográfica líder en Medicina. Para ello recogen 29 revisiones sistemáticas publicadas en la Cochrane Database Systematic Reviews 20 y en JAMA (Journal of the American Medical Association) en 2009. Los resultados reflejan una mayor cobertura de Google Scholar. y posteriormente buscan cada estudio en Google Scholar para evaluar el porcentaje de trabajos que podrían haber sido identificados buscando únicamente en este buscador. que descubrirlos en un proceso de revisión sistemática original. quienes identifican 21 revisiones sistemáticas en Biomedicina y estudian la recuperación teniendo en cuenta el límite impuesto por Google para la visualización (1. para determinar si Google Scholar es suficientemente sensible para ser usado como buscador único. Sin embargo. solo el 72% de las referencias incluidas podían realmente ser usadas al encontrarse listadas dentro de los primeros 1. La importancia de la mayor o menor utilidad de Google Scholar como base de datos bibliográfica para la búsqueda de revisiones sistemáticas genera un importante debate que prosigue con el estudio de Bramer et al (2013). El 80% de las referencias incluidas en las 21 revisiones sistemáticas se encontraban en Google Scholar (frente al 68% de Pubmed).

pues simplemente se basan en comprobar la existencia o no de referencias de calidad. Cualquier análisis con dos años de antigüedad ya no resulta representativo de la situación actual del buscador. los autores identifican 14 revisiones sistemáticas de Cochrane y trasladan las estrategias de búsqueda a Google Scholar para medir la recuperación y precisión de éste en condiciones derivadas de procedimientos convencionales de búsqueda estructurada en recuperación de literatura científica. Por ello. constructor visual de búsquedas o existencia de un histórico de búsquedas). En cambio. no está preparada todavía como una herramienta de búsqueda profesional para tareas donde es necesaria una metodología de recuperación estructurada. Los resultados finales sugieren a los autores que Google Scholar no proporciona los elementos necesarios para una recuperación de literatura científica sistemática (tales como una optimización incremental de la búsqueda. Entrenamiento de los usuarios: La utilidad de las herramientas de búsqueda depende asimismo del posible entrenamiento previo que tengan los usuarios. existen otras variables externas que pueden afectar a la validez de los estudios sobre Google Scholar en su comparación con otros productos de búsqueda: El período temporal: La calidad de los resultados de Google Scholar mejora continuamente. exportación de un amplio número de referencias. . de forma que cada búsqueda se lanza a un conjunto diversos de recursos y bases de datos para posteriormente recuperar y combinar todos los resultados y presentarlos unificados al usuario. Vach y Motschall (2013) también critican las altas expectativas creadas en torno a la amplia tasa de respuesta de Google Scholar en revisiones sistemáticas. por lo que el año del análisis resulta necesario para contextualizar adecuadamente los resultados. Nygren y Widmarck (2007) comparan Google Scholar con Metalib (una herramienta de búsqueda federada que representa a más de 200 bases de datos) 21 21 Metalib es un metabuscador.70 La revolución Google Scholar Boeker. específica). Otras variables externas: Aparte de la disciplina (área de conocimiento) y tipo de consulta (general. incidiendo en el hecho de que dichos estudios no utilizan la interfaz de búsqueda de Google Scholar de forma realista. las limitaciones de la interfaz del buscador deberían considerarse a la hora de comparar este producto con otras herramientas de recuperación profesionales. Para ello. Haya.

aspectos todos ellos esenciales para valorar correctamente a Google Scholar. por encima de la calidad media). habiendo recibido formación previa la mitad de los estudiantes. Para ello. los estudiantes localizaban más del doble de documentos relevantes en Google Scholar que en Metalib. Tras ello. quienes realizan búsquedas relacionadas con sus trabajos de tesis. cobertura y relevancia).Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) a través un estudio de usuarios compuesto por 32 estudiantes de doctorado en ciencias sociales de la Stockholm University. Estas conclusiones tienen una especial importancia dada la diferencia integral en el funcionamiento de estas dos herramientas. 71 . actualización. y que puede disponer de distintas versiones agrupadas. El entrenamiento había tenido además un efecto positivo tanto en la cantidad como en la calidad de los artículos localizados. calidad media. a lo largo de una sesión de 20 minutos. Los autores plantean que esos estudios (basados en medidas puramente numéricas) no reflejan ni miden la eficacia de ninguna búsqueda particular ni la naturaleza académica o los algoritmos de descubrimiento de los contenidos. especializados en Humanidades. Relevancia y precisión: Howland et al (2009) constatan por su parte la existencia de demasiados análisis centrados en la comparación de título por título (o registro por registro 22) para evaluar a Google Scholar como herramienta. Los autores utilizan el término “cita” para referirse a cada “hit” que el buscador devuelve ante una consulta. Los autores advierten que. los estudiantes que habían recibido un entrenamiento previo en las dos herramientas. Este error terminológico se constata igualmente en diversos artículos publicados en la primera mitad del siglo XXI. encontraban relativamente más artículos académicos (revisados por pares) en Scholar. en este libro se utilizan los términos “resultados” o “registros” para referirse a los “hits”. reservando “citas” para contabilizar las citaciones que recibe un determinado hit asociado a un documento. de media. Además. desarrollan una consulta basada 22 En el original se usa el término “cita”. usando para ello tres grados de valoración (por debajo de la calidad media. autoridad. objetividad. El estudio consistía en contabilizar los resultados que los estudiantes obtenían en sus búsquedas como “relevantes” si éstos marcaban o guardaban los resultados para ser utilizados en un futuro. hasta siete bibliotecarios de la Brigham Young University. Para evitar la posible y razonable confusión. estos investigadores aplican el “índice de academicidad” a los resultados obtenidos a través de un modelo basado en categorías (precisión. Ciencias y Ciencias sociales. aunque los estudiantes no estaban completamente entusiasmados con ninguna de las dos herramientas.

inciden especialmente en indicar que las bases de datos han fallado principalmente en ordenar los resultados por fecha en lugar de por relevancia. 2007) y temas específicos (Robinson y Wusteman. Pubmed y Sociological Abstracts tienen consistentemente una mayor respuesta y precisión que las búsquedas diseñadas por los expertos. PsycINFO. GEOBASE. Los resultados muestran además que las búsquedas simples en Google Scholar. En otro trabajo representativo. Es más. Jstor. se plantea precisamente un análisis comparativo de la recuperación y precisión de los resultados de Google Scholar con otro conjunto de bases de datos (EconLit. la indización del texto completo resulta pues esencial a la hora de conseguir la máxima relevancia en las búsquedas. Esa “falta” de lógica a la que aludía Giustini (2005) para indicar que Google Scholar no mostraba los resultados ordenados por fecha queda pues resuelta del siguiente modo por Howland y sus colegas: la clave del éxito es la relevancia y el amplio universo de información contenida. los resultados muestran que Google Scholar es. POPLINE. y Google Scholar) y evalúan los 30 primeros resultados obtenidos en cada una de éstas con el modelo diseñado. Posteriormente adaptan esta consulta a un conjunto de bases de datos (SportDiscus. Business source premier. GEOBASE. Tal vez podríamos creernos que la potencialidad de Google Scholar sólo reside en los primeros 20 ó 30 resultados.72 La revolución Google Scholar en una necesidad de información típica o estándar solicitada por estudiantes. pero prestando especial atención a la efectividad de las búsquedas simples y las realizadas por expertos.6% más académico que los materiales encontrados únicamente en el resto de las bases de datos bibliotecarias analizadas. Social Sciences Full Text y Sociological Abstracts). Esto viene a confirmar en parte los resultados previos de otros investigadores: las búsquedas de términos simples (LevineClark y Kraus. Applied Science and Technology Abstracts. Sorprendentemente. un 17. en promedio. Social Sciences Citation Index. 2007) obtienen resultados precisos y relevantes en Google Scholar. PubMed. llevado a cabo por Walters (2011). PAIS. relacionadas todas ellas con el tema de la “migración”. Medline. El análisis de los resultados revela que Google Scholar es una de las pocas bases de datos capaz de recuperar resultados relevantes y con una precisión razonable a partir de la posición 50 en la página de resultados. Para ello se evalúan las respuestas obtenidas a 32 búsquedas (9 de ellas consultas simples construidas mediante palabras clave y 23 construidas por bibliotecarios expertos). . Linguistic and language behavior.

comparando Google Scholar con Ex Libris Primo®. Otro interesante estudio es el 73 . podemos concluir que Google Scholar no sólo es el buscador preferido por los distintos usuarios para comenzar sus búsquedas. 2013). concluye que los resultados de Google Scholar son inferiores en todos los aspectos. descubriendo que la relevancia de ambos productos es similar. tras analizar 500 artículos de revistas alemanas en diversas áreas y comparar los resultados de Google Scholar con los de la herramienta de descubrimiento de EBSCO implementada en la University Library of Cologne. Incluso las diversas tecnologías de búsqueda federada no pueden competir con Google en rapidez. Sin embargo. Con el fin de competir con esa interfaz simple y diseño intuitivo de los motores de búsqueda como Google y Google Scholar. Kaluza (2013). Zhang (2013).Bloque A · Capítulo 2 · Las dos caras de Google Scholar (I) Herramientas de descubrimiento Resumiendo. concluyen que interfaces simples pueden ser igualmente útiles. Cooke y Donlan (2008). en lo que podríamos denominar una transición desde los pioneros sistemas de búsqueda federados hacia los modernos recursos de descubrimiento (Mussel y Croft. Con todo. por ejemplo. la precisión de estas herramientas de nueva generación no parece superar en prestaciones a Google Scholar si tenemos en cuenta el coste de su adquisición. quienes comparan Serials Solution’s Central Search (personalizada por la Florida Gulf Coast University Library) con Google Scholar y Microsoft Academic Search. las bibliotecas académicas comienzan a reconfigurar sus sitios web en torno a ese concepto de caja de búsqueda única para proporcionar a sus usuarios una experiencia de búsqueda similar a Google. especialmente ante consultas sencillas y basadas en palabras clave de términos específicos. dependiendo de las preferencias de los usuarios y de las necesidades de información. simplicidad y facilidad de uso. Chen (2006) es claro por su parte en su diagnóstico de la situación: los sistemas de búsqueda federados han fallado en su propósito de convertirse en ventanillas únicas de consulta y acceso a la información académica. aunque destaca su adecuación como primer paso en la búsqueda científica por su gratuidad y resultados generales satisfactorios. se centra en conocer la evaluación de los resultados de búsqueda por parte de los usuarios. aunque también depende obviamente de la herramienta con la que se compare. a día de hoy. sino que la relevancia de sus resultados. los distintos estudios reseñados a lo largo de este apartado. es superior en ocasiones (dependiendo de áreas de conocimiento) a la de bases de datos bibliográficas especializadas. aunque la herramienta de descubrimiento recibe puntuaciones sensiblemente inferiores en el aspecto de la usabilidad del producto.

especialmente Google Scholar. Estos resultados plantean serias dudas acerca de la necesidad de invertir dinero en el desarrollo (y adquisición) de estos productos considerando que. El 73. exploraran y adquirieran prácticas recomendadas relacionadas con la publicación de contenido en la Web de forma que se maximizara su indización por parte de los motores de búsqueda académicos. 2015). y que serán descritas con mayor detalle más adelante. —— La escala y sofisticación de la tecnología implicada en Google Scholar excede con mucho el de los proveedores de servicios bibliotecarios.57% en Google Scholar mientras que Google buscador general obtiene el mejor porcentaje (90. entre las conclusiones del reciente informe técnico elaborado desde la NISO acerca del futuro de las herramientas de descubrimiento de las bibliotecas (Breeding. El informe indica finalmente que. Google Scholar es completamente gratuito.74 La revolución Google Scholar realizado por Namei y Young (2015).26%). quienes envían 299 consultas a la herramienta Summon (implementada en la University of Southern California). De hecho. aunque el hecho de que Google Scholar no revele la escala y amplitud del material disponible (una información necesaria para poder valorar y evaluar sus prestaciones como producto de información académico). entre otras cuestiones.91% de los resultados proporcionados por Summon se consideran relevantes por el 73. resultaría beneficioso para la NISO extender programas o crear grupos de trabajo que. a pesar de las múltiples limitaciones que éste indudablemente tiene. Google y Google Scholar y comparan la relevancia de los resultados obtenidos en los tres buscadores. todavía mejora más Google Scholar (79. Esta circunstancia plantea una discusión y debate crucial para los servicios bibliotecarios actuales. aunque el porcentaje de Summon mejora (76.97%). —— Google Scholar. que envuelve muchas de las características de los servicios de descubrimiento. Sin embargo.14%) mientras que Google se mantiene prácticamente igual (90. hoy por hoy. se sitúa como uno de los más importantes canales a través del que los estudiantes y académicos acceden a los contenidos proporcionados por las bibliotecas. se destacan los siguientes puntos: —— Los motores de búsqueda académicos (como Google Scholar o Microsoft Academic Search) pueden ser vistos como una alternativa a las herramientas de descubrimiento producidas por organizaciones bibliotecarias. cuando las consultas se restringen a ítems académicos (278 consultas). .65%).

Desde los inadmisibles errores en la calidad de la información que afectan a los indicadores proporcionados por Google Scholar (esgrimidos por los detractores) hasta su innegable capacidad para recopilar nuevas 1 http://googlescholardigest.com. Por esta razón.es . funcionamiento y funcionalidades para localizar información científica. pero en contadas ocasiones a evidencias empíricas. ha estado sujeta en muchas ocasiones a conjeturas y opiniones. los autores creamos en 2014 el producto “Google Scholar Digest: research on Google Scholar empirical evidences” 1. localizar y recopilar la mayor cantidad de trabajos científicos que hayan aportado evidencias empíricas acerca del uso de Google Scholar para la evaluación de la actividad investigadora. este portal sirve de base para el depósito de nuevo material empírico realizado desde el propio grupo de investigación. con el que se pretenden dos claros objetivos. la evaluación acerca de su mayor o menor pertinencia para ser utilizada como herramienta para el análisis de la actividad investigadora tanto de usuarios como de revistas u otras agregaciones. y bajo la creencia del hecho de que los investigadores dudan. prueban (en ocasiones aciertan y en otras yerran) y discuten (pero no opinan).Capítulo 3 Las dos caras de Google Scholar (II): La herramienta de evaluación Así como las prestaciones de Google Scholar en tanto que buscador han sido continuamente probadas y analizadas (especialmente por los profesionales de la información) de cara a conocer sus principales características. Por otra parte.blogspot. bajo la forma de diversos informes y documentos de trabajo. Gracias a todo el material recopilado en Google Scholar’s Digest se ha elaborado gran parte de este capítulo. Por una parte. Por razones de espacio (y de discurso) no aparecen en esta obra todos los trabajos allí recopilados (que se mantienen accesibles desde el sitio web) sino sólo aquellos necesarios para enarbolar la discusión necesaria acerca de este espinoso asunto.

en algunos casos completamente justificadas mientras que en otras desmesuradas. Las críticas que este profesor de la University of Hawai’i at Mãnoa ha dirigido hacia este buscador durante años han sido feroces. es probablemente la persona que más influyera durante la primera década del siglo XXI en su mejora y optimización. Una cosa es buscar material para satisfacer necesidades informacionales y otra bien distinta es buscar para evaluar.76 La revolución Google Scholar evidencias de impacto en las Ciencias sociales y Humanidades a través de un producto sencillo y gratuito (requerida por sus defensores). es decir. Jacsó (2008c) somete a Google Scholar al tercer grado.sin duda alguna . el galardón iría a parar . eran corregidas o minimizadas posteriormente por parte del equipo de Mountain view (al igual que ahora sucede con los Working papers y Reports depositados por nosotros mismos en Google Scholar’s Digest). promociones. La evaluación de la actividad académica Si existiera un premio al investigador más crítico con Google Scholar. Sin embargo.para Peter Jacsó. Jacsó (2008a) tiene claro desde el principio las diferencias entre un Google Scholar buscador y otro como herramienta bibliométrica. fundamentalmente desde la prestigiosa revista Online Information Review. Según sus propias palabras. como por ejemplo hallar el número de citas recibidas o determinar el h-index (tanto de personas como de revistas) es un asunto bien diferente. El algoritmo de vinculación de citas de documentos citantes a documentos citados no es confiable igual- . pues las cuestiones que Jacsó destapaba. para ayudar en la toma de decisiones relativas a contrataciones. este apartado refleja las principales discusiones académicas surgidas durante la última década. incluso atribuye un gran valor al servicio de versiones (que se verá en capítulos posteriores) pues éstas guían al usuario de una manera sencilla para acceder al texto completo de documentos primarios. Sucesivos tests en los que detecta de forma extendida errores en la identificación de nombres de autores. Google Scholar es una excelente herramienta para localizar información o documentos que pueden no estar representados en las bases de datos bibliográficas tradicionales. renovación o cancelación de revistas o la elaboración de diferentes rankings de actividad académica que pretenden reflejar un supuesto prestigio profesional. Pese a ello. distribución de la financiación. y en ocasiones incluso hirientes. revistas y de datos bibliográficos (año de publicación. premios de investigación. volumen/número o paginación). el uso de Google Scholar con fines bibliométricos.

por lo que los autores reales se ven privados del reconocimiento. Estos errores hacen que autores al principio optimistas respecto a las posibilidades de un motor de búsqueda académico de funcionamiento automático y cobertura mundial. El propio Jacsó (2008b) destaca algunos de ellos: “Google Scholar’s ability to identify citations is at best dodgy. comprueban cómo Google Scholar pierde el 12% (501) de las citas relevantes debido a errores del sistema. Unless it changes its course. Las críticas de Jacsó. quienes al analizar a un conjunto de profesores del área de Biblioteconomía y Ciencias de la información en los EE. and many web searchers are now moving back to regular Google for indiscriminate scholarly trawling of the web […]. la excesiva dependencia en la cooperación con los editores puede influir en la correcta in- 77 . repletos de falsos positivos y negativos. aunque existen otras variables de importancia.Bloque A · Capítulo 3 · Las dos caras de Google Scholar (II) mente. Todo ello provoca que las estimaciones de hits (resultados ante una consulta) y citas resulten groseras. mientras que el algoritmo de vinculación de versiones no funciona completamente bien. al trabajar con los datos de forma rápida y relativamente superficial. Los errores en las atribuciones de autores generan errores subsiguientes en la asignación de citas.UU. obteniendo duplicados. Bornmann et al (2009) destacan que la diversa tipología documental en Google Scholar dificulta los procesos comparativos con fines evaluativos basados en citas. adoptaran una actitud más crítica.” [Reinhard Wetz] “Scholar is not as useful as promised. Así mismo. especialmente por cuestiones de matching (el motor de búsqueda falla a la hora de identificar los documentos pertinentes respecto a la búsqueda realizada). aunque los datos y estadísticas aportados por Google Scholar puedan ser informativas. lo que genera la obtención de números excesivos o absurdos. la existencia de estos errores hace que los indicadores bibliométricos que puedan ofrecer sean de poco uso real. pues no es posible conocer los tipos de documentos que se están comparando. Por ejemplo. but more likely misleading and based on very spurious use of algorithms establishing similarity and relationships between references […] Google Scholar should withdraw the “cited by” feature from its Beta version and probably not offer it in the final version. GS well go the way of the dodo bird eventually. triplicados o cuadruplicados de documentos no agrupados correctamente. Meho y Yang se dirigen fundamentalmente al software empleado. Por ello.” [Dean Giustini] Los problemas localizados por Jacsó son igualmente identificados por Meho y Yang (2007).

2 Estas cifras han mejorado sustancialmente. 2 Pese a ello. 299) proclama asimismo que. no inclusión de todas las revistas académicas. En otro trabajo. . mientras Jacsó (2006) critica el trabajo de Pauly y Stergiou (2005) por trabajar con una muestra reducida (114 artículos). un producto gratuito mientras que las principales herramientas de uso bibliométrico (WoS y Scopus) son de (prohibitivo) pago. Merece una atención especial el trabajo realizado por Harzing y Van der Wal (2008). en lugar de realizar diseños de investigación a mayor escala.78 La revolución Google Scholar dización de citas. aunque dependen de la fuente de datos. replica la consulta en 2008 localizando entonces sólo 956 artículos firmados por “I Introduction”. que resumen en los siguientes puntos: inclusión de citas no académicas. especialmente Jacsó. cobertura desigual entre campos del conocimiento. No olvidemos que Google Scholar es. p. Harzing y Van der Wal son conscientes no obstante de las importantes desventajas que supone Google Scholar en el análisis de citas. Una búsqueda realizada a fecha de septiembre de 2015 por nuestra parte (Figura 8) muestra apenas cinco resultados. todo no han sido críticas. quienes hacen hincapié en la posibilidad que brinda Google Scholar para democratizar el análisis de citas al proporcionar éste a cada académico la disponibilidad gratuita a los datos de citas. deficiencias para artículos antiguos (tal vez no digitalizados todavía). Harzing. a día de hoy. Jacsó (2006. Aguillo (2011) utiliza una aproximación cibermétrica con el fin de comprobar la utilidad de Google Scholar para la realización de análisis bibliométricos. Google Scholar muestra a “I Introduction” como al autor más prolífico con 40. podemos considerar que la mejora del sistema ha sido sencillamente espectacular. y actualización lenta (cada 2 ó 3 meses). especialmente en la evaluación de la investigación.100 artículos. concluyendo que Google Scholar carece del control de calidad necesario para su correcto uso como herramienta bibliométrica incidiendo. con el fin de mostrar los pasos positivos que el sistema está realizando para mejorar. Por ejemplo. en los errores de atribución de nombres. Teniendo en cuenta el incremento de cobertura del sistema desde 2008 hasta 2015. se muestran disconformes especialmente con las formas empleadas por los detractores de Google Scholar. al igual que Bornmann et al. Sin embargo. Harzing critica a Jacsó precisamente por trabajar igualmente con muestras pequeñas y por centrarse en casos basados en consultas manuales. independientemente de los medios financieros de sus instituciones. en que su mayor cobertura está constituida por ítems no comparables con aquellos contenidos en las bases de datos bibliométricas. resultados ilógicos debido al procesamiento automático de las citas.

frente al concepto “one size fits all”. Con ello se pretendía conocer la mayor o menor necesidad de un uso combinado de diferentes plataformas para obtener una imagen completa de las citas recibidas por un autor o revista principalmente. que 79 .Bloque A · Capítulo 3 · Las dos caras de Google Scholar (II) Figura 8.google. Asignación errónea de autores en Google Scholar <https://scholar.com/scholar?hl=en&q=author%3A%22I+Introduction%22> Métricas de evaluación y bases de datos bibliométricas La irrupción de Google Scholar en el mercado de los productos de información bibliométrica produjo una oleada de trabajos (que todavía dura a fecha actual) en los que se trataba de comparar el número de citas que las diferentes bases de datos proporcionan con el propósito de conocer la posible correlación entre éstas.

80

La revolución Google Scholar

aboga por el uso de un único producto, así como el papel que Google
Scholar juega en este nuevo sistema.
En el campo de la medicina y áreas afines, los estudios han puesto
su interés en la comparación entre Google Scholar y MEDLINE/Pubmed.
Al contrario de los estudios vistos en el capítulo anterior (centrados en
las prestaciones de búsqueda), en este caso se han fundamentado en
la localización de citas. A pesar de la habilidad de Google Scholar para
devolver resultados relevantes y proporcionar - de forma gratuita - una
trazabilidad de las citaciones recibidas por cada resultado obtenido, algunos autores expresan al comienzo serias dudas acerca de su capacidad para proporcionar citas recientes (Henderson, 2005), necesarias en
investigación médica dada la rápida obsolescencia en esta disciplina, así
como ciertos sesgos hacia la literatura más antigua, que podrían limitar
los análisis de citas desde Google Scholar en esta disciplina; de ahí que
la comparación de éste con Pubmed podría proporcionar información
precisa acerca de su mayor o menor utilidad.
Shultz (2007) compara y contrasta un total de 10 búsquedas en Pubmed y Google Scholar. Pese a que el autor concluye que ambos sistemas
funcionan de forma muy diferente (y por tanto no pueden ser comparados directamente), sus resultados ya atisban las principales características de Google Scholar: a) mayor cantidad de citas (en 8 de las 10 consultas, Google Scholar recupera más citas que Pubmed); b) localización de
citas únicas (de las 247 citas recuperadas por Google Scholar, el 50.61%
eran únicas, es decir, no recuperadas en Pubmed); c) diversidad de documentos citantes (el 12.96% de los resultados obtenidos en Google Scholar no eran artículos de revista); y la ampliación del espectro citante (el
4.05% de los resultados únicos de GS provenían de revistas no indizadas
en Pubmed).
Freeman et al (2009) también localizan más citas en Google Scholar
que en Pubmed al evaluar la capacidad de éstas dos bases de datos para
evaluar el impacto de revisiones de consultas sobre información en
drogas publicados en The Annals of Pharmacotherapy Drug Information
Rounds. Sin embargo, constatan la capacidad de Pubmed para localizar
información más específica y relevante.
Estos resultados concuerdan parcialmente con los obtenidos por
Mastrangelo et al (2010), quienes recopilan información acerca de los
factores de riesgo de sarcoma a través de Pubmed y Google Scholar. Los
autores, aparte de subrayar la mayor cantidad de citas recopiladas por
Google Scholar y la muy baja concordancia entre ambas bases de datos
(8%), inciden en el hecho de que muchas de las citas recuperadas por

Bloque A · Capítulo 3 · Las dos caras de Google Scholar (II)

Google Scholar son innecesarias, provenientes de resultados desactualizados e incluso falsos (debidos a fallos en la asignación de autores a
artículos), lo que ayuda en gran parte a la obtención de más resultados,
pero que precisan de un proceso posterior de filtrado.
Los autores detectan adicionalmente un problema ya planteado anteriormente y relativo al grado de comparabilidad entre los productos,
dada la diferente naturaleza de los materiales indizados en ambas bases de datos. La detección de una gran cantidad de las citas de Google
Scholar provenientes de fuentes no convencionales (libros, conferencias,
actas de congresos, posters, cartas, editoriales, etc.) complica la comparación directa de los dos buscadores. El idioma constituye un problema
adicional. Por ejemplo, Mastrangelo et al (2010) solamente tienen en
cuenta los artículos publicados en inglés para llevar a cabo su estudio.
No obstante, la delimitación temática de Pubmed (y su completa indización actual por parte de Google Scholar) 3 ha hecho que la mayoría de
los trabajos comparativos en términos de citas se hayan dirigido a las
tres principales bases de datos bibliométricas: Web of Science core collection, Scopus y Google Scholar.
Desde un inicio, existió un gran interés por la comunidad científica
en conocer las diferencias en términos globales del número de citas que
Google Scholar era capaz de recopilar respecto a Scopus y WoS. Por ejemplo, Jacsó (2005a) recoge los 30 artículos más citados en Current Science y
analiza las citas recibidas por éstos en las tres bases de datos. Sus resultados muestran que, aparentemente, tanto WoS como Scopus recuperan
un número de citas muy similar (977 y 992 respectivamente), mientras
que en Google Scholar los datos son muy inferiores (358), debido a que
éste sólo tiene indizados 14 de los 30 artículos analizados.
Este trabajo constituye una excepción en la literatura al ser de los pocos en los que se recuperan menos citas en Google Scholar. Los procesos
de búsqueda empleados para la localización de los artículos, la meticulosidad del autor para eliminar citas erróneas (labor no siempre realizada
en este tipo de estudios) así como las mayores deficiencias del sistema
en aquel momento a la hora de vincular correctamente las distintas versiones de los documentos pudieron influir en sus resultados.
Sin embargo, una gran parte de los estudios posteriores se han caracterizado de hecho por localizar más citas en Google Scholar. Por ejemplo, Martell (2009) analiza 217 artículos publicados en College & Research
3 La consulta <site:ncbi.nlm.nih.gov> en Google Scholar arroja un total de 3.650.000
resultados (julio 2015). Aunque el comando “site” no es exhaustivo, proporciona una idea
general de la alta tasa de indización en Google Scholar del material contenido en Pubmed.

81

82

La revolución Google Scholar

Libraries entre 2000 y 2006, observando que el promedio de citas por
artículo en WoS es de 3.1, mientras que en Google Scholar es de 6.4. Posteriormente, Minasny et al (2013) observan por su parte que el número
de citas en Google Scholar es 1.9 veces mayor que el de WoS a la hora de
analizar las citas recibidas por más de 300 investigadores del área de
Ciencias de la Tierra. Con todo, este tipo de estudios comparativos de
citas vienen fuertemente delimitados por las distintas disciplinas científicas y su desigual cobertura en cada base de datos.
Uno de los primeros análisis de citas por disciplinas en Google Scholar
fue el realizado por Bakkalbasi et al (2006), quienes estudian las citas recibidas en WoS, Scopus y Google Scholar para los artículos pertenecientes
a dos disciplinas (Oncología y Física de la materia condensada) en dos
momentos temporales (1993 y 2003). Los resultados muestran diferencias en función de la base de datos, del año de publicación y de la disciplina. Centrándonos en la muestra más reciente (2003), en Oncología
es Scopus la que obtiene un mayor promedio de citas (8.9), seguida de
WoS (8.3) y Scholar (6.2). Sin embargo, en Física de la materia condensada
es WoS la que ocupa el primer lugar (3.9), seguida de Scopus y Scholar
(ambas con un promedio de 2.2). Estos datos vendrían a coincidir con los
resultados previamente discutidos de Jacsó (2005a), aunque los autores
reconocen la capacidad de Scholar de aportar citas únicas no contenidas en las restantes bases de datos, aspecto en el que se ahondará más
adelante.
Posteriormente, Kousha y Thelwall (2008) llevan a cabo una de las
contribuciones más importantes en el área al analizar una muestra amplia (882 artículos) conformada por 39 revistas en Acceso Abierto recogidas en la WoS (versión 2011), en diversas áreas (Biología, Química,
Física e Informática). Los autores encuentran diferencias significativas
entre las citas recibidas en WoS y Scholar por área. Por ejemplo, tanto en
Física (WoS: 1.111; Scholar: 1.313) como especialmente en Informática
(WoS: 1.117; Scholar: 2.884), el número de citas recopiladas por Scholar es
claramente superior, mientras que en Biología en ligeramente inferior
(WoS: 1.288; Scholar: 1.113) y en Química claramente inferior (WoS: 668;
Scholar: 279).
Los autores atribuyen las posibles razones de este fenómeno a la tipología de fuentes de citas incluidas en Scholar y no incluidas en WoS. De
este modo, por un lado, la Física (repositorios) e Informática (congresos)
se ven favorecidas, mientras que la Biología y Química (citas fundamentalmente de revistas) se ven perjudicadas. No obstante, en el caso de la
Química, las razones debían buscarse entonces en la cobertura deficien-

Bloque A · Capítulo 3 · Las dos caras de Google Scholar (II)

te de ésta en Scholar, debido a la no inclusión de la American Chemical
Society, como se ha comentado previamente.
Este hecho se confirma nuevamente con el trabajo de Bornmann et
al (2009), quienes tras examinar un conjunto de 1.837 artículos (aceptados para su publicación en la prestigiosa revista Angewandte Chemie
International Edition, o bien rechazados, pero posteriormente publicados
en cualquier otro lugar) calibran la medida en la que el uso de Google
Scholar puede proporcionar citas válidas en el campo de la Química. Los
autores recuperan 44.502 citas a través de la WoS, 44.601 desde Scopus,
48.160 desde Chemical Abstracts, pero solamente 9.320 a través de Google Scholar, demostrando la deficiente cobertura de éste en el campo de
la Química en aquellos momentos.
Dada la dependencia de la disciplina bajo estudio, los autores comienzan paulatinamente a centrar sus estudios en las correlaciones
obtenidas más allá del número total de citas recibidas en cada base de
datos, gracias en parte a los resultados positivos de los primeros análisis
realizados. De ese modo, Pauly y Stergiou (2005), a partir de un estudio
a 99 artículos seleccionados de 11 disciplinas diferentes, obtienen una
buena correlación entre el número de citas en Google Scholar y WoS. De
forma similar, Belew (2005), a partir de un conjunto de 203 publicaciones, encuentra igualmente una alta correlación entre las citas proporcionadas por estas dos bases de datos.
La correlación de Scholar con Scopus es igualmente analizada por
Kousha, Thelwall y Rezaie (2011), quienes encuentran ligeras diferencias
por área de conocimiento. En el caso de Derecho, la correlación entre
Scopus y Google Scholar es de 0.7, mientras que sube hasta 0.9 en el caso
de la Sociología, mostrando su gran utilidad en disciplinas orientadas a
las Ciencias Sociales.
Este tipo de cálculos también se han aplicado a otros niveles de estudio. Por ejemplo, Vaughan y Shaw (2008) obtienen la correlación entre WoS y Scholar en función de la tipología documental, a partir de una
muestra de 1.483 publicaciones que representan la producción científica
de una Facultad de Biblioteconomía y Documentación, encontrando correlaciones altas en el caso de los libros (0.75), intermedias en el caso de
los capítulos de libro (0.59) y sorprendentemente bajas en el caso de las
actas de congresos (0.29).
Por otra parte, Bar-Ilan, Levene y Lin (2007) se proponen testar un
conjunto de medidas para comparar las diferentes bases de datos de
citas, tomando como muestra las citas a los artículos indizados por WoS

83

84

La revolución Google Scholar

por un listado de autores israelitas (un total de 44) altamente citados.
Los resultados obtenidos revelan altas similaridades entre Scopus y WoS,
mientras que la similaridad de Scholar con el resto es menor, indicando
de este modo que su cobertura es considerablemente diferente.
La circunstancia de que, a pesar de las diferencias notables en la cobertura, se obtengan (especialmente en algunas disciplinas) correlaciones elevadas entre el número de citas obtenido en Scholar y el resto de
bases de datos, ha llevado a algunos autores a explorar la relación entre
los contenidos albergados en Scholar (que reflejan en parte una presencia web) y otros indicadores bibliométricos de actividad.
Por ejemplo, Smith (2007) compara la tasa de citas de ocho universidades de Nueva Zelanda a través de Google Scholar con los resultados
del New Zealand’s Performance Based Research Funding (PBRF), un ejercicio de evaluación de la investigación. La alta correlación entre los resultados de producción del PBRF y el total de citas (0.94), así como del total
de hits recuperados (0.85) ponen en evidencia que el número de citas
medida a través de Google Scholar es una medida útil de los datos de
producción de una institución, a pesar de los problemas metodológicos
asociados al buscador.
Orduna-Malea, Serrano-Cobos y Lloret-Romero (2009) estudian
igualmente la validez de Google Scholar como servicio capaz de reflejar adecuadamente la producción científica de una universidad, en este
caso comparando la producción científica de las universidades públicas
españolas a través de Scopus con la cobertura de documentación científica que las sedes web de estas universidades tienen indizadas en Google
Scholar. Los resultados muestran, si se excluyen ciertos outliers (bases de
datos bibliográficas depositadas en los dominios web de algunas universidades como Dialnet y Compludoc), que la producción académica de las
univeridades a través de Scopus y la publicación web en Scholar están
muy correlacionadas, aunque constituyen conjuntos documentales de
diferente naturaleza.

En búsqueda de las citas únicas y del impacto total

Más allá del número total de citas obtenidas por cada base de datos,
de la correlación entre éstas o de la naturaleza de sus contenidos, en lo
que sí existe consenso es en que ninguna base de datos proporciona las
necesidades completas para un análisis de citas si lo que pretendemos
es conocer el impacto “total” de una publicación, revista o autor. Este es
el caso por ejemplo del conocido trabajo de Judith Bar-Ilan (2010), quien
realiza un análisis de citas completo al clásico libro “Introduction to in-

La autora descubre que.4% para Mostafa (5. Scopus: 98. Scopus y Scholar para dos profesores del área de Library and Information Science (Javed Mostafa y Thomas E. tal y como pretendía Bar-Ilan en su estudio. la combinación de WoS y Scholar incrementa el número de citas en un 25.más o menos . Scopus y Scholar observando 85 . concluyendo que el uso combinado de WoS. especialmente para Nisonger (WoS: 173. Los resultados muestran que WoS en la base de datos que más citas recupera para los dos profesores y Scholar la que menos.7% en el caso de Nisonger (13% de citas únicas procedentes de Scholar). Por ejemplo. las correlaciones nos dicen básicamente que los autores. Google Scholar: 83). Yang y Meho (2006) analizan las citas recogidas en WoS. Otra cosa bien distinta es la pretensión de recopilar el mayor número de citas reales existentes para valorar la influencia de una persona. Scopus y Scholar ayuda a revelar una imagen más precisa y exhaustiva del impacto de los autores. Lancet. sí localiza 109 citas no incluidas en éstas. de Leo Egghe y Ronald Rousseu. aunque Google Scholar es incapaz de localizar el 30% de las citas que sí cubren Scopus y WoS (unas 90). A pesar de ello.buenos o malos independientemente del metro (base de datos) que utilicemos para medir (lo que es válido hasta cierto punto según qué disciplinas). Nisonger) con perfiles ligeramente diferentes (Information Science y Library Science respectivamente). Por tanto.9% de citas únicas en Scholar) y un 19. Y esta circunstancia no sucede de forma exclusiva (aunque tal vez sí de forma más acusada) en las ciencias sociales. Dado que ninguna base de datos proporciona las necesidades para un análisis completo de citas (Bakkalbasi et al. la combinación de aquellas es necesaria. Levine-Clark y Gil (2008) llegan a una conclusión similar al estudiar las citas recibidas por un conjunto de revistas de Economía y Negocios. Meho y Yang (2007) amplían el estudio inicial a 15 autores. revistas o artículos buenos (o malos) siguen siendo . Efectivamente. publicación o idea en la sociedad en general y en la comunidad científica en particular. el valor añadido que puede suponer Google Scholar (especialmente en su capacidad para localizar nuevas citas) debe ser tenido en cuenta.Bloque A · Capítulo 3 · Las dos caras de Google Scholar (II) formetrics”. New England Journal of Medicine) entre 1999 y 2008 a través de WoS. Kulkarni et al (2009) comparan los perfiles de citación para 328 artículos publicados en revistas de medicina general (JAMA. Estos datos corresponden con las apreciaciones de Bauer y Bakkalbasi (2005) al tratarse de material antiguo y probablemente fuera de la Web académica. 2006). destacando el papel de Google Scholar al recopilar citas de actas de congresos y revistas en idiomas diferentes al inglés.

4% 37.40% (n=122) Arqueología Scopus – GS: 72. se ha procedido a calcularlos manualmente.35% 81.02% 81.3% 34.4% de todas las citas recuperadas por Scholar son únicas) y Física (47.73% (n=222) Ciencias políticas Scopus – GS: 73. Thelwall y Rezaie (2011) Derecho Scopus – GS: 83. Química.99% (n= 517) Comunicación Scopus – GS: 77.94% 86. Para ello toman una muestra de 882 artículos provenientes de 39 revistas de Acceso Abierto a fecha de 2001.6% (n= 27) Kousha.8% Scopus – GS: 55. Tabla 2. pero mucho menores en Química (21. definiendo “citas únicas en Google Scholar” como aquellas citas recuperadas por Scholar pero que no se encuentran en las bases de datos bibliométricas con las que se compara (esencialmente WoS y Scopus). Los resultados arrojan porcentajes de citas únicas en Google Scholar elevados para Informática (78.86 La revolución Google Scholar cómo las tres bases de datos producen. Ante esta situación.54% 80. Kousha y Thelwall (2008) analizan en profundidad este fenómeno.07% 82.1% (n=563) Zarifmahmoudi y Sadeghi (2012) Medicina nuclear Scopus – GS: 23. En aquellos casos en los que los datos porcentuales no se ofrecían en la fuente original.9% 11.18% (n= 333) Historia Scopus – GS: 76. Recopilación de trabajos relativos a citas únicas en Google Scholar AUTORES DISCIPLINA SOLAPAMIENTO CITAS ÚNICAS GS Bakkalbasi et al (2006) Oncología WoS – GS: 4% Scopus – GS: 5% 13% (n= 614) Materia condensada WoS – GS: 9% Scopus – GS: 3% 50% (n= 296) Mikki (2009) Ciencias de la Tierra WoS – GS: 26% 68% (n= sin datos) Jaćimović.93% (n= 511) Biología WoS – GS: 29.2% 54.8% 58% (n=167) García-Pérez (2010) Psicología WoS – GS: 41.7% (n= 380) Šember.33% 81. Petrović y Živković (2010) Odontología WoS – GS: 55. Utrobičić y Petrak (2010) Medicina WoS – GS: 44% Scopus – GS: 51% 22% (n= 86) Adriaanse y Rensleigh (2013) Ciencias ambientales WoS – GS: 15% Scopus – GS: 3.87% 90. tanto cuantitativa como cualitativamente.47% 66.4% 59.67% (n= 1044) WoS – GS: 43. Física e Informática).4%).9%). .89% (n=792) Filosofía Scopus – GS: 71. citas diferentes.80% (n= 318) Informática Física WoS – GS: 68.27% (n= 2737) Química WoS – GS: 53.08% (n= 222) Sociología Scopus – GS: 71.62% (n= 707) Kousha y Thelwall Elaboración propia. procedentes de diversas disciplinas (Biología.76% 81.

poniendo un especial énfasis en Google Scholar. Por un lado. la disciplina y el tamaño de la muestra afecta significativamente a los resultados obtenidos. el solapamiento entre bases de datos y el porcentaje de citas únicas. fuentes indizadas en WoS/Scopus vs fuentes no indizadas. es todavía una cuestión no resuelta si la inclusión de citas de documentos no revisados por pares mejoraría el valor de los resultados del conteo de citaciones o si. pues esta circunstancia puede ser útil para el seguimiento de citas en un amplio rango de documentos académicos y proporcionar de ese modo un tipo de impacto más amplio y completo (Kousha y Thelwall. la comunidad ha adoptado en este punto claramente dos posiciones bien diferenciadas. En cualquier caso. pues el año de realización del estudio. dentro de las académicas. Tipologías documentales citantes Más allá de calcular el número de citas y citas únicas que proporciona cada base de datos. así como el porcentaje de citas únicas que cada una de ellas proporciona. Con el propósito de ofrecer una panorámica general de las investigaciones realizadas se ha elaborado la Tabla 2. la aportación de Google Scholar a la recuperación de citas queda fuera de toda duda. destaca la corriente de autores que razona que la consideración de fuentes alternativas supone una ventaja de Google Scholar. en la que se muestra una recopilación de los principales trabajos empíricos relativos al cálculo de citas únicas en Google Scholar. especialmente en Ciencias Sociales y Huma- 87 . mostrando las disciplinas analizadas. la procedencia y tipología de estas citas introduce obviamente una nueva y necesaria discusión: ¿deberíamos valorar una cita procedente de un artículo publicado en una revista recogida en los Journal Citation Reports igual que una cita de una revista no indizada? ¿Y de un informe? ¿Y de un trabajo final de carrera? Tal y como Kousha y Thelwall (2008) indican. Y. Los datos mostrados en la Tabla 2 deben leerse de forma muy contextualizada. sobrevalorarían la investigación de menor calidad. que puede ser importante en muchos campos. Y en esta discusión aparecen claramente dos dimensiones complementarias: fuentes académicas vs fuentes no académicas. por el contrario. 2008).Bloque A · Capítulo 3 · Las dos caras de Google Scholar (II) Estos resultados llevan a la comunidad científica a desarrollar numerosos trabajos dedicados a conocer tanto el grado de solapamiento entre bases de datos bibliométricas. A pesar de la dificultad que supone medir el impacto intelectual que pueden aportar las citas en función de su procedencia. tal y como hacen Vaughan y Shaw (2008).

8%). otros trabajos como los de Mukherjee (2009). actas de congresos (33. informes técnicos (2. 2007). comentado previamente. páginas web. etc. entre las que se pueden encontrar desde fuentes más académicas (revistas. capítulos de libro. En el análisis de citas de 15 investigadores que estos autores realizan posteriormente (Meho y Yang.1%. Aunque las revistas constituyen la tipología más presente (25. capítulos de libros (8. En el análisis realizado por Bar-Ilan (2010) del libro “Introduction to informetrics”. Un porcentaje de citas realmente significativo (50.9%) o informes (9. sino que desciende a la identificación de citas únicas en Google Scholar. Entre las tipologías de fuentes de citas en Google Scholar sobresale una por derecho propio: las monografías.6% de informes técnicos y un 4. un 12. la alta diversidad de procedencia de las citas obtenida en Google Scholar se confirma: artículos de revista (40.35%). pues documentos enviados por estudiantes. entre otros. Independientemente de la calidad de las citas y su influencia en el retrato más o menos fidedigno del impacto científico. libros. tesis (13. que en el caso de Nisonger sólo representa el 17. 2008b). la autora identifica no sólo las citas por categoría documental. tesis…) hasta otras fuentes menos académicas (como currículums. Pese a existir proyectos .7%). el estudio de la variedad de tipologías documentales de las fuentes de citas en Google Scholar es actualmente un área de gran interés. otras tipologías como las actas de congresos (22.42%). 2007).7%). pueden influir y tergiversar los conteos de citas y por tanto el impacto científico real (Jacsó.75%).2%) proporcionan un porcentaje alto de citas únicas. los autores obtenían un 33. entradas de blogs o listas de discusión.5% de tesinas y tesis doctorales. webibliografías. capítulos de libros (3.6% de las citas procedentes de actas de congresos.62%) y libros (1. actas de congresos. lo que muestra la variación que puede existir entre carreras científicas diferentes incluso dentro de áreas disciplinares similares. En el caso concreto de Mostafa. Con posterioridad. tesis (4.32%). informes.86%). Este asunto ya fue abordado por Yang y Meho (2006) en su análisis de los profesores Mostafa y Nisonger.88 La revolución Google Scholar nas (Schroeder.).9%). tesinas de máster (4. 2008a. Los libros se encuentran totalmente excluidos de las grandes bases de datos bibliométricas (únicamente aparecen en las referencias citadas).66%). que han sido incluidos en Google Scholar por el mero hecho de estar online (independientemente de su valor académico). destaca la corriente que considera negativa esta circunstancia. Por otro lado. Van Aalst (2010) o Bergman (2012) discuten igualmente la amplia diversidad de fuentes de citas en Google Scholar.

su cobertura es todavía insuficiente y excesivamente sesgada hacia el idioma inglés como para poder ser usada con fines bibliométricos. Thelwall y Rezaie (2011) realizan un estudio más amplio con el fin de examinar las citas procedentes de Google Scholar y Google Books como fuentes alternativas de evidencia de impacto científico.aspx 89 .Bloque A · Capítulo 3 · Las dos caras de Google Scholar (II) en marcha. de gran importancia para la evaluación de autores en disciplinas de Ciencias Sociales y Humanas. Aunque en capítulos posteriores (dedicados a la cobertura de Google Scholar) se incidirá nuevamente en este hecho. Conviene diferenciar las citas a libros proporcionadas por Google Scholar de los datos de citas que pudiera proporcionar Google Books (Kousha y Thelwall. Posteriormente.com/products_tools/multidisciplinary/bookcitationindex 5 Galardón anual entregado por la Academy of Management al libro juzgado por haber realizado la contribución más destacada al avance global en la disciplina de la Gestión del conocimiento en los dos años precedentes. entre otros importantes problemas conceptuales como las citas de diferentes ediciones de un libro (Torres-Salinas et al. En los trabajos señalados al comienzo de esta sección ya se mostraba el importante porcentaje de citas (tanto totales como únicas) provenientes de libros en Google Scholar. 2015). como el Book Citation Index 4 (elaborado por Thomson Reuters en 2011). Este hecho. se debe dejar claro que las bases de datos de Google Scholar y Google Books son diferentes. en las que los libros y capítulos de libros constituyen vehículos esenciales de comunicación científica.000 monografías que habían sido remiti- 4 http://wokinfo. Una diferencia más que notable. mientras que en Google Scholar alcanza las 833 citas por libro. en su exploración de Google Scholar como una nueva fuente para el análisis de citaciones. Kousha. Para ello recogen 1. ha permitido abrir una línea de investigación centrada en el impacto de las monografías (tanto como fuentes citantes como documentos citados). No todos los libros académicos incluidos en Google Books se encuentran en Google Scholar debido a una serie de factores tanto técnicos como de cobertura y filtrado de documentos. 2014). Google Scholar se erige como la principal fuente actual de citas procedentes de monografías. Una muestra de ello es el trabajo llevado a cabo por Harzing y Van der Wal (2008) quienes. unido a la enorme base de datos del buscador. contabilizan las citas recibidas por los distintos ganadores del Terry Book Award (10 monografías) 5. En ese sentido.org/Meetings/awards/2015George-R--Terry-Book-Award. http://aom. El promedio de citas localizadas por libro en WoS es de 346.

Derecho.700). Este sistema fue sustituido por por el denominado REF (Research Excellence Framework). Filosofía. oculto o simplemente ignorado. HEFCW y DELNI). Estos resultados remueven absolutamente los cimientos de la evaluación tradicional del impacto científico basada en análisis de citas desde y hacia revistas de calidad (la elite) en Scopus y WoS. Historia y Estudios culturales y de medios).000 documentos más citados en Google Scholar durante el período 1950-2013. realizado aproximadamente cada cinco años. es la tipología documental con mayor promedio de citas por documento (2. Además. el 18% son monografías.uk . y para cada libro comparan las citas recibidas desde Google Scholar. y dentro del top 25. categorizando las monografías por disciplina (Arqueología.410 documentos (71%) en los que se puede identificar la tipología documental.ref. Un ejemplo ilustrativo lo conforma el estudio realizado por Etxebarria y Gomez-Aranga (2010). De los 45. dentro del top 1% de documentos más citados. se localizan hasta 14 monografías.ac. sin 6 RAE (Research Assessment Exercise): ejercicio de evaluación por las agencias financiadoras de la educación superior británicas (HEFCE. SHEFC. http://www. quienes comparan Scopus y Google Scholar a la hora de medir la producción en ciencias sociales en cuatro universidades españolas (Universidad Complutense de Madrid. Este hecho sugiere a los autores que Google Scholar puede ser una fuente de citas necesaria en aquellos casos donde las publicaciones en tipologías distintas a los artículos de revista son importantes. hasta ahora relativamente minusvalorado.700). Política y Estudios internacionales. que fue aplicado por primera vez en 2014 para evaluar el período 2008-2013. Los autores identifican que ciertos investigadores tienen un nivel internacional y son reconocidos independientemente de la base de datos utilizada.90 La revolución Google Scholar das al RAE (Research Assessment Exercise) 6 en 2008 por parte de los autores como evidencia de su producción científica. Universitat Autònoma de Barcelona y la Universidad del País Vasco). El hecho de que Google Scholar sea una importante fuente de citas a monografías ha permitido revelar por otra parte el gran impacto científico de éstas. El efecto de la consideración de las monografías en la evaluación de los autores es tan rotundo que su consideración ya resulta ineludible. La mayor sorpresa llega no obstante cuando los documentos se ordenan según su número total de citas. el 62% son libros. Google Books y Scopus. Los autores contabilizan que la mediana de citas a libros obtenida desde Google Books y Google Scholar era dos y tres veces respectivamente más elevada que la obtenida desde Scopus. Universitat de Barcelona. seguida de los artículos en revistas (con 1. con el fin de evaluar la calidad de la investigación llevada a cabo por las universidades británicas. Sociología. Martin-Martin et al (2014) analizan los 64.

Scopus) AUTORES UNIDAD DOCUMENTO GS WOS SCOPUS Winter & Zadpoor & Dodou (2014) N= 58 (multidisciplinar) Revistas 805 546 -- Conferencias 123 53 -- Libros/Capítulos de libro 63 7 -- Tesis 75 0 -- Informes 13 0 -- Artículos originales 39 30 40 Artículos de revisión Miri & Raoofi & Heidari (2012) Bergman (2012) Meho & Yang (2007) Jaćimović & Petrović & Živković (2010) N= 104 (Hepatología) N= Sin datos (Ciencias sociales) Artículos publicados por 5 revistas durante 2005 N= 1093 (Documentación) N= 158 28 25 25 Informes breves 9 8 10 Editorial 8 4 7 Informe de casos 3 3 3 Carta al editor - 1 1 1951 1735 1782 Artículo Libro 318 -- 1 Artículo en congreso 32 -- 25 Revisión 24 -- 248 Editorial 1 -- 28 Carta 1 -- 10 Artículo 2215 1529 1754 Artículo en congreso 1849 229 359 Revisión 86 172 147 Editorial 25 63 36 Reseña 3 17 0 Carta 2 9 2 Ítem bibliográfico 1 2 1 Artículo 117 50 56 Revisión 13 4 6 Editorial 3 1 3 Actas de congreso 3 2 3 Estas continuas evidencias de impacto global. economía. informática. En concreto. las disciplinas que más se benefician de Google Scholar en el estudio realizado son las ingenierías. y especialmente en tipologías documentales básicas para la comunicación de la ciencia en gran multitud de disciplinas científicas sociales y humanas. ha dado lugar al 91 . De ahí el enorme beneficio del uso de Google Scholar para la evaluación de estos investigadores. Tabla 3. Web of Science. matemáticas y humanidades. la mayoría de los autores prestigiosos en sus comunidades científicas locales ni siquiera aparecen en Scopus. Recopilación de trabajos relativos a comparación de citas recibidas por tipología de documento citante (Google Scholar.Bloque A · Capítulo 3 · Las dos caras de Google Scholar (II) embargo. gestión y administración de empresas.

todavía debe prestarse atención a la confiabilidad de los datos y a la necesidad de su filtrado.). entre algunos otros). 2015). universidades. así como estudios acerca de sus ventajas e inconvenientes (Costas y Bordons. citas únicas y citas procedentes de tipologías documentales alternativas. valores elevados para un artículo en bibliometría. 2009). necesarios para su utilización en distintos campos científicos. comparándolas posteriormente con Web of Science o Scopus. Bornmann et al (2015) han desarrollado recientemente procedimientos para comprobar el grado de normalización del impacto de citación en Google Scholar (tomados de los procedimientos de la bibliometría clásica) concluyendo que los datos de Google Scholar resultan adecuados para la normalización. En este sentido. entre las que destaca por derecho propio el g-index (Egghe. especialmente del h-index. 2014. así como de la aplicación de procesos de normalización. El h-index es un indicador compuesto ideado por el físico Jorge Hirsch (2005). Wilsdon et al. Sin embargo. 2012. el artículo en el que se propuso el indicador ha logrado las 1973 citas en la Web of Science Core Collection. mientras que alcanza las 5060 en Google Scholar. La insultante sencillez de su cálculo. la capacidad de generar comparaciones instantáneas. 2007. provocaron una amplia y rápida expansión 7 así como la aparición de numerosas variantes (Alonso et al. en el contexto de la evaluación. es evidente que 7 Actualmente (septiembre 2015). Elaboración de indicadores bibliométricos En los apartados precedentes se ha dejado constancia de la importancia de Google Scholar como fuente de citas. A modo de resumen. En este último apartado del capítulo se aborda la construcción de indicadores bibliométricos a partir de los datos extraídos de Google Scholar. Waltman y Van Eck. un autor tiene un índice “h” cuando “h” de sus artículos publicados tienen al menos “h” citas cada uno de ellos. etc.92 La revolución Google Scholar testeo de este buscador como posible fuente de citas en programas y ejercicios de evaluación estatales (Prins et al. en la Tabla 3 se muestran algunos de los principales trabajos que ofrecen datos de citas recibidas por tipología de documento en Google Scholar. esenciales en determinadas disciplinas científicas. 2006). Sin entrar en la discusión acerca de las características de este indicador o la mayor o menor necesidad de sus variantes (un tema que merecería por sí mismo una obra entera dedicada a ello). . su robustez frente a errores y su posterior aplicación a otras unidades de estudio (revistas. mediante el que se pretende conocer el impacto de un investigador a partir del número de publicaciones y el número de citas recibidas.

los investigadores que exhiben un mejor rendimiento académico en WoS. Las conclusiones apuntan a que Google Scholar proporciona resultados significativamente más altos que WoS. la autora declara que en la mayoría de los resultados obtenidos a través de Google Scholar son considerablemente diferentes a los obtenidos por WoS y Scopus. por lo que en realidad se precisa tanto de WoS. la comunidad científica precisamente ha construido un creciente corpus dedicado a la influencia de la base de datos en el cálculo del h-index. De forma paralela. Por su parte. Unas conclusiones similares obtienen Amara y Landry (2012). a partir de las citas obtenidas en WoS. 93 . también tienen los mejores valores en Google Scholar. Scopus y Google Scholar. trabajos posteriores obtienen resultados bien diferentes. las posiciones de los autores más y menos importantes. así como a determinar las posibles diferencias en los rankings de autores proporcionados. Por ejemplo. indizados o no en una determinada base de datos). Los primeros trabajos al respecto no son muy positivos respecto al papel de Google Scholar en este asunto. mostrando resultados tan solventes. pues una sola base de datos no puede ser confiable para proporcionar una evaluación exclusiva del impacto de un investigador. Sin embargo. El objetivo detrás de estos trabajos es determinar si una sola base de datos sería suficiente para conocer. Aparte de constatar las diferencias entre las distintas disciplinas. Scopus y WoS para calcular el h-index más fidedigno posible. Aunque los valores absolutos son superiores en Google Scholar. concluyen que Google Scholar es capaz de identificar las principales revistas de la disciplina. independientemente de que el h-index no fuera el completo de los autores (el formado por todos los trabajos publicados por un autor. con un cierto margen de error tolerable. pero los rankings (tanto de autores como de revistas) no varían significativamente o sólo de manera moderada cuando se ordenan por el h-index. Bar-Ilan (2007) compara los h-index de una lista de autores altamente citados de Israel.Bloque A · Capítulo 3 · Las dos caras de Google Scholar (II) cada base de datos bibliométrica proporciona citas duplicadas y únicas. fiables y válidos como aquellos generados por Web of Science o Scopus. Delgado-López-Cózar y Repiso-Caballero (2014). Sin embargo. Franceschet (2009) analiza tanto autores como publicaciones en el área de Informática a través de WoS y Google Scholar. las comparaciones del valor del h-index deben realizarse obligatoriamente en el marco de una base de datos específica para que tengan sentido. quienes comparan por su parte la producción de investigadores en Escuelas de negocio canadienses según WoS y Google Scholar. Por ejemplo. tras analizar el h-index de 277 revistas de comunicación a través de Google Scholar Metrics.

Este asunto será tratado nuevamente en el Bloque B.97). Rosenstreich y Wooliscroft (2009) destacan que. aunque la correlación entre los distintos rankings es elevada. en concreto al Journal Scholar Metrics. Sin embargo.79 con Scopus). r= 0. Una experiencia interesante la constituye el trabajo de Couto et al (2009).93) como con Scopus (r= 0. quienes desarrollan un servicio web denominado CIDS (Citation Impact Discerning Self-Citations) para analizar la influencia de las autocitas en el análisis de impacto de un equipo de investigación en Informática (formado por 72 personas y un corpus de 229 artículos). obteniendo diferentes h-index en función de la base de datos. Los autores demuestran que el h-index a nivel individual incrementa en un 24% de media al contar las autocitas. se observa un gran parecido entre los rankings proporcionados por las tres bases de datos (r= 0. Lamentablemente. en el que precisamente se trabaja con la computación de autocitas.895 con WoS. las pobres prestaciones de búsqueda que ofrece Google Scholar (que serán detalladas en el apartado dedicado a sus ventajas e inconvenientes) impiden que el trabajo de recopilación y análisis sea rápido y amigable.94 La revolución Google Scholar Del mismo modo. las autocitas no se pueden eliminar automáticamente en Google Scholar. Cabezas-Clavijo y Delgado López-Cózar (2013) comparan el h-index obtenido por las revistas más relevantes en el área de Medicina intensiva en WoS. Zarifmahmoudi y Sadeghi (2012b) comparan igualmente el h-index de los investigadores en este caso en el área de Medicina nuclear en Irán. y que puede ser controlado tanto en WoS como en Scopus (donde existe la posibilidad de excluir las autocitas en el cálculo de ciertos indicadores como el h-index). y pese a proporcionar valores de h-index más elevados (47% superior a Scopus. 40% superior a WoS). no existen variaciones importantes en las clasificaciones generadas a partir de cada fuente de datos. éste exige un proceso de filtrado y depuración importante de datos Otro importante problema que afecta al cálculo del h-index en Google Scholar son las autocitas. Por otro lado. aunque los valores medios del h-index en Google Scholar son prácticamente un 15% y 30% más elevados a los obtenidos en Scopus y WoS respectivamente. a pesar de que Google Scholar proporciona una mayor cobertura y citas que Scopus y WoS. Los resultados indican que. obteniendo correlaciones significativas de Scholar tanto con WoS (r= 0. dedicado a los productos derivados de Google Scholar. Cambiando de disciplina. . en este caso en revistas. Scopus y Google Scholar. un parámetro al que el h-index es sensible.

but it would be irresponsible” 8- 9. los estudios más recientes ofrecen mejores resultados. Medicina y Física).667) como en Scimago Journal Rank (edición 2011. quien expresa que aunque las tres bases de datos (WoS. la autora constata (tras un seguimiento mensual durante 2012) que la base de datos presenta menos diferencias entre disciplinas y que la tasa de crecimiento se ha estabilizado (estabilizándose así mismo el crecimiento del h-index en el tiempo). n= 19. Jacsó es implacable: “I could list here the h-index of F.567). Los resul 8 Cfr.708) y Google Scholar Metrics (edición 2007-2011. Scopus y Google Scholar) muestran limitaciones. n= 5. 2008a). lo que puede convertir a Google Scholar en una herramienta mucho más adecuada para la evaluación del impacto de la investigación. mostrando información acerca de publicaciones no cubiertas por éstas a la hora de computar el h-index automático que generan (Jacsó. quienes comparan los hindex de 3. corporativos como a nivel de revista. Scopus y WoS.423 revistas recogidas tanto en Journal Citation Reports (edición 2011.W Lancaster.W. A pesar de esta última declaración. Podría listar aquí el h-index de F. n= 10.W. Lancaster según Google Scholar. quien tras realizar un análisis longitudinal (entre abril 2011 y enero 2012) a 20 investigadores galardonados con el premio Nobel (en las disciplinas de la Química. tal y como denuncia Jacsó (2012c). Jacsó analiza su impacto académico a través de Google Scholar. tanto individuales. En el posterior estudio realizado por Anne-Wil Harzing (2014) a partir de la misma muestra de 20 autores. destaca que el h-index promedio para los novelistas en Medicina y Física es bastante similar tanto en Google Scholar como en WoS. En cualquier caso. las deficiencias de Google Scholar son particularmente voluminosas de tal forma que sus estimaciones de hits no pueden ser aceptadas ni siquiera como punto de partida para la evaluación del rendimiento académico.Bloque A · Capítulo 3 · Las dos caras de Google Scholar (II) Pero no sólo la poca amigabilidad del sistema o la imposibilidad de eliminar las autocitas afectan al cómputo del h-index desde Google Scholar. con el fin de estudiar la forma más real y justa de calcular su h-index. mientras que en Economía son claramente superiores en Google Scholar. 95 . pero eso podría ser irresponsable. Estos datos se confirman con el estudio empírico llevado a cabo por Delgado López-Cózar y Cabezas-Clavijo (2013). aunque ciertamente pueden ayudar a revelar ciertas limitaciones de WoS y Scopus. Lancaster as reported by Google Scholar. En el caso de la Química los datos son superiores en WoS. confiables ni reproducibles) distorsionan los indicadores de métricas. Los metadatos creados por Google Scholar (que no son estándar. Economía. Cabe destacar el trabajo de Harzing (2013a). 9 Para celebrar el 75 aniversario de F.

la Tabla 4 constituye sólo un ejemplo con una muestra muy reducida de autores en una disciplina muy concreta (y considerando únicamente a los más productivos). aunque superior en valor en Google Scholar. Por supuesto. hemos recopilado el número total de citas y h-index en Google Scholar (a través de los perfiles creados en Google Scholar Citations). los datos más importantes son que la correlación entre el h-index obtenido en Scopus y el obtenido en Google Scholar es elevado (r= 0.96 La revolución Google Scholar tados obtenidos indican que las tres fuentes posicionan de manera muy similar las revistas (salvo algunas excepciones como PNAS o PLoS One). con excepciones en algunos autores específicos cuyo rendimiento en Google Scholar puede ser mucho mayor debido a la idiosincrasia de su disciplina (o mucho menor si su producción científica no está en el espacio público online). las correlaciones entre los distintos indicadores son por lo general altas y significativas (α=0. Para ellos hemos utilizado la base de datos Scopus (simplemente por ser más automática la identificación controlada de autores por disciplina dentro de una determinada institución). En concreto. para estos mismos autores. hemos procedido a identificar los autores más prolíficos en el área de Informática (una de las disciplinas más favorecidas con el uso de Google Scholar) para una determinada universidad (en este caso la Universitat Politècnica de València).81). correlaciona significativamente con el resto de bases de datos. Los resultados para los autores con al menos 100 publicaciones en el área “Computer Science” afiliados a la Universitat Politècnica de València se muestran en la Tabla 4 (superior). el hindex. Como se puede observar en la Tabla 4 (inferior). a pesar de la falta de estandarización en GSM y de las diferencias en las ventanas de citación entre fuentes. Con el propósito de mostrar un ejemplo sencillo a la par de útil que ilustre las diferencias entre el h-index computado entre diferentes bases de datos. Posteriormente. excepto para el número de publicaciones en Scopus. el h-index proporcionado por Google Scholar Metrics (GSM) obtiene una correlación significativa con el h-index de Scimago Journal Rank (0. Sin embargo. Tras ello hemos recopilado tanto el número de publicaciones como el total de citas recibidas y el h-index a fecha de septiembre de 2015.82). que no alcanza correlaciones importantes salvo con el número de citas obtenidas en Google Scholar.05).88) y con el Factor de Impacto de Journal Citation Reports (0. Estos datos refuerzan las ideas mostradas previamente. por lo que sus resultados no deben generalizarse. .

58 *0.050 (two-tailed test) 1 97 . 2015).62 *0.39 0.20 *0.91 * Nivel de significancia alpha=0. Flich 100 649 14 2112 26 Citas GS h-index GS Artículos Scopus Citas Scopus h-index Scopus Artículos 1 Citas Scopus 0. Calafate 119 752 13 2134 23 M. Rosso 167 629 13 3976 34 J. Julián 135 739 9 1613 22 C. Pastor 184 970 15 5164 32 P.80 1 Citas GS 0. Alcañiz 114 2212 24 -- -- E. Duato 249 1611 25 11567 48 O. Cano 143 739 14 2988 24 V. Autor Scopus GSC Publicaciones Citas h-index Citas h-index J. Botti 148 1031 16 3227 30 P.Bloque A · Capítulo 3 · Las dos caras de Google Scholar (II) Tabla 4. Manzoni 148 1031 15 3503 27 J.82 *0.51 *0. Lloret 153 739 12 2234 22 V. Autores más prolíficos en la Universitat Politècnica de València (UPV) en área de Computer Science (Scopus.C.78 1 h-index GS 0. Vidal 110 1942 24 7166 44 J.T.12 1 h-index Scopus 0.

.

Capítulo 4 Capturando la Web académica: Funcionamiento general En un reciente informe acerca del futuro de las herramientas de descubrimiento. en el peor de los casos. Sin duda. Este capítulo está dedicado pues a detallar. con el propósito de aportar un granito de ayuda a aquellas personas que se dedican a la creación y difusión de contenidos académicos en la Web. Algunos de estos robots o crawlers están preparados para detectar recursos académicos disponibles en la Web pública e incluirlos posteriormente en el índice de Google Scholar. diferentes de aquellos utilizados para la búsqueda general de Google. de forma algo más técnica. 2015). Documento académico y Web académica El funcionamiento de Google Scholar es similar al de Google. existen . Google maneja una red masiva de aplicaciones de robots automatizados que recorren la Web en busca de contenido. la más absoluta invisibilidad en el buscador. el funcionamiento y los requisitos de indización de Google Scholar. el desconocimiento acerca de los pilares fundamentales en los que se sustenta el funcionamiento de Google Scholar puede provocar en el mejor de los casos una pérdida de visibilidad e impacto de muchos contenidos y. aspecto crucial si recordamos el papel que juega Google Scholar en la búsqueda de información académica hoy día. entre las áreas potenciales de acción para la NISO (National Information Standards Organization). Aunque Google Scholar tiene su propio conjunto de robots. aunque presenta unas diferencias importantes especialmente en la indización de los contenidos. Marshall Breeding (2015) destaca. la creación de un grupo de trabajo que podría explorar prácticas recomendadas en relación a la presentación de contenido en la Web que maximizaran la exposición e indización de éstos en Google Scholar. Los robots de indización asociados a Google Scholar recogen de manera sistemática los metadatos y el texto completo para todos los contenidos que el sistema considera como “académicos” (Breeding.

no existe ninguna norma obligatoria para determinar el tipo. salvo dos importantes excepciones (patentes y disposiciones legales) que se detallarán más adelante. aunque el funcionamiento exacto del sistema no sea conocido con exactitud. La cuestión ahora radica en conocer qué entiende exactamente Google Scholar por documento académico y por Web académica.100 La revolución Google Scholar evidentes sinergias entre ellos. con independencia de la es- . Pese a ello. siendo un aspecto delimitado generalmente por las normas específicas de una publicación. Simplificando. y cómo realiza a grandes rasgos este proceso. en la que se basa gran parte de este capítulo. Figura 9. El sistema se basa fundamentalmente en la estructura del documento y en la posterior identificación de cada una de sus partes constituyentes. nomenclatura y orden exacto de los elementos constitutivos de un documento científico (más allá del sentido común). existen ciertos elementos que deben aparecer en cualquier texto que se considere académico. Indización de contenidos en Google Scholar La metodología que Google Scholar ha utilizado para determinar qué es un documento académico es bastante más pedestre y pragmática de la que nos podríamos imaginar a priori. Google Scholar solamente indiza “documentos académicos” alojados en la “Web académica” (Figura 9). basado en el siguiente orden de elementos: Introducción. Google Scholar proporciona en su ayuda cierta información orientativa. Metodología. Resultados y Discusión). Aunque existen diversos métodos más o menos implantados para estructurar un documento científico (como por ejemplo el formato IMRYD para el caso de los trabajos de investigación.

y que la estructura puede variar en función de la tipolo- 101 . Un documento sin resumen no será indizado en Google Scholar. Como en algunas publicaciones el resumen va incrustado en la primera página del documento. —— Que posea unos autores (deben mostrarse justo debajo del título en una línea separada). Siguiendo este principio. —— Que tenga resumen. ya comentado en el capítulo 1) es una práctica válida.Bloque A · Capítulo 4 · Capturando la Web académica tructura organizativa utilizada. unos autores o una bibliografía. —— Que contenga una sección independiente titulada como Bibliografía. o similar. Estructura de un documento científico en Google Scholar De todos estos puntos. el resumen es completamente obligatorio (tal y como ya se ha comentado previamente). entre otros. Google Scholar considera los siguientes aspectos (Figura 10): —— Que el documento esté encabezado por un título (a ser posible en una fuente mayor que el resto del documento). Aunque ciertamente no existen normas universales para estructurar un documento. referencias. Figura 10. como son un título. liberar esta primera página (tal y como hace JSTOR.

Servicios de distribución o almacenaje. la existencia de estos elementos (título. autor. Este parámetro no es exhaustivo. Una vez determinado qué es un documento académico para Google Scholar. Repositorios temáticos. se debe indicar la existencia de acuerdos comerciales no públicos entre Google Scholar y ciertas editoriales privadas. En estos casos. 1 Los datos se han obtenido mediante la aplicación del comando de búsqueda “site”. nos sirven para reflejar la amplitud y diversidad del espacio académico web. algunas instituciones. Entre éstas destacan las siguientes entidades: —— —— —— —— —— —— —— Universidades e instituciones de educación superior. el buscador incorpora a su base de datos los contenidos correspondientes. Editoriales comerciales. no se prestan de forma adecuada a este análisis (basado en calcular la cantidad de documentos alojandos en su dominio web). Por otra parte. Adicionalmente. y además está sujeto a procesos de redondeo de datos en la estimación de resultados que proporciona el buscador. asunto que trataremos en la sección dedicada al proceso de indización y a los requisitos técnicos específicos que deben cumplirse. Aunque estos datos no deben ser tomados al pie de la letra (no son más que estimaciones) 1. Bases de datos bibliográficas. Otros motores de búsqueda académicos. En cualquier caso. a modo de ejemplo. resumen y referencias bibliográficas) es común en la inmensa mayoría de documentos académicos. aunque no esté exento de errores y causísticas. el segundo requisito para la incorporación de un documento a la base de datos es que este recurso esté alojado en la llamada “Web académica”. dada la estructura de sus sedes web. de la que Google Scholar se nutre y alimenta.102 La revolución Google Scholar gía documental. las disciplinas o las normas concretas de una editorial. nada impide que otro tipo de institución (pública o privada). En este punto. Google simplemente confía en los espacios públicos web proporcionados por diferentes entidades y organizaciones con cierto marchamo científico o académico. Organismos públicos de investigación. por supuesto. En la Tabla 5 se puede observar. . siendo por ello un método sencillo de implementar y con ciertas garantías de éxito a la hora de determinar si un documento es o no científico. pueda estar indizada correctamente en Google Scholar. la cantidad de documentos recopilados por Google Scholar de algunas de las entidades más representativas.

260.900 Universidad de Granada ugr. o bien OJS en el caso de publicaciones periódicas).jp 13. especialmente si el proceso se ha realizado en alguna plataforma diseñada con algún tipo de software especial (por ejemplo Dspace o EPrints en el caso de los repositorios.600 Stanford University stanford.es 2.100.300 Arxiv arxiv.nih.gov 3.000 Dialnet dialnet.000 Emerald emeraldinsight.000 Max Planck Gesellschaft mpg.000 Social Science Research Network ssm.com 5. el sistema automáticamente indizará el nuevo registro en la base de datos. procederemos a continuación a detallar el proceso de indización que sigue Google Scholar desde el principio paso a paso (centrándonos exclusivamente en los contenidos incorporados automáticamente por un crawler.com 8.987.nlm. como Google Scholar.edu 660.000 Bases de datos Pubmed ncbi. dado que esto no siempre sucede así (por diversos motivos que iremos relatando a lo largo de este capítulo).000 Servicios de distribución Ingenta Connect ingentaconnect.440.org 3.rclis. y no los incorporados directamente debido a cualquier tipo de acuerdo) de forma que sirva igualmente para ilustrar de forma más didáctica su funcionamiento a los lectores menos familiarizados con esta base de datos.edu 39.Bloque A · Capítulo 4 · Capturando la Web académica Tabla 5. 103 .es 31.psu.700 Elsevier sciencedirect.670. Sin embargo.ist.400 Consejo Superior de Investigaciones Científicas (CSIC) csic.edu 86.org 11.com 485.700 National Institute of Informatics nii.com 343.000 Wiley onlinelibrary.unirioja. que disponen de módulos especialmente diseñados para describir los documentos (insertar metadatos) y que sean recolectados por los robots de los motores de búsqueda.000 Organismos de investigación Repositorios temáticos Plataformas de editoriales comerciales Motores de búsqueda académicos Proceso y requisitos de indización En el momento en que un usuario deposita un documento en un espacio considerado por Google Scholar como académico.000 ELIS eprints.wiley.430.de 85.000 CiteseerX citeseerx. Tipos de entidades en el espacio académico web TIPO DE ENTIDAD ENTIDAD URL REGISTROS Universidades MIT harvard.es 71.ac.com 229.

aunque en algunos casos particulares (como por ejemplo las páginas personales de los académicos alojadas fuera del espacio web de la universidad). esta información puede ser vital para lograr una correcta indización en la base de datos. Para ello. por ejemplo. Interfaz de solicitud de inclusión en Google Scholar Fuente: Google Paso 2: requisitos básicos Una vez el usuario ha seguido los pasos de la solicitud de inclusión comentados previamente.google. 2 https://support. el sistema accederá al URL correspondiente para verificar una serie de parámetros y requisitos técnicos que deben cumplir las sedes web para que sus contenidos sean admitidos.104 La revolución Google Scholar Estas fases de indización están fundamentalmente orientadas a los webmasters o personas encargadas de la puesta a punto de las sedes web que deben albergar los documentos académicos que Google Scholar indizará en su base de datos y no al usuario final (que se limitará a depositar un documento en una plataforma siguiendo unos sencillos pasos).com/scholar/troubleshooter/2898950?rd=1 . una revista u otro tipo de sede web (Figura 11). Paso 1: inclusión en la Web académica El primer paso que debe realizarse es la solicitud de inclusión en Google Scholar. el buscador dispone de una interfaz desde la que el webmaster debe indicar qué tipo de sitio web desea dar de alta en el sistema 2. Figura 11. si es un repositorio.

Por último. entre las que destacan las siguientes: —— Tipos de ficheros admitidos: HTML. pese a que no existe restricción técnica alguna para su correcta indización. PS (GZ).765 documentos a texto completo analizados por Jamali y Nabavi (2015). —— Tamaño: ficheros que no superen los 5 MB. Volvemos a incidir en que el resumen es un elemento completamente obligatorio. los documentos sin información de autores o sin título pueden igualmente ser excluidos automáticamente. el sistema introduce una serie de limitaciones técnicas que deben conocerse de forma obligatoria. pues estos formatos suelen transformarse en PDF antes de ser depositados en la Web. al menos uno de los siguientes recursos: texto completo o resumen. Paso 3: Formatos de fichero Aparte de la identificación de un contenido como un recurso académico gracias a su estructura. Entre los 64. reflejando de este modo las dos realidades (online y offline) que predominan actualmente.3% en HTML. Los documentos ofimáticos (principalmente DOC. PPT. PDF. Estos datos reflejan por sí mismos la importancia de estos ficheros en la base de datos. Respecto al primer punto. el 86% lo constituían documentos en formato PDF y el 12% en HTML. puede servir de sustituto la primera página del artículo o documento. aunque el formato PDF ya puede ser legible directamente desde un navegador web. se deben tener en cuenta adicionalmente dos puntos importantes para asegurar una correcta indización: 105 . los tipos de ficheros más recomendados son HTML y PDF. En el caso de los ficheros PDF. Un documento sin resumen no será incluido en Google Scholar. están claramente en desuso dentro de Google Scholar. Esta decisión permite que los contenidos de pago (no sólo artículos de revistas sino monografías) puedan ser indizados si éstos ofrecen al menos el resumen del documento. el 69. sin necesidad de que el texto completo esté accesible. éste debe ofrecer de forma gratuita y fácil de consultar (cuando un usuario hace clic en un resultado de búsqueda en Google Scholar). DOCX. PPTX). De los 4. PDF (GZ).Bloque A · Capítulo 4 · Capturando la Web académica Para que el sitio web sea correctamente admitido.000 documentos altamente citados en Google Scholar analizados por MartinMartin et al (2014). de donde Google Scholar los identifica e indiza. En su defecto.2% se encontraban en PDF y el 30.

se indica claramente que Google Scholar incluye automáticamente los trabajos académicos desde Google Books 4. Una posible forma de eludir parcialmente este problema es crear una página web de inicio en la que se ofrezcan todos los metadatos del documento (sin olvidar el resumen) y un enlace al texto completo. los documentos deberán ser transformados obligatoriamente a través de un programa de reconocimiento óptico de caracteres OCR (Optical Character Recognition) antes de ser depositados en la Web.com/intl/en/scholar/inclusion. De esta forma. cuya presencia es común en los repositorios institucionales de una universidad (pensemos por ejemplo en un trabajo final de grado de un estudiante de Arquitectura. El troceado de un documento en diversos ficheros más ligeros es igualmente posible. Es decir. aunque es una opción que no recomienda Google Scholar.com/books/uploads 4 Google Scholar automatically includes scholarly works from Google Book Search. En la ayuda de Google Scholar se indica claramente que los libros.html#content . con la gran cantidad de planos y pliegos de condiciones de un proyecto arquitectónico. monografías y trabajos que superen el tamaño máximo podrán ser depositados en Google Books directamente por parte de los autores 3. Esto afecta especialmente a diversas tipologías documentales académicas. monografías y trabajos finales de carrera. En el caso de ficheros PDF que son el resultado de un proceso de digitalización. Igualmente. —— El nombre del fichero PDF que contenga el documento a texto completo debe terminar en “. ni de extraer por tanto citas. como son las tesis doctorales. como veremos más adelante. En otros casos se aconseja reducir el tamaño de los ficheros PDF antes de ser depositados en la Web. Respecto a la segunda restricción. En algunos sistemas de repositorios la especificación del tipo de fichero se omite. por ejemplo).pdf”.106 La revolución Google Scholar —— El fichero debe ser legible por texto. el sistema limita el tamaño máximo de los ficheros. no debe estar en formato imagen. siempre y cuando no se incumpla ninguno de los requisitos técnicos impuestos. Es importante tener en cuenta que Google Scholar es incapaz de detectar los caracteres incrustados en un fichero tipo imagen. https:// scholar. Es importante por tanto tener en cuenta este punto para cumplir con esta especificación. tesinas y otros documentos de trabajo. Google Scholar sí podría indizar el documento a partir de los metadatos ofreciendo adicionalmente el enlace al texto completo.google.google. 3 https://play. Todo fichero que supere los 5 MB no será indizado en Google Scholar.

es/ 107 .Bloque A · Capítulo 4 · Capturando la Web académica En la figura 12 se muestra un ejemplo de la indización en Google Scholar en función del peso. Para ello hemos recogido dos tesis doctorales del repositorio institucional de la Universidad de Granada (Digibug) 5.39 MB y en el segundo de 1. Finalmente hemos procedido a buscar estos dos documentos en Google Scholar. Figura 12.ugr. En el primer caso el fichero tiene un peso de 7. Indización para ficheros de más de 5MB de tamaño 5 http://digibug.1MB.

Entendemos que la norma no supone un umbral fijo y exacto o que no funciona al 100% de su efectividad. y tras múltiples búsquedas realizadas. como los carritos de compra.108 La revolución Google Scholar El primer fichero (Figura 12. Para asegurarse de que el crawler de Google Scholar no está bloqueado. En cambio. apareciendo bajo la etiqueta de “Citation”. el sitio web no será indizado.robotstxt. ofreciendo acceso al texto completo de la tesis en la parte derecha de la pantalla. abajo). los autores hemos constatado que en ocasiones existen documentos PDF que superan las restricciones de tamaño y. Pero el texto completo no se encuentra directamente accesible desde Google Scholar. arriba) no se encuentra indizado en Google Scholar de forma completa.org . han sido indizados en Google Scholar. inservibles para la localización de registros. Paso 4: requisitos técnicos (I): aceptar la visita Aunque pueda parecer obvio. A pesar de esta restricción. es fundamental verificar que el sitio web permite la entrada del robot de búsqueda de Google Scholar porque si está excluido (en ocasiones los webmasters excluyen la entrada de ciertos robots porque pueden ralentizar el sitio web o ser potencialmente dañinos). se aconseja introducir el siguiente código en el fichero “robots. se aconseja tener en cuenta el límite de 5MB impuesto por Google Scholar. etcétera: 6 http://www. y para evitar posibles problemas en la indización de ciertas tipologías documentales. a pesar de ello. que ofrece un acceso a la URI del documento (donde se encuentran los metadatos y desde allí el acceso al texto completo proporcionados por el repositorio). siguiendo los consejos del Robot Exclusion Protocol 6: User-agent: Googlebot Allow: / De forma contraria. formularios. En cualquier caso. el segundo fichero sí se encuentra integrado de forma completa (Figura 12. se debe bloquear a los robots para que no accedan a páginas dinámicamente generadas.txt” del sitio web.

como se ha comentado anteriormente. esto facilita igualmente el trabajo de sus robots y sus procesos automáticos de indización de documentos. Entre las restricciones anteriores cabe destacar la primera. Paso 5: requisitos técnicos (II): usabilidad El objetivo fundamental de Google Scholar es facilitar al usuario la localización rápida y sencilla de los documentos académicos. Por ello todos sus esfuerzos van encaminados a que los ficheros sean localizados en el menor número de clics. Aceptar disclaimers. cursos OCW. Para cumplir con este objetivo. no sólo evitamos que el robot pueda acceder a zonas restringidas. Esto es especialmente importante en las sedes web de las universidades. tras realizar una consulta determinada en el cajetín de búsqueda de Google Scholar y haber obtenido un conjunto de resultados. Instalar software especial. Google Scholar no lo indiza. pulsar botones o desplazarse por la página (scroll). Por supuesto. Clicar en enlaces. Si el usuario no puede acceder a un contenido. sino que Google Scholar no pierda tiempo en rastrear lugares donde no va a localizar información académica. pueda acceder directamente al texto completo o al resumen. Rechazar ventanas emergentes o anuncios intersticiales. el sistema impone una serie de restricciones técnicas a los sitios web. al clicar en alguno de éstos. En concreto. 109 . en las que una gran parte de los contenidos están accesibles únicamente a los alumnos o profesores una vez se han identificado con sus cuentas de usuario en la intranet (material docente.Bloque A · Capítulo 4 · Capturando la Web académica User-agent: * Disallow: /add_cart. El fin es que un usuario. antes de leer el resumen (o texto completo). respecto a los sitios en los que se requiere una contraseña para acceder a los contenidos. y que pueden ralentizar y complicar su trabajo de indización del sitio web. una página web debe evitar requerir a los usuarios (o robots de búsqueda). las siguientes acciones: —— —— —— —— —— Identificarse como usuarios registrados.php De esta forma.

Por tanto: Evitemos los ficheros con más de una obra intelectual: Un fichero PDF puede contener en realidad una amplia cantidad de obras intelectuales independientes. Veamos un ejemplo para ilustrar este enorme problema. En ocasiones. La obra completa quedará bien registrada. Toda documentación en una intranet será opaca a Google Scholar. Pensemos por ejemplo en las monografías por capítulos o en las actas de congresos.110 La revolución Google Scholar etc. Esta obra está compuesta por 37 capítulos completamente independientes (Figura 13. que podemos localizar en el sitio web del servicio de publicaciones de la Universidad de Murcia (Editum) 7. que simplemente quedan relacionadas al estar compiladas en un mismo volumen. superior). coordinado por Rosa Nortes Martínez Artero y José Ignacio Alonso Roque. donde cada capítulo o artículo constituyen obras completamente independientes (en contenido y autoría). Paso 6: requisitos técnicos (III): identificación de ficheros La identificación y localización de los ficheros es igualmente clave para el correcto funcionamiento de Google Scholar. Es decir. pero no así cada uno de los capítulos o partes. constituye un buen ejemplo de libro por capítulos como tipología documental. el almacenamiento de documentación académica en intranets o zonas restringidas puede obedecer a políticas web específicas dentro de una institución u organización para asegurar la confidencialidad de cierta información. proteger ciertos derechos de propiedad intelectual o proporcionar ventajas competitivas sólo a sus usuarios. la indización se realizará de forma incorrecta. 7 http://libros.um. Si ese PDF (constituido por una multitud de trabajos académicos individuales) es depositado directamente en un repositorio u otra plataforma para hacerlo accesible a Google Scholar. que lo identifique unívocamente en la Web. pues no se cumplirá la regla de una obra igual a un URL. obedece al mero desconocimiento o desinterés. Si buscamos la obra colectiva “Investigación educativa en educación primaria”. que podrían de hecho estar recibiendo citas de forma independiente. La regla a seguir es clara: cada registro debe corresponder con un documento académico y debe disponer de su propio URL.es/editum/catalog/book/1151 .). en otros muchos casos.

“HIDEA: cuestionario de aproximación diagnóstica contextualizado del trastorno por déficit de atención e hiperactividad (TDAH)”. En el caso de ejemplo anterior. “Relaciones entre autoestima. El resto de capítulos se localizan porque Google Scholar detecta que aparecen en el sumario de la obra colectiva. solamente existe un URL vinculado al registro 9. y en algunos casos por existir diversas versiones 8. “Efecto de una unidad didáctica de resistencia aeróbica basada en juegos sobre la capacidad cardio-respiratoria de escolares de 5º curso de primaria”. “¿Qué programas de televisión ven los alumnos de educación primaria? preferencias según su nacionalidad”. “Estudio sobre el consumo televisivo de los escolares de educación primaria de la región de murcia”. 9 http://libros. Google Scholar sólo ha sido capaz de describir de forma independiente 9.um.es/editum/catalog/download/1151/1821/1421-1 111 . inferior). la podemos localizar sin problemas (Figura 13. “El cuento. medio). “La participación de las familias en contextos educativos multiculturales: hacia una escuela intercultural e inclusiva”. De los 37 capítulos. no podremos identificarlos (Figura 13. aptitudes intelectuales y rendimiento académico: un estudio en alumnos de educación primaria”. Aunque a nivel técnico es una solución completamente válida. privando a sus respectivos autores no sólo de la publicación sino de las posibles citas recibidas. 8 En concreto los siguientes capítulos: “Comparación de la intensidad del esfuerzo de actividades cardio-respiratorias en función de la estructura de la sesión en escolares de primaria”. una ventana hacia el aprendizaje”. de forma que cada nuevo fichero tenga un URL propio que lo defina e identifique en la Red.Bloque A · Capítulo 4 · Capturando la Web académica Si buscamos esta obra en Google Scholar. En estos casos. pero no los cataloga como registros independientes. Google Scholar ha obviado completamente la información de la estructura de esta monografía. “Libros interactivos multimedia (LIM) al servicio de la competencia comunicativa oral y escrita en educación primaria”. si buscamos cada capítulo de libro de forma independiente. En definitiva. En cambio. a nivel de posicionamiento en buscadores no es la más adecuada. se aconseja crear un fichero independiente para cada obra intelectual existente y posteriormente depositar cada uno de ellos por separado. que además no coincide a nivel jerárquico con el URL que contiene la información bibliográfica (el registro de la obra completa está alojado en la carpeta “downloads” mientras que la información bibliográfica está en la carpeta “books”).

capítulo de libro no localizado en Google Scholar (inferior) Este problema de indización tiene una solución sencilla conceptualmente. supone adecuar una sede web a los requisitos particulares impuestos por una determinada base de datos privada. obra localizada en Google Scholar (medio). Además. que retomaremos en el capítulo final. Evitemos dividir una obra en distintos ficheros: El caso contrario ocurre cuando un fichero que contiene una única obra intelectual se desea particionar o dividir en diversos ficheros para facilitar su carga/descarga o el acceso a cierto material complementario . pues implica tener que adecuar toda una colección de monografías y sus respectivos capítulos (pensemos en grandes servicios editoriales con cientos de libros y miles de capítulos de libro. Tratamiento de obras colectivas a Google Scholar: obra localizada en servicio editorial (superior). o en grandes colecciones de actas de congresos). lo que implica una discusión no menos intensa.112 La revolución Google Scholar Figura 13. aunque costosa económicamente.

asegurando que al menos sólo existe un URI único. Por tanto. La exclusión del texto completo de un documento puede tener un 10 A continuación. que podría depositarse o bien en Google Books (para intentar asegurar su indización completa en Google Scholar) o en cualquier repositorio (si el fichero superara los 5MB no se indizaría a texto completo). a través de los metadatos asociados al registro.Bloque A · Capítulo 4 · Capturando la Web académica de forma independiente. de forma que Google Scholar indizara al menos correctamente la obra completa y. pues solamente ofrece enlace a un fichero. es importante seguirlas y cumplirlas en la medida de lo posible. se aconsejaría la creación de un fichero adicional que incluyera la información clave (título. En el primer caso. Ambas opciones deberían evitarse en la medida de lo posible.net/10481/35673 http://hdl. dada su extensión. y no uno por registro 11. informar a Google Scholar del URL con el documento a texto completo.ugr. se muestran dos URLs que pertenecen a dos tomos de una misma tesis doctoral: http://hdl. En la segunda opción. Google Scholar no sabría cuál de los ficheros PDF debería mostrar como acceso a texto completo. al menos el título del documento debería tener un elemento diferenciador (tomo 1. se hubiera publicado en varios tomos y. En el caso de que finalmente se mantuvieran varios ficheros para una misma obra. autores. etc. y siguiendo con la norma de “una obra un URL”. se consideraría una mala práctica la fragmentación del contenido pues cada fichero dispondría de un URL independiente y Google Scholar podría no comprender que se tratan de diferentes partes de una misma obra. al exportarse a un fichero electrónico.es/handle/10481/6142 113 . parte 1. En estos casos.net/10481/35674 11 A continuación. se muestra un URI al que se asocian 5 ficheros de una misma tesis doctoral: http://digibug. dadas las restricciones técnicas de Google Scholar a este respecto. una opción sería la de generar distintos registros separados (cada uno con un fichero) 10 o bien la de reunir en un mismo registro todos los ficheros.) y posteriormente el autor podría al menos fusionar ambos registros en su perfil académico personal en Google Scholar Citations (como se verá en el bloque B).handle.handle. Este podría ser el caso de una tesis doctoral que. En el caso de que fuera imposible obtener un único fichero PDF que incluyera todo el contenido y cuyo peso fuera inferior a los 5MB. se hubieran generado los correspondientes ficheros (un PDF por tomo). resumen y bibliografía).

Además de las limitaciones técnicas.es/bitstream/10481/14556/1/2460_1. Es más. Veamos como ejemplo un registro correspondiente a una tesis doctoral depositada en el repositorio Digibug. si procede. solamente encontraremos el documento si buscamos por las palabras del título. Además. símbolos y códigos alfanuméricos. y no siempre los usuarios son conscientes de ello. por lo que su personalización puede ser compleja y 12 El URL a cada fichero es el siguiente: http://digibug. Google Scholar podrá bucear dentro del texto para localizar en él la aparición de los términos de búsqueda y devolver.pdf Obviamente.ugr.es/bitstream/10481/14556/2/2460_2. los resultados en posicionamiento académico web podrían ser abismales: http://digibug. ante cualquier búsqueda que se realice. con los útiles a la par de semánticos nombres de 2460_1. Entre los URL existentes y otro posible URL amigable (como el propuesto a continuación). la disposición del texto completo permitirá la extracción de las posibles citas contenidas en el documento.ugr. En ese sentido se desea remarcar nuevamente que una cosa es que Google Scholar identifique y describa un documento (apareciendo por tanto en los resultados de búsqueda como un registro) y otra muy distinta que ofrezca un enlace directo al texto completo. compuesto por dos ficheros PDF 12. resumen y palabras clave (en definitiva. en ocasiones los usuarios ni siquiera son conscientes de que el texto completo no está indizado.es/tesis/VeraCasares_acciones-caracter-formativo-tercera-edad.pdf .pdf y 2460_2. el documento en cuestión entre los resultados. autor.pdf http://digibug. específicamente remarcadas en la ayuda de Google Scholar. El nombre de los ficheros debe contener información semántica (especialmente información del autor y título) y el URL final debe evitar diacríticos.pdf.ugr. pequeños detalles pueden impedir no sólo el buen posicionamiento de un documento en un motor de búsqueda académico (será más difícil de localizar) sino que puede impedir además su indización en el sistema (que puede influir claramente en el impacto en citas).ugr. pues éstos impiden un correcto posicionamiento de los contenidos.es/bitstream/10481/14556/1/2460_1. por los campos del fichero descriptivo o metadatos). En caso contrario. algo imposible si no es capaz de leer el documento a texto completo. las plataformas utilizadas (como los repositorios) automatizan estas tareas.114 La revolución Google Scholar efecto negativo en su visibilidad.pdf http://digibug. Si el documento está correctamente indizado.

Las recomendaciones anteriores van encaminadas a la disposición de un URL por fichero (a poder ser HTML o PDF). inferior a 5MB y que corresponda con una obra académica independiente. Esquema de enlaces posibles hacia el fichero final Desde la página de inicio de un sitio web podemos encontrarnos directamente un fichero (a texto completo o resumen. Este proceso podría 115 . podríamos encontrarnos de nuevo o con un fichero (texto completo o resumen) o bien con otro hiperenlace. siguiendo un máximo de 10 enlaces. Si pulsamos en el hiperenlace (contamos 1 enlace) accederíamos a una segunda página. debería poder llegar al texto completo (o resumen) de una obra en menos de 10 clics. Es decir. al llegar a la página principal de un sitio web. un usuario. se recomienda que cada artículo sea accesible desde la página de inicio. Adicionalmente. En ésta. Google Scholar propone algunas recomendaciones para acceder de forma sencilla a estos ficheros al navegar por el sitio web académico correspondiente. En concreto. Figura 14. en ambos casos con sus metadatos correspondientes) o bien un hiperenlace. En la figura 14 se ejemplifica gráficamente el proceso. pero deberían estar siempre contemplados en los momentos iniciales de diseño.Bloque A · Capítulo 4 · Capturando la Web académica tediosa en ocasiones.

se recomienda crear una interfaz de búsqueda adicional que liste los artículos incluidos sólo en las dos últimas semanas (para indizar rápidamente las novedades). para facilitar la tarea al robot de búsqueda. En el caso de sitios web complejos con cantidades grandes de documentos (editoriales. Figura 15. se proporcionan una serie de recomendaciones a la hora de crear los metadatos asociados a cada registro. desde la página de resultados del buscador. “citation_author” y “citation_publication_date”. debería accederse directamente al recurso final con el texto completo. Un número superior de pasos supondría una complejidad excesiva para el robot de búsqueda a la hora de indizar los contenidos académicos del sitio web. En la figura 15 se observa un ejemplo de metadatos asociados a un documento. —— Si se manejan cientos de miles de documentos. Es importante indicar que las etiquetas “citation_title”. —— Si se manejan miles de documentos.000 documentos. se recomienda proporcionar una forma de ordenar los registros por fecha de publicación o fecha de registro. nombre del autor . Ejemplo de esquema de metadatos recomendado La exportación de datos bibliográficos debe configurarse preferentemente mediante meta-etiquetas HTML. Paso 7: requisitos de indización: metadatos y maquetación Por último. Por otra parte. con el fin de obtener una descripción bibliográfica de los mismos. se proponen las siguientes recomendaciones: —— Hasta 1. se recomienda crear un fichero HTML con un enlace al URL de cada documento. correspondientes al título del documento.). repositorios. etc.116 La revolución Google Scholar repetirse hasta un máximo de 10 veces.

en el caso de que no esté incluido en el documento actual. utilizar la etiqueta “DC. páginas. Por otra parte. BE Press y PRISM. La razón por la que probablemente Google Scholar ha adoptado esta decisión es sencilla. entre otras). La importancia de este último punto es máxima. se indican las siguientes consideraciones generales: —— Google Scholar soporta los esquemas Highwire Press. si lo que deseamos es estar correctamente indizados en su base de datos.Bloque A · Capítulo 4 · Capturando la Web académica y fecha de publicación. Dublin Core no proporciona etiquetas unívocas para los datos bibliográficos de un artículo académico publicado en una revista (volumen. número. cuyas principales características se describen a continuación: Título: —— Usar el tamaño de fuente más grande del documento.title” únicamente y exclusivamente para el título del artículo. son obligatorios para la correcta indización. Dublin Core es un esquema de metadatos sencillo que no incluye un campo de información específico para el número de citas recibidas por los documentos. Por tanto. para los ficheros PDF se propone como alternativa una indización sin meta-etiquetas. —— Usar Dublin Core como última opción. Por defecto. Este hecho ha sido empíricamente estudiado por Arlitsch y O’Brian (2012) para diversos repositorios institucionales norteamericanos y posteriormente por Orduña-Malea y Delgado López-Cózar (2015) para el conjunto de repositorios latinoamericanos. cuando Google Scholar claramente nos indica que no debería utilizarse. a menos que se sigan ciertos patrones de uso recomendados por el equipo de Google Scholar (por ejemplo. ¿qué utilidad proporciona Dublin Core a Google Scholar? La respuesta es ninguna. título de la revista…). La pérdida de visibilidad que este hecho puede suponer a los repositorios es importante si no se corrije. Mediante la etiqueta “citation_pdf_url” se puede redirigir al robot de búsqueda al URL que contenga el texto completo. 117 . —— Emplear etiquetas <h1> ó <h2>. mediante la clase “citation_title”. siendo éste uno de los indicadores clave para el posicionamiento de los resultados de búsqueda. Adicionalmente. los repositorios como DSpace funcionan con Dublin Core. —— Usar CSS. Estas directrices están principalmente orientadas a los ficheros HTML. Eprints.

Información bibliográfica: —— A incluir en la cabecera o pie de página de la primera página. —— Usar CSS. mediante la clase “citation_author”. “bibliography”. .118 La revolución Google Scholar Autores: —— Deben situarse inmediatamente antes o después del título. como “references”. Fuentes: —— Evitar fuentes Type 3 en los PDF. —— Las referencias individuales pueden ser numeradas: En PDF: [1]. —— Usar etiquetas <h3>. Referencias bibliográficas: —— Utilizar una cabecera estándar. [2]… En HTML: incluir la etiqueta <ol>.

Cobertura opaca y dinámica Durante el primer lustro del Siglo XXI se sucedieron diversos estudios en los que se deseaba conocer la tasa de indización de Google Scholar para determinadas editoriales y fuentes de contenidos con el firme propósito de testar profesionalmente el producto. tal vez de menor importancia para la mayoría de usuarios finales (y por tanto de menor importancia para los responsables de Google Scholar). tamaño y evolución La cantidad y calidad de los contenidos alojados en Google Scholar sigue siendo motivo de agrias y en ocasiones estériles discusiones. sino de comparar el material existente en una editorial y los registros que Google Scholar era capaz de recopilar ante una consulta delimitada a dicha editorial. No se trataba de comparar los resultados devueltos por distintos buscadores y bases de datos (aspecto ya tratado en el capítulo 2). A lo largo de este capítulo se describen los principales trabajos aportados por la literatura científica en torno a la cobertura de Google Scholar. El hecho de co-existir ciertas limitaciones técnicas y acuerdos comerciales ha provocado que algunos contenidos académicos en abierto puedan no estar incluidos en el buscador y sí lo estén en cambio algunos contenidos de pago. . de forma que ayuden a retratar mejor al buscador académico. editoriales o al menos fuentes de contenidos ha avivado sin duda este debate. tanto bibliotecarios (más centrados en la faceta de buscador de contenidos) como especialistas en bibliometría (más enfocados a la faceta de fuente de evidencia de impacto científico). El desconocimiento de la cobertura real y la política opaca de la compañía californiana han desencadenado una multitud de elucubraciones acerca del verdadero tamaño de la base de datos. La ausencia de una master-list de publicaciones.Capítulo 5 El retrato de Google Scholar Cobertura. así como a su tamaño y evolución. pero de gran importancia para los profesionales de la información.

chino. Aunque la última actualización data del 22 de octubre de 2005 y el sistema ya no funciona correctamente. mientras que Kesen. que Jacsó (2005a) comprobara que a mediados de abril de 2005 existía un retraso de 6 meses en la actualización de la base de datos de Google Scholar. permitía comparar los contenidos alojados en una editorial (y recuperados por su propio buscador) con los resultados que Google Scholar tenía indizados de ese lugar. japonés o arábigo. Igualmente se descubrieron ciertas inconsistencias en los resultados devueltos en determinados idiomas. constataran que el material más reciente estaba mejor recogido en Google Scholar que el material antiguo. Interfaz de Polysearch El buscador. Figura 16. por ejemplo.120 La revolución Google Scholar Debemos destacar muy especialmente el sistema Polysearch. que Neuhaus et al (2006) detectaran un retraso de al menos 3 meses en la actualización de la información de BioMed Central o que Bauer y Bakkalbasi (2005). la interfaz sigue online (Figura 16). desarrollado por Peter Jacsó precisamente con el propósito de conocer la cobertura de Google Scholar para determinadas editoriales. El sistema permitía a grandes rasgos comparar los resultados de una búsqueda directa en el buscador online de una editorial con los resultados de esa misma búsqueda realizada en Google Scholar y restringiendo la búsqueda al dominio web de la editorial. lo que permitía obtener un nuevo retrato de Google Scholar. Noruzzi (2005) observa que Google Scholar no indizaba artículos en persa. . Şenol y Yanar (2008) detectaban errores en la recuperación de caracteres especiales en turco. Los trabajos comparativos entre la cobertura de Google Scholar y las distintas editoriales permitieron. aunque de forma un tanto pedestre. tras realizar un análisis de citas a la prestigiosa revista Journal of the American Society for Information Science and Technology (JASIST). Este método permitía conocer el grado de indización de algunas editoriales.

Google Scholar proporcionaba una cobertura del 88% a las revistas del Social Science Citation Index. tras tomar muestras aleatorias en 8 bases de datos distintas. Mayr y Walter (2006. Este dinamismo y crecimiento irregular de Google Scholar ha propiciado por tanto que muchos estudios acerca de su cobertura hayan 121 . En concreto. quienes observan un crecimiento de la cobertura de Compendex en Google Scholar (a partir de una muestra de registros) a lo largo del tiempo. por lo que los sesgos o deficiencias advertidos durante los primeros años han ido desaparenciendo en su mayor parte. mientras que el porcentaje promedio ronda el 95% para el resto de las revistas. Así mismo. Por ejemplo. desde un 33% en los 1950s hasta un 88% en los 2000s. aunque con importantes diferencias entre éstas. y en la cobertura de revistas de sociología en alemán. la cobertura real podría ser dramáticamente menor. Bakkalbasi et al (2006) detectan que tras noviembre de 2005 la cobertura de Google Scholar da un salto espectacular. Teniendo en cuenta que los autores consideraban indizada una revista si al menos un artículo estaba indizado en Google Scholar. Los resultados obtenidos muestran que la indización completa al 100% solamente es lograda por 8 revistas. Estos datos son contrastados posteriormente por Chen (2010) quien. detectan carencias importantes en revistas de acceso abierto. comprueba que Google Scholar solo indiza el 66% de éstos y Lewandowski (2010) comprueba por su parte la indización en Google Scholar de 35 revistas del área de Library & Information Sciences en el período 2004-2006. pues la cobertura de Google Scholar ha demostrado ser muy dinámica. Christianson (2007). cuando precisamente años atrás se había discutido la deficiente cobertura de ésta en Google Scholar.Bloque A · Capítulo 5 · El retrato de Google Scholar Otros trabajos han detectado deficiencias en la cobertura y actualización de Google Scholar. quienes calculan la cobertura de Google Scholar en función de diversas editoriales. advierte que la cobertura de Google Scholar oscilaba entre el 30% y el 88% en 2005. 2007) constatan la ausencia de revistas importantes sí indizadas en WoS. un 86% a las del Science Citation Index y sólo de un 81% a las revistas incluidas en el Arts & Humanities Citation Index. y en el trabajo de Neuhaus et al (2006). Los efectos de la evolución de la cobertura de Google Scholar se observan igualmente en el trabajo realizado por Meier y Conkling (2008). tras seleccionar 960 artículos de Ecología en la base Compendex. Por otra parte. pero que asciendía al 98% en 2010. Los datos son sorprendentes pues reflejan un 100% de cobertura en el caso de Pubmed. Todos estos estudios empíricos deben no obstante contextualizarse en el tiempo.

Sin embargo. tras ello vino un proceso de rápido crecimiento (Harzing. Pomerantz.122 La revolución Google Scholar quedado completamente obsoletos. estas presuntas debilidades se han transformando en fortalezas diez años después. sino para la evaluación de su impacto global en la sociedad. Neuhaus et al (2006) obtienen coberturas muy bajas (44% en el caso de ERIC y un 6% en el caso de Historical Abstracts). en ese caso WoS se convertiría en un subconjunto de Google Scholar. pues la cobertura en estos campos (así como en la literatura no inglesa) es muy pobre. Efectivamente. Cobertura adicional: disposiciones legales y patentes Aparte de la colección de artículos (que incluye todas las tipologías documentales consideradas como documentos académicos. En el caso de las humanidades. Estos resultados llevan a los autores a concluir que Google Scholar presenta importantes sesgos por disciplinas y que no es todavía una herramienta válida para la búsqueda de información académica en las Humanidades. independientemente de su valor académico. 2014). desde artículos en revistas a monografías). 1989. Zadpoor y Dodou. va logrando más acuerdos comerciales con diferentes grupos editoriales y se van digitalizando colecciones antiguas de revistas en papel) ha llevado a algunos autores a criticar que la cantidad va en contra de la calidad de sus contenidos. El crecimiento continuo en la cobertura de Google Scholar (conforme va recopilando más fuentes académicas en abierto. 2014). En ese momento. en algún momento la cobertura de WoS en Google Scholar podría ser completa. en sus primeros años la disciplina de la Química estuvo mal representada (como vimos. 2013a) y después cierta estabilización (Harzing. mientras que los defensores de Google Scholar argumentan que éste podría cubrir en breve la tesis de Kilmour del 100% de disponibilidad de la información (Kilmour. que . Los defensores de WoS argumentan que esta base de datos actúa como filtro de alto nivel frente al ruido (Winter. Google Scholar incluye dos colecciones de documentos adicionalmente (disposiciones legales y patentes). Educación. por cuestiones de política de publicaciones de algunas de sus principales editoriales). Por ejemplo. Negocio y Ciencias Sociales. al incorporar todo el material que localiza. Google Scholar podría convertirse irremediablemente en la fuente principal no sólo de acceso a la literatura científica. 2006). con el añadido de disponer de acceso a textos completos aparte de sus capacidades de búsqueda y localización de información (superiores a WoS al buscar en el texto completo de los documentos) e información adicional de citas y otros servicios complementarios.

de apelación. En la figura 17 se muestra un ejemplo de búsqueda de disposiciones legales que hagan referencia a los litigios entre dos compañías (Samsung y Apple). los tribunales federales de Distrito. La búsqueda se puede hacer global o bien se puede seleccionar la Corte de Estado o Federal correspondiente.com/scholar?q=samsung+vs+apple> 123 . Estos materiales están depositados como colecciones independientes con el fin de proporcionar un valor añadido a los usuarios. a través de un breve comunicado en el Blog oficial de Google Scholar. lo que permite buscar casos influyentes (por lo general antiguos o internacionales) que aún no están en línea o disponibles públicamente.Bloque A · Capítulo 5 · El retrato de Google Scholar no cumplen ni los requisitos de documento académico (a partir de su estructura) ni de estar depositados en la Web académica.google. Para realizar una búsqueda se debe seleccionar la opción “Case law” previamente (solamente aparece si el idioma de la interfaz está en inglés). fiscales y de quiebras desde 1923 y los casos de la Corte Suprema de Estados Unidos desde 1791. Búsqueda de disposiciones legales en Google Scholar <https://scholar. incluye citas de casos citados por opiniones o artículos de revistas indizadas. y por tanto no siguen los requisitos de indización del resto de materiales académicos. Figura 17. Las disposiciones legales fueron incluidas en 2009. desde la búsqueda avanzada. éstas incluyen el acceso a las opiniones publicadas de apelación del Estado y de la Corte Suprema de los casos de Estados Unidos desde 1950. Además.

Esto es importante. Estos documentos provienen de la base de datos de Google Patents. y la razón por la que están incluidos en Google Scholar es un tanto incierta. —— No se permite la búsqueda por materia.). En cuanto a los documentos de patentes. pues las colecciones de artículos y de disposiciones legales son independientes y se encuentran separadas. la posibilidad de recopilar este tipo de material cuando se realiza una búsqueda es interesante para el usuario. etc. en la parte izquierda de la pantalla disponemos de la opción “Case law” (disposiciones legales en la versión española) activada. Ortega (2014) advierte en cualquier caso que en la colección de disposiciones legales también se incluyen artículos de revista especializados en Derecho. así como el . —— La cobertura excluye estatutos y regulaciones. Finalmente. la posibilidad de exportar los resultados. —— Las actualizaciones (tanto de los artículos como de las disposiciones legales) pueden tardar entre 6-9 meses en aparecer. Obviamente. Es posible que aparezcan aquellos documentos de patentes que hayan sido citados o referenciados en otros documentos académicos indizados por Google Scholar. Ortega (2014) cifra en torno al 12. mediante la opción “Select courts” se pueden seleccionar las Cortes judiciales o tribunales específicos en los que se desea buscar. Pese a que la disposición de este tipo de material es interesante y supone un gran avance hacia el acceso abierto a la documentación legal (además de ofrecer información de valor añadido como las citas recibidas.124 La revolución Google Scholar Como se puede observar en la figura 17. —— Etc. Estos aspectos limitan el uso de esta herramienta como una fuente decisiva en asuntos legales. pero no en el entorno legal. aunque sí de gran utilidad. el sistema presenta una serie de importantes limitaciones: —— Está restringido a los Estados Unidos. que pueden estar igualmente incluidos en la colección de artículos. El resto de opciones son idénticas a las que se ofrecen para la búsqueda de artículos (filtrado por años y ordenación de resultados por año o relevancia. En el mundo académico puede ser tolerable esperar esta cantidad de tiempo para una actualización. aunque esto es una suposición que debería comprobarse empíricamente.8% la cantidad de patentes en Google Scholar respecto de las existentes en Google Patents. éstos se encuentran integrados dentro de la colección de artículos de forma que no se puede restringir la consulta específica a estos materiales (solamente incluirlos o excluirlos en la búsqueda).

Figura 18. 2014).Bloque A · Capítulo 5 · El retrato de Google Scholar hecho de ofrecer datos de citas (no incluidos en Google Patents). Cuando Anurag Acharya es consultado acerca de esta cuestión. su postura es clara: esta discusión no es útil. el desconocimiento de sus criterios de inclusión en la colección impide la realización de búsquedas exhaustivas. Incluso utiliza la expresión “bike-shedding” (Van Noorden.google. En la figura 18 se muestra un ejemplo de consulta en Google Scholar en la que aparecen documentos de patentes integrados entre los resultados. más si consideramos la escasa información oficial que se nos ofrece acerca del producto. expresa sus dudas 125 .com/scholar?q=RFID+tag+switched+capacitor> Tamaño y evolución El cálculo del tamaño de Google Scholar (en términos de número de registros) es un tema igualmente candente en la comunidad académica. Así mismo. Sin embargo. Inclusión de patentes en Google Scholar <https://scholar. que deberían realizarse en bases de datos de patentes especializadas.

más allá de la cobertura o tamaño total de la base de datos. Bensman. diversos autores han tratado de cuantificar el tamaño de Google Scholar. 2006). Un ejemplo pionero lo constituye Jacsó (2005a). y ganadores de la medalla Fields en Matemáticas. En esos mismos términos se expresan otros autores como SJ Bensman. Algunos años después. Scopus y Google Scholar en número de registros desde 1955 a 2005. creemos sinceramente que es una aproximación incompleta. Khabsa y Giles (2014) cifran el tamaño en 99. Posteriormente. a lo largo de los últimos años. pero constituye un dato esencial si se desea utilizar Google Scholar como objeto de estudio. quien incide en la importancia del corpus de documentos disponibles para una consulta específica.126 La revolución Google Scholar acerca de la importancia en conocer este tamaño pues. están incorporados en el corpus de conocimiento de sus disciplinas a partir de Google Scholar. aunque el autor advierte de los problemas de búsqueda asociados al filtrado de años. incluso si se conociera. Aguillo (2012) estima el tamaño de Google Scholar en 83 millones de registros (a fecha de 2010) utilizando un método basado en el análisis de nombres de dominio (Top Level Domains). Los bibliotecarios deben conocer las características y la composición del producto tanto para evaluar el producto como para sus procesos de formación de usuarios. no vería la forma en la que este dato podría ayudar a los usuarios acerca de cuándo o cómo utilizar Google Scholar (Hughes. quien ofrece datos anuales comparativos entre WoS. Aunque no podemos dejar de estar de acuerdo con esta postura (centrada en la relevancia del sistema ante las consultas de los usuarios). Smolinsky y Sage (2014) utilizan el modelo Yule-Simon para estimar hasta qué medida el trabajo de los premios Nobel en Química. Estamos de acuerdo que a un porcentaje importante de usuarios finales los datos de tamaño no van a interesarles o influirles. que impiden un cálculo preciso del número de registros. Los profesionales de la información tienen la obligación de caracterizar y describir exhaustivamente un producto de información como es un motor de búsqueda académico. Bajo esta idea.3 millones . Siguiendo con esta línea de trabajos. Los bibliómetras deben conocer por su parte el tamaño y la evolución de la base de datos para poder dar contexto a sus análisis cuantitativos y conocer la mayor o menor representatividad de la base de datos en función de diversos parámetros. Bensman et al (2014) analizan la capacidad de Google Scholar para construir un conjunto documental relevante para la evaluación de los trabajos científicos de un conjunto de autores galardonados con el Premio Nobel de Economía. Por ello.

18.3 de citaciones y cerca de un millón de patentes. como por ejemplo la cantidad de artículos sin año de publi- 127 . de los que 99. y sólo considerando los documentos en inglés) mientras que Ortega (2014) obtiene 109. aproximadamente).Bloque A · Capítulo 5 · El retrato de Google Scholar (a fecha de 2013.73 corresponden a la colección de artículos y el resto a la colección de disposiciones legales. estiman el tamaño entre 160 y 165 millones de documentos (a fecha de mayo de 2014).3 millones (a fecha de diciembre de 2013). Figura 19. Scopus y Microsoft Academic Search en número de registros Fuente: Orduna-Malea et al (2015) Estos datos deben no obstante tomarse con extrema cautela. Comparación del tamaño de Google Scholar. donde se destaca la igualdad entre WoS y Scopus. En cuanto al crecimiento. la clara superioridad de Google Scholar y la menor cobertura de Microsoft Academic Search. la figura 20 muestra el número de registros anuales en las cuatro bases de datos analizadas en el período 1800-2010. Finalmente.5 millones de artículos. En la figura 19 se ofrece la comparativa obtenida por Orduna-Malea et al (2015) entre las principales bases de datos. utilizando diversos métodos. Web of Science. y sólo a nivel orientativo. Orduna-Malea et al (2015). de los que 94.8 millones corresponden a la colección de artículos (compuesta por 80. El cálculo del número de registros contenidos en Google Scholar por año no es preciso debido a una serie de conocidos problemas.

2014). Figura 20. Google Scholar y el big data académico Con los datos de cobertura. que implican una falta de correspondencia entre los hits obtenidos (un valor además redondeado) y los documentos almacenados. Adicionalmente. existe un importante problema de falta de replicabilidad. estamos ante la mayor base de datos académica que existe en la actualidad. pues en Google Scholar se han contabilizado los registros tipo “citations” (estos registros serán explicados en el capítulo siguiente). Web of Science. sin duda. Estas características unidas a la filosofía del producto de recopilar automáticamente la Web académica (y una parte importan- . la comparación con la Web of Science tiene ciertos sesgos. dada la imposibilidad de cuantificarlos con precisión. mientras que en Web of Science no se han contabilizado los registros equivalentes (denominados “cited references”). Estos estudios no pueden ser replicados debido al alto crecimiento retroactivo de Google Scholar (Winter. crecimiento y tamaño vistos en los apartados anteriores.128 La revolución Google Scholar cación o las versiones de documentos no agrupadas correctamente. podemos concluir que. Zadpoor y Dodou. un producto que incluye todas las tipologías documentales en la mayoría de idiomas y con una tasa de crecimiento superior tanto a Web of Science Core Collection como a Scopus. Scopus y Microsoft Academic Search en número de registros Fuente: Orduna-Malea et al (2015) Por otra parte. Comparación del crecimiento anual de Google Scholar.

Figura 21. Sin embargo. Características de Google Scholar La cobertura y el funcionamiento de Google Scholar ha permitido la creación de una familia de productos (junto a Google Scholar Citations y Google Scholar Metrics. pese a tener una cobertura notable. nos llevan irremediablemente a considerar Google Scholar como un sistema de big data académico (Figura 21). y cuyas principales características se pueden observar mejor de forma gráfica en la Figura 22. no dejan representar la punta del iceberg del impacto científico.Bloque A · Capítulo 5 · El retrato de Google Scholar te de la privada con las editoriales). indiza y vacía cualquier documento de apariencia científica depositado en un dominio académico por voluntad de un autor. que serán comentados en el Bloque B del libro) completamente opuesta a la familia clásica de bases de datos bibliométricas. derivada de la conocida Ley de Bradford de concentración de la literatura científica. viene en realidad determinada por una serie de restricciones (tecnológicas y económicas fundamentalmente). y sin sufrir ningún control externo previo (el de los repositorios es sólo un filtro técnico que no opera sobre los contenidos). Las bases de datos clásicas. Esta asunción. Desde el momento en que Google Scholar automáticamente rastrea. el sistema nos conduce a la voladura de todos los controles o filtros científicos a los que estaban sometidos 129 . constituyen sistemas cerrados basados en la selección controlada de una colección de revistas a partir de la cual se construyen índices de citas desde artículos de revistas de elite hacia otros artículos de revistas de elite.

que refleja estrictamente al mundo científico (en realidad a una parte concreta de éste). Figura 22. Los índices de citas Google Scholar se construyen desde cualquier recurso académico hacia cualquier recurso académico. este concepto no debe llevar a engaño. la elite también está incluida en Google Scholar.130 La revolución Google Scholar tradicionalmente los investigadores. sus trabajos y las publicaciones en las que éstos comunicaban sus resultados de investigación (peer review). dando así luz donde antes no había más que sombra (especialmente en las Ciencias Sociales y Humanidades). que representa una apertura desde el estricto mundo científico al más amplio concepto de mundo académico. Google Scholar frente a las bases de datos bibliométricas clásicas Esta selección de revistas elitistas. ofreciendo un producto gratuito basado en la recolección de cualquier tipo de material sin más moderación que la de haber sido depositado en la Web académica y cumplir ciertos requisitos formales. permitiendo ver la parte oculta del iceberg de la citación. se rompe con la aparición de Google Scholar. aunque se necesite un filtrado (no siem- . Sin embargo.

Figura 23. En el trabajo realizado por Martin-Martin et al (2014). errores absolutos importantes en investigadores con muchas citas.Bloque A · Capítulo 5 · El retrato de Google Scholar pre amigable). Dejamos en el aire si importa la normalidad. Si consideramos solamente éstos. como se puede observar en la figura 23. Pero con todo. no controlado y tan dinámico. los autores observan que sólo el 51% de estos documentos están incluidos en Web of Science.89). a partir de 64. Estos datos hablan por sí solos. el sistema es capaz de lo más importante. En un sistema big data académico hemos de olvidarnos sin embargo de la exactitud y buscar la mera correlación. de identificar la excelencia y la mediocridad. la correlación entre el número de citas obtenidas en WoS y Google Scholar es total (R2= 0. Efecto en la contabilización de citas de una tasa de error del 10% 131 . en un sistema automático. Es evidente que. los errores y las imprecisiones vayan a existir. Esto implica. es decir. Nuestros estudios empíricos indican que podemos asumir una tasa de error no superior a 10% en la contabilización de citas.000 documentos altamente citados en Google Scholar.

.

la búsqueda avanzada. Para ello se describirá la búsqueda sencilla o básica. un AND en lógica booleana). Como se ha dicho ya con anterioridad. Por defecto. el sistema devolverá un conjunto documental de registros que en teoría satisfacen la consulta efectuada. En la zona inferior al cajetín de búsqueda el sistema nos informa de la cantidad total aproximada de registros que cumplen con los criterios de búsqueda (156. la configuración del sistema y los servicios de valor añadido. Solamente en ese momento el sistema mostrará las funcionalidades de filtrado. Además. el número de resultados es un valor redondeado y que supone tal vez una burda aproximación.000) así como del tiempo que ha tardado en realizar la consulta (0. el sistema entiende que los dos términos deben aparecer obligatoriamente en los documentos (es decir. 133 .04 segundos).Bloque A · Capítulo 6 · El proceso de búsqueda en Google Scholar Capítulo 6 El proceso de búsqueda en Google Scholar: Prestaciones y servicios En este capítulo vamos a analizar el proceso de búsqueda en Google Scholar. En la figura 24 podemos observar un ejemplo de búsqueda básica (en este caso mediante dos keywords. a partir de un menú lateral en la zona izquierda de la pantalla. Finalmente se describirá de forma pormenorizada los elementos del registro bibliográfico que Google Scholar proporciona para cada uno de los resultados generados ante una consulta específica. “ultrasound” y “dispersion”). Búsqueda básica Google Scholar Una vez introducimos una consulta determinada en el cajetín de búsqueda de la página de inicio de Google Scholar y pulsamos en el adictivo botón de buscar. este valor puede ir variando ligeramente conforme nos vamos desplazando por las distintas páginas de resultados.

El tercer bloque de elementos está centrado en la ordenación de los resultados. En ocasiones el usuario puede haberse confundido. bien ordenar por relevancia (es decir.com/scholar?q=ultrasound%20dispersion> En la parte izquierda se ofrecen los elementos de filtrado.google. El segundo bloque lo constituye el filtro temporal. En el ejemplo de la Figura 24 el sistema recomienda “ultrasonic” (ultrasónico) en lugar de “ultrasound” (ultrasonido). Adicionalmente. desde 2005 al 2015) o un año concreto (por ejemplo. En todo caso. similar al PageRank. El valor por defecto es mostrar todos los documentos. Debajo de estos elementos se ofrece acceso al gestor bibliográfico (Librería). no indica nada respecto al término “dispersion” cuando en la literatura especializada el término más correcto debería ser “scattering”.134 La revolución Google Scholar Debajo de esta información. pero . El sistema de forma automática sugiere otra búsqueda alternativa. En un primer bloque de opciones se ofrece la posibilidad de elegir la colección de documentos donde se desea efectuar la búsqueda (artículos o disposiciones legales). 1995). el sistema ofrece recomendaciones de búsqueda. que se comentará más adelante. supone una ayuda en ocasiones muy válida y oportuna para refinar la búsqueda inicial. dos o cinco años atrás. aunque podemos seleccionar la posibilidad de recuperar solamente aquellos publicados uno. Por otro lado. Figura 24. escrito mal una palabra o simplemente haber usado una forma menos correcta. Búsqueda básica en Google Scholar <https://scholar. a partir de un algoritmo de ordenación. Se ofrecen dos alternativas. Esta selección también se puede realizar desde la página de inicio antes de efectuar ninguna búsqueda. podemos utilizar un selector personalizado donde se puede indicar la búsqueda para un intervalo específico (por ejemplo. que no son completamente sinónimos.

Informa además de los días transcurridos desde su indización en el sistema. En último lugar aparece la funcionalidad de las alertas. Buscar textos con la frase exacta indicada. el resultado aparece sin ningún hipervínculo. Buscar textos con al menos uno de los términos indicados. mientras que las patentes están alojadas exclusivamente en la colección de artículos.Bloque A · Capítulo 6 · El proceso de búsqueda en Google Scholar cuyo funcionamiento exacto se desconoce). Si el sistema es incapaz de vincularlas a una entrada principal (por algún error técnico o simplemente porque no exista en el sistema). Búsqueda avanzada Google Scholar Se puede acceder a la búsqueda avanzada tanto desde el desplegable situado en la parte superior derecha. podemos especificar distintos tipos de búsqueda avanzada: —— —— —— —— Buscar textos con todos los términos indicados. el sistema ofrece dos particularidades: —— Muestra únicamente los artículos “añadidos” durante el último año. como pulsando en la flecha situada en la parte derecha del cajetín de búsqueda (Figura 25): De esta forma. actualizaciones personalizadas. 135 . En la parte derecha de la pantalla el sistema permite el acceso a la configuración del sistema. El cuarto bloque de elementos permite la inclusión o exclusión de ciertas tipologías documentales contenidas en la colección seleccionada: —— Patentes: documentos procedentes de Google Patents. servicios derivados (Google Scholar Metrics y Google Scholar Citations) y búsqueda avanzada. Las citaciones están incluidas tanto en la colección de artículos como en la de disposiciones legales. —— Permite visualizar todos los documentos recuperados o solamente aquellos que posean una página específica con el resumen. o bien ordenar por fecha de publicación. incrustados en la colección de artículos (ver Figura 18). —— Citaciones: referencias bibliográficas localizadas en los documentos incluidos en la base de datos (cited references). independientemente de disponer o no del texto completo. En este último caso. Buscar textos en los que no aparezca un término indicado. que será comentada posteriormente. aunque su fecha de publicación original pudiera ser anterior.

y no aparezca el término “Bornmann”. —— Seleccionar el filtrado temporal.google. donde aparezcan los términos “altmetrics” o “links” en el título. —— Buscar textos publicados por una determinada editorial. Búsqueda avanzada desde la caja de búsqueda general (mayo 2015) Por ejemplo.com/scholar?as_q=&as_epq=&as_oq=altmetrics+links&as_ eq=bornmann&as_occt=title&as_sauthors=%22M+Thelwall%22&as_ publication=scientometrics> . en la revista Scientometrics. que se concreta en dos registros recuperados: Figura 26. podemos seleccionar la siguiente consulta: buscar textos publicados por el autor Mike Thelwall desde el año 2010. —— Buscar textos publicados por un determinado autor. Figura 25.136 La revolución Google Scholar —— Determinar el lugar de aparición del término indicado (en cualquier parte del texto o en el título del documento). En la figura 26 se puede observar el resultado de esta consulta. también presente en la búsqueda básica. Ejemplo de búsqueda avanzada <https://scholar.

el sistema ha transformado la consulta en un conjunto de términos. Idioma En el caso de los idiomas. el usuario puede determinar. Cuenta Desde este apartado el usuario puede o bien cerrar sesión o cerrar su cuenta en Google Scholar (que habilita. la restricción por revista no puede ser introducida directamente). Endnote. de las búsquedas. aunque esto no sirve para todos los comandos (por ejemplo.Bloque A · Capítulo 6 · El proceso de búsqueda en Google Scholar Como se puede observar. se puede elegir tanto el idioma de la interfaz de búsqueda como el idioma de los resultados. En este último caso. Se incluye la configuración general de la cuenta. por ejemplo. 137 . de la siguiente forma: allintitle: altmetrics OR links -Bornmann author:”M Thelwall”. si un resultado seleccionado se abrirá en la misma ventana o en ventana nueva o si la búsqueda se realizará por defecto en la colección de artículos o de disposiciones legales (esta opción aparece únicamente en la versión inglesa). Búsqueda El usuario puede seleccionar el número de resultados que desea visualizar en cada página de resultados (10 ó 20). se permite incluir o no los enlaces al servicio del gestor bibliográfico. que se comentará en la siguiente sección. Todas las consultas realizadas durante la sesión activa implican que el sistema sea capaz de monitorizarlas para aprender y comprender las necesidades e intereses informacionales de los usuarios. En caso de querer visualizar esta opción. RefMan y RefWorks. lo que implica tanto una mejora continua de la experiencia de usuario como un mayor control sobre su actividad. Configuración del sistema Desde este apartado el usuario puede realizar algunas configuraciones básicas del sistema. la creación de los perfiles personalizados. Finalmente. Veamos cada uno de ellos a continuación. el enlace a un gestor por defecto a elegir entre BibText. a través de un desplegable. que se detallarán en el bloque B). Esto significa que los usuarios más avanzados pueden llegar a controlar los términos específicos de una consulta avanzada e introducirlos directamente en el cajetín de búsqueda sin necesidad de acceder a la interfaz de la búsqueda avanzada. el idioma y los enlaces de bibliotecas.

sección Evolución). denominados “Library links” (más orientado a los registros electrónicos) y “Library search” 1 (más orientado a los registros impresos). las bibliotecas también fueron desde el principio uno de los frentes importantes de negociación por parte del equipo de Google Scholar. podrán acceder directamente al texto completo. mientras que Young (2005). podrán acceder igualmente a estos servicios. se establecieron dos programas paralelos.google. de forma que al navegar por Google Scholar.138 La revolución Google Scholar el usuario puede elegir entre realizar la búsqueda independientemente del idioma en el que un documento esté escrito o por el contrario buscar solamente en aquellas páginas escritas en un determinado idioma (a elegir entre 13 posibles). a los usuarios que navegan a través de una dirección IP institucional se les asigna de forma automática un perfil institucional. No existe ningún listado oficial en el que se pueda consultar las instituciones que tienen activada esta funcionalidad. si entre los resultados obtienen un recurso que está accesible a través de los fondos contratados por su biblioteca. proporcionando de este modo un filtro de calidad extraordinario. tras analizar 948 campus universitarios norteamericanos entre 1 https://scholar. Para ello. a fecha de mayo de 2005. se podrá visualizar en cada registro el número de citas que ese documento tiene en Web of Science. Oder (2005) detecta un crecimiento en el número de bibliotecas que utilizan esta tecnología (25 instituciones a fecha de febrero de 2005). informa de la existencia de más de 100 Escuelas que trabajan con Google con el fin de acelerar el acceso de los usuarios a los recursos bibliotecarios. Este aspecto se comentará nuevamente en la sección dedicada a describir la anatomía del registro bibliográfico en Google Scholar. De ese modo. pero tengan activado algún mecanismo de autenticación. Los usuarios que naveguen fuera del entorno laboral. Posteriormente Neuhaus. El programa “Library links” permite a los usuarios asociados a una institución (principalmente universidades) acceder al texto completo de los fondos electrónicos de pago a través de la tecnología del link resolver (descrita en el capítulo 1. Enlace de bibliotecas (Library support) Aparte de las editoriales. sabedores de que los catálogos en línea proporcionaban un acceso organizado y controlado a una cantidad ingente de recursos a lo largo y ancho de todo el planeta. Neuhaus y Asher (2008).com/intl/en-US/scholar/libraries . gracias a un reciente acuerdo de colaboración entre WoS y Google Scholar. Adicionalmente.

carnegiefoundation.Bloque A · Capítulo 6 · El proceso de búsqueda en Google Scholar 2003 y 2004. según informa el propio equipo de Google Scholar en la página de ayuda. El proveedor del link resolver deberá disponer de la siguiente información: rango de IPs de los usuarios y el texto de los enlaces. similar al anterior. Estos catálogos dejan disponibles los registros bibliográficos para que sean indizados automáticamente por los robots de Google Scholar. En la figura 27 se puede observar cómo el usuario final puede activar o no la opción. desde donde se ha accedido para realizar la captura de pantalla. y éste con el acceso al texto completo final. como por ejemplo SFX (Ex Libris). Figura 27. Se debe disponer de un link resolver compatible con OpenURL. 2 El funcionamiento de este sistema (válido tanto para instituciones como para usuarios que dispongan de link resolvers en servidores individuales) es sencillo. detectan que la tecnología del link resolver es utilizada por el 73% de todas las Research institutions y por una tercera parte de las Master’s Colleges and Universities. pero enfocado a los catálogos tanto internacionales (como WorldCat) como nacionales o regionales. No obstante. Este acceso corresponde al programa “Library Search” de Google Scholar. que deberán ser proporcionados por la biblioteca o centro al vendedor.org 3 http://catalogo. 360 Link (Serials solutions). 2 La clasificación de las instituciones en este trabajo sigue la llamada Carneggie Classification.rebiun. y ya es éste quien enlaza con los catálogos individuales de las diversas instituciones. Google únicamente enlaza con el catálogo federado.org 139 . En este caso están activado el link resolver de la Universitat Politècnica de València. utilizada en los Estados Unidos: http://classifications. Programas de “Library link” y “Library search” en Google Scholar En la figura 27 se observa igualmente el acceso al catálogo Rebiun de la Red de Bibliotecas Universitarias en España 3. Link Source (Ebsco) o Webbridge (Innovative interfaces). una vez la institución madre ha implementado el sistema.

Full text (texto completo) Este elemento solamente aparece cuando Google Scholar dispone de una versión a texto completo de la versión del registro analizada. Figura 28. y considerando el efecto negativo en términos de visibilidad que supone para un documento no encontrarse entre ellos. publicación y modificación de la literatura académica de forma que facilite a los motores de búsqueda su recolección e indización”. El valor no es marcado explícitamente por el buscador. han comenzado a generalizarse prácticas de posicionamiento en buscadores (clásicas en los motores de búsqueda generales en un entorno comercial) aplicadas al entorno académico. Marca por tanto la relevancia del registro. aunque se incide en el hecho de que depende de la consulta realizada al no ser un valor intrínseco del registro. se describen cada uno de estos elementos: Rank (rango) Es la posición de un determinado registro en la página de resultados (Search Engine Results Page) de Google Scholar ante una consulta determinada.000 primeros resultados para cada consulta. aparecen los siguientes sub-elementos en la parte derecha de la pantalla: . Dado que Google Scholar sólo muestra los 1. En ese caso. resumen y palabras clave o en qué plataformas depositarlo. Gipp y Wilde (2010) lo definen como “la creación. aunque aplicaciones como Publish or Perish sí lo muestran. pueden por tanto influir positiva o negativamente en el rango final obtenido ante determinadas búsquedas. dando lugar a un nuevo concepto denominado Academic Search Engine Optimization (ASEO). Factores como la longitud de los artículos. Beel. qué palabras utilizar o no utilizar en el título.140 La revolución Google Scholar Anatomía del registro bibliográfico En la figura 28 podemos observar un registro bibliográfico estándar en Google Scholar. Elementos de un registro bibliográfico en Google Scholar A continuación.

Este lugar no tiene por qué guardar concordancia con el campo “Domain” del texto completo. incluso en un formato diferente al que esté el texto completo. pero que ha sido localizado en las referencias bibliográficas de algún otro documento (por ejemplo: [PDF]) sí indizado en Google Scholar. en unas ocasiones sí se hace referencia a tipologías documentales (como los libros) pero en otras se especifica únicamente el fichero en el que está contenido. que podría ser el resumen o la descripción bibliográfica del documento. BOOK: el registro corresponde a una monografía. Por ejemplo. edu>). CITATION: el registro hace referencia a un documento no indizado en Google Scholar. —— Link (enlace): hipervínculo al texto completo. Title link (enlace del título) Hipervínculo que apunta al sitio web donde el registro ha sido localizado. —— Domain (Dominio): dominio web en el que Google Scholar ha localizado la versión del documento a texto completo (en este caso <wustl. el registro bibliográfico o el resumen podrían estar en la página de una editorial (lugar al que nos redirigiría este hiperenlace) y el texto comple- 141 . HTML: indica que el documento original está en formato HTML. En este caso se refiere al fichero del registro. se remarcan en negrita las palabras que guarden alguna condordancia con los términos de búsqueda. pues la información bibliográfica del registro y el texto completo pueden estar en lugares diferentes. no se debe confundir este fichero con el campo “Format” del texto completo visto anteriormente. Brackets (corchetes) En este campo se indica la tipología documental del registro en cuestión. En cualquier caso. Como se puede observar. Adicionalmente. que aparece entre corchetes justo delante del título. Title (título) Se muestra el título del documento.Bloque A · Capítulo 6 · El proceso de búsqueda en Google Scholar —— Format (Formato de fichero): se indica entre corchetes el fichero en el que está disponible el texto completo (PDF). Los elementos más comunes son los siguientes: —— —— —— —— PDF: indica que el documento original está en formato PDF.

ciertos campos. número. Por tanto. Bibliographic description (descripción bibliográfica) Este elemento está formado por cuatro campos. . información descriptiva (volumen. fuente de publicación. que contienen información relativa a los autores. en algunos casos. GS Citations link (enlace a citas recibidas) Hipervínculo que dirige al usuario al listado de documentos citantes correspondiente. —— URL Domain/Publisher (dominio web/editorial): aparece el URL donde el documento ha sido localizado. podrían no aparecer. en el caso de publicaciones con muchos autores. el nombre aparece en forma de hipervínculo directo hacia dicho perfil. Éste no tiene por qué corresponder con el campo “Domain” del texto completo. año y editorial: —— Authors (autores): se muestra la lista de autores del documento. lo que limita la utilidad de este campo en la descarga de datos.142 La revolución Google Scholar to ser una versión disponible en un repositorio (la versión completa de la editorial podría ser inaccesible al ser de pago). Elsevier). sumando las correspondientes a todas las versiones correctamente vinculadas por el sistema. incluso el nombre de algunos autores. GS Citations (citas recibidas) Se muestra el número de citas que el documento ha recibido según Google Scholar. Este elemento tiene la peculiaridad de que no toda la información se muestra de igual forma en todos los registros. y sólo para las grandes editoriales. En aquellos casos en los que el autor dispone de un perfil académico público en Google Scholar Citations. Adicionalmente. —— Publication source (publicación): aparece el nombre de la fuente donde el documento ha sido publicado y. paginación). Las palabras que concuerdan con los elementos de búsqueda aparecen marcadas en negrita. pues éste tiene un espacio límite. puede aparecer el nombre de la editorial (por ejemplo. Abstract (resumen) Se muestra a modo de snippet sólo las primeras líneas del resumen del documento. El sistema está diseñado para mostrar esta información en una sola línea. —— Year (año de publicación).

Bloque A · Capítulo 6 · El proceso de búsqueda en Google Scholar

Related link (enlace a documentos relacionados)

Enlace que dirige al usuario a un listado limitado de documentos que
Google Scholar ha considerado similares o relacionados con el registro
consultado y, por tanto, de posible interés para el usuario.

Versions (versiones) y Versions link (enlace a versiones)

Imaginemos un artículo científico escrito por tres autores; una vez
aceptada su publicación la editorial podría depositar inmediatamente
un registro bibliográfico en su sede web (incluyendo resumen y acceso
previo pago); el primero de los autores podría depositar posteriormente
un preprint autorizado (o no) en su repositorio institucional; el segundo
autor haría lo propio pero en otra institución diferente; el tercer autor,
que podría no trabajar en una universidad, lo depositaría en una plataforma online (como por ejemplo ResearchGate) así como en su página
personal.
Un mismo trabajo puede estar depositado en multitud de plataformas online. Google Scholar afronta este problema mediante una funcionalidad patentada que le permite identificar y mostrar todas las posibles
versiones de un mismo documento, así como facilitar su localización y
acceso 4. Pulsando en el elemento “Versions link” se accede a un listado
de todas las versiones que Google Scholar ha sido capaz de localizar para
el documento correspondiente. En este caso podemos observar hasta 29
versiones (Figura 29).

Figura 29. Versiones para un registro bibliográfico en Google Scholar

Como se puede observar en la figura 29, las versiones aparecen ordenadas por relevancia. El sistema nos informa de que ha localizado
4 https://www.google.com/patents/US8589784

143

144

La revolución Google Scholar

aproximadamente 29 versiones (12 de ellas sin acceso al texto completo). Como su propia palabra indica, esto significa que es una aproximación. En documentos con una alta cantidad de versiones (en ocasiones
pueden superar el centenar), esta cifra podría no corresponder exactamente con la cantidad de registros mostrados.
La información de citas únicamente aparece en el registro situado en
primer lugar. A este registro se le denomina la versión principal. Según
Google Scholar, cuando hay diversas versiones para un mismo documento, se selecciona como versión principal el texto completo publicado por
la editorial, siempre que esto sea posible. Y esta versión principal es la
que aparece asimismo en la página de resultados del buscador.
Sin embargo, esta declaración de buenas intenciones no siempre se
cumple, pues podemos detectar registros correspondientes a publicaciones en revistas cuya versión principal es aquella depositada en un
repositorio u otra plataforma online, quedando la versión de la editorial relegada a una versión secundaria. Esto puede tener un importante
efecto negativo en la visibilidad de algunas editoriales en Google Scholar.
Por ejemplo, en la figura 30 podemos comprobar cómo la versión principal para una gran cantidad de artículos antiguos en la revista Nature
corresponde con la copia depositada en ResearchGate.

Figura 30. Versión principal no correspondiente a la versión editorial
<https://scholar.google.com/scholar?q=protein+site%3Aresearchgate.net>

Este efecto sucede especialmente en las revistas que, por alguna u
otra razón, no publican inmediatamente los artículos a texto completo. Los autores realizan su autoarchivo en distintas plataformas y estas

Bloque A · Capítulo 6 · El proceso de búsqueda en Google Scholar

primeras versiones son las que pasan a ser las principales en Google
Scholar. La versión en abierto de la editorial podría no llegar nunca y, en
el caso de hacerlo, podría no sustituir al registro que funcionara como
versión principal hasta ese momento. Por tanto, parece que la primera
versión en abierto identificada tiene muchas probabilidades de constituirse como la versión principal estable del registro.
Aparte de las distintas copias de un mismo documento, en ocasiones nos podemos encontrar con verdaderas versiones. Por ejemplo, informes técnicos anuales en los que el título y los autores pueden ser
los mismos y el contenido tener un grado de solapamiento importante,
pero ser documentos independientes documentalmente. En esos casos, el sistema de agrupación de versiones agrupa todas las versiones
que estima son variaciones de un mismo documento. En la figura 31 se
muestra el ejemplo de “The STM Report”, elaborado por M. Ware y M.
Mabe. Podemos comprobar cómo el sistema ha agrupado las distintas
ediciones de este informe.

Figura 31. Ejemplo de distintas ediciones agrupadas en una misma versión

Aunque no faltan argumentos a favor de esta agrupación, debemos
advertir del efecto que esto puede tener en estudios cuantitativos. En

145

146

La revolución Google Scholar

algunas ediciones podrían no coincidir todos los autores y, todavía peor,
las referencias bibliográficas podrían ser bien diferentes. Por tanto, la
consideración de “The STM report” como documento citante es compleja
de resolver si las distintas ediciones aparecen agrupadas bajo una misma obra.

WoS Citations (citas en WoS)

Se muestran las citas recibidas por el documento correspondiente
según la Web of Science. Este campo solamente aparece si la consulta
se ha realizado desde una computadora conectada en un rango de IPs
autenticadas para su acceso a la plataforma Web of Science.
Aunque no se muestra en la pantalla, cuando el registro es descargado aparece un campo adicional, denominado WoS accession number (UT),
un número de identificación del documento dentro de la WoS.

WoS Link (enlace a citas en WoS)

Hipervínculo al listado de documentos citantes en la Web of Science.

Bonus track: servicios de valor añadido

Finalmente, en esta sección se incluyen diversos servicios extra disponibles desde la interfaz de Google Scholar, y que aportan un valor
añadido a los usuarios en sus procesos de búsqueda de información
científica.

Referencias bibliográficas

Entre los elementos que conforman un registro bibliográfico, descritos en la sección anterior, se encuentra el elemento “Cite”. Si se pulsa
sobre este enlace en cualquiera de los registros de una página de resultados, el sistema nos muestra un cuadro de diálogo flotante en el que
aparece la referencia bibliográfica completa del registro seleccionado en
cinco estándares diferentes (MLA, APA, Chicago, Harvard y Vancouver),
que pueden ser copiados y pegados en cualquier otro documento. En la
figura 32 se muestra un ejemplo del sistema de referencias bibliográficas de Google Scholar.
Adicionalmente, el sistema permite la generación de la referencia bibliográfica en diversos gestores bibliográficos (BibText, Endnote, RefMan
y RefWorks), para poder ser exportados de forma sencilla. En el caso de
que en la configuración de la búsqueda hubiésemos activado la opción
de gestor bibliográfico, entonces el enlace “Cite” sería sustituido por el
gestor seleccionado.

Bloque A · Capítulo 6 · El proceso de búsqueda en Google Scholar

Figura 32. Sistema de referencias bibliográficas en Google Scholar

Mi biblioteca

Junto al elemento “Cite” (Citar) aparece otro útil elemento que proporciona acceso a un recurso de interés. Se trata del elemento “Save”
(Guardar). Y al pulsar sobre éste, el sistema guarda el registro seleccionado en “My Library” (Mi biblioteca), una suerte de biblioteca personal
donde el usuario registrado puede almacenar colecciones de documentos. Este servicio apareció el 19 de noviembre de 2013 5 y trata de competir con otros gestores populares como Zotero o Mendeley. Sin embargo,
sus prestaciones, aunque interesantes, son todavía limitadas como para
competir con estas aplicaciones 6.
El acceso a la biblioteca personal se encuentra tanto en la página
de inicio de Google Scholar (menú superior) como en el menú de opciones que aparece en la parte izquierda de la pantalla cuando se realiza
cualquier búsqueda en la base de datos. Y su utilización requiere de la
activación o habilitación previa del usuario.
En el momento de la activación, el sistema vuelca automáticamente
todos los artículos que el autor tuviera incluidos en su perfil académico
en Google Scholar Citations. Así mismo, se le consulta la posibilidad de
incluir adicionalmente los artículos que el autor haya podido citar, identificados en las publicaciones del perfil. La apariencia de la biblioteca es
prácticamente idéntica a la interfaz de búsqueda Google Scholar (Figura
33), y se puede distinguir por la aparición de un icono de carpeta justo
5 http://googlescholar.blogspot.com.es/2013/11/google-scholar-library.html
6 https://scholar.google.com/intl/en/scholar/help.html#library

147

Por defecto “Mi biblioteca” muestra dos colecciones. en el caso de que se hubiese activado la opción en el momento de la activación. El funcionamiento es el que sigue: . “Mis citas” (que corresponde a los artículos importados automáticamente del perfil académico del usuario) y “Citado por mí”. En todo caso. accesible desde el menú lateral izquierdo de la biblioteca. el sistema mostrará los documentos almacenados. indicando que el artículo se encuentra almacenado en la biblioteca. El usuario conforme navega por Google Scholar puede localizar un registro de interés. el producto proporciona una herramienta de etiquetas. Figura 33. el funcionamiento del sistema es muy sencillo.148 La revolución Google Scholar en la parte izquierda del registro bibliográfico. en la que se incluyen los artículos citados por el autor en los artículos incluidos en el perfil. Figura 34. Ejemplo de colección en “Mi biblioteca” Una vez activado. Pulsando posteriormente el enlace “My Library”. y simplemente pulsando en el elemento “Save” (Guardar) el registro se añadirá a la colección. Importación de referencias citadas en “Mi biblioteca” Con el fin de facilitar la organización de contenidos. esta colección de documentos puede habilitarse en cualquier momento (Figura 34).

las últimas aportaciones en alguna determinada materia. —— Acceder a cualquier colección (por defecto “Mi biblioteca”. algún asunto muy particular o de una selecta selección de publicaciones. el nombre de la carpeta aparecerá en el menú lateral derecho (Figura 34). aparecerán todos los documentos etiquetados en esta categoría. 149 . —— Pulsar en “Labels” y etiquetar la referencia correctamente (Figura 35). por ejemplo “Libros”.Bloque A · Capítulo 6 · El proceso de búsqueda en Google Scholar —— Acceder a la gestión de etiquetas: “Administrar etiquetas”. La solución que plantea Google Scholar es la creación de Alertas que automaticen la identificación de nuevos registros incluidos en la base de datos que cumplan unos criterios de búsqueda. y notificarlos automáticamente al usuario mediante un correo electrónico. “Mis citas” y “Citado por mi”. Todo ello exige la creación de comandos de consulta que en ocasiones pueden ser complejos y laboriosos si deben realizarse además con cierta frecuencia. se está en el proceso de realización de un trabajo académico de envergadura (como una tesis doctoral) o simplemente se desea estar al día. creado anteriormente. Etiquetado de contenidos en “Mi biblioteca” Alertas Las tareas de seguimiento en Google Scholar pueden ser realmente tediosas. Tras esto. Al crearla. como puede suceder cuando se están realizando tareas de vigilancia tecnológica. Figura 35. —— Crear una etiqueta nueva. al pulsar en el menú “Libros”. Conocer los últimos artículos de un autor. —— Pulsar en el artículo que se desee etiquetar.

Si el usuario hace clic en el icono una vez ha realizado una consulta. el sistema copiará la consulta efectuada en el campo “Consulta de alerta”.150 La revolución Google Scholar El icono de “Alertas” se encuentra situado en el menú superior de la página de inicio de Google Scholar. según provengan de Google Scholar (aparecen entre corchetes en el panel de alertas) o las provenientes de Google Scholar Citations (aparecen sin corchetes). cuando el usuario realiza una consulta básica. es decir. lo que puede ser útil a la hora de fijar una alerta ante una consulta que ha demostrado ser útil al usuario. Adicionalmente. así como el número máximo de resultados que desea recibir en cada notificación. En este caso. Figura 36. El usuario deberá incluir un correo electrónico para recibir las notificaciones. El perfil académico es tal vez la mayor fuente de datos pues describe completamente a un autor (afiliación institucional. La consulta de alerta debe corresponder con la ecuación de búsqueda que debería realizarse en el cajetín de búsqueda de Google Scholar. Se puede destacar igualmente que las alertas no pueden editarse una vez creadas. solamente pueden ser eliminadas. Las alertas pueden además crearse en vivo. Google Scholar registra todos los movimientos que los usuarios realizamos dentro del sistema. el usuario puede comprobar la eficiencia de los resultados de la consulta realizada a través del botón “Actualizar resultados”. el sistema le muestra siempre el icono de alertas en el menú lateral izquierdo (Ver Figura 24). el sistema muestra una interfaz desde la que se pueden crear las alertas de consulta (Figura 36). palabras clave identificando . qué autores consultamos. qué revistas. Si se pulsa en el enlace. Actualizaciones El sistema de actualizaciones es un sistema de recomendación automático de artículos. mientras se está buscando material académico. etc. Creación de alertas en Google Scholar Las alertas pueden dividirse en dos tipos. a qué documentos accedemos a texto completo.

situado en el menú superior de la página de inicio de Google Scholar. donde podemos consultar todo el histórico o bien las últimas incorporaciones (figura 37). a partir de un icono en forma de campana. situado en la parte superior derecha de la interfaz de búsqueda. artículos publicados e información de a quién cita y por quién es citado). Toda esta información es acumulada para ofrecer una recomendación basada en nuestros gustos e intereses académicos. Figura 37. Para acceder a esta colección de documentos recomendados basta con pulsar el botón “Actualizaciones”.Bloque A · Capítulo 6 · El proceso de búsqueda en Google Scholar áreas de interés. El sistema nos avisa igualmente en el momento en que se ha incorporado una novedad. Sistema de recomendación de artículos en Google Scholar I Figura 38. Sistema de recomendación de artículos en Google Scholar II 151 . al igual que funcionan los sistemas de recomendación de música o de parejas sentimentales.

. Una vez instalada. Imaginemos que estamos consultando un repositorio (Figura 39). pero nos interesa. podemos observar cómo el sistema ha localizado el artículo seleccionado en Google Scholar (que no se encuentra en acceso abierto). y cuya última actualización es del 7 de mayo de 2015) permite realizar esa consulta de forma inmediata. nos aparecerá un pequeño icono en la parte derecha de la barra de navegación del buscador. Botón de referencias En ocasiones.152 La revolución Google Scholar En el momento en que existen nuevos documentos que el sistema cree poder recomendarnos. y nos encontramos con un texto que no es accesible. en el caso de que sea necesario. arriba). El botón de Google Scholar (lanzado en abril de 2015. lista para ser usada. Si con el ratón seleccionamos el título de la obra y a continuación pulsamos en el icono del botón. el icono se ilumina en rojo y en su interior aparece un número representativo del número de documentos nuevos recomendados (Figura 38. por ejemplo. ofreciéndonos la posibilidad de exportar la referencia normalizada. A veces. podemos llegar a localizar una referencia bibliográfica que nos interese y deseemos entonces acceder al artículo correspondiente. En el ejemplo mostrado en la Figura 39. bajo). Un proceso que se puede hacer engorroso si se realiza con frecuencia. cuando navegamos por algún sistema de información o página web. La forma es a través de una extensión del navegador web Chrome al que se puede acceder desde esta sección de la configuración y que puede ser instalada en el navegador directamente a través de la Chrome Web Store. estos nuevos documentos aparecen en la página de inicio listados justo debajo del cajetín de búsqueda (Figura 38. Sin embargo. el sistema realizará la búsqueda de esa cadena de caracteres seleccionada directamente en Google Scholar. de acceder al texto completo (en este caso accesible desde la plataforma de ResearchGate) o bien abrir definitivamente Google Scholar para refinar la búsqueda. para ello deberemos abrir en una pestaña nueva el buscador (si no lo teníamos ya abierto) y copiar/pegar el título u otra información de dicha referencia para realizar la consulta. buscando en Google Scholar.

Ejemplo del botón de referencias de Google Scholar 153 .Bloque A · Capítulo 6 · El proceso de búsqueda en Google Scholar Figura 39.

.

Capítulo 7 Google Scholar en la balanza: Fortalezas. en los que hemos pretendido de algún modo . Los defensores y los detractores (recordando en ocasiones a los apocalípticos e integrados de Umberto Eco) han tenido tradicionalmente posiciones claramente diferenciadas y contrapuestas. a la inclusión de material de dudosa calidad y a los errores en la contabilización de citas. Desde el inicio se ha hecho especial hincapié. A lo largo de la última década. tanto académicos como divulgativos. en la diversidad de opiniones vertidas. tanto empíricos como descriptivos. Por el contrario. los entusiastas del producto no sólo inciden en las ventajas del buscador. así como el impacto de su lanzamiento tanto en el mercado de los buscadores como posteriormente en la evaluación de la actividad académica. aunque no niegan algunas de sus principales bazas como su amplia cobertura. las intenciones y objetivos iniciales de sus creadores. debilidades y peligros A lo largo de los capítulos anteriores hemos descrito el nacimiento de Google Scholar. sus características distintivas principales. Los detractores. en algunas áreas y disciplinas. muestran su desagrado al poco o escaso control de calidad de los datos. aun con el peligro de resultar demasiado densos. que lo invalidan como herramienta a emplear en procesos de evaluación académica. sino que argumentan que los errores (imposibles de negar por otra parte) no influyen demasiado en las conclusiones generales a obtener en un proceso de evaluación de impacto académico. Inciden en que su uso debería generalizarse como fuente complementaria a los resultados ofrecidos por bases de datos bibliométricas como WoS o Scopus y. desde el Grupo EC3 (Evaluación de la Ciencia y de la Comunicación Científica) hemos realizado una gran cantidad de estudios y análisis. En un plano intermedio nos atrevemos a situarnos a nosotros mismos. Google Scholar no deja indiferente a nadie. como fuente absolutamente obligatoria. su facilidad de uso y el gran papel que juega como puerta de entrada a la búsqueda de información científica.

la tarea de analizar Google Scholar no es sencilla. Uno de los paneles de evaluación más completos es quizás el elaborado por Torres-Salinas. Sin embargo. Sin entrar en estos puntos y ya concentrándonos en sus prestaciones en tanto que herramienta para la realización de estudios bibliométricos. su más insigne virtud es indudablemente la amplia y diversa cobertura. Ventajas Los principales valores de Google Scholar. El creciente uso de Google Scholar y el movimiento de las Altmetrics 1 supondrán a buen seguro un cambio de tendencia en la utilización de este buscador en tareas y análisis tanto bibliométricos como cibermétricos. sí cumplen la misión de abordar. que se concentra en tres puntos clave: idiomas. cobertura general y precio). tanto las buenas como las no tan favorecedoras o incluso las directamente malas. búsqueda y resultados. contribuyendo de ese modo a poner un granito de arena en la mejora del conocimiento sobre Google Scholar tanto a investigadores como a profesionales. Llegados a este punto parece conveniente realizar una parada en el camino con el propósito de recopilar. disciplinas y tipologías documentales. 1 http://altmetrics. Aunque la evolución y dinamismo del buscador hacen complicada la utilización de este tipo de modelos de análisis. cobertura de revistas científicas.org/manifesto/ . en su gratuidad. quienes estructuran la evaluación del buscador en seis apartados (control de la información. junto a las posibles amenazas y peligros a los que debe hacer frente en la actualidad. además contemplando prácticamente a todos los posibles usuarios. Con ello crecerá la necesidad de conocer sus principales limitaciones y problemas en aras a extraer el máximo partido al enorme potencial que esta base de datos contiene. residen en la fascinante sencillez de su uso en las búsquedas y. En la tabla 6 se resumen los principales puntos de debate en este apartado. todos los aspectos importantes de la base de datos.156 La revolución Google Scholar mostrar todas las caras de Google Scholar. interfaz. por supuesto. extraidos de los innumerables trabajos y estudios recopilados durante la elaboración de este libro. categorizar e incluso discutir las principales ventajas e inconvenientes de este buscador. ya comentados en la introducción. desde una óptica integral. Ruiz-Pérez y Delgado López-Cózar (2009).

estiman que el inglés puede representar aproximadamente el 65% de los registros en Google Scholar.Bloque A · Capítulo 7 · Google Scholar en la balanza Tabla 6. a partir de un análisis sobre estudios empíricos previos. en el que se observa de forma comparada la cantidad de registros por idioma 157 . el inglés constituye aproximadamente el 90% de los documentos indizados. Ventajas. considerando los artículos indizados en Web of Science en el período 1900-2014. En el caso de Google Scholar es complicado realizar este cálculo pues no existen comandos de búsqueda específicos para filtrar por idioma (aunque sí por dominios web geográficos) y existe además un número máximo de resultados por consulta (1. Orduña-Malea et al (2015). dato que habla por sí mismo.000) que imposibilitan el cálculo manual. inconvenientes y amenazas de Google Scholar VENTAJAS INCONVENIENTES AMENAZAS Idiomas Calidad Manipulación Disciplinas Transparencia Control Tipologías Prestaciones Googlelización Amigabilidad Gratuidad Idiomas El sesgo hacia el idioma inglés por parte de las bases de datos bibliométricas es ampliamente conocido. Por ello. solamente podemos trabajar con estimaciones. Esta mayor diversidad lingüística se puede observar en el estudio llevado a cabo por Orduña-Malea y Delgado López-Cózar (2014). Según Orduña-Malea et al (2014).

con especial relevancia los llevados a cabo por Anne-Wil Harzing en las áreas de Administración y dirección de empresas y Economía. chino y japonés) mucho más elevada en Google Scholar. francés. español. Thelwall y Rezaie (2011). GSM cuenta con revistas publicadas en 13-15 lenguas. Este y otros productos similares serán descritos con mayor detalle en el Bloque B del libro (capítulo 10). Disciplinas Dado que el uso del idioma vernáculo es una de las características antropológicas clave en la comunicación científica en ciertas disciplinas. A parecidas conclusiones se llega en los estudios dirigidos a analizar la lengua y procedencia geográfica de las revistas indizadas en Google Scholar Metrics comparadas con las vaciadas en Web of Science o Scopus. o en las de Library and Information Science (Delgado López-Cózar et al. Por otra parte. De este modo. por ejemplo) han aprovechado precisamente esta potencialidad para desarrollar productos orientados a conocer el rendimiento individual de investigadores españoles en estas disciplinas. Los resultados reflejan una representación de ciertos idiomas (especialmente el italiano. eliminando el abultado sesgo anglófono que poseen Scopus y WoS. Productos derivados (como H-Index Scholar. Tanto en las revistas de Comunicación (Delgado-López-Cózar y RepisoCaballero. si las revistas en inglés representan en Scopus y WoS entre el 85 o 90% de los títulos. GSM se ajusta mejor al uso real que tienen los distintos idiomas en las revistas científicas existentes en el mundo. con la excepción del alemán. esencialmente en las Ciencias Humanas y parte de las Ciencias Sociales. sorprendentemente mejor cubierta en WoS y Scopus en el momento del estudio. sociales y jurídicas. Scopus y Google Scholar. así como el trabajo seminal de Kousha. en GSM no alcanzan el 60%. Los trabajos reseñados a lo largo de este libro. dan sobrada muestra de la potencialidad de Google Scholar para ser utilizado en la evaluación del impacto académico en dichas disciplinas. es lógico pensar que una mayor diversidad lingüística pueda conllevar necesariamente una mayor y mejor representación de estas disciplinas. . quienes abarcan las principales áreas humanas. 2013) como en las de Enfermería (Reina. 2013). 2012).158 La revolución Google Scholar en Web of Science. Repiso-Caballero y Delgado López-Cózar. mientras que Scopus y WoS sólo registran revistas publicadas en 7-9 idiomas diferentes.

presentaciones (tanto docentes como de conferencias o eventos) y especialmente monografías y tesis doctorales. aparte de por usar los idiomas vernáculos.2% y los capítulos de libro un exigüo 1. Por tanto. no hemos de olvidar que el producto es. Actas de congresos. revistas secundarias no incorporadas en la corriente principal de la ciencia. Únicamente se requiere de acceso a Internet. pueden disponer de una herramienta no sólo complementaria sino necesaria para obtener un dibujo completo de su impacto académico. Estas características convierten a Google Scholar especialmente útil en estudios y análisis a nivel micro. fácil y directa documentos a texto completo como para identificar las citas únicas a sus trabajos independientemente de su procedencia. Según el análisis de Orduña-Malea et al (2014). Ni siquiera se precisa disponer de una cuenta de correo de Gmail para usar los servicios de Google. la presencia a texto completo de actas de congresos. capítulos de libro o monografías son formatos usados con mucha frecuencia y que no están recogidos en las bases de datos bibliométricas clásicas. informes. proporcionan a Google Scholar no sólo una base de datos única donde localizar información sino un corpus de documentos citantes de incalculable valor (imaginemos la cantidad de citas perdidas que puede suponer simplemente excluir las tesis doctorales de los análisis de citas). las actas de congreso suponían solamente el 10. Ruiz-Pérez y Delgado López-Cózar. 2009). por ejemplo. por utilizar canales de comunicación diversos en los que el artículo publicado en una revista es una tipología claramente minoritaria. investigadores en áreas sociales y humanas o de ingeniería. idioma o tipología documental (Torres-Salinas. Inconvenientes A pesar de todas las indudables ventajas descritas anteriormente el sistema no está exento de ciertas limitaciones e inconvenientes.Bloque A · Capítulo 7 · Google Scholar en la balanza Tipologías documentales Las disciplinas sociales y humanas se caracterizan. que se 159 .1%. Por último. Por tanto. el artículo científico era la tipología más presente en Web of Science (57%) durante el período 1700-2014 mientras que. completamente gratuito. a día de hoy. patentes. tanto para localizar de una forma sencilla. editoriales o asociaciones no gubernamentales. y no por ello menos importante. capítulos de libro. Google Scholar recopila documentos académicos sin importar la tipología documental (los documentos solamente deben cumplir unos requisitos técnicos y de estructura).

los especialistas en bibliometría y cibermetría deben contar con registros sin errores para que sus análisis tengan el suficiente rigor científico y sus conclusiones puedan tener validez. La calidad de la información ofrecida (entendiendo con ello los datos descriptivos de los registros indizados) no fue una prioridad por tanto en el proyecto de Google Scholar. Desarrollado con la perspectiva de satisfacer las demandas de los usuarios a la hora de localizar y acceder a información científica. sigue la filosofía del laissez faire laissez passer. más cuando esto va a tener una incidencia tal vez mínima en la satisfacción de un alto porcentaje de sus usuarios. mejor) y dando preferencia a los documentos más influyentes (cuanta más relevancia. ya denunciaba la existencia de importantes limitaciones en los resultados proporcionados. Conclusiones que. de cobertura global y con poco personal no puede seguramente dedicar demasiado tiempo a controlar la precisión de los datos bibliográficos aportados. En 2005 (tan sólo un año después del lanzamiento del buscador). La prioridad por tanto radica en disponer de información (cuanta más.160 La revolución Google Scholar pueden resumir en una falta de control de calidad de los datos. por ejemplo. por otra parte. rápido. en ofrecerla de forma inmediata a los usuarios (cuanto más rápido. Control de calidad Google Scholar. sirven y guían como apoyo para la correcta toma de decisiones tanto en instituciones académicas como en organismos de financiación. los especialistas en información tienen la obligación profesional de evaluar las prestaciones de los buscadores. especialmente durante sus primeros años de vida. Una base de datos actualizada de forma dinámica. así como para formar a sus usuarios. A pesar de ello. Los bibliotecarios y documentalistas deben conocer a fondo su cobertura. de cobertura mundial y que además es gratuito. Peter Jacsó ha sido quizás el investigador que más tiempo ha dedicado a identificar y criticar las deficiencias de Google Scholar (aspecto ya comentado ampliamente en el capítulo 2). al igual que otros productos y servicios desarrollados por Google. funciones de búsqueda y precisión para realizar su trabajo de forma profesional (buscar y localizar información de calidad para sus usuarios). Un producto sencillo de utilizar. Por otro lado. mejor). opacidad en su funcionamiento y la poca amigabilidad para poder analizar los datos recuperados. mejor) y de manera intuitiva (cuanto más fácil. mejor). que afectaban especialmente a la hora de localizar las contribuciones de un determi- .

La recuperación e indización de la Web por parte de Google se basaba en la identificación de URLs y títulos en el código HTML. patético. 161 . El software empleado era. Emplea asimismo términos como “under-trained and inferior web crawlers”. En ocasiones ciertos datos eran tomados por error de las opciones de menú de las páginas web. de la afiliación profesional o incluso de la dirección postal. 2007). Igualmente. 2008b). según palabras de Jacsó. se detectaban errores tales como la existencia de duplicados (y triplicados). enlazado a textos completos que no correspondían a los registros. los parsers eran incapaces de reconocer los metadatos bibliográficos. Los errores identificados generaban millones de registros con atribuciones de autoría y de citas erróneas (que provocaban la existencia de autores y citas fantasmas). muy especialmente. los desarrolladores de Google Scholar habían depositado toda su confianza en el desarrollo de un software propio para extraer automáticamente los metadatos de los archivos a texto completo en lugar de utilizar los metadatos creados por los bibliotecarios y las editoriales (Jacsó.Bloque A · Capítulo 7 · Google Scholar en la balanza nado autor. este procedimiento no podía funcionar igual de bien en la búsqueda de ítems conocidos a partir de la combinación de nombres de autores. Jacsó es especialmente crítico en este asunto. los documentos con estructuras no bien definidas podían provocar que el sistema no recuperara de forma correcta las citas de muchos documentos citantes (Meho y Yang. Este método había resultado exitoso en el buscador general de Google para crear conjuntos de resultados que fueran relevantes para consultas “tipo” de los usuarios (basadas generalmente en una o dos palabras clave). 2005b). 2008a. Jacsó (2010) describe cómo en ocasiones los años de publicación de los registros eran tomados de los datos del volumen y número de la publicación o de parte de números de teléfono o fax. era imposible entonces distinguir dos autores con el mismo apellido y misma inicial. Por ejemplo. debido a importantes problemas en la desambiguación de nombres (Jacsó. Igualmente. Como consecuencia. de los descriptores. errores en las búsquedas filtradas por año. este procedimiento planteaba un error de base. años de publicación o nombres de revistas (Jacsó. Sin embargo. en la mala utilización de los metadatos proporcionados por las editoriales. Sin embargo. Pese a ofrecer un acceso sin precedentes a cientos de editores académicos (quienes ofrecen al buscador millones de registros bibliográficos a texto completo). en la aplicación de algunos comandos de búsqueda avanzada y. 2010).

especialmente en el proceso de ranking de resultados ante una consulta determinada (algoritmo de posicionamiento). Cabe admitir no obstante una importante evolución y mejora del producto. institución o editorial el hecho de no aparecer entre los resultados a una consulta pertinente es un asunto nada trivial. Zadpoor y Dodou (2014) identifican por ejemplo un 1% de falsos positivos en citas y un 5% de duplicados para una muestra de 56 artículos en diversas disciplinas analizadas en 2013. es vital. 2009). Localizar . más teniendo en cuenta la escala de su cobertura y la ausencia de control de calidad en su mantenimiento.000 resultados por consulta. Se evidenciaba que Google Scholar era un producto ambicioso desde el punto de vista de su cobertura. Conocer las razones por las que un registro aparece por delante de otro. resumen o texto o el PageRank del dominio web donde se ha depositado el texto completo) es igualmente importante. porcentajes asumibles. el peso de otros indicadores (como podrían ser la calidad de la editorial. por lo que resultaba claramente inapropiado en la realización de búsquedas bibliométricas para la evaluación del rendimiento e impacto científico de investigadores y revistas. Así mismo. los autores advierten de la falta de fechas de publicación en el 9% de los datos. se desaconsejaba su utilización como única fuente de información para la evaluación de la ciencia. Ruiz-Pérez y Delgado López-Cózar. En todo caso. pero mal resuelto en el plano del procesamiento de la información. la concordancia de palabras en el título. así como en su presentación (TorresSalinas. y constituye por tanto una importante limitación a remarcar en este apartado. La pérdida de visibilidad que puede suponer tanto para un autor. aunque su influencia específica no se puede calcular con exactitud. Aunque parece ser que el número de citas es uno de los indicadores clave en este proceso de posicionamiento (Beel y Gipp (2009). Este hecho puede explicar los errores en los filtros temporales del buscador. Winter. especialmente en trabajos a media y gran escala.162 La revolución Google Scholar Todos estos errores impedían un uso académico de los datos albergados en el sistema. Opacidad Una de las principales críticas que suelen realizarse a Google Scholar es la falta de transparencia a la hora de detallar públicamente el funcionamiento del buscador. en un producto que muestra un máximo de 1.

En ocasiones podemos olvidar que Google Scholar. Esto puede tener un efecto negativo al favorecer a los artículos más antiguos frente a los nuevos. Este hecho puede justificar que no revelen sus algoritmos de búsqueda y posicionamiento. por ejemplo. que un usuario acceda al texto completo. tal y como ya se ha comentado en diversas ocasiones a lo largo del libro. por ejemplo. 163 . lo descargue.Bloque A · Capítulo 7 · Google Scholar en la balanza un texto entre los resultados de búsqueda puede suponer. lo cite en futuros trabajos propios. aunque es gratuito. pues son clave para mantener su posición en el mercado de los buscadores frente a las empresas de la competencia. Lógicamente. Las fuentes en abierto constituyen un número demasiado elevado (y con un dinamismo muy elevado) como para poder disponer de una master list de las mismas. Más allá de revelar los procesos de ordenación de resultados y otros procedimientos internos (algunos de ellos. El algoritmo del ranking es un secreto comercial. como la identificación automática de versiones. que se realiza de forma irregular e inconsistente (Walters. los artículos con más citas son por lo general artículos más antiguos (han tenido tiempo suficiente como para reunir muchas citas). éstos no mencionan explícitamente la influencia directa que puede tener el uso del número de citas como elemente clave de posicionamiento web en su producto. Aunque los autores atribuyen este efecto a las nuevas tecnologías y al uso de los motores de búsqueda. En cambio. en el sentido de que favorecen la localización de artículos pioneros. el segundo punto importante respecto a su opacidad. se encuentran descritos en las patentes publicadas por el equipo de trabajo de Google Scholar). lea y. con fortuna. es la total falta de transparencia acerca de la cobertura de la base de datos (más exactamente qué fuentes indiza) y su actualización. a través de un listado online actualizable anualmente. Igualmente puede servir para dar a conocer tu trabajo. es un producto elaborado por una empresa privada. La influencia del número de citas en el ranking de resultados puede traer problemas adicionales. La tendencia a citar artículos antiguos en Google Scholar fue estudiada por Verstak et al (2014). localizar posibles colaboradores y generar interés por tu línea de investigación. las fuentes privadas (como editoriales) que han llegado a un acuerdo específico con Google Scholar para que éste indexe el texto completo de sus contenidos sí deberían ser notificadas. 2007). especialmente en aquellas búsquedas no restringidas temporalmente.

000 resultados por búsqueda limita la realización de estudios métricos dada la imposibilidad práctica de recopilar todos los resultados existentes ante una determinada consulta. se destacan los siguientes puntos: La exportación de registros bibliográficos (a través de la opción “Citar”) es útil para copiar una referencia bibliográfica en un formato estándar en un documento de trabajo. —— No existe la posibilidad de ordenar los resultados en función de diversos parámetros. el límite de 1. Las únicas opciones son por relevancia o fecha de indización). 2005) 2. Respecto a las capacidades del buscador. pero únicamente operativa en los perfiles académicos. y no en la interfaz de búsqueda de Google Scholar. —— No existe la posibilidad de restringir los resultados a enlaces que proporcionen acceso al texto completo. el sistema muestra claramente una preferencia por la sencillez e inmediatez de las búsquedas a costa de limitar las opciones avanzadas. Respecto a la exportación y tratamiento de los resultados. —— No se permite la búsqueda por tipo de publicación o metodología de investigación (esencial por ejemplo en medicina). 2006).164 La revolución Google Scholar Prestaciones documentales El último punto importante a destacar respecto a las limitaciones de Google Scholar es el relativo a las escasas prestaciones documentales del sistema. entre muchas otras: —— Los operadores booleanos y el filtro temporal no funcionan con precisión (Jacsó. Aunque existen diversos métodos como el query splitting (basado en la combinación especial de diversos términos de búsqueda). pero es insuficiente como para trabajar con ella de forma sistemática. —— Carencia total de términos controlados y control de autoridades (Giustini y Barsky. típicamente incluidas en otros productos de información. Esto hace que el proceso de exportación de referencias sea tedioso. pues no se permite la selección de más de un ítem a la vez. Por otro lado. . tanto en la búsqueda avanzada de información como en las capacidades para exportar y tratar los resultados de las búsquedas efectuadas. desarrollado 2 El producto Google Scholar Citations ha elaborado un control de autoridades en agosto de 2015. En ese sentido. Ni siquiera se puede realizar esta operación en la Biblioteca de Google Scholar. se destacan las siguientes limitaciones.

que se concretan en su facilidad de manipulación. Amenazas Tras describir las principales ventajas e inconvenientes de Google Scholar.uk 4 http://www. 2010). Aunque su funcionamiento queda igualmente delimitado por los requisitos técnicos de Google Scholar. tedioso y definitivamente poco amigable (Bar-Ilan. durante la descripción del registro bibliográfico en Google Scholar. esta última sección del capítulo 7 se centra en las principales amenazas en torno a este buscador. A lo largo de los últimos años se han desarrollado aplicaciones que.harzing. Meho y Yang (2007) incluso lo cuantifican mostrando. Es decir. Todas estas limitaciones llevan a que la recopilación y procesamiento de resultados de búsqueda sea un proceso costoso. diversas variantes del h-index).Bloque A · Capítulo 7 · Google Scholar en la balanza por el equipo de Mike Thelwall en la University of Wolverhampton e incluido en la aplicación Webometric Analyst 3. Scopus (200 horas) y Google Scholar (300 horas). no trabaja sobre ninguna API. para una misma muestra. el tiempo requerido para la recolección y procesamiento de datos en WoS (100 horas). Y en este mismo capítulo 3 http://lexiurl. a través de una interfaz amigable. que les impide proporcionar contenidos estructurados a terceros. permiten consultar y recuperar datos en Google Scholar. esta limitación invalida la realización de estudios bibliométricos con datos masivos. La razón por la que el equipo de Google Scholar no habilita una API es debida a los contratos privados firmados con las editoriales u otras fuentes.htm 165 . ya se introdujo el término de ASEO (Academic Search Engine Optimization) al discutir acerca de la posición de los registros en la página de resultados ante una consulta concreta. Este hecho ya fue advertido por Jacsó (2008a).ac. Manipulación En el capítulo 6.wlv. aportando adicionalmente datos de interés para el análisis bibliométrico (por ejemplo. Entre estas aplicaciones destaca por encima de todas Publish and Perish 4. el control sobre el usuario y la excesiva dependencia en los productos de Google.com/pop. La falta de disponibilidad de una API (Application Programming Interface) en Google Scholar obliga a realizar descargas de datos de una forma manual desde la pantalla de resultados a una hoja de cálculo (u otra aplicación similar para el tratamiento de datos).

Los resultados muestran que esta manipulación es. sin demasiado esfuerzo. De forma similar. Gipp y Wilde. Para ello. Beel y Gipp (2010) realizan diferentes pruebas en Google Scholar. El investigador francés Cyril Labbé (2010) dio un paso más allá en el estudio de la manipulación de citas en Google Scholar utilizando la aplicación SCIgen para generar de forma automática una gran cantidad de artículos falsos firmados por un autor inventado (Ike Ankare). como una forma de hacer sus contenidos más amplia y fácilmente disponibles y. 2010). Con el fin de determinar si la manipulación de los motores de búsqueda académicos podría ser efectivamente una amenaza. desde el punto de vista del investigador. en este caso en los perfiles académicos (éstos serán descritos en el bloque B). una de las principales amenazas de las técnicas de ASEO es que puede ser tomado como una guía sobre cómo engañar y manipular a los motores de búsqueda (Beel.166 La revolución Google Scholar ha vuelto a ser comentado durante la discusión acerca de la opacidad de Google Scholar en el posicionamiento de los resultados. Sin embargo. como una ayuda para comprender mejor el contenido de los artículos y trabajos académicos y mejorar así su precisión. sin la necesidad además de disponer de conocimientos informáticos excesivamente profundos. Los autores depositaron seis documentos falsos en un repositorio institucional. En la sección de bibliografía se incluyeron adicionalmente de forma masiva referencias bibliográficas reales a diversos autores. que al autocitarse entre ellos de forma masiva terminaron por convertir a este autor en el más citado de la historia. posible. Estos experimentos demuestran que la manipulación de citas y otros indicadores bibliométricos. Los autores indican cómo lograron incrementar la posición de documentos científicos manipulando artificialmente el número de citas. Delgado López-Cózar. provocando que estos documentos aparecieran en búsquedas para las que no eran relevantes. Idealmente. firmados por un autor inexistente. los autores indizaron un conjunto de documentos en Google Scholar con cierto texto invisible. el ASEO debería ser considerado. desde el punto de vista de los motores de búsqueda académicos. Google Scholar detectó los seis artículos y atribuyó las citas falsas a los autores reales. Robinson-García y Torres-Salinas (2014) realizaron un experimento para analizar la capacidad de Google Scholar para detectar la manipulación de citas. así como la posición en los resultados de búsquedas es posible en Google Scholar. que aparecieron instantáneamente en sus perfiles académicos. Este hecho puede tener un efecto devastador en procesos de evaluación y . mejorando de esta forma los indicadores bibliométricos asociados al impacto de sus trabajos.

Control personal Si recordamos algunas de las funcionalidades descritas en el capítulo 6 (como las alertas o las recomendaciones) así como algunos de los productos que describiremos en el siguiente bloque (Google Scholar Citations y Google Scholar Metrics). según se mire. Un investigador que manipule sus datos de citas será tarde o temprano descubierto. Acharya no cree necesario realizar ningún tipo de acción específica. la posible manipulación de datos es entendida simplemente como spam. Y la imposibilidad de realizar un control humano de los contenidos albergados en Google Scholar dificulta enormemente la tarea de control. Por ese motivo. La recopilación de toda esta información . desde qué computador. tanto los relacionados con sus búsquedas como con las horas a las que se conecta. aunque ciertas relativamente (el spam científico es mínimo y la comunidad científica se controla). Es posible que el poco personal dedicado a Google Scholar impida desarrollar prácticas anti-spam. habrá que observar cómo se desarrollan los acontecimientos a corto y medio plazo para valorar con mayor tino la magnitud de esta importante amenaza. que significarían tiempo y dinero. entonces su credibilidad profesional desaparecerá y la comunidad científica lo expulsará del sistema.Bloque A · Capítulo 7 · Google Scholar en la balanza selección de personal académico. dejan entrever en parte la filosofía de Google en el sentido de que el propio sistema se autoregule.y en ocasiones definitivo . el sistema puede recopilar y combinar las actividades del usuario en todas las interfaces. En todo caso. 2014). Estas afirmaciones. 167 . el sistema confía completamente en la honestidad del mundo académico.en principio .va dirigida a poder ofrecer servicios completamente personalizados al usuario. En palabras de Anurag Acharya (Van Noorden. financiación de proyectos o promoción institucional en los que se pueda utilizar Google Scholar como fuente complementaria. para el equipo de Google Scholar. Sin embargo.en la toma de decisiones. qué sistema operativo utiliza y qué es lo primero que lee cuando llega a la oficina. Y el porcentaje de spam es todavía lo suficientemente reducido como para tener que tomar acciones concretas. al menos por el momento. pues el número de citas es relevante . pudiendo conocer todo tipo de datos. Conocer sus gustos para poder servirle mejor o para poder equivocarse menos en sus recomendaciones (especialmente en las no gratuitas). Google Scholar recopila una importante cantidad de información del usuario. Si el usuario además inicia la sesión en Google Chrome y tiene Google GMail abierto.

torproject.org 7 https://www. razón por la cual no desean dejar rastro alguno de su navegación por la Web. la dependencia en Google es tal vez excesiva hoy en día. como pueden ser Mendeley o ResearchGate. entre otras. Googlelización Aunque Google Scholar es un producto gratuito. el hecho de ser un motor de búsqueda académico sin publicidad incorporada impide de alguna forma la pérdida de excesivo control sobre la información personal que el usuario pudiera tener en el buscador general. la recopilación incluso por parte de Google Scholar de tanta información sobre los usuarios debería concienciarnos acerca del posible uso que la compañía privada pudiera hacer de ellos. existen pocos sistemas que realmente lo permitan. total o parcialmente? Cuestiones que debemos tener siempre presente a la hora de depositar nuestra plena confianza en un sistema. que se rige además por la legislación del Estado de California. las plataformas que salvaguardan nuestros datos de navegación suelen ser utilizadas en un alto porcentaje por personas que están realizando tareas de dudosa legalidad. No obstante. más si tenemos en cuenta el tamaño del equipo de trabajo. que pueden aportar información complemen 5 https://duckduckgo. la gran cantidad de servicios y productos que Google ha deshabilitado a lo largo de los últimos años (baste recordar a iGoogle o Google Reader. Por ello. ¿Qué ocurriría si Google Scholar dejara de existir? ¿Y si pasara a ser un servicio de pago. si no tomara ciertas precauciones. Aunque el resto de bases de datos bibliométricas (productos pertenecientes a empresas privadas como Thomson Reuters o Elsevier) no están exentas de este mismo problema. Además.semanticscholar. en los Estados Unidos de América. En el caso de Google Scholar. no debemos olvidar que Google es una compañía privada.com 6 https://www. no podemos más que aplaudir tanto el desarrollo de nuevos motores de búsqueda (como Semantic Scholar) 8 como de otras plataformas sociales académicas.168 La revolución Google Scholar Aunque es cierto que existe la posibilidad de navegar de forma segura (los navegadores van incorporando esta opción).org .pinterest. La excesiva dependencia en un solo producto puede ser negativa. Lamentablemente. Hoy día destacan por ejemplo DuckDuckGo 5 o sistemas más complejos como Tor 6. por ejemplo) 7 no permite ser muy optimista al respecto. Nada asegura la pervivencia del buscador.com/googlegraveyard/google-graveyard 8 https://www. minúsculo dentro de un gigante como Google.

upc.microsoft.Bloque A · Capítulo 7 · Google Scholar en la balanza taria y que debemos tener igualmente en cuenta como herramientas de análisis y evaluación.edu 169 . Del mismo modo se lamenta la desaparición silenciosa de Microsoft Academic Search (Orduña-Malea et al. y Microsoft Academic Search (http://academic. El sistema FUTUR 10. de la Universitat Politècnica de Catalunya. 9 Los rumores finalmente se confirmaron. los repositorios institucionales deberán dar un paso adelante para proporcionar igualmente datos científicos de valor añadido en abierto.com) volvió a nacer en marzo de 2016. aunque existen rumores oficiales acerca de su reaparición a lo largo de 2016 9. research. Finalmente. para no convertirse en auténticos cementerios de PDFs. 2014). 10 http://futur. es un fantástico modelo a seguir en el “futuro”.

.

Bloque B La familia Google Scholar: Productos derivados oficiales e independientes .

.

2000b. Por esta razón. que son puramente bibliométricos) como en su materialización (diferente política. 2012b). 2000c. Igualmente hemos descrito su funcionamiento interno. indización. los análisis del producto no tardaron en aparecer. 2012a) y Jacsó (2012a. Un nuevo servicio bibliométrico en acceso abierto El 1 de abril de 2012 Google Scholar sorprende a la comunidad bibliométrica con la aparición de un nuevo producto. GSM es una herramienta distinta tanto en su concepción (producto híbrido [bibliométrico y bibliográfico] frente a JCR y SJR. Este segundo bloque está dedicado en exclusiva a la descripción de los principales productos derivados de Google Scholar. arquitectura y presentación formal). del impacto en el mercado de los buscadores académicos y en el de la evaluación de la investigación. 2000d. Finalmente. los criterios de indización que se siguen y sus principales características y servicios. Se trataba de un ranking de publicaciones científicas ordenado en función del h-index a partir de los datos de citaciones de Google Scholar.Capítulo 8 Google Scholar Metrics: El impacto de las revistas científicas El bloque A de este libro ha estado dedicado a la descripción de Google Scholar. destacando especialmente los trabajos de Cabezas-Clavijo y Delgado López-Cózar (2000a. accesible desde la opción “Metrics” del menú superior de la página de inicio del buscador. cobertura. De ese modo hemos hablado de su origen y evolución. El producto se presentaba con una serie de características y funcionalidades que lo hacían único a cualquier otro ranking de revistas previamente conocido. . y que pasó a conocerse como Google Scholar Metrics (GSM). En este capítulo 8 nos centraremos en Google Scholar Metrics mientras que el Capítulo 9 estará dedicado a Google Scholar Citations. el capítulo 10 mostrará nuevos productos independientes.

y se podía acceder igualmente a los artículos que contribuían al h-index Tanto Jacsó como Cabezas-Clavijo y Delgado López-Cózar detallan algunas de las importantes limitaciones del sistema. ordenados por el número de citas recibidas por artículo. Pulsando en el h-index correspondiente. se mostraban un máximo de 20 resultados por consulta. coreano. portugués. El usuario podía de este modo localizar una publicación. Finalmente. a pesar de sus conocidas limitaciones. algunas de ellas heredadas de los errores de Google Scholar y otras propias del nuevo producto: —— La categorización por idiomas no tiene precedentes en la bibliometría. —— Revistas con al menos 1 cita recibida para los artículos publicados en el período 2007 . el criterio de ordenación se basaba en el h-index (relativo a los últimos 5 años). japonés. chino. Por otra parte. sencillo. Así mismo. francés. . de forma que Google Scholar se decantaba por el uso de este indicador. simple y robusto frente a los errores. incluía la posibilidad de ordenar por el h-index median (mediana del número de citas que contribuyen al h-index calculado). el sistema mostraba un listado de las 100 revistas con mayor h-index. español. De forma complementaria a la categorización por idiomas. dejaba relucir el escaso conocimiento del equipo de Google Scholar del mundo de la bibliometría y de las publicaciones académicas. el sistema mostraba a su vez el conjunto de artículos que habían contribuido a ese valor. pulsando en el título de cada artículo se podía acceder al texto completo (si estaba disponible). alemán. original sin duda. En este caso.174 La revolución Google Scholar La cobertura de Google Scholar Metrics se basaba en los siguientes criterios: —— Revistas con al menos 100 artículos publicados en el período 20072011. tal y como remarcan Cabezas-Clavijo y Delgado López-Cózar en su informe de urgencia de 2012. aunque ésta no estuviera incluida en el Top 100 de su idioma. holandés e italiano). Las revistas se encontraban categorizadas por idiomas (inglés. Estas restricciones pretendían potenciar las publicaciones activas con una productividad media-alta (20 artículos al año) en un período reciente de 5 años.2011. Esta decisión. Al seleccionar un idioma cualquiera. el sistema proporcionaba un buscador interno mediante el cual el usuario podía buscar directamente por palabra clave.

175 . Este último punto. que aparecen mezclados junto con las revistas. reconocen la singularidad del producto. de indudable interés metodológico. la adopción del h-index. Este importante hecho es indicado tanto por Jacsó (2012b) como por Ortega (2014). con graves problemas en su configuración y funcionamiento. Sin embargo. Google Scholar Metrics diferencia entre la versión de un artículo publicada en una editorial y la versión depositada en un repositorio. —— En algunos casos. los datos mostrados no son reproducibles manualmente. aunque con diferente descripción bibliográfica. 2012). —— Control de calidad: los errores bibliográficos en los registros de Google Scholar no se habían corregido (identificación de autores. como son los repositorios temáticos o series de monografías o informes técnicos (Delgado López-Cózar y Robinson-García. que lo convierten en una herramienta inadmisibile para propósitos evaluativos. comparar en una misma dimensión ambos productos carece de validez científica. Estas importantes limitaciones llevan a Delgado López-Cózar y Cabezas-Clavijo (2012) a definir el producto como inmaduro. plantea a Delgado LópezCózar y Robinson-García (2012) la realización de un análisis exploratorio a partir de una muestra formada por los 40 artículos más citados que contribuyen al h-index en cuatro repositorios incluidos en Google Scholar Metrics (RePec. Los autores advierten que el 89% de los documentos de la muestra depositados en los repositorios habían sido previamente publicados en revistas.Bloque B · Capítulo 8 · Google Scholar metrics —— Falta absoluta de estandarización: las publicaciones aparecen duplicadas bajo diferentes nomenclaturas y variantes e incluso en diferentes idiomas. revistas y otros datos bibliográficos como la fecha de publicación). y no en el de los repositorios. Social Science Research Network y NBER). Arxiv. Manteniendo el mismo número de citas recibidas. generando errores en el h-index obtenido. el artículo se incorpora como documento citado tanto a la revista como al repositorio. por una parte. Por otra parte. las citas recibidas por dichos artículos deberían influir en el impacto de las revistas. Por tanto. En el caso de los repositorios. así como el papel que puede jugar en la evaluación de revistas en Ciencias Sociales y Humanidades y en el fomento de una sana competitividad en el mercado de los productos de evaluación de revistas. —— Cobertura: el sistema incorpora una variedad de tipologías documentales que difícilmente son comparables.

Life Sciences & Earth Sciences. La principal novedad de esta nueva versión (que mantenía el intervalo temporal. y no para el resto. es que introducía una clasificación temática de las revistas. una misma revista puede estar integrada en diferentes categorías o subcategorías. Engineering & Computer Sciences. arXiv Digital Libraries quedaría clasificada en Social Sciences – Library & Information Science. pero actualizaba las citas recibidas hasta el 15 de noviembre). es decir. esta categorización se proporcionaba (y sigue proporcionando en la actualidad) únicamente para las revistas en inglés. entre las que se destaca la clasificación más granular de los repositorios. se anunciaba una actualización de la base de datos en la que se eliminaban algunas de las deficiencias apuntadas en los estudios anteriormente citados. el 15 de noviembre de 2012. En concreto 8 grandes áreas temáticas (Business. La respuesta de Google Scholar a las críticas siempre constructivas que se han realizado desde los numerosos informes técnicos y documentos de trabajo elaborados por el grupo de investigación EC3 ha sido siempre tan inmediata como silenciosa. Chemical & Material Sciences. y arXiv Cosmology and Extragalactic Astrophysics en Physics & Mathematics – Astronomy & Astrophysics). Arxiv). el sistema visualizaba las primeras 20 publicaciones. la clasificación lingüística predomina frente a la temática. contestando de este modo a las críticas previas recibidas. De este modo. Humanities. en la que destaca la inclusión de la posición de una revista en las diferentes categorías temáticas en las que puede estar incluida (figura 40 b). apenas siete meses y medio después de la primera versión. la polijerarquía está aceptada en el sistema. Y para cada una de estas categorías y subcategorías. Health & Medical Sciences. Economics & Management. Physics & Mathematics. y Social Sciences) y 313 disciplinas. especialmente en el caso de repositorios que engloban a una gran cantidad de disciplinas (por ejemplo.176 La revolución Google Scholar Pero Google Scholar no había dicho todavía la última palabra. aparte de la inclusión de nuevas revistas. Finalmente. Delgado López-Cózar y Cabezas-Clavijo (2012b) desgranan esta nueva versión identificando adicionalmente una serie de mejoras. . muy similar en prestaciones a la existente en 2012. Lamentablemente. Es decir. En la figura 40 se observa la interfaz en la actualidad (septiembre 2015). Literature & Arts. que ahora se incluían segmentados en distintas colecciones ofreciendo así una visión menos sesgada de su impacto. Fiel a su filosofía empresarial. las distintas colecciones podían clasificarse en distintas categorías o subcategorías (por ejemplo.

Esta segunda versión mejorada de Google Scholar Metrics abría pues el camino a posibles estudios por disciplina y por tanto a facilitar de este modo la comparación de los indicadores proporcionados (básicamente h-index) con los correspondientes a otras bases de datos. Listado de revistas por idioma (a) y de artículos por revista (b) La existencia de dos versiones en un mismo año presentaba la oportunidad a Orduña-Malea y Delgado López-Cózar (2014) de medir la estabilidad de los indicadores bibliométricos entre las fechas correspondientes (abril y noviembre de 2012). 2012d) donde 177 . Los autores observan cómo en apenas siete meses el h-index de las revistas incrementa un 15%. aunque con una tasa de crecimiento diferente por idioma. Interfaz de Google Scholar Metrics (versión 2015). En esa línea se sitúan los trabajos de Cabezas-Clavijo y Delgado López-Cózar (2012c. de una forma mucho más sencilla y rápida que antaño.Bloque B · Capítulo 8 · Google Scholar metrics Figura 40.

Por otra parte. En este caso. en la que se volvía a ajustar el marco temporal (2009-2013). El 24 de julio de 2013 llegaría la tercera versión del producto 1. llevan a Delgado López-Cózar y Cabezas-Clavijo (2013) a definir Google Scholar Metrics como una herramienta de indudable ayuda tanto para autores como editores a la hora de localizar las revistas nucleares de un área o de conocer el impacto de una publicación específica en una ventana de citación de 5 años (más adecuada para las ciencias sociales).es/2014/06/2014-scholar-metrics-released.com. su gratuidad y sus criterios alternativos de ranking (como la mediana del h-index en el período). Así mismo.html . Por otra parte. Delgado López-Cózar y Repiso (2013) analizan 277 revistas en el área de Comunicación. 2013). por lo que resultaba imposible la realización de estudios evolutivos si con anterioridad no se habían almacenado los datos. incapaz de recuperar todas las revistas pertinentes a través de una consulta con la raíz de palabras comunes (por ejemplo “cardiol”). se constataba que las actualizaciones de datos suponían un borrado de las versiones anteriores. De forma similar.com.html 2 http://googlescholar.blogspot. aunque todavía con importantes limitaciones. aunque los distintos errores y limitaciones denunciados con anterioridad seguían vigentes. Se detectaban artículos sin enlace al texto completo. Cabezas-Clavijo y Delgado López-Cózar (2013) realizan una comparativa para las revistas en biomedicina observando cómo Google Scholar (a través de los ojos de Google Scholar Metrics) obtenía unos valores de h-index un 30% superiores a los obtenidos por WoS y Scopus.178 La revolución Google Scholar se demuestra como los criterios de indización adoptados por GSM dejan fuera a casi un 40% de las revistas indexadas en Google Scholar (635 revistas de 1038 identificadas en GS).blogspot. duplicados. Las mejoras del producto. 1 http://googlescholar. Los autores destacan la capacidad de Google Scholar Metrics para identificar las revistas principales de la disciplina. podrían constituir un desafío futuro para otros productos ya establecidos en el mercado. Con ello Google dejaba claras sus intenciones de mostrar datos relativos a los últimos 5 años (Cabezas-Clavijo y Delgado López-Cózar. los autores observan cómo Google Scholar Metrics proporciona un h-index en promedio 47% y 40% superior que Scopus y WoS respectivamente. doblar la cobertura general de la misma así como reducir el sesgo hacia el idioma inglés. con errores en el título o problemas graves en el buscador interno. cuya principal novedad sería la actualización del marco temporal (2008-2012).es/2013/07/2013-scholar-metrics-released. El 26 de junio de 2014 aparecía la cuarta versión de Google Scholar Metrics 2.

aunque su cálculo preciso es imposible de llevar a cabo debido tanto a las limitaciones del buscador interno como a las restricciones impuestas en la visualización de resultados.2% (118) son repositorios temáticos. lo que supone aproximadamente un 45% del número total de publicaciones en España. lo que fija en 5. Los autores estiman que el número total de revistas incluidas en Google Scholar Metrics (versión 2014) es probablemente superior a 40. En el caso español. Circadian Rhythms & Sleep. Esta nueva versión es descrita y analizada de forma completa por Martin-Martin et al (2014). con una serie de ventajas (como la gratuidad.418 el número de publicaciones únicas.5% de los registros corresponden con revistas académicas.3% (232) son conferencias y el 2.000 publicaciones. mientras que el 4. Adicionalmente.000. Los autores proponen finalmente una serie de propuestas de mejora con el fin de eliminar la etiqueta “de bajo coste” (Tabla 7): 179 . mostrando únicamente 983 revistas escritas en otros idiomas (lógico si tenemos en cuenta que las categorías solamente están habilitadas para las revistas escritas en inglés). Martin-Martin et al (2014) no dudan en calificar Google Scholar Metrics como un producto “low cost”.7% (1. el inglés domina claramente con el 89% de las publicaciones (4. Finalmente. and Cryogenics & Refrigeration). en lo que supone el trabajo seguramente más exhaustivo realizado hasta la fecha. el 93. Back & Spine Health. Lipids. Real-time & Embedded Systems. se estiman sobre las 1.435).Bloque B · Capítulo 8 · Google Scholar metrics caracterizándose por la continuidad con la versión anterior. sin mayor novedad que la desaparición de algunas subcategorías (Microscopy. simplicidad) pero una serie de limitaciones importantes si se compara con las prestaciones de otros productos comerciales.338) están clasificadas en más de una categoría. Dadas las características del producto. European Studies.100 revistas). el informe contabiliza el número de publicaciones que pueden ser visualizadas en la versión 2014 sin necesidad de utilizar el buscador interno (un total de 7. cobertura. Entre este número de publicaciones. de las que el 24.

La posibilidad de seleccionar diferentes marcos temporales según la categoría ofrecería una visión más justa del impacto de las publicaciones. país. para conocer la evolución del impacto de las publicaciones en el tiempo. el índice de inmediatez o las citas normalizadas. fundamental para verificar los datos proporcionados por Google Transparencia en la clasificación Definir los criterios seguidos para la creación de las categorías y subcategorías. títulos erróneos. en la medida de lo posible. etc. por idioma. enlaces incorrectos. especialmente para las revistas de ciencias sociales y humanas Versiones previas Permitir el acceso y consulta de las versiones previas. Opciones de búsqueda Permitir la consulta. Ordenación de resultados Permitir ordenar los resultados por título de la publicación. tanto por disciplina como por consulta específica. La última versión hasta la fecha de Google Scholar Metrics data del 25 de junio de 2015.). Comunicación con los usuarios Permitir a los usuarios una opción para informar acerca de errores (duplicados. Recomendaciones de mejora para Google Scholar Metrics PROPUESTA DETALLE Indicadores bibliométricos Incluir otros indicadores como la tasa de autocitación de las revistas. incluyendo aquellos con 0 citas. Master list de publicaciones Proporcionar la lista detallada de publicaciones. en el anuncio de esta nueva . además de por idioma. Exportación de resultados Permitir la descarga y exportación de resultados. además de por título de revista. idioma y editorial. valor de indicadores.180 La revolución Google Scholar Tabla 7. así como por la eliminación de muchos de los errores constatados y descritos en el informe de Martin-Martin et al (2015). Personalización del período de citación por categoría Los diferentes patrones de publicación y citación entre las diferentes categorías aconsejan a utilizar diferentes ventanas de citación por disciplina. Este hecho muestra. que el equipo de Google Scholar sigue los análisis que sobre sus productos se realizan para mejorarlos y corregirlos. por país y editorial. Tiempo real Actualizar a tiempo real los indicadores (tal y como sí hace Google en los perfiles académicos) Opciones de navegación Permitir la navegación. Por ejemplo. especialmente el número de conferencias y repositorios incluidos. país y editorial Ampliar límite de resultados No restringir o ampliar el límite de 100 resultados por idioma y 20 resultados por categoría/subcategoría y por búsqueda manual. en la que el marco temporal se actualiza a 2010-2014. Master list por publicación Incluir el número de documentos por publicación. una vez más. Esta versión destaca fundamentalmente por la continuidad con las versiones anteriores.

Este dato. advierten hasta 959 formas de referirse a la revista PNAS (Proceedings of the National Academy of Sciences). En la figura 41 se puede observar la interfaz actual de Google Scholar Metrics (versión 2015). en el que ya advierten de la enorme cantidad de variantes existentes para referirse a una publicación. el equipo de Google Scholar advierte de los problemas existentes con el control y normalización de los títulos de revistas. Por ejemplo. sin duda significativo. constituyendo en la actualidad un servicio más completo y de mayor calidad que el ofrecido en su primera versión.Bloque B · Capítulo 8 · Google Scholar metrics versión. por ejemplo. El problema de la normalización ha estado no obstante presente desde el lanzamiento del producto. en este caso para la subcategoría de Library & Information Science: Figura 41. viene definitivamente a demostrar la dificultad de realizar un control automático sobre un conjunto dinámico de revistas y publicaciones en un producto gratuito realizado por pocas personas. aunque algunas de sus limitaciones más importantes (especialmente el número de revistas mostrado por categoría y la restricción del uso de categorías al idioma inglés) impiden la generalización de su uso. En cualquier caso. la corrección de errores y la robustez del producto han ido mejorando paulatinamente. Interfaz de Google Scholar Metrics (versión 2015) 181 . constatan la existencia de 9.000 formas diferentes de referirse a la Conference on Computer Vision and Pattern Recognition.

182 La revolución Google Scholar En lo que respecta al ranking general de revistas para el idioma inglés. Ayllón et al 2014. ocultas en primera instancia. portugués y español. Ayllón. No obstante. 2015) en el que las publicaciones se clasifican por áreas temáticas y se ordenan en función del h-index. Ayllón. En la Tabla 8 se muestra. Tabla 8. Los datos reflejan claramente el predominio del inglés. desde el Grupo EC3 se viene realizando un informe anual de las revistas científicas españolas según Google Scholar Metrics (Delgado López-Cózar. Delgado López-Cózar. Ruiz-Pérez. constituyendo un esfuerzo de gran utilidad para conocer la presencia e impacto de las revistas españolas en este buscador. H-index por idioma en Google Scholar Metrics IDIOMA H-index H-index Median Inglés 377 130 Chino 57 27 Portugués 45 15 Alemán 24 10 Español 34 13 Francés 22 9 Italiano 11 4 Japonés 12 6 7 2 Holandés Pese al enorme sesgo mostrado hacia el inglés (no en el sentido de impacto sino en el de la aplicación de subcategorías). seguido por el chino. Ruiz-Pérez 2013. . a modo de ilustración.000 revistas son listadas cada año (Figura 42). siendo la revista con mayor puntuación en Google Scholar Metrics. la combinación de distintas disciplinas en este ranking invalida cualquier tipo de comparación seria. En este sentido. Le sigue en segundo lugar The New England Journal of Medicine (328) y Science (316) en tercer lugar. Nature ocupa la primera posición con un impresionante valor de h-index igual a 377 en los últimos 5 años. el h-index más elevado para cada idioma. 2013. así como la mediana de las 100 primeras publicaciones mostradas por idioma. En torno a 1. el buscador interno ha permitido la localización de revistas.

183 . de más países y en más lenguas que los productos tradicionales de revistas patrocinados por Thomson Reuters y Elsevier. Repiso-Caballero. 2013. 2013. Delgado López-Cózar. Delgado López-Cózar. 2014) o la enfermería (Reina. en más idiomas. Y en ambos casos se obtienen las mismas conclusiones: GSM identifica más revistas.Bloque B · Capítulo 8 · Google Scholar metrics Figura 42. Número de revistas científicas españolas indizadas en Google Scholar Metrics En la misma línea. se ha explorado la capacidad de GSM para cubrir revistas en disciplinas como la comunicación (Repiso-Caballero. 2014).

.

Estas plataformas permiten la creación online del perfil de cada usuario en el que éstos pueden depositar sus trabajos científicos así como remarcar sus habilidades. tanto cotidianas y personales como profesionales. hasta pequeños widgets que permiten la incorporación en una página de un listado de publicaciones generado en otras aplicaciones externas. experiencia y actividades. discutir de forma privada o pública y seguir las publicaciones de algún autor determinado). que sirven al fin y al cabo de reclamo para facilitar la interacción entre usuarios. Se pueden encontrar desde plugins específicos para gestores de contenidos web como Wordpress que permiten la construcción de una página personal académica. En la actualidad existe una amplia variedad de aplicaciones que permiten a un académico la construcción de su currículum investigador en la Web. transformando la forma y modo en que nos comunicamos los unos con los otros. Instrumentos tan aparentemente sencillos y perennes como un currículum académico han sufrido igualmente una transformación justo delante de nuestros ojos. Así mismo han proliferado las llamadas redes sociales académicas (como ResearchGate. que se fundamentan en las interacciones entre académicos (el sistema les permite compartir material. pues éstos tenderán a establecer algún tipo de interacción con otros usuarios con interereses comunes. algunos repositorios (tanto temáticos como institucionales) han comenzado a generar perfiles académicos a par- . Academia.edu o Mendeley). sino de los perfiles académicos en la Web.Capítulo 9 Google Scholar Citations Los perfiles académicos en la Web Completamente sumergidos en la segunda década del Siglo XXI. la Web se ha integrado en nuestras actividades. Aunque menos usuales. Y no hablamos de la simple utilización de un procesador de textos para crear un CV (esto supondría volver a la época en la que los ordenadores se utilizaban como sustitutos de la máquina de escribir).

Por tanto. sino que el sistema proporciona a) métricas de producción e impacto. dentro del conglomerado de servicios del repositorio RepEC. funcionamiento. describiendo sus principales características. o el servicio Author Citation Profiles.186 La revolución Google Scholar tir de los datos disponibles en sus plataformas. ventajas y limitaciones. Sin embargo. como por ejemplo la búsqueda asistida de material académico relevante. el servicio de perfiles académicos que pre- . Estos perfiles se caracterizan por hacer uso de la amplia cobertura mundial de la que disponen (los repositorios están limitados a una institución o temática). creación de alertas. con el fin de generar estadísticas de índole bibliométrica a nivel de autor. En este caso podemos destacar el proyecto FUTUR. de la Universitat Politècnica de Catalunya. y c) otros servicios adicionales. se puede observar la existencia de una tendencia clara hacia la creación de un currículum académico online y multiplataforma en el que no sólo aparecen listadas las publicaciones de un autor como en un CV clásico o una página web personal simple. aunque el servicio estaba limitado a un pequeño número de usuarios con el fin de testar sus funcionalidades. Introducción a los perfiles académicos de Google Scholar El 20 de julio de 2011 Google Scholar anuncia la creación de este nuevo servicio de perfiles académicos a través de su blog oficial. b) la posibilidad de interaccionar con los “currículums” de otros investigadores. etc. En este capítulo abordaremos el servicio de Google Scholar Citations. ya abierto para todos los usuarios. Tal y como indica Ortega (2014) en su obra dedicada a los motores de búsqueda académicos. el servicio de perfiles académicos creado por Google Scholar. podemos distinguir una última categoría de perfiles académicos que son creados de forma automática (o asistida) por un motor de búsqueda académico. Entre éstos destacan los perfiles personales de Microsoft Academic Search (desactualizado) y Google Scholar Citations. ya mencionado con anterioridad. Tras unos meses de prueba. así como de las potencialidades del motor de búsqueda que los sustentan para ofrecer servicios de valor añadido. el producto fue lanzado definitivamente el 16 de noviembre de ese mismo año. Tanto las redes sociales académicas como los perfiles académicos de los repositorios se nutren de los documentos que los propios investigadores (o en quien éstos deleguen) han depositado en la plataforma o repositorio. incluido en el producto CitEc (Citations in Economics).

Una vez activado. Todo ello sin contar la plena disponibilidad de la base de datos de Google Scholar como telón de fondo para alimentar los perfiles. cuándo y a qué documentos de un perfil. Difundir las publicaciones científicas y otros trabajos académicos. El sistema detecta automáticamente que existe un perfil público (este concepto será explicado más adelante) cuyo nombre coincide con la cadena de caracteres buscado. Las principales ventajas que el uso de GSC puede aportar son las siguientes: —— —— —— —— —— Mejorar la visibilidad e impacto de un autor. En la figura 43 se ha realizado una búsqueda libre por nombre de autor (baeza-yates) en el cajetín general de Google Scholar. el perfil se encontraba completamente vacío a la espera de que el usuario fuera rellenándolo con sus publicaciones (en principio solamente aquellas indizadas en Google Scholar). los objetivos de Google Scholar se dirijen hacia la localización de material académico y no al posible uso posterior de los datos albergados. Saber quién cita. Estar al día mediante la configuración de alertas personalizadas. resaltándolo de éstos y mostrando los datos más importantes (adscripción y citas recibidas). Además. Conocer y dar a conocer algunos indicadores bibliométricos. no necesariamente el propio.Bloque B · Capítulo 9 · Google Scholar Citations sentaba Google Scholar difería sustancialmente de los existentes hasta la fecha. la idea original de Google Scholar distaba de esa finalidad métrica. Al igual que se ha señalado en capítulos anteriores. La integración de los perfiles académicos en las páginas de resultados ante determinadas búsquedas (Figura 43) proporciona suficientes pistas acerca de la utilidad de estos perfiles en los procesos de búsqueda de información. el sistema lo incorpora en la página de resultados. Aunque la utilización de los perfiles personales (y la ulterior explotación de sus datos) ha servido posteriormente a los investigadores para conocer innumerables aspectos acerca de la producción e impacto de los autores. De este modo. El usuario debía activar personalmente el servicio. Este sistema de recomendación de resultado permite que los usuarios interesados en localizar una o varias obras de este autor (pero tal vez sin una idea exacta de qué obras desea localizar. Estas tres características juntas dotaban a Google Scholar Citations (GSC) de unas propiedades únicas en el mercado de los perfiles académicos online. puede que algunas que traten un determinado tema) puedan filtrar su búsqueda al entrar 187 . el servicio era lo suficientemente abierto y permisivo como para permitir al usuario la creación de cualquier perfil.

Figura 43.google. Este paso es absolutamente obligatorio.google. Acceso al perfil Una vez disponemos de una cuenta de correo electrónico. ya habremos iniciado sesión). A continuación. . Integración de perfiles académicos en Google Scholar <https://scholar. En la figura 44 se muestra este paso de forma gráfica. si es posible. acceso al perfil y creación del perfil). pues sí exigirá un mayor trabajo y cuidado por parte de los usuarios. Se aconseja por otra parte que sea una cuenta personal y no institucional. deberemos pulsar en la opción de menú denominada “My citations”. En este punto. acceder al documento deseado. como Gmail o Chrome. se describen estos pasos de forma más detallada: Creación de la cuenta La creación de un perfil académico exige una cuenta de correo electrónico. en el que les será más cómodo.com>. El principio bastará con tener una cuenta de Gmail creada. accederemos a la siguiente dirección: <scholar.com/scholar?hl=en&q=baeza-yates> Creación de un perfil académico en Google Scholar La creación de un perfil académico es sencilla y consiste en tres pasos (creación de la cuenta.188 La revolución Google Scholar en el perfil académico correspondiente. rápido y seguro localizar y. Seguidamente. El mantenimiento y la calidad de los datos contenidos en el perfil ya será harina de otro costal. debemos iniciar sesión registrada en Google (si hubiéramos iniciado sesión previamente en algún producto o servicio de Google.

Se aconseja siempre utilizar el estilo de firma normalizado (independientemente de todas aquellas variantes de firma que el autor o 189 .Bloque B · Capítulo 9 · Google Scholar Citations Figura 44. y estemos por tanto en el proceso de creación del mismo. Registro de un perfil en Google Scholar Citations Veamos estos campos más detenidamente: En cuanto al campo “Name”. Perfil Los campos que debemos cumplimentar en este primer paso son los siguientes: nombre. Acceso a Google Scholar Citations Creación del perfil En el caso de que sea la primera vez que accedemos al perfil. email de verificación. áreas de interés y página personal (Figura 45). al pulsar en “My Citations” accederemos al formulario de registro del perfil formado por tres pasos: perfil. artículos y actualización. afiliación institucional. el usuario deberá incluir su nombre completo. Figura 45.

empresa. éste podrá 1 Cuidado en todo caso con esta práctica. por ejemplo 1. el país. centro de investigación. El campo del correo electrónico es obligatorio. El campo “Affiliation” debe servir para que los autores incluyan su institución. se recomienda incluir la posición o cargo ocupado por el investigador. El nombre incluido en este campo será tanto el nombre que aparecerá posteriormente en el perfil como la cadena de caracteres que se utilizará como búsqueda por defecto para localizar trabajos a incluir en el perfil. Nótese que no existe restricción alguna para introducir el campo nombre. Durante julio de 2015. el equipo de Google Scholar Citations incorporó un servicio de afiliación institucional controlada (que será comentado en secciones posteriores). por lo que se aconseja no extenderse demasiado. como por ejemplo el nombre de una revista. no mostrándolo en ocasiones en la página principal de resultados tal y como veíamos en la Figura 42. Es decir.) y finalmente. Con el fin de que este sistema de control de autoridades funcione con mayor precisión. la validación solamente será necesaria para convertir el perfil en público. El sistema tiene una longitud limitada de caracteres. facultad o departamento). de una editorial o de algún grupo de investigación. su unidad (grupo de investigación.190 La revolución Google Scholar autora hayan podido utilizar a lo largo de su carrera) para evitar variantes que puedan impedir una localización completa de contribuciones y citas a éstos. pues Google Scholar detecta que el perfil no es de usuario y limita su visibilidad. El sistema enviará automáticamente un correo a la dirección indicada con el fin de validar la creación de la cuenta (pues cualquier usuario podría incluir una dirección de correo falsa o simplemente de otra persona sin su consentimiento). Sin embargo. su institución (universidad. con el fin de que todos los autores de una misma institución puedan ser localizados y recuperados bajo este campo de forma normalizada. Así mismo se recomienda a las instituciones que desarrollen políticas específicas para estimular el uso de formas estandarizadas. etc. Si el perfil es privado. si todavía tenemos espacio. . instituto de investigación. podría incluirse el nombre de una persona (que será lo más usual) pero también el de otros agentes de investigación. Así mismo. lo que permite que un usuario pueda utilizar otro correo distinto o incluso cumplimentar el perfil de otra persona. Este correo no tiene por qué ser necesariamente el mismo con el que el autor se ha registrado en el sistema. organización. se aconseja a los autores que incluyan en este campo siempre la forma estandarizada de su institución (o al menos la variante adoptada por Google Scholar) en su lengua original (sin traducir).

excepto en temas muy locales y específicos. pues de ello dependerá en una parte importante el buen comportamiento del sistema a la hora de localizar la producción y citas correspondientes con las que se alimente el perfil académico.es/citations?user=fd_7rQ4AAAAJ> no posee datos de afiliación. lo usuarios podrán acceder a la página personal. De este modo. aunque nunca se valide el correo enviado a la dirección de correo electrónica incluida en este campo. En este caso. El sistema permite la incorporación de hasta 5 keywords. pues aparecerá en el perfil público (por tanto. una vez el perfil esté creado.Bloque B · Capítulo 9 · Google Scholar Citations existir. 2 Por ejemplo. Todos estos campos podrán ser posteriormente editados. el campo “Homepage” está destinado a que los autores incorporen el URL de su página personal académica. sí se recomienda en este caso la adopción del término en inglés. centro de investigación. En todo caso. en caso de que dispongan de ella. 191 . En este caso se aconseja igualmente la utilización de términos estandarizados y en la forma y género adoptados por la mayoría de los usuarios. empresa. como por ejemplo el Derecho. Así mismo. se separa el correo electrónico personal de control del perfil. Pese a ello. recomendamos encarecidamente cumplir con las normas indicadas por el equipo de Google Scholar. lo más importante. Pese a los distintos controles de seguridad indicados en este apartado (como el del correo electrónico). Finalmente. si los autores disponen de una página oficial creada dentro del dominio académico de la universidad. mejorando su visibilidad) y. keywords o email verificado. se recomienda incorporarla. cualquier otro sitio web creado de forma independiente será de gran utilidad. esta página será indizada por los robots de Google Scholar e incorporada dentro del espacio académico web. el perfil público <https://scholar. empresa u organismo en el que trabajen. siempre se recomienda tomarse el tiempo necesario para cumplimentarlos con el mayor rigor.google. En este caso el sistema recomienda que se utilice una cuenta de correo electrónico institucional (universidad. El campo “Areas of interest” sirve a los autores para incluir palabras clave que describan sus intereses académicos o sus principales líneas de trabajo e investigación. organización. en la actualidad existen perfiles públicos que los incumplen 2. etc. Por tanto. Si se desea una mayor proyección o visibilidad internacional. y el correo institucional que sirve para validar la cuenta. institución.). los posibles contenidos académicos incorporados a este sitio web podrán ser incluidos en el perfil.

192

La revolución Google Scholar

Artículos
Una vez tengamos cumplimentados todos los datos descriptivos podremos seguir al siguiente paso del proceso de creación del perfil, los
artículos. Esta segunda pantalla está dividida en cuatro zonas: el tipo
de búsqueda (por artículos o por grupos de artículos), el buscador, los
resultados y las métricas asociadas a los resultados (Figura 46).

Figura 46. Búsqueda de artículos en un perfil en Google Scholar Citations

El sistema permite la búsqueda tanto de artículos individuales como
de grupos de artículos (agrupados por autor). Por defecto, en el cajetín
de búsqueda aparecerá la cadena de caracteres que hayamos introducido en el campo “Name” del paso anterior. Por ejemplo, si seleccionamos
la opción de añadir artículos, el sistema devolverá todos aquellos artículos relevantes ante esta búsqueda. Al lado de cada resultado tendremos
disponible una casilla para seleccionar un artículo e incluirlo en el perfil.
Una vez se añada un artículo, los datos correspondientes se actualizarán en la parte izquierda de la pantalla, mostrando tanto el número
de artículos incorporados al perfil hasta ese momento como el número
total de citas recibidas por dichos artículos.
El cajetín de búsqueda está totalmente habilitado para que podamos
realizar distintas búsquedas, y no sólo la correspondiente al nombre del
autor. Aunque las opciones no son tan extensas como las disponibles en
Google ni en Google Scholar, puede servir para filtrar más adecuadamente las búsquedas. En este momento de la creación del perfil se recomienda realizar una búsqueda muy general e incluir algunos pocos registros
al perfil, con el fin de finalizar el proceso de creación del mismo.
Más adelante ya tendremos tiempo para volver a esta pantalla de
edición y dedicar una buena parte de nuestro tiempo a ir probando con

Bloque B · Capítulo 9 · Google Scholar Citations

paciencia nuevas consultas, identificando artículos y mejorando la cobertura y precisión de los datos de nuestro perfil. En la sección dedicada
a la gestión del perfil volveremos por tanto a este importante punto.
Actualizaciones
Finalmente llegamos al último paso para la creación del perfil. En este
caso el sistema nos solicita que decidamos el proceso de actualización
del perfil. Se puede optar por una actualización automática o manual
(Figura 47).

Figura 47. Modos de actualización de un perfil en Google Scholar Citations

La actualización automática supone que el sistema se autoregula.
Dados los artículos incluidos en el sistema, los intereses incorporados
como keywords y el nombre del perfil, el sistema es capaz automáticamente de identificar nuevas aportaciones e incorporarlas automáticamente al sistema, actualizando con ello los datos bibliométricos pertinentes.
Por el contrario, la opción manual implica que el sistema no introduce ningún registro sin el consentimiento previo del autor. Para ello se
envía un correo electrónico a la dirección marcada por el usuario cada
vez que un nuevo recurso tiene altas probabilidades de corresponder
con una contribución a ser incluida en el perfil. De este modo el usuario
puede validar o no dicha inclusión.

193

194

La revolución Google Scholar

En términos generales, el sistema automático se recomienda a usuarios que tengan el perfil muy cuidado y pulido (las incorporaciones serán
más fiables y acertadas) y que lo revisen con cierta periodicidad. De esta
forma, ante la incorporación de un registro equivocado, podrían darse
cuenta y eliminarlo manualmente a la mayor brevedad. Por el contrario,
para aquellas personas que no actualicen demasiado el perfil, se recomienda una actualización manual, pues la incorporación de muchos registros equivocados y la no edición o eliminación de éstos por el usuario
podría dar lugar a una mala imagen pública del perfil.
Una vez elegida la modalidad de actualización del perfil, el usuario
ya podrá finalizar el proceso y acceder al perfil académico creado. En la
figura 48 (arriba) se muestra la pantalla de un perfil ficticio creado para
un investigador. Como podemos observar, el perfil está completamente
vacío (no se ha incorporado ningún artículo en la fase de creación) y
es privado. En la figura 48 (abajo), se muestra el perfil completamente
creado y público.

Figura 48. Perfil privado (arriba) y público (abajo) en Google Scholar Citations

Bloque B · Capítulo 9 · Google Scholar Citations

Un perfil privado significa que solamente podrá ser visible por el
usuario que lo haya creado, a partir de su pantalla de inicio en Google
Scholar una vez ha iniciado sesión en el navegador. Nadie más podrá acceder a este perfil ni a la información que contiene. Del mismo modo, no
aparecerá en los resultados de ninguna búsqueda. Por el contrario, un
perfil público podrá ser accedido libremente por cualquier usuario sin
necesidad alguna de haber iniciado sesión. Este perfil aparecerá igualmente en los resultados de búsqueda. Además, Google Scholar nos marcará la existencia de un perfil público subrayando el nombre del autor
correspondiente en el registro bibliográfico de un resultado.
Los perfiles permanecen privados por diversas razones. Por ejemplo,
puede que estén en plena construcción y sus responsables no deseen
hacerlos públicos hasta que estén completamente construidos. Es asimismo posible que se estén realizando pruebas o ejercicios con fines de
formación (como el ejemplo de la figura 48). En otros casos, algunos investigadores desean mantenerlo únicamente para un uso personal (conocer su impacto), pero no desean que otras personas puedan acceder a
él, bien porque no deseen entrar en un juego de comparaciones o competencia con colegas o simplemente porque los datos tal vez son peores
de los esperados y no se desea dar una mala imagen académica pública.
En cualquiera de los casos, creemos con sinceridad que los profesores de universidades e instituciones públicas deberían mantener estos
perfiles públicos en aras a ofrecer una mayor transparencia hacia los
ciudadanos acerca de su quehacer como investigadores, y que estas instituciones deberían establecer las actividades necesarias tanto de formación como de difusión para que sus investigadores mantuvieran un
perfil actualizado, con el fin de aumentar la visibilidad académica de la
institución.

Gestión de un perfil académico en Google Scholar

Una vez el perfil está creado correctamente, el siguiente paso consiste en su edición, gestión y mantenimiento. Con el propósito de ilustrar
este proceso, utilizaremos un perfil académico real, en este caso perteneciente a uno de los autores (Figura 49). De este modo podremos
ilustrar todo el proceso de edición personal sin necesidad de recurrir a
perfiles de otras personas o perfiles no existentes.
En la figura 49 se puede observar la composición de un perfil público
cuando se accede a éste como usuario registrado. Se pueden distinguir
las siguientes cinco áreas:

195

196

La revolución Google Scholar

—— Área personal: información descriptiva del perfil, correspondiente
principalmente a un/a autor/a, aunque podría pertenecer, tal y como
se comentó anteriormente, a otras entidades como revistas, editoriales o grupos de investigación.
—— Buscador interno: este buscador permite localizar perfiles académicos a partir de la búsqueda directa por palabras clave. Es por tanto
diferente al buscador de Google Scholar.
—— Información bibliométrica: se proporcionan diversas métricas de impacto académico.
—— Área de información: contiene los registros incluidos en el perfil.
—— Área de co-autores: muestra los autores que han colaborado con el
autor en las publicaciones incluidas en el área de información.
A continuación desgranaremos cada una de estas áreas con el fin de
conocer al detalle los distintos servicios y opciones de los perfiles académicos de Google.

Figura 49. Perfil público en Google Scholar Citations

Igualmente tenemos la opción de convertir el perfil en privado o público de forma sencilla. Información personal en Google Scholar Citations Por defecto. Por otra parte.es). sino únicamente el dominio (en este caso upv. podemos acceder a la edición manual de esta información (Figura 50). Figura 50. Podemos observar cómo el email de verificación no aparece en su forma completa en la versión pública (figura 50. existen tres campos que aparecen como hiperenlaces en el perfil público: la web personal. la información que aparece es la que el autor introdujo en el proceso de creación del perfil (concretamente en el primer paso). con el propósito de no ofrecer información personal y de validar la afiliación institucional. 197 . la afiliación institucional y las etiquetas correspondientes a las palabras clave.Bloque B · Capítulo 9 · Google Scholar Citations Información personal Si pulsamos en el botón de editar situado en el área de información personal. siendo este proceso siempre reversible. arriba).

y no el nombre del sitio web o el URL. en el momento de redactar estas líneas este sistema adolece de una serie de limitaciones. Cualquier otro sitio web similar (como el perfil público de Mendeley) o página web personal podrán ser incluidos. títulos uniformes erróneos. pues es un lugar donde el autor puede controlar la información que deposita en la web académica. las cinco keywords que el sistema permite como máximo incluir en el campo de áreas de interés se transforman automáticamente en hiperenlaces que permiten reunir en una nueva página de resultados a todos los perfiles que compartan una misma etiqueta. Estas limitaciones se deben fundamentalmente a que el control institucional se realiza a partir del cumplimiento de dos criterios: introducción de una variante aceptada de la institución en el campo de afiliación y la inclusión de un correo electrónico institucional que concuerde con esta afiliación. Aparte de las innumerables ventajas que supone disponer de un control de autoridades para las instituciones. tales como errores metodológicos. el autor debe incluir un único URL válido (no se pueden incluir dos sitios web). En la parte superior de la figura se muestra como esta afiliación (y sólo esta parte de toda la información contenida en este campo de afiliación) se ha transformado en un hiperenlace. podemos observar cómo en la parte inferior de la figura 50 se ha introducido el término “Universitat Politècnica de València”. por el momento. de gran importancia especialmente en el mundo anglosajón). En la figura 50 se ha optado por incluir la dirección correspondiente a otro perfil académico (en este caso ResearchGate) con el propósito de que Google Scholar índice bien esta plataforma. incluyendo diversas variantes recogidas por el sistema. Es importante mencionar que la etiqueta del hiperenlace es siempre “homepage”. no reconocimiento de instituciones con pequeños errores de escritura. El análisis pormenorizado del mismo se puede localizar en un informe realizado por OrdunaMalea et al (2015). Por último. diversos problemas en la desambiguación de instituciones y acrónimos o la incapacidad. Esta práctica sin duda penaliza el posicionamiento web de estas páginas. de identificar más de una afiliación por perfil o las unidades internas de una institución (facultades o escuelas. Respecto a la afiliación personal. ordenados por . el sistema redirije a una pantalla de resultados en la que se recopilan todos los perfiles en los que Google Scholar ha sido capaz de identificar esta misma afiliación (Figura 51). Este servicio fue incluido por el equipo de Google Scholar Citations durante el verano de 2015.198 La revolución Google Scholar En cuanto a la web personal. Al pulsar sobre éste.

Búsqueda y navegación por etiquetas en Google Scholar Citations <https://scholar. Adicionalmente. Este estudio es posteriormente ampliado por Ortega (2014) quien. quienes a partir de un total de 6. a partir de un total de 521.google. Esta opción es muy útil para navegar por intereses temáticos y localizar a los expertos en diversas disciplinas.660 etiquetas extraidas de un total de 26. En este sentido cabe destacar los trabajos de Ortega y Aguillo (2012).397 etiquetas. confirma las etiquetas 199 .Bloque B · Capítulo 9 · Google Scholar Citations número de citas totales recibidas.682 perfiles observan que la etiqueta más frecuentemente utilizada en la muestra era “Machine learning” (1. seguida de “Artificial Intelligence” (998) y “Computer vision” (989).es/citations?view_op=search_authors&hl=es&mauthors=label:altm etrics> El análisis del uso de las etiquetas puede dar lugar a interesantes análisis temáticos en Google Scholar.243 usuarios). Figura 51. el sistema permite la búsqueda directa por etiqueta a través del comando especial “label” (figura 51).

incorporan asimismo una serie de limitaciones. y al igual que ocurre con las afiliaciones temáticas.661 usuarios). a excepción de aquellas con importante carga local. incluir “almetrics”) puede significar que el sistema no detecte el error y que la etiqueta.200 La revolución Google Scholar más usadas: “Machine learning” (4. por tanto. pues las etiquetas cumplen la función de agrupar perfiles bajo intereses comunes. la libertad a la hora de elegir términos provoca que los usuarios utilicen términos no adecuados (enseñanza-aprendizaje).219). empleados por tanto por menos usuarios y donde puedan por tanto aparecer en mejor posición o. permitiendo la generación de listados temáticos y propiciando la fácil localización de perfiles a los que tal vez deseemos realizar un seguimiento especial. seguida de “Artificial Intelligence” (4. Si bien el uso de etiquetas proporciona un valor añadido de indudable interés práctico. Es decir. Se aconseja el término en plural e inglés para la mayoría de las disciplinas.176) y “Computer vision” (3. no funcione adecuadamente. no la de generar rankings competitivos. En ocasiones esto se debe a que los usuarios buscan cierta exclusividad. al dividirse en función del término por el que hayan optado a la hora de configurar el perfil. en solitario. en cierto desuso (análisis documental) o simplemente inventados (curriculum en ciencias de la información). especialmente en las humanidades y ciertas ciencias sociales como las jurídicas. Por un lado. Valga como ejemplo la utilización de los términos “derecho internacional privado” y “private international law” para observar cómo en ciertas áreas los términos en inglés no resultan los más adecuados. Se deben utilizar preferentemente las etiquetas ampliamente aceptadas por la comunidad correspondiente. . no sólo por la utilización de sinónimos o expresiones similares sino por variantes de género (data analytic vs data analytics) o de idioma (bibliometria vs bibliometrics). Por todo ello. utilizar términos poco comunes. siempre se recomienda tomarse un tiempo prudencial para elegir los mejores términos y asegurarse de su corrección y funcionamiento. Esta opción debe evitarse en la medida de lo posible. pequeños errores tipográficos (por ejemplo. En otros casos. De la misma forma. la falta de control terminológico produce la existencia de variantes indeseadas. o bien precisan de otro término más ajustado (tal vez en este caso “international economic law”). Esto puede provocar inevitablemente una indeseada dispersión de la comunidad científica presente en Google Scholar Citations. en algunos casos.

acústica o derecho internacional público. en la que se muestran los tres primeros autores para la etiqueta “scientometrics”. 201 . correspondiente al área de información. Este problema puede observarse en la figura 52. El sistema además incluiría al autor en dichos rankings temáticos con el número total de citas del autor. el tercer gran problema es la falta de verificación. Nada impide que en el perfil de la figura 50 se puedan introducir por ejemplo las áreas temáticas que se deseen (siempre que no se superen los cinco términos). Limitaciones funcionales de las etiquetas en Google Scholar Citations Herramientas de gestión Las principales herramientas de gestión de los perfiles se encuentran localizadas en la zona cuatro. —— Combinar: permite fusionar dos o más referencias.Bloque B · Capítulo 9 · Google Scholar Citations Finalmente. como zoología. Figura 52. y son las siguientes: —— Añadir: permite incluir nuevas publicaciones (en Google Scholar o bien manualmente) —— Exportar: permite exportar resultados seleccionados. habiendo obtenido el grueso de sus citas en otras disciplinas. donde dos de ellos han publicado en esta área de forma esporádica.

artículos individuales y entrada manual. El botón “More” es un desplegable que muestra las opciones de actualizar el perfil. Grupos de artículos Para ciertos investigadores senior. En la figura 53 se observa . Este listado puede ser ordenado por título. la adición individual puede resultar muy laboriosa. Por otro lado. borrar la cuenta o ver la papelera de artículos. Añadir grupos de artículos en Google Scholar Citations El producto ofrece tres posibilidades para añadir nuevos recursos al perfil: grupos de artículos. que pueden ser recuperados posteriormente. En la figura 53 observamos la pantalla de ingesta de documentos en Google Scholar Citations. por fecha de publicación o por el número de citas totales recibidas. Para solventar este problema. —— Actualización: permite actualizar el perfil. Por tanto. Veamos con mayor detenimiento cada una de estas opciones. En la cabecera del listado podemos localizar los dos principales botones de edición. el botón “Add” nos abre la posibilidad de incluir nuevos registros al sistema. En el área de información encontramos el listado de contribuciones añadidas al perfil durante el proceso de creación del mismo. Figura 53. Al pulsar en el botón de añadir registros. la cantidad de publicaciones puede ser enorme. —— Papelera: lugar donde se depositan los artículos eliminados.202 La revolución Google Scholar —— Eliminar: elimina los artículos seleccionados. pero con la novedad de que las opciones de ingreso de nuevos documentos se han ampliado. Google Scholar ofrece la posibilidad de añadir grupos de artículos de una sola vez. el sistema nos dirige a una pantalla prácticamente idéntica a la obtenida en el paso dos de la creación del perfil (Ver figura 46).

Igualmente se podrán realizar consultas por términos específicos (keywords) o utilizando comandos especiales como “site” (para delimitar el espacio web en el que deseamos realizar la búsqueda) o “allintitle” (para delimitar la búsqueda en el título del documento). el proceso de localización y navegación resulta tedioso y poco amigable. como sucede en el caso de los grupos. el usuario debe marcarlo y a continuación pulsar en el botón de añadir al perfil 203 . El usuario puede realizar una búsqueda en el cajetín general situado en la parte superior de la pantalla. se podría realizar la siguiente búsqueda: <author:”a Alonso arroyo” OR “Adolfo Alonso”>. El cajetín de búsqueda permite la utilización de diversos comandos para filtrar mejor la consulta. Un mismo autor podría aparecer en distintos resultados si el sistema lo hubiera detectado con diversas variantes de nombre. ofreciendo por tanto un máximo de 1. Adicionalmente. que coincide aproximadamente con los términos usados para la búsqueda. el usuario puede elegir incorporar todos estos artículos de golpe a su propio perfil. y el sistema devuelve conjuntos de artículos agrupados bajo un nombre de persona. cada una de ellas con su correspondiente conjunto de documentos. y posteriormente incluir un comando OR para realizar combinatorias para distintas variantes de nombre. El número máximo de páginas de resultados son 100. los términos de la búsqueda han sido “Emilio Delgado”.000 resultados por consulta. Por ejemplo. no modificables. al que el sistema le ha asignado automáticamente una serie de artículos como autor. otros comandos como “filetype” o la combinación de varios de éstos no proporcionarán resultados precisos. para poder seleccionar solamente aquellos pertinentes y rechazar el resto. Artículos individuales La opción de artículos individuales implica la búsqueda directa de contribuciones y no de autores. En el ejemplo de la figura 53. incluir el comando “author” para delimitar que deseamos buscar a un autor. Por tanto. se le da la oportunidad de revisar cada uno de los artículosque conforman el conjunto. La página de resultados está delimitada a 10 resultados por página. El sistema devuelve un conjunto de autores. Es decir. En el momento en que se localiza un artículo pertinente. Cada resultado corresponde con una forma normalizada de un autor dentro de Google Scholar. De esta forma.Bloque B · Capítulo 9 · Google Scholar Citations la interfaz correspondiente.

Adición de nuevos registros en Google Scholar Citations En la figura 54 se puede observar un ejemplo para la búsqueda “Delgado López-Cózar”. patente. algunas de las cuales ya están añadidas en el perfil. casos judiciales. Para cada tipo se ofrecen los campos de descripción oportunos de forma que el usuario mismo los cumplimente (figura 55). no localizable en el buscador interno). Esta opción se ofrece para aquellos casos en los que el usuario desee incorporar un registro que no esté indizado en Google Scholar (y. En este caso. Automáticamente el registro se incorporará a la zona de información del perfil. Figura 54. mientras que otras no. El sistema devuelve una serie de contribuciones. el servicio ofrece la posibilidad de elegir la tipología documental correspondiente (artículo de revista. . otras). libro. tesis doctoral. conferencia. y los datos bibliométricos se actualizarán automáticamente. El usuario puede asimismo seleccionar más de un documento a la vez. tesis que no han sido incorporadas a Google Scholar o cualquier tipo de informe técnico. capítulo de libro. por tanto. En estas últimas se ofrece la posibilidad de seleccionarlas e incluirlas en el perfil.204 La revolución Google Scholar (figura 54). Podría tratarse de artículos publicados en revistas en papel no digitalizadas. que por diversas razones no haya sido indizado en el sistema. Entrada manual La última opción para incluir nuevos registros es la entrada manual.

simplemente aparecerá su descripción bibliográfica. Si volvemos al listado de documentos en el área de información del perfil. Cuando éste se activa. Edición del listado de registros en Google Scholar Citations 205 . los botones de edición situados en la cabecera de la tabla se modifican para proporcionarnos opciones complementarias (figura 56). Entrada manual de registros en Google Scholar Citations En este punto es importante remarcar que el hecho de describir un nuevo documento en esta interfaz implica que su referencia bibliográfica aparecerá en el perfil del autor. pero en ningún caso significará que el documento esté indizado en Google Scholar. no existirá ningún hipervínculo al documento a texto completo. A pesar de esta limitación. Figura 56.Bloque B · Capítulo 9 · Google Scholar Citations Figura 55. podremos observar que en la parte izquierda de cada registro aparece un casillero. esta opción puede ser útil a los usuarios que deseen dar a conocer la existencia de una obra realizada a los seguidores de su perfil o comunidad. Es decir.

editorial. El área de edición nos muestra una ficha descriptiva de la publicación. Así mismo. si siquiera a los perfiles de los posibles co-autores). En este caso. Edición de registros Una vez un registro ha sido incluido en el perfil mediante la opción de añadirlo a la colección. Adicionalmente podemos ver un gráfico evolutivo del número de citas recibidas por año. Al registro resultante se le computan todas las posibles citas recibidas por cada una de las versiones. En primer lugar. RefMan y CSV). es el método que está utilizando Google Scholar para poder detectar versiones no agrupadas.206 La revolución Google Scholar En el caso de seleccionar uno o varios registros. A continuación. y el resto se eliminan. La opción de combinación de registros (Merge) solamente aparece cuando se activan como mínimo dos casillas. fecha de publicación. sí permiten la mejora del sistema a largo plazo. las opciones de borrado (Delete) y exportación (Export) se activan. el usuario accederá a la zona de edición de registros bibliográficos. en aquellos casos en los que el sistema haya sido incapaz de agrupar correctamente las distintas versiones. El proceso de comprobación de duplicados y la correcta fusión es un paso necesario para la creación de un perfil sin errores. permitiendo eliminar el registro del perfil o exportar la descripción bibliográfica del mismo a diferentes formatos (BibTex. éste aparecerá en la zona de información del perfil. así como las versiones que el sistema tiene agregadas para ese registro. Endnote. El usuario decide cuál de los documentos fusionados es el principal (cuya descripción bibliográfica se mantiene). al pulsar sobre éste. El título de cada registro constituirá un hiperenlace. el título nos dirige directamente hacia la fuente original del documento. volumen. el sistema permite fusionar distintos registros duplicados. de forma que. resumen y citas recibidas). respectivamente. En la figura 57 se muestra a modo de ejemplo un registro tal y como aparece al pulsar su título en el listado del área de información bibliográfica. junto con las citas totales recibidas. se nos muestra la información bibliográfica (autores. Ciertamente. . ¿quién mejor que el propio autor para indicar cuándo dos registros son realmente distintas versiones o copias del mismo? Aunque estos cambios no se aplican automáticamente a los datos de versiones de los registros en los resultados de búsqueda en Google Scholar (sólo se aplican al perfil donde se aplican.

Figura 58. eliminar el registro o editarlo. desde la cual podremos editar el contenido de los campos. Si pulsamos sobre esta última opción. corregir algún dato descriptivo que el sistema hubiera capturado de forma errónea o gestionar las versiones del registro. accederemos a una interfaz similar a la obtenida en la figura 55.Bloque B · Capítulo 9 · Google Scholar Citations Figura 57. el sistema nos ofrece tres posibilidades: exportar los datos descriptivos. pudiendo eliminar o desunir versiones específicas (Figura 58). Edición de registros en Google Scholar Citations En la parte superior de la pantalla. En este caso. Edición de registros en Google Scholar Citations 207 . podremos reasignar la tipología documental.

Google Scholar adopta en primer lugar el número de citas totales y el h-index como indicadores clave en el rendimiento investigador y hace hincapié en el rendimiento reciente. las métricas y el gráfico de evolución de citas por año (Figura 59). donde se muestra el número de citas totales recibidas por registro. En el caso de los indicadores. Figura 59. Estos datos se muestran tanto a nivel total como para los cinco años anteriores al año actual. extensible al pulsar sobre éste. en el que se muestra el número de citas por año al pasar el ratón por la barra correspondiente a cada año. Este valor de citas es un hipervínculo . h-index y el i10-index (métrica propuesta por Google Scholar mediante la que se cuantifica el número total de artículos que han recibido al menos 10 citas). útil para observar el impacto de los autores emergentes. La información métrica aparece igualmente en el área de información bibliográfica. Indicadores bibliométricos en Google Scholar Citations Debajo de la información métrica se muestra un gráfico de barras. De esta forma. Google Scholar Citations muestra tres: número de citas recibidas. que pueden ser infravalorados en los indicadores totales. Esta funcionalidad sirve de gran ayuda para ver la proyección e impacto en el tiempo de un/a autor/a.208 La revolución Google Scholar Indicadores bibliométricos El área de indicadores bibliométricos está compuesta por dos elementos.

Exactamente lo mismo que ofrece la pantalla general de resultados de Google Scholar. Una vez el autor ha aceptado la inclusión de aquellos autores con los que efectivamente ha publicado conjuntamente. El nombre de estos co-autores aparecen como hipervínculos. el sistema muestra una ventana emergente en la que se puede visualizar un listado con todas las versiones unidas para ese registro. exportación de información bibliográfica). Esta pantalla ofrece las prestaciones de búsqueda de Google Scholar (búsqueda por palabra clave. esta información aparece en la parte pública del perfil (Figura 60). Co-autores La última zona identificable en la página principal del perfil académico de Google Scholar Citations es la información de co-autores. Aunque el filtrado temporal permitiría conocer el número de resultados (y por tanto de citas) por año. mientras que para cada documento citante se ofrece el registro bibliográfico completo (citas recibidas. el sistema nos dirije a una pantalla de resultados en la que se listan todos los documentos citantes. especialmente si el autor ha realizado cualquier modificación fusionando registros o deshaciendo versiones. En este caso. como ya hemos visto con anterioridad (ver Figura 57). para el perfil de autor determinado. Este símbolo aparece cuando el sistema tiene dudas acerca de la contabilización realizada. Si se pulsa en el asterisco. De éstos. aquellos que tienen un perfil creado y público se muestran como sugerencias para añadir como co-autores. versiones. así como el número de citas de cada una de ellas. al pulsar sobre él. Aunque por defecto únicamente aparece un número limitado de coautores en la pantalla (por razones de espacio). de esta forma. pulsando en “View all”. pero dentro de un conjunto limitado de registros que constituyen los documentos citantes del registro seleccionado previamente en el perfil. filtrado temporal. al pulsar en cada nombre el usuario puede acceder al perfil público correspondiente. Esta información de sugerencias sólo se visualiza cuando un autor accede a su perfil iniciando sesión.Bloque B · Capítulo 9 · Google Scholar Citations tal que. el sistema identifica automáticamente los autores que han publicado conjuntamente con este autor. esta información se encuentra de forma más amigable en la interfaz de información bibliográfica del registro.). En algunos registros podemos observar un asterisco justo al lado de la indicación del número total de citas recibidas. etc. el sistema permite acceder a una página de resultados en la que se reco- 209 .

. queda comentar el servicio de alertas personalizadas de Google Scholar Métrics. Adicionalmente. el sistema sugiere nuevos co-autores para añadir al perfil. Inclusión de co-autores en Google Scholar Citations Si a esta pantalla de co-autores se accede como usuario registrado. en la parte inferior de la página. Figura 60. La única pega de esta página de co-autores es el orden en el que aparecen. Alertas Por último.210 La revolución Google Scholar pilan todos los co-autores aceptados por el autor en su perfil. que está sincronizado internamente con el servicio de alertas de Google Scholar visto en el capítulo 6. el sistema permite la posibilidad de eliminar a algún co-autor (en el caso de que no deseemos que figure en el listado por cualquier motivo). nombre. que no parece seguir ningún patrón lógico (citas totales recibidas o apellidos. adscripción institucional. número de citas totales recibidas y palabras clave). Para cada uno de ellos aparece la información básica (fotografía. En este caso. por ejemplo).

En el segundo caso. seleccionar la alerta deseada y notificar el correo electrónico donde se desea recibirla (Figura 62). efectuar un autoseguimiento. el propio usuario debe pulsar sobre el icono “Follow” que aparece en la parte superior de la zona del área personal. Por un lado.Bloque B · Capítulo 9 · Google Scholar Citations el sistema de alertas puede realizarse de dos formas complementarias. Sin embargo. En el primero de los casos. Alertas personalizadas en Google Scholar Citations (II) 211 . basta con acceder al perfil público que deseemos seguir. Figura 61. existe la condición de que el perfil deba ser público para poder habilitar esta alerta (Figura 61). Y por otro lado se puede realizar el seguimiento de autores de interés. La alerta puede cubrir tanto la notificación de nuevos artículos como de nuevas citas recibidas. es decir. recibir notificaciones en el momento en el que se produzca alguna modificación en el perfil personal. pulsar en el botón “Follow”. Alertas personalizadas en Google Scholar Citations (I) Figura 62.

el cambio más importante hecho público se produjo el 21 de agosto de 2014. aunque esta funcionalidad fue eliminada en 2014. Google Scholar se despreocupa de la posible veracidad y precisión de los datos y deja en manos del autor toda la responsabilidad sobre lo mostrado. Aunque el cambio fue fundamentalmente estético (mejorando el diseño y disposición de los elementos en la pantalla). laissez passer”. pues en la versión anterior solamente se mostraban datos aproximados) y otros menos (la creación de una versión imprimible amigable).212 La revolución Google Scholar En las primeras versiones de Google Scholar Citations se contabilizaba el número de seguidores que tenía un autor a partir de este botón de “Follow”. aparecido en agosto de 2015 sin notificación alguna. profesional y temática hasta la vinculación de la producción bibliográfica que estimen pertinente. menos importantes o con una mayor carga profesional (por ejemplo Comunicación) recibían mucha más visibilidad. En cualquier caso. Se deja total libertad a los autores para que puedan configurar el perfil a su entero gusto y beneficio desde su identificación personal. comentado en la sección anterior. El autor puede añadir. como la del número de seguidores de un perfil (Delgado López-Cózar. Pequeñas mejoras en la edición de los registros o en las opciones de visualización han ido apareciendo paulatinamente. en algunos casos. editar. algunos más importantes (mostrar el número exacto de citas totales recibidas por año. 2014). cuando el producto dio un lavado de cara a los perfiles. En cualquier caso proporcionaba información interesante. y eliminar los registros bibliográficos tal como le venga en gana. Igualmente desaparecieron algunas funcionalidades. incluso invisible. Explotación de los perfiles académicos en Google Scholar Google Scholar Citations ha ido mejorando el producto desde su lanzamiento hasta nuestros días. pasando por el modo de actualización del perfil (automático o no). Un claro ejemplo de ello es el control de las afiliaciones institucionales. los cambios siempre han ido orientados a la creación de un producto que como ya comentamos responde a la filosofía del “laissez faire. pues ilustraba cómo investigadores con largas trayectorias científicas y amplio impacto podían ser seguidos por un número escaso de seguidores (o ninguno en la mayoría de los casos) y por el contrario. otros investigadores con carreras científicas más cortas. . se introdujeron algunos cambios. Probablemente. mostrando de ese modo un interés en el seguimiento de perfiles que no correlaciona necesariamente con el impacto científico. aunque de una manera irregular y.

Bloque B · Capítulo 9 · Google Scholar Citations Esta completa libertad a los usuarios puede generar situaciones tan extravagantes como las siguientes: —— Que puedan existir autores con varios perfiles creados. o tan peculiares y singulares que sólo les representan a ellos mismos (por ejempo “tetons”.com/torressalinas/status/701683372935008258/ photo/1> 213 . como ya discutimos en el apartado de información personal de este capítulo. Por tanto. esto ocurre para uno de los mayores investigadores sobre Google Scholar amplia e intensamente citado en este libro. cada uno de ellos con un número distinto – aunque similar – de citas y de palabras clave 3. pues la ambigüedad de ciertos nombres y la no depuración del perfil puede hacer que se incluyan contribuciones de otras personas con el mismo nombre y apellidos. <https://twitter. etc. como es Peter Jacsó. que 3 La duplicación de perfiles públicos está comenzando a ser controlada por Google Scholar desde marzo de 2016. Esto puede suceder por descuido. “gendermetrics gender studies scientometrics”. —— Que vinculen a sus perfiles publicaciones que no les pertenecen. Figura 63. “vocabularios controlados”.). quien a fecha de septiembre de 2015 dispone de dos perfiles públicos creados (Figura 63). Por ejemplo. un mismo autor puede crearse varios perfiles (cada uno de ellos con una cuenta de correo electrónico diferente) o varias personas diferentes podrían haber creado un mismo perfil. Duplicación de registros en Google Scholar Citations —— Que escojan palabras clave inadecuadas para describir su orientación temática. Esto se debe a que el sistema no controla la duplicidad de nombres en los perfiles.

Figura 65. Figura 64.214 La revolución Google Scholar Google Scholar no desambigüa correctamente (Figura 64). Robinson-García y Torres-Salinas. 2014). Asignación errónea de registros en Google Scholar Citations <http://scholar. ya hemos podido advertir de la facilidad con la que se puede engañar al sistema ante la carencia total de control y libertad total del usuario para introducir la información que estime oportuna. en cuyo caso estaríamos ante un claro caso de fraude. o bien puede suceder a propósito. Durante el proceso de construcción de perfiles académicos seguido en este capítulo.google. Esto ha permitido la generación tanto de citas falsas 4 como de perfiles falsos (Figura 65). Perfil falso Google Scholar Citations <http://scholar.google.com/citations?user=D1EHFZQAAAAJ> —— Que se manipulen las citas e indicadores bibliométricos (Delgado López-Cózar. Este punto ya fue comentado en el capítulo dedicado a las amenazas de Google Scholar.com/citations?user=D1EHFZQAAAAJ> 4 http://retractionwatch.com/2014/11/17/fake-citations-plague-some-google-scholarprofiles .

lo que genera un importante sesgo en la distribución de la población de investigadores con perfil creado. queda claro que la responsabilidad última es del autor y no alcanza a Google: el perfil retrata a quien lo elabora. más allá de la utilidad que tienen para Google Scholar (ayuda en el filtrado de información en las búsquedas. en su análisis comparativo de los perfiles de Google y Microsoft. como Universidade de Sao Paulo (3.Bloque B · Capítulo 9 · Google Scholar Citations En cualquier caso. Ortega (2014). Ortega (2015) muestra que la mayoría de usuarios son jóvenes investigadores. lo que impide que pueda ser representativa de la población científica real. y cuya distribución por países e instituciones es muy desigual. En ese sentido. Ortega y Aguillo (2014). estén comenzando a ser objeto de análisis métricos para caracterizar la ingente cantidad de información contenida.764 perfiles) y Universidade Estadual Paulista 215 . Hemos de pensar que Google Scholar Citations supone pasar la descontrolada base de datos de Google Scholar bajo un prisma que permite distinguir las contribuciones de autores.8% y el 6. cooperación de los autores para detectar y corregir errores bibliográficos) y para los propios autores (ayuda en la visibililidad y difusión de su trabajo). Esta amplia autonomía que Google concede al autor trasluce la filosofía desde la que se ha diseñado este producto: un sistema de información orientado al usuario. temas e instituciones. Una inteligente manera no sólo de reducir costes de tratamiento y gestión de la información sino de hacer que el usuario trabaje para el sistema. Este hecho ha permitido que estos perfiles. con datos de diciembre de 2013. con el 24. así como ciertas características de los autores que disponen de perfil público creado. principalmente debido a la enorme cantidad de perfiles creados para algunas instituciones brasileñas. creado por y para él. Por ejemplo. Google Scholar Citations contenía más materiales académicos que generaban una mayor cantidad de citas.4% respectivamente). concluyen que aunque los perfiles producidos por Microsoft Academic Search eran más óptimos para ser analizados desde un punto de vista bibliométrico al disponer de un servicio más balanceado temáticamente. por lo que era más adecuado para estudios a nivel individual e institucional. necesarias para calibrar el impacto total de autores.2% de todos los perfiles existentes (tras Estados Unidos y Reino Unido. fundamentalmente. infiere a partir de una muestra que Brasil posee aproximadamente el 5. Este modo de funcionamiento ha permitido a Google Scholar Citations distanciarse del resto de servicios de perfiles académicos. en disciplinas relacionadas con las ciencias de la información y tecnología.

concluyen que Google Scholar Citations es una herramienta apropiada para los estudios de colaboración científica a nivel macro. Es decir. ciertas políticas de evangelización hacia el producto pueden provocar la excesiva visibilidad de ciertas instituciones y la infravisibilidad de otras. 1. quienes identifican propiedades de fractalidad y redes de escala libre en las relaciones institucionales por país (donde Estados Unidos domina el mapa científico mundial). En esta línea destacan los trabajos de Ortega y Aguillo (2013).912 perfiles de Google Scholar Citations. con el fin de descubrir y caracterizar las colaboraciones científicas a nivel de país e institución. ocupa la cuarta posición global). Los autores.636). A pesar de estos sesgos de población y de cobertura temática.320 perfiles. quienes analizan los datos proporcionados por el servicio de co-autores en un total de 19. los estudios sobre la base de datos de Google Scholar Citations pueden proporcionar información de indudable interés si son convenientemente filtrados y contextualizados. entre países e instituciones. . que son de hecho las dos instituciones con más perfiles asociados en todo GSC (la Universidade Estadual de Campinas.216 La revolución Google Scholar (1.

y bajo el firme convencimiento de la importancia y valor de la empresa emprendida. Analizar por tanto sus características. Finalmente. Proceedings Scholar Metrics. un propósito empírico y práctico. En este último capítulo deseamos introducir una serie de productos independientes que han sido diseñados y elaborados por el Grupo de investigación EC3 a partir de la información contenida en Google Scholar. errores y limitaciones. ventajas. Journal Scholar Metrics) pretenden aportar una respuesta empírica (y no teórica u opinática) a todas nuestras dudas iniciales. Los productos desarrollados (H-Index Scholar. el equipo de trabajo ha dedicado gran parte de sus esfuerzos en los últimos años a cuantificar diversos agentes y canales de investigación (autores.Capítulo 10 Productos derivados independientes A lo largo de los capítulos anteriores (8 y 9) hemos descrito los dos principales productos derivados de Google Scholar. Fruto de estos propósitos. El objetivo de estos productos ha sido doble. la propuesta y aplicación de toda una nueva metodología de análisis basada en Google Scholar a nuestra propia disciplina (tanto a la Biblioteconomía y Documentación como a la Bibliometría) sirve de excelente colofón no sólo para mostrar las enormes posibilidades y potencial de Google Scholar sino para aflorar la eviden- . Publishers Scholar Metrics. que denominamos bajo la etiqueta de oficiales al haber sido desarrollados directamente por el equipo de Google Scholar e integrados en su interfaz de búsqueda. Diseñar productos que pudieran ser de utilidad a la comunidad investigadora en general. propiedades. estudiar y analizar Google Scholar como un objeto de estudio en sí mismo. congresos y editoriales) para comprobar si Google Scholar era o no era capaz de proporcionar resultados coherentes (y por tanto útiles) que cubrieran con dignidad una importante laguna en el panorama de la evaluación del impacto académico en las ciencias sociales y humanas. Por un lado. Por otro lado. un propósito fundamentalmente investigador: conocer. y a las ciencias sociales y humanas en España en particular. libros. revistas.

Publish or Perish Tan solo dos años después de la creación de Google Scholar (noviembre de 2004) nacía la primera versión de Publish or Perish (PoP). una democratización . a pesar de que Google Scholar ofrecía datos de citas recibidas para cada registro indizado. Efectivamente.218 La revolución Google Scholar te necesidad de un cambio de paradigma en la evaluación del impacto académico en las ciencias sociales y humanas. A ello se unían las inexistentes prestaciones para exportar los datos para ser tratados estadísticamente fuera del entorno de Google Scholar. Publish or Perish servía de interfaz entre el usuario y Google Scholar. Esta sencilla pero potente aplicación (disponible tanto para entorno Windows como OS X o GNU/Linux). antes de pasar a describir los productos elaborados por los autores (productos bibliométricos derivados). ofrecía una serie de indicadores bibliométricos. conviene recordar que Google Scholar no proporciona ningún tipo de API). exportarlos en un fichero estructurado. realizar análisis bibliométricos y estadísticos sobre los datos obtenidos (tanto a nivel de autor como de revista). entre otras muchas funcionalidades. y de la que ya circula actualmente la versión 4. fusionar duplicados e incluso exportar los datos finales a una hoja de cálculo. y visualizarlos en una interfaz sencilla. la información comenzaba y terminaba en este punto.1 (a fecha de 17 enero de 2016). Por si no fuera poco. Sin embargo. la aplicación era capaz de obtener los datos correspondientes directamente de Google Scholar (a través de sus prestaciones de búsqueda avanzada. lanzada oficialmente en octubre de 2006. el software permitía editar los resultados obtenidos. Así pues. Tal y como ya se ha comentado de forma extensa a lo largo de esta obra. No es de extrañar que este software permitiera.25. la gran ventaja de Google Scholar es su impresionante cobertura aunque una de sus principales limitaciones es la total ausencia de mecanismos profesionales para gestionar la información que proporciona. de forma que ante una determinada consulta. ya bien adentrados en el hiperconectado Siglo XXI. permitía la realización de búsquedas directamente sobre la base de datos de Google Scholar y. junto a Google Scholar. a partir de los resultados obtenidos. deseamos en primer lugar rendir un merecido tributo a un par de productos pioneros en la extracción y tratamiento de datos procedentes de Google Scholar: Publish or Perish (elaborado por Anne-Wil Harzing) y Scholarometer (elaborado por el equipo liderado por Fil Menczer).

ese será el número máximo de resultados que obtendremos ante cualquier búsqueda. 2007). Interfaz de búsqueda de Publish or Perish Observamos cómo la aplicación permite tres tipos de consultas (general. Figura 66. En función de la búsqueda seleccionada (Figura 66. por tanto. se recomienda introducir entre comillas el nombre de la persona buscada (en el ejemplo mostrado “Corma A”). Aparte de Google Scholar.Bloque B · Capítulo 10 · Productos derivados independientes del análisis de citas.1). zona 1) el usuario puede configurar los campos de consulta correspondientes (Figura 66. el sistema se encuentra analizando el resultado número 920 de los 1000 obtenidos. zona 2). En el ejemplo de la figura 66. En la figura 66 se puede observar un ejemplo de búsqueda de autor y los resultados obtenidos a través de la aplicación. Se debe recordar que Google Scholar devuelve un máximo de 1000 resultados por query. Adicionalmente se pueden excluir determinados coautores o delimitar el año de publicación. tal y como expresa Harzing en el prólogo de esta obra. En el caso de la búsqueda por autor. Se debe re- 219 . Adicionalmente se puede seleccionar la base de datos. Una vez se ha perfilado la búsqueda. Publish or Perish permite seleccionar Microsoft Academic Search (desde la versión 4. por autor y por revista). el sistema lanza la consulta directamente a Google Scholar. Aunque no se recomienda su utilización (al menos entre 2010 y 2016). Una pantalla flotante nos informa del estado de la evolución de nuestras consultas. debido a la ya comentada desactualización de esta base de datos. y en uno de sus principales y más citados trabajos (Harzing y Van der Wal.

AR-index. Editorial y Tipo. Los ficheros de exportación de estas bases de datos pueden se importados a PoP desde la opción (File/ Import external data). En el caso de la figura 66.220 La revolución Google Scholar cordar igualmente que cada resultado es tratado por el programa como un documento. e-index. La consulta general por su parte simplemente incorporar todos los campos (tanto de la búsqueda por autor como por revista) en una consulta. Publicación. donde conforme se van procesando los hits de respuesta en Google Scholar ante la consulta efectuada. Adicionalmente se ofrecen los siguientes datos para cada resultado: Citas por año. como indica su propio nombre. para ello permite la búsqueda por título e ISSN. de tal forma que podamos repetirlas en el futuro sin tener que volver a elaborarlas. este símbolo aparece para los 131 artículos con mayor número de citas. Año. En ese caso se recomienda restringir la consulta a partir de los límites temporales. general. número de citas recibidos. como el h-index obtenido es de 131. zona 3). La limitación de los 1000 resultados es. La consulta por revista simplemente ofrece la posibilidad de localizar artículos publicados por una determinada revista. Por último. se van calculando de forma automática una serie de indicadores tanto simples (número de documentos. De forma que podemos utilizar las funcionalidades del análisis bibliométrico de los datos a partir de registros obtenidos en estas dos bases de datos. autores por artículo). El símbolo “h” en azul y delante del número de citas recibidas por cada resultado aparece para todos aquellos artículos que contribuyen al núcleo del h-index. Esto se puede observar en la zona de resultados (Figura 66. generalized h-index. intervalo de publicación) como promedios (citas por artículo. se destacaría la opción de importar resultados tanto desde Web of Science como desde Scopus. hlnorm. Título. Los resultados localizados se muestran ordenados por defecto según el número de citas totales recibidas. hl annual y multiauthored h-index). . al igual que en la interfaz de Google Scholar. Multi-query center es el espacio destinado a almacenar las consultas efectuadas en la aplicación. Autores. Por último. Rank (posición en la página de resultados). citas por autor. crítica especialmente en el caso de búsquedas masivas o susceptibles de generar una gran cantidad de resultados. artículos por autor. que conforman el núcleo de Hirsch para el autor. se ofrece el valor tanto del h-index obtenido como de una amplia cantidad de variantes del h-index (g-index.

2012). el programa había recopilado cerca de 1.indiana. existen versiones compatibles tanto con Google Chrome como con Firefox. Bajo esta premisa. 39.8 millones de artículos. y las tareas de social tagging por otra. Google Scholar. plataforma creada en la School of Informatics and Computing de Indiana University–Bloomington en noviembre de 2009 (Kaur et al.400 disciplinas (Kaur et al.com/pop.1.harzing. Scholarometer (actualmente en su versión 4.4 millones de artículos. En la actualidad.Bloque B · Capítulo 10 · Productos derivados independientes Los aspectos concretos del funcionamiento del programa pueden ser consultados directamente tanto en la página web personal de Anne-Wil Harzing 1 como en el manual oficial del software (Harzing. con 34.000 autores. 2013b). que pueden ser posteriormente computadas para permitir la comparación de métricas de impacto a nivel de autor entre disciplinas. pues Scholarometer se instala simplemente como extensión del navegador. Scholarometer se presenta como una herramienta social que pretende facilitar el análisis de citas así como favorecer que los usuarios puedan expresar relaciones entre elementos a partir de la inclusión de anotaciones.htm 2 http://scholarometer. los datos habían aumentando considerablemente: 2. es diametralmente opuesta a la propuesta por Publish or Perish. Scholarometer La filosofía de Scholarometer 2. la cobertura especial de este buscador hizo que la balanza se inclinara finalmente hacia Mountain View. Esta característica le permite convertirse en una interfaz que carece de las limitaciones de acceso al servidor de Google Scholar (la plataforma es independiente y se ejecuta en el navegador del usuario).000 autores y 2. La base de datos sobre la que funciona Scholarometer es.0) pretende reunir en una sola herramienta dos funcionalidades que generalmente se encuentran separadas: el análisis estadístico de la información bibliográfica de la literatura científica por una parte. El usuario puede confeccionar una ecuación de búsqueda que el sistema lanza a Google Scholar. obteniendo los datos solicitados 1 http://www. 2014). A fecha de marzo de 2014. A fecha de 2009. como no podía ser de otra forma. firmados por 21. El desarrollo de la aplicación presenta igualmente particularidades. Aunque la aplicación podría haber funcionado con cualquier otra base de datos.edu 221 .000 anotaciones en cerca de 900 disciplinas (datos depurados tras aplicar procesos de filtrado).

222 La revolución Google Scholar a través de un scraping de los resultados de Google Scholar. variantes aceptadas de nombres. Esta funcionalidad requiere de manera obligatoria que el usuario introduzca una etiqueta temática en la búsqueda (opción tag this query). útil esto último por ejemplo para el análisis de grupos de investigación. tal y como funciona cualquier navegador. Group y Advanced). XLS y BibJSON. la posibilidad de analizarlas estadísticamente. entre otras operaciones. Name. El sistema ofrece cuatro pestañas de consulta (Google Scholar ID. Interfaz de búsqueda de Scholarometer El usuario puede. En la figura 67 se puede observar el modo de funcionamiento de Scholarometer. CSV. RefMan (RIS). desagregar artículos escritos por autores diferentes pero que comparten el mismo nombre o filtrar los datos por año de publicación. El resto de opciones permiten la búsqueda de un autor (Name) o un grupo de autores (Group) en Google Scholar. El sistema permite de este modo la descarga de todas las publicaciones contenidas en el perfil y ofrece. de manera adicional. la opción Advanced incorpora diversas funcionalidades de búsqueda avanzadas Figura 67. fusionar distintas versiones de un mismo documento. La primera de estas opciones permite la búsqueda directa en Google Scholar Citations a partir del código identificador de cada perfil (código de 12 cifras incluido en el URL público de cada perfil). se ofrecen facilidades para exportar los datos en diferentes formatos: BibTex (BIB). disciplina. Del mismo modo. El etiquetado de los autores en determinadas disciplinas permite a Scholarometer el cálculo del hs-index (normalización del h-index a partir . Finalmente. EndNote (ENW).

indiana. se destaca la disponibilidad de una API.edu/explore.indiana. que facilita la comparación de autores pertenecientes a disciplinas diferentes. que permite la consulta a la base de datos de Scholarometer 3. H-index Scholar El H-Index Scholar (Delgado López-Cózar et al. propuesto por Kaur. Por último. 2014) 5 es un índice bibliométrico que pretende medir el rendimiento de la producción académica de los profesores e investigadores de universidades públicas españolas de Humanidades y Ciencias sociales a partir del recuento de sus publicaciones y de las citas bibliográficas que éstas han recibido a través de Google Scholar (Figura 68). Figura 68. Radicchi y Menczer (2013).com 223 . Página de inicio de H-Index Scholar Los objetivos que pretende cubrir son los siguientes: —— Comprobar la capacidad de Google Scholar para recuperar la producción científica y académica de científicos adscritos a los ámbitos de Humanidades y Ciencias sociales. invisibles a las tradicionales bases de datos por sus peculiares hábitos de publicación.html 5 http://hindexscholar.Bloque B · Capítulo 10 · Productos derivados independientes del promedio del h-index de los autores en una misma disciplina). así como de funcionalidades de visualización de redes tanto de autores como de disciplinas 4.edu/data.html 4 http://scholarometer. 3 http://scholarometer.

tomando como umbral de corte el primer tercio de los profesores con mayor índice h de un área de conocimiento. Los datos de rendimiento son relativos a 2012. Para ello se ejecutó una búsqueda para cada profesor que contemplaba las principales variantes de su nombre a fin de identificar todas sus posibles publicaciones y las citas enlazadas a las mismas. basados en información suministrada por Google Scholar. En los distintos listados por áreas figuran sólo aquellos profesores que se encuentran en el núcleo de mayor rendimiento. En la figura 69 se muestra a modo de ejemplo el ranking experimental obtenido para el área de Documentación (top 5). no siempre se pudo realizar esta tarea de forma exitosa. Tras un proceso manual de depuración de resultados (eliminación de duplicados y unión de citaciones). se llegó igualmente a rastrear los sitios web de Facultades. de los que se visualizaban cerca de 14. se calculó el índice h y g de cada autor. las ciencias sociales se estructuraban en 9 disciplinas y 35 áreas de conocimiento. El número de profesores con el que se trabajó en la master list del proyecto superaba los 41. no se contemplan ni las contribuciones realizadas ni citas recibidas con posterioridad. Datos que hablan por sí mismos de la magnitud del trabajo realizado. Por tanto. De este modo. aunque en cada área la fecha de toma de datos puede variar sensiblemente (según el mes en el que se hicieran las búsquedas). En algunos casos. las ciencias humanas en 10 disciplinas y 35 áreas.000 en el sitio web público. Sin embargo. Para adscribir a los profesores a sus áreas de conocimiento respectivas se consultaron los sitios web de todos los departamentos de las universidades públicas españolas de Humanidades y Ciencias Sociales.224 La revolución Google Scholar —— Examinar su idoneidad para identificar la producción de entornos geográficos nacionales distintos al mundo anglosajón.500. . dadas las carencias de información en algunas de estas fuentes universitarias (especialmente departamentos). Escuelas e Institutos Universitarios. Los índices se presentan por áreas de conocimiento agrupados en disciplinas. para detectar el núcleo de académicos de mayor influencia en las distintas disciplinas humanísticas y sociales. El cálculo de los índices h y g se realizó a partir de la producción científica y las citas asociadas a la misma localizadas en Google Scholar. las ciencias jurídicas en 14 áreas. y finalmente las bellas artes en 4 áreas. y que usan lenguas de expresión distintas al inglés —— Determinar la fiabilidad y validez de los índices h y g.

Los libros constituyen uno de los principales medios de comunicación científica en Humanidades y en buena parte de las Ciencias Sociales.info/ 225 . Por consiguiente.publishers-scholarmetrics. De entre los distintos criterios que pueden emplearse para evaluar el rendimiento de las editoriales (pervivencia y antigüedad. así como una inclinación a citar fundamentalmente este tipo de documentos. reputación e impacto 6 http://www. Todos los estudios bibliométricos que han analizado los hábitos de publicación y citación en las distintas disciplinas que conforman las Ciencias Humanas y Sociales destacan cómo los investigadores de estos campos publican en una amplia variedad de medios. no es de extrañar que este tipo de publicaciones ocupen una parte importante en el curriculum de los investigadores y que cuando se les pregunte cuáles son los medios de publicación que deben ser utilizados preferentemente en la evaluación de su actividad científica.Bloque B · Capítulo 10 · Productos derivados independientes Figura 69. por encima del resto. visibilidad. producción/especialización. aunque tienen una especial predilección por las monografías publicadas en su lengua vernácula y en editoriales nacionales. sean las monografías las destacadas en primer lugar. Ranking de profesores del área de Documentación según H-Index Scholar Publishers Scholar Metrics Publishers Scholar Metrics 6 es un índice bibliométrico que pretende medir el impacto de las editoriales de monografías científicas a partir del recuento de citas de los libros publicados por los profesores e investigadores de universidades públicas españolas indizados en Google Scholar hasta 2012. calidad editorial. en el ámbito de las Humanidades y Ciencias Sociales.

handle. han quedado relegadas las más importantes editoriales científicas de carácter nacional de países de honda tradición investigadora en estas áreas como Francia.es/ . las traducciones o su inclusión en bibliografías.net/10481/32117 8 http://www. España o Alemana. Para paliar estos problemas tanto Thomson Reuters. han intentado ampliar la cobertura de libros. tratando de ofrecer respuesta a la primera variable contemplada anteriormente: el número y la calidad de las citas.CNEAI 8.html 9 http://www. En el caso del Book Citation Index. la aparición de Google Scholar significó una auténtica revolución en los sistemas de búsqueda de información científica. por lo que no resultaban adecuadas dados los hábitos de publicación y citación de los investigadores en ciencias humanas y sociales. Pero los resultados han sido desalentadores: el sesgo idiomático hacia los documentos en inglés (98% de los libros indizados) y los países anglosajones (más del 50%) es aplastante. que son usadas con efectos evaluativos para contabilizar publicaciones y citas (Web of Science. los editores.ANECA 9) han contemplado como criterios preferentes: el número y la calidad de las citas recibidas. Scopus). se orientan fundamentalmente a las disciplinas científico-técnicas y poseen un marcado sesgo anglosajón en cuanto a la procedencia e idioma de los documentos que indizan. la colección en la que se publica la obra. las bases de datos tradicionales. pero especialmente afectó 7 Véase : http://hdl. que es el proyecto más ambicioso. Italia. Agencia Nacional de Evaluación de la Calidad y Acreditación .aneca. 2012). con su Book Citation Index. Agencia Nacional de Evaluación y Prospectica ANEP.226 La revolución Google Scholar científico) y de los libros que éstas publican 7. el prestigio de la editorial. Lamentablemente no existen herramientas que puedan medir de manera más o menos objetiva estos criterios. Este proyecto nace directamente con la vocación de satisfacer dicha demanda.gob. Robinson-García y Delgado López-Cózar. Desde el punto de vista bibliométrico. son totalmente inadecuadas pues cubren casi exclusivamente artículos de revistas. como Elsevier con su programa “Titles Expansion Program”. Constatadas la falta de adecuación de las bases de datos actuales para la evaluación de monografías a partir de las citas recibidas.es/ministerio-mecd/organizacion/organismos/cneai. en España las agencias de evaluación de la actividad científica (Comisión Nacional Evaluadora de la Actividad Científica . las reseñas en las revistas científicas especializadas. 2013). tanto en Web of Science como en Scopus (Torres-Salinas y Delgado López-Cózar. así como otras de carácter internacional (Torres-Salinas.mecd.

985 documentos. que es la peor controlada por los sistemas de información dominantes en el mundo académico. comentado previamente. —— Comprobar la capacidad de Google Scholar para recuperar la producción científica y académica de científicos adscritos a los ámbitos de Humanidades y Ciencias Sociales. que fueron ya detallados en el capítulo 3 del libro al tratar la diversidad de documentos citantes en Google Scholar. que recibieron un total de 2. Para calcular el impacto de las editoriales científicas donde publican los profesores e investigadores de universidades públicas españolas a través de Google Scholar se siguió el siguiente procedimiento: Identificación de los libros publicados por los profesores e investigadores de universidades públicas españolas. Para ello se partió de los resultados obtenidos en el producto H Index Scholar.249 citas.378. clasificados según el área de conocimiento al que figuraran adscritos. 227 . invisibles a las tradicionales bases de datos por sus peculiares hábitos de publicación. La primera tarea se dirigió a elaborar un censo de los profesores que trabajaban en 2012 en las universidades públicas españolas. documentos en todos los idiomas sin restricción y recupera un porcentaje muy elevado de citas.Bloque B · Capítulo 10 · Productos derivados independientes muy positivamente a aquellas disciplinas cuyos hábitos de publicación no se constreñían únicamente a las revistas científicas. libros. indiza mayor variedad de géneros documentales (artículos de revistas. han puesto de relieve que este buscador cubre muchísimos más documentos que cualquiera de los sistemas de información científica tradicionales. pues controla como nadie lo ha hecho hasta ahora la literatura no anglosajona y aquella transmitida por medios distintos a las revistas científicas (especialmente los libros). tesis. Se recuperaron un total de 1. comunicaciones a congresos…).020. informes. Pero es especialmente de utilidad para los científicos de Humanidades y Ciencias sociales. Es por lo que los objetivos de este producto son fundamentalmente dos: —— Determinar la fiabilidad y validez de la información suministrada por Google Scholar para detectar el núcleo de editoriales científicas de mayor influencia en las distintas disciplinas humanísticas y sociales en España. Todos los estudios realizados hasta la fecha.

se eliminaron los documentos no citados (740. lo que restringió el número de documentos a analizar a 280.5%).6% de los documentos recuperados. En primer lugar.3%).203 libros más citados. En definitiva. y que se basa en las leyes bibliométricas que determinan que un número relativamente pequeño de documentos son los que concentran la mayor atención de los científicos.228 La revolución Google Scholar Selección de documentos fuente: identificación de los libros altamente citados.628 (43.153 citas. y no de toda la población de monografías publicadas por los profesores universitarios españoles. congreso) ni una descripción bibliográfica completa y fiable. Sobre este conjunto de libros se seleccionó una muestra que contenía los 7. libros que recibieron 625.776. El total de libros identificados. artículo. En términos de citación representa el 17.7% de los documentos válidos de la muestra y el 43.3% . es preciso verificar manualmente la editorial referenciada por Google Scholar o insertarla directamente en caso de que no figure. nuestro objetivo ha sido identificar el núcleo de monografías científicas más influyentes publicadas por los profesores españoles de universidades públicas.203 libros fueron repasados individualmente a fin de identificar de forma fiable y unívoca la editorial que los había producido. fue de 26.454 documentos válidos analizados.123 documentos que serían examinados a fin de averiguar qué porcentaje de ellos eran monografías (esta muestra concentraba el 74.462 (27. Sobre el total de documentos analizados se eligió una muestra de 78.678 documentos por diversas razones: duplicados (dado que las búsquedas se hicieron por profesor.7% de las citas (1.978 citas.218 citas). la muestra de libros altamente citados sobre los que se construyen estos rankings representa el 2. Estos 7. el 11. Para conseguirlo se diseñaron varios filtros que fueron decantando las monografías que conformaron la muestra definitiva. era lógico que documentos escritos en coautoría estuviesen duplicados). Los rankings de editoriales se elaboraron a partir de una muestra de libros. tras el análisis de los 61.3% del total de libros identificados. documentos erróneos (documentos producidos por profesores ajenos a nuestra unidad de análisis) y documentos ajenos a la temática del área de conocimiento). si se mide la repercusión en términos de citas. Esta es una práctica ya extendida en diversos productos bibliométricos como los Essential Science Indicators de Thomson Reuters. que recibieron un total de 417. Por consiguiente. Se excluyeron 16. Dado que Google Scholar no proporciona de manera exhaustiva ni la tipología del documento (libro.523).

tal y como 229 .Bloque B · Capítulo 10 · Productos derivados independientes del total de citas de los documentos recuperados. así como el número de documentos trabajados en cada fase. En la figura 70 se muestra un resumen del mismo. Proceso de identificación muestra de libros altamente citados Cálculo de indicadores Los tres indicadores empleados (libros. Finalmente. se calculó un índice global que no es más que la multiplicación de las dos dimensiones contempladas.8% de los documentos válidos de la muestra y el 66.4% del total de libros identificados. Visualización de resultados Los rankings de editoriales se presentan por disciplinas y especialidades científicas. citas e índice global) se han basado en los siguientes datos: —— Número de libros de una editorial que figuran entre los libros altamente citados de la muestra. el 30. —— Número total de citas de los libros de una editorial que figuran entre los libros altamente citados de la muestra. entendiendo por tales las áreas de conocimiento a las que están adscritos los profesores universitarios españoles. El proceso aquí descrito de forma general se ha realizado por área de conocimiento. Figura 70. Los datos brutos se normalizaron tanto para los libros como las citas en una escala que fluctúa entre 0 y 100 tomando como referencia la editorial que ha alcanzado el valor más elevado.

org/10. Ingeniería eléctrica y electrónica y Comunicaciones. Proceedings Scholar Metrics 10 es un ranking que muestra reuniones científicas (conferencias.9681 . etc.1. sino de aquellas que han conseguido con alguna de sus obras una cierta influencia. simposios. Figura 71. en las áreas de Informática. Este hecho constituye un valor en sí mismo. talleres.) indizadas en Google Scholar Metrics. medida ésta a través del recuento de citas en Google Scholar.230 La revolución Google Scholar se mostraban en el H Index Scholar.4504.org/abs/1412. En la figura 71 se muestra como ejemplo el ranking obtenido para Psicobiología. no deben interpretarse estos rankings como unos listados de todas las editoriales científicas que pueden publicar libros sobre una especialidad.7633 11 http://doi.2. Por tanto. encuentros. 10 http://arxiv. Ranking de editoriales en Psicobiología según Publishers Scholar Index Conviene subrayar que en los listados sólo figuran aquellas editoriales que han conseguido publicar libros altamente citados en cada una de las especialidades.13140/RG. en el período 2009-2013 (actualizado posteriormente a 2010-2014) 11. Proceedings Scholar Metrics En este caso.

231 . cubre tanto revistas como repositorios y actas de congresos. de ahí que Google Scholar sea especialmente útil en estos campos. Dadas las limitaciones en la visualización de los datos que Google Scholar Metrics posee (categorías únicamente aplicables al idioma inglés. Las diversas bases de datos que han sido tradicionalmente utilizadas con propósitos evaluativos (Web of Science y Scopus) cubren este tipo de publicaciones con diferentes grados de exhaustividad. Este producto derivado. como son las ingenierías en general. las conferencias y congresos han cumplido históricamente este rol. con la única condición de haber publicado al menos 100 documentos y recibido al menos una cita en los últimos 5 años. ha revolucionado no sólo al mundo de las ciencias sociales y humanas. 100 registros por categoría y 20 registros por búsqueda directa). toma Google Scholar Metrics como fuente de datos. De hecho. pero en ninguno de los casos de forma óptima. Internet constituye un entorno casi natural para estas disciplinas. La elevada velocidad con la que el conocimiento es generado en estas áreas requiere de la creación de un sistema más dinámico para comunicar y publicar resultados de investigación que los sistemas tradicionales de revistas. sino que tuvo adicionalmente un efecto positivo en todas las disciplinas en las que los hábitos de publicación no estaban ceñidos a la publicación de artículos en revistas. en lugar de basarse directamente en Google Scholar (tal y como hacen H Index Scholar o Publishers Scholar Metrics). Por tanto. esta ha sido una de las razones por las que han existido distintos intentos de crear clasificaciones que identificaran y/o clasificaran esta tipología documental. espléndidamente representadas en la Web. Eléctrica y Electrónica y Telecomunicaciones. electrónica y telecomunicaciones. La creación de Google Scholar. informática. y especialmente las de Informática. no sorprende que las actas de los congresos ocupen un lugar prominente en el currículum de los investigadores en estas áreas y que sean consecuentemente objeto de una consideración especial en los programas de evaluación del rendimiento académico de los investigadores. Proceedings Scholar Metrics. como hemos visto a lo largo de los capítulos previos. descrito en profundidad en el capítulo 8.Bloque B · Capítulo 10 · Productos derivados independientes Es un hecho ampliamente conocido que las conferencias y congresos juegan un papel importante como medios de comunicación científicos en todas las áreas técnicas relacionadas con la computación. De hecho. Además. la interfaz definitivamente no permite determinar la cantidad de actas de congresos indizadas en el sistema.

and Communications. seguida de “Proceedings of the IEEE” con h-index igual a 85 y las “International World Wide Web Conferences (WWW)” con h-index igual a 83.infoec3.232 La revolución Google Scholar Precisamente. Así mismo. En caso de igualdad. Journal Scholar Metrics 12 es una herramienta bibliométrica que pretende medir el rendimiento de las revistas en las 12 http://www. Electrical & Electronic Engineering. and Communications) en el período 2009-2013. El proceso de trabajo se describe a continuación: —— Se recopilaron todas las actas de conferencias mostradas en las subcategorias pertenecientes a las siguientes categorías (obviamente en inglés. Las actas están ordenadas por su h-index. y posteriormente ordenarlas en función de su impacto científico. que se muestran completos en el informe final de esta investigación (MartinMartin et al. con un h-index de 118. se obtuvieron un total de 1. el indicador bibliométrico disponible en Google Scholar Metrics. Finalmente. CVPR”. y los duplicados fueron eliminados.es . Electrical & Electronic Engineering. el h5-index y h5-median. repositorios o congresos que estuviesen fuera de los temas objeto de análisis). se ha utilizado el h5-median para desempatar la posición. —— Se realizó un proceso manual de limpieza de datos para filtrar entradas irrelevantes (revistas. Los resultados dieron como conferencia con mayor impacto a la “IEEE Conference on Computer Vision and Pattern Recognition. 2015). El proceso de recolección de datos tuvo lugar a finales de diciembre de 2014. Journal Scholar Metrics Tras el análisis de autores y editoriales. —— Los resultados de cada búsqueda fueron descargados (incluyendo el nombre de la conferencia. —— Se realizaron búsquedas directas utilizando keywords específicas descriptivas para localizar conferencias adicionales. con este producto llega el turno al análisis de las revistas.208 actas de congresos. en este caso a partir del h-index.journal-scholar-metrics. único idioma en el que se aplican las categorías): Computer Science. se incluye para cada conferencia el cuartil y la subcategoría temática en la que la conferencia había sido asignada en Google Scholar Metrics. el objetivo de Proceedings Scholar Metrics es compilar un inventario de todas las conferencias incluidas en Google Scholar Metrics en los campos de conocimiento indicados anteriormente (Computer Science.

A continuación. Buscando de manera manual en el resto de idiomas se pudieron localizar unas 300 publicaciones más. Humanidades y Ciencias Sociales a través de la contabilización del número de citas bibliográficas que sus artículos han recibido a través de Google Scholar. dadas las limitaciones en la información aportada por este producto. Literature & Arts”. y “Business. las categorías temáticas únicamente aparecen para las revistas en inglés (independientemente del país). En el caso de las Artes. Por una parte. 233 . procesado. se describen las principales características del producto (cobertura y funcionalidades de búsqueda) así como el proceso de realización del trabajo (identificación de revistas. El objetivo de este producto es identificar al subconjunto de revistas indizadas en Google Scholar Metrics relativas a las áreas de estudio anteriormente mencionadas y ofrecer posteriormente una batería de indicadores basados en citas para cada publicación. es justo indicar que el objetivo último del producto es asimismo calibrar el grado en que Google Scholar Metrics cubre las revistas en Arte. Con el fin de solventar estas limitaciones (similares a las encontradas durante la confección del Proceedings Scholar Metrics). Humanidades y Ciencias Sociales. La realización de un producto de estas características a través de Google Scholar Metrics se antojaba complicada. Es evidente que esta cantidad de revistas representa a una porción muy reducida del número total de revistas existentes en esas áreas. Humanidades y Ciencias Sociales. “Social Sciences”.Bloque B · Capítulo 10 · Productos derivados independientes áreas de Arte. en los informes anuales de revistas científicas españolas en Google Scholar (reseñados anteriormente). Por otro lado. Economics & Management”) ascendía aproximadamente a unas escasas 1.800. las revistas no aparecen ordenadas ni agrupadas por país. fuimos capaces de localizar hasta 1069 revistas que cumplían con dichos criterios. Como botón de muestra. clasificación y visualización). Por tanto. indizadas en Google Scholar y que cumplan los criterios de Google Scholar Metrics. el número de revistas localizadas bajo las categorías ofrecidas por Google Scholar Metrics (“Humanities. se utilizó el buscador directo de Google Scholar Metrics para realizar diversas búsquedas a partir de términos relacionados con las áreas de interés.

chinos. Las Ciencias naturales y experimentales quedan por tanto fuera de este producto pues éstas ya disponen de productos adecuados que cubren sus necesidades evaluativas (Web of Science y Journal Citation Reports.journalmetrics. Se recopiló el listado de revistas científicas (academic/scholarly) indizadas en las 162 categorías (subjects) relativas a las áreas de Arte. no sesgadas geográfica o lingüísticamente. coreanos o japoneses han sido excluidas. Journal Scholar Metrics muestra las revistas de todo el mundo y en todos los idiomas. Por este motivo. Google Scholar (cuyos robots indizan la web académica aparentemente sin sesgos geográficos o lingüísticos). Humanidades y Ciencias Sociales. se consultaron previamente las siguientes bases de datos de revistas: —— Ulrichsweb: Global Serials Directory. las revistas escritas en caracteres árabes. y Scopus y Journal Metrics 13 por otra). Es considerado el más extenso y actualizado directorio de publicaciones periódicas del mundo. Humanidades y Ciencias Sociales. Se recopilaron las publicaciones indizadas en las 84 categorías incluidas en Arts & Humanities Citation Index y the Social Science Citation Index. y para las que existe una mayor falta de herramientas de cobertura internacional. los investigadores generalmente utilizan canales de comunicación científicos locales (y en sus idionas nativos). Por ello. siempre y cuando el nombre de la revista aparezca en caracteres latinos en Google Scholar Metrics. cirílicos. Respecto a la cobertura geográfica. 13 http://www. para comunicar sus resultados. —— Web of Science Master Lists. por una parte.com . idiomas y países Journal Scholar Metrics se centra exclusivamente en las revistas pertenecientes a las Artes. es el motor de búsqueda más apropiado para localizar evidencias de impacto para estas revistas. donde las investigaciones se orientan con frecuencia a intereses locales y donde las distintas peculiaridades culturales son determinantes. Identificación y búsqueda de las revistas en Google Scholar Metrics Con el fin de identificar todas las revistas potencialmente susceptibles de ser incluidas en el producto. dado que esas son las áreas que han presentado tradicionalmente más dificultades en la evaluación bibliométrica. En estas disciplinas.234 La revolución Google Scholar Cobertura: tipologías documentales.

“Social Sciences” y “Business. Econlit. polaco y checo. A partir de la información recopilada de las bases de datos mostradas anteriormente. —— International disciplinary-based databases. italiano. Se consultaron las siguientes bases de datos: Library and Information Science Abstracts. Economics & Management”. se desarrollaron dos estrategias de búsqueda para localizar las revistas en Google Scholar Metrics. Cada revista localizada en Google Scholar Metrics fue asignada posteriormente al menos a una categoría temática (Tabla 9).Bloque B · Capítulo 10 · Productos derivados independientes —— SCImago Journal Rank. Social Work Abstracts. Historical Abstracts. indicando en 235 . —— Google Scholar Metrics: toda las revistas incluidas en las categorías “Humanities. Literature & Arts”. francés. En segundo lugar (y con el propósito de localizar revistas no incluidas en la master list). donde los títulos fueron normalizados y unificados y los duplicados eliminados. Procesamiento de datos y clasificación de revistas Una vez se identificaron las revistas en Google Scholar Metrics. Psychinfo. portugués. español. Se recogieron las publicaciones incluidas en las 64 categorías relacionadas con las áreas de Humanidades y Ciencias Sociales. MLA. se buscaron las publicaciones a partir de una búsqueda por nombre. Es importante indicar que la información bibliográfica proporcionada por Ulrichs fue considerada como prioritaria en el caso de cualquier discrepancia con la información contenida en el resto de bases de datos. se procedió a descargar los siguientes datos para cada una de ellas: —— Nombre de la revista e indicadores bibliométricos asociados (h5-index y h5-median).454 revistas. alemán. —— Información bibliográfica de los documentos citantes a los artículos que contribuyen al h5-index de cada una de las publicaciones. A partir de la master list obtenida. Communication & Mass Media Complete y Anthropological Online. Sociological Abstracts. se aplicaron búsquedas temáticas a partir de keywords pertinentes en cada uno de los siguientes idiomas: inglés. —— Información bibliográfica de los artículos publicados por las revistas anteriores que contribuyen al h5-index. se desarrolló una Master list de revistas. dando como resultado una base de datos exhaustiva de 66. En primer lugar.

Clasificación temática en Journal Scholar Metrics Social Sciences Arts & Humanities: Anthropology Archaeology & Prehistory Communication Arts Economics & Business History Education Literature Geography & Urbanism Language & Linguistics Law Philosophy Library & Information Science Religion Political Science Psychology Social Work Sociology Sports Science Las revistas nucleares (core) son aquellas publicaciones consideradas como esenciales en una categoría. así como tras analizar sus patrones de citación entrantes (citas recibidas) y salientes (citas proporcionadas).). La decisión de asignar una revista a una categoría. Con el fin de realizar estas distinciones con precisión. Scopus. se confió en las clasificaciones realizadas por las bases de datos consultadas (Ulrichs. mientras que las relacionadas son aquellas vinculadas con una categoría debido a un conjunto específico de artículos publicados. el uso de determinadas palabras clave en los artículos y la afiliación de los autores de dichas publicaciones. Web of Science.236 La revolución Google Scholar cada caso si podía ser considerada nuclear o relacionada a dicha categoría. . etc. pero no a la mayoría. Tabla 9. así como de considerarla nuclear o relacionada se realizó por tanto tras examinar a qué categorías había sido asignada por otras bases de datos. Indicadores bibliométricos Los indicadores bibliométricos que se ofrecen para cada una de las revistas incluidas en Journal Scholar Metrics se recogen en la Tabla 10.

se informa del total de revistas nucleares incluidas en la categoría correspondiente. Por último. Cada listado puede ser ordenado por cualquiera de los seis indicadores bibliométricos mostrados en la Tabla 10. En la parte superior de cada listado se ofrece información de valor añadido. En la figura 73 se ilustra el ranking de las revistas nucleares pertenecientes a la categoría “Library & Information Science” en el Reino Unido. Por una parte. las revistas nucleares se marcan en negrita para diferenciarlas de las relacionadas). 237 . Adicionalmente se puede habilitar la visualización de revistas relacionadas en el listado final (en este caso. el producto muestra directamente el ranking obtenido (un máximo de 20 resultados por página). se permite el filtrado por país. así como la búsqueda directa por palabra clave. ordenadas por defecto a partir del h5-index. Al pulsar sobre una categoría determinada. Por defecto aparecen desplegadas las categorías relativas a las Ciencias Sociales. El acceso a las publicaciones puede realizarse directamente pulsando en el país correspondiente del mapa situado en la parte derecha de la pantalla. mientras que las relativas a Artes y Humanidades aparecen simplemente pulsando en el menú correspondiente. Así mismo la búsqueda por continente y la global están igualmente disponibles. Indicadores bibliométricos en Journal Scholar Metrics INDICADOR ALCANCE H5-index h-index construido a partir de los artículos publicados por la revista en los últimos 5 años (período 2009-2013) H5-median Mediana del número de citas para los artículos que contribuyen al h5index H5-citations Suma del número de citas recibidas por todos los artículos que contribuyen al h5-index H5-index (sin autocitas) h5-index en el que se excluyen las citas procedentes de la misma revista H5-citations (sin autocitas) h5-citations en el que se excluyen las citas procedentes de la misma revista Journal self-citation rate Porcentaje de citas a una revista que provienen de artículos publicados en esa misma revista Visualización de datos Los rankings se presentan por categorías temáticas.Bloque B · Capítulo 10 · Productos derivados independientes Tabla 10. En la figura 72 se muestra la página de inicio del producto y la selección de categorías del menú principal.

Ranking de revistas inglesas en la categoría “Library & Information Science” en Journal Scholar Metrics <http://www. .journal-scholar-metrics. Página de inicio de Journal Scholar Metrics Figura 73.php?id=rank&subject=library_and_information_science> El indicador relativo a la tasa de autocitación de la revista (%) se muestra gráficamente a partir de un gráfico circular tipo tarta.infoec3.238 La revolución Google Scholar Figura 72.es/layout. que muestra un área sombreada mayor cuanto mayor es la tasa de autocita.

Bloque B · Capítulo 10 · Productos derivados independientes Si el usuario se sitúa encima de cada gráfico.infoec3. En el caso de ser listada únicamente en el ranking “all journals”. Figura 74. así como la categoría temática en la que ha sido clasificada en cada una de ellas. implica por tanto que la revista es solamente relacionada para la categoría en cuestión. el usuario podrá acceder a la página correspondiente al perfil de la revista. —— Lista de bases de datos en las que la revista ha sido indizada. que incluye tanto revistas nucleares como relacionadas). Finalmente. marcando en negrita las categorías que corresponden con la categoría nuclear asignada en Journal Scholar Metrics. —— Indicadores de impacto: se recopilan los mismos indicadores mostrados en la página del ranking.journal-scholar-metrics. Perfil de la revista Online Information Review en Journal Scholar Metrics <http://www.es/layout.php?id=journal&j_name=Online+Infor mation+Review&subject=library_and_information_science> 239 . en la que se muestra la siguiente información: —— Nombre y país de la publicación. automáticamente podrá obtener el porcentaje de autocita. tanto si contamos únicamente las revistas nucleares (ranking “only core journals”) o todas (ranking “all journals”. así como la posición y cuartil que ocupa en cada una de ellas. si pulsamos sobre cualquier título de revista listada en cualquiera de los rankings. —— Categorías temáticas en las que la revista ha sido asignada.

las revistas y las editoriales en las que se publican y las instituciones donde laboran los autores). en general. que fue publicado en diciembre de 2014 en el blog Google Scholar’s Digest 14. de una comunidad científica-profesional concreta (la española) así como de los principales agentes que la vertebran (los científicos y profesionales. los documentos que producen. Este listado pretendía ser un mero ejercicio dialéctico acerca del impacto científico e influencia académica de las distintas especialidades que anidan en la Biblioteconomía y Documentación española. Con este producto iniciamos un proceso de deconstrucción de los tradicionales rankings de revistas. los autores nos dispusimos a diseñar un nuevo producto que. fundamentalmente) y de autores.es/2014/12/los-autores-espanoles-de. a 14 http://googlescholardigest. de instituciones (universidades. ampliara sus objetivos. a la par de exhaustivo y metódico. El resultado de este ejercicio fue “La Biblioteconomía y Documentación española según Google Scholar Citations” 15. se obtiene una radiografía bastante fiel de lo que es toda una disciplina o especialidad. se procedió a realizar un listado actualizado y ampliado de “Los autores españoles de Biblioteconomía y Documentación según Google Scholar Citations”.html 15 http://www. Con ese fin diseñamos un original y novedoso procedimiento para conocer el impacto de toda una disciplina científica (la Biblioteconomía y Documentación). Scopus). Dado el impacto que este listado tuvo y la discusión generada en torno al mismo y a su metodología.infoec3.es . que es la base de datos de información científica más exhaustiva que existe a día de hoy. Respondemos con ello a las llamadas públicas realizadas tanto por especialistas en bibliometría y evaluación científica como.biblioteconomia-documentacion-española. Aquí es donde precisamente radica la originalidad de esta propuesta pionera: a partir de la producción científica de la comunidad académica de la Biblioteconomía y Documentación que cuenta con un perfil público en Google Scholar Citations.blogspot. Se trata de una aproximación bottom-up que parte del trabajo realizado por los autores vinculados a una disciplina tal como se muestran en Google Scholar. confeccionados exclusivamente a partir de indicadores basados en el impacto de las revistas en las que publican y que figuran indizadas en determinadas bases de datos (Web of Science.com.240 La revolución Google Scholar La biblioteconomía y documentación española según Google Scholar Citations Tomando como base el listado de autores del área de Documentación obtenido durante el desarrollo del H-Index Scholar.

revistas y editoriales más influyentes en la Biblioteconomía y Documentación española. a fecha de 27 de febrero de 2015.Bloque B · Capítulo 10 · Productos derivados independientes una corriente de pensamiento que recorre todos los ámbitos científicoacadémicos. fiabilidad y validez de la información suministrada por Google Scholar Citations para radiografiar bibliométricamente una disciplina. sustantiva y mayoritariamente sobre Biblioteconomía y Documentación. Búsqueda e identificación de autores La unidad de análisis del producto fueron los autores con perfil público en Google Scholar Citations. se empleó el listado de profesores españoles de ByD utilizado previamente para otros productos (en este caso el H Index Scholar). Se excluyeron por tanto a aquellos autores que empleaban palabras clave propias del campo de la ByD para etiquetar su perfil. esto es. El criterio de inclusión fue el siguiente: dos tercios de la producción que contribuyera al h-index debían tratar de 241 . Tras el proceso de búsqueda (realizado el 27 de febrero de 2015). se realizó una revisión sistemática del listado de autores a fin de detectar falsos positivos. La fuente de datos utilizada fue Google Scholar Citations. Asimismo. Asímismo. donde se reclama medir directamente el impacto real de las diversas unidades de análisis científica (individuo. pero cuya producción no se correspondía a la temática de nuestra disciplina. Para la búsqueda e identificación de los autores españoles se realizaron diversas búsquedas por palabras clave representativas de los temas cubiertos por la Biblioteconomía y Documentación (ByD). cuya producción científica versara sobre Biblioteconomía y Documentación. grupo de investigación. organización. autores cuya producción no verse sustancial. —— Probar nuevas formas de construcción de clasificaciones y rankings científicos utilizando los recuentos de citas producidos por Google Scholar. documentos. dominio temático) en lugar de seguir evaluando a los científicos e instituciones a partir del impacto de los medios o canales de difusión en los que éstos publican sus resultados. se excluyeron a aquellos autores que habían publicado esporádicamente sobre ByD. Los objetivos de este producto son fundamentalmente tres: —— Testar la exhaustividad. en este caso la Biblioteconomía y Documentación. —— Comprobar la capacidad de Google Scholar Citations para gestar rankings que detecten el núcleo de los autores.

el sistema ofrece datos bibliométricos de dos fuentes externas. como son Web of Science y ResearchGate: Para los datos de la Web of Science. editoriales e instituciones que se mencionan. A partir de una muestra final de 493 documentos altamente citados. se podrían haber cometido algunos errores en el cálculo de estos . tarea necesaria pues muchos documentos al ser firmados en colaboración aparecían en los perfiles de cada autor.242 La revolución Google Scholar asuntos relativos a la ByD. pero tuvimos que desistir de ello por varias razones: en primer lugar. debido a la problemática en la búsqueda de autores en Web of Science. Una vez depurado el listado de documentos se ordenaron por número de citas y se seleccionó el 10% de los documentos altamente citados (percentil 90). Se realizó una última revisión de estos documentos a fin de excluir aquellos que no guardaran vinculación temática con la ByD (39). en segundo lugar porque la mayoría de los perfiles o bien carecían de información bibliográfica o bien estaba desactualizada. En caso de discrepancia en el número de citas. porque el 32% no tenían perfil. Procesamiento de datos Una vez descargados los perfiles de los 336 incluidos en nuestro listado. se optó por elegir el que contaba con la cifra más alta. se construyeron los rankings de revistas. Datos adicionales a Google Scholar Aparte de Google Scholar. Estos listados contienen el número de documentos altamente citados publicados en las revistas científicas. Para la adscripción institucional de los documentos se siguió el recuento múltiple. asignándose el documento a todas las instituciones firmantes. Se ejecutaron búsquedas bibliográficas para cada autor contemplando las principales variantes de su nombre a fin de identificar todas sus posibles publicaciones y las citas enlazadas a las mismas. Se realizó un proceso de eliminación de duplicados. la filiación institucional que figura en el ranking de autores es la declarada expresamente por los autores en sus perfiles de Google Scholar Citations. Por otra parte. Advertimos que. Inicialmente pretendimos utilizar los perfiles de ResearcherID para obtener los datos. editoriales e instituciones. se extrajeron los 100 documentos más citados de cada autor. se identificaron los documentos indizados en esta base de datos para los 336 autores que figuraban en nuestro listado y las citas que estos documentos habían recibido.

se identificaron los perfiles de los autores españoles que investigan en Biblioteconomía y Documentación en ResearchGate. —— Revistas que contengan documentos altamente citados (percentil 90). Visualización de resultados El producto se presenta en los siguientes cinco rankings complementarios: —— Autores españoles que publican en Biblioteconomía y Documentación con perfil público en Google Scholar Citations. editoriales e instituciones se utiliza el porcentaje de documentos altamente citados (incluidos en el percentil 90) y el de citas que acumulan dichos documentos. Indicadores bibliométricos Para clasificar a los autores se ha empleado el número total de citas recibidas y el h-index (tanto total como el relativo a los últimos cinco años. animamos a los investigadores a que creen su perfil en ResearcherID y a que lo mantengan actualizado para evitar posibles errores en próximas ediciones. Para clasificar los documentos altamente citados de los autores cuyo perfil ha sido objeto de análisis. Adicionalmente se incluyeron el número de documentos publicados en Web of Science Core Collection. se utilizó el número de citas. El segundo es el sumatorio del factor de impacto de las revistas indizadas en los Journal Citation Reports donde se han publicado los artículos. Aquellos que no disponían de un perfil en Google Scholar Citations fueron incluidos en un listado independiente. 243 . en el período 2010-2014). Para clasificar las revistas.Bloque B · Capítulo 10 · Productos derivados independientes datos. Por ello. El primero se edifica a partir de las publicaciones que figuran en los perfiles. Por otra parte. así como el número total de citas recibidas y h-index según esta base de datos. tanto en Google Scholar como en Web of Science Core Collection (en aquellos casos en que el documento esté indizado en dicha base de datos). De ResearchGate se han utilizado dos indicadores: el RG Score y el Total Impact Points. de cómo éstas son recibidas por los científicos de la red y del nivel reputacional de los científicos que interactúan con los perfiles y los documentos asociados a ellos. —— Documentos altamente citados (percentil 90) por los autores incluidos en dichos perfiles.

permiten obtener una radiografía completa del entramado de una disciplina. ResearchGate. editoriales e instituciones) como de fuentes de datos (WoS. A conocer mejor las carreras científicas y académicas de los autores incluidos y. en definitiva. Figura 75. y otras que puedan incorporarse en el futuro). a valorar de una forma quizá más justa y completa la madurez y desarrollo de la disciplina en un país. En la parte superior se dispone del menú general. que permite acceder a los cinco rankings. Ranking de documentos en La Biblioteconomía y Documentación española según Google Scholar Metrics El análisis complementario tanto de diversas unidades (autores. documentos. —— Instituciones que contengan documentos altamente citados (percentil 90). . observando diferentes tipos de impacto (más profesional. revistas. En la figura 75 se muestra el ranking obtenido para los documentos altamente citados. más académico) y diferentes patrones de publicación.244 La revolución Google Scholar —— Editoriales que contengan documentos altamente citados (percentil 90). Google Scholar. en el que se muestra tanto el año de publicación como las citas obtenidas en WoS y Google Scholar.

Webometría y Altmetrics). Una vez se conoce la población de autores que GSC ofrece de la especialidad. Informetría. y siguiendo el modelo desarrollado anteriormente en La biblioteconomía y documentación española según Google Scholar.scholar-mirrors. revistas y editoriales (figura 76). independientemente de la nacionalidad de sus autores: la Bibliometría y áreas afines (Cienciometría. se presenta en Scholar Mirrors 16 el impacto de una especialidad científica completa. Scholar Mirrors – Author general overview Deconstrucción de rankings y espejos académicos El desarrollo de este producto parte de la identificación de los miembros de la comunidad bajo estudio a partir de los autores que han creado un perfil público en Google Scholar Citations (los autores sin perfil o con perfil privado han sido excluidos).es 245 . Figura 76.Bloque B · Capítulo 10 · Productos derivados independientes Scholar Mirrors: Arts.infoec3. ésta se confronta a la fotografía que proporciona ResearcherID (sistema de identificación de autores científicos elaborada por Thomson Reuters) así como a las imágenes proyectadas por nuevas plataformas 16 http://www. documentos. Humanities and Social Sciences Finalmente. a partir de sus agentes principales: autores (tanto académicos como profesionales).

Este producto responde por tanto a una corriente actual de pensamiento que clama por la medición directa del impacto real de las diversas unidades de análisis científico (documentos. se incorporan al producto las páginas personales de los autores (en tanto que primera ventana que los investigadores dispusieron en la Web para mostrar sus actividades académicas) y Twitter (el popular servicio de microblogging). como son ResearchGate (red social académica) y Mendeley (gestor de referencias bibliográficas con prestaciones de red social académica).246 La revolución Google Scholar provenientes del mundo de la Web social que permiten actualmente a los autores la construcción de perfiles personales. Cienciometría. queda en el observador individual. en el que los datos hablan por sí mismos y la interpretación. como no podía ser de otra forma. Y es en este contexto en el que aparece el concepto de Scholar Mirrors. permitiendo la visualización de los distintos espejos en los que la actividad de los académicos se está reflejando hoy día. autores. a fecha del 24 de julio de 2015. Finalmente. Scholar Mirrors permite por tanto la apertura de un proceso de deconstrucción de los rankings tradicionales de revistas y autores. haciendo posible una comparación tanto del uso de las plataformas sociales como de la huella que éstas producen de una forma sencilla e intuitiva. dominios temáticos) en lugar de continuar evaluando a los autores de forma restrictiva a través del impacto del medio o canal de comunicación en el que difunden sus resultados de investigación. Búsqueda e identificación de autores relevantes Tal y como se ha comentado. y que dispusiesen de un perfil público en Google Scholar Citations. en este caso de los autores que habían publicado en las áreas de Bibliometría. Informetría. Webometría y Altmetrics. De esta forma se desarrolla una perspectiva exhaustiva y multifacetada (tanto en agentes de investigación como en canales de comunicación) de la disciplina de la Bibliometría (y áreas métricas afines). organizaciones. Para la localización de los perfiles se siguieron tres estrategias complementarias: Palabras clave . elaborados a partir de las métricas generadas exclusivamente por el impacto de una colección de revistas elitistas en las que los autores publican (aquellas indizadas en las bases de datos tradicionales: Web of Science y Scopus). el primer paso consistió en la identificación de todos los miembros de la comunidad analizada.

Journal of informetrics. sin control o filtro alguno). ISSI Proceedings) con el objetivo de extraer un conjunto de términos ampliamente utilizados y representativos de la disciplina (un total de 18 keywords). Búsquedas adicionales Finalmente se llevaron a cabo búsquedas adicionales en el buscador general de Google Scholar con el fin de localizar autores con perfiles públicos creados en GSC.Bloque B · Capítulo 10 · Productos derivados independientes Se realizó una búsqueda en un conjunto de revistas nucleares de la disciplina (Scientometrics. Dada la falta de normalización de los términos. todos los artículos publicados por las revistas nucleares indicadas previamente). pero que no incluían entre sus áreas de interés los términos utilizados en la primera estrategia. etc.000 documentos (entre ellos. ‘bibliometric’. aunque éstos hayan incorporado etiquetas pertinentes en sus perfiles personales (debemos recordar que Google Scholar proporciona control absoluto a los autores para incorporar los términos que ellos deseen. ‘bibliometrics methodology’.nl. ‘bibliometry’.leidenuniv. se procedió asimismo a buscar términos alternativos (por ejemplo: ‘bibliometrics’. etc. Research Evaluation. Este proceso permitió la recopilación de cerca de 15.). ver figura 50). —— Clasificar a los autores en dos categorías: 247 . Afiliación institucional Se buscaron manualmente los perfiles asociados a centros de investigación dedicados a la Bibliometría.com. a partir de las cuentas de correo electrónico verificadas en los perfiles (por ejemplo cwts. con el doble propósito de: —— Detectar falsos positivos: autores cuya producción científica está completamente alejada de la disciplina evaluada. Cybermetrics. Filtrado y clasificación de perfiles de autor En esta fase se llevó a cabo un proceso de revisión manual sistemática. a partir de los cuales se identificaron autores no incluidos en los pasos anteriores.). science-metrix. Posteriormente se buscaron los perfiles académicos que contuvieran dichos términos entre las áreas de interés manifestadas por los autores (se recuerda que GSC permite un máximo de 5 términos por perfil.

se extrajo la información bibliográfica básica (especialmente las fuentes: revistas y editoriales) así como el número de citas en Web of Science. .000 documentos. h-index i10-index. En el caso de que el documento no estuviera indizado en esta base de datos. Tras aplicar los procesos anteriores. Para los 1. aparte de las 6 métricas extraídas de Google Scholar Citation (Citas recibidas. Related (relacionados): autores que de forma esporádica han publicado estudios bibliométricos o su área de especialización está muy relacionada (estudios sociales. un total de 24 métricas (5 en ResearcherID. se trató de localizar sus perfiles en las plataformas seleccionadas: ResearcherID.248 La revolución Google Scholar Core (nucleares): autores cuya producción científica pertenece en su mayor parte al campo de la Bibliometría. La página personal de los autores se extrajo de la información proporcionada por los autores en su perfil académico en GSC (Ver figura 50). 4 en Mendeley. que se ordenaron en función del número de citas recibidas. En cada una de las plataformas seleccionadas se extrajeron los principales indicadores disponibles. se procedió a extraer los 100 documentos más citados de cada autor según su perfil académico. y 6 en Twitter). de los que 397 se consideraron nucleares y. se utilizó el servicio WoS’s Cited Reference Search. Mendeley y Twitter. 9 en ResearchGate. se seleccionaron finalmente un total de 813 perfiles públicos en GSC. Tras la eliminación de duplicados se obtuvo una muestra de 41. autores relacionados. para los 813 autores seleccionados con anterioridad. ResearchGate. tanto totales como las relativas a los últimos 5 años).000 documenos más citados de este listado. Aproximación multifacetada II: espejos en la web social Finalmente. Esta búsqueda se realizó durante las dos primeras semanas de septiembre de 2015. Aproximación multifacetada I: unidades de análisis científico Una vez obtenida y caracterizada la muestra. los 416 restantes. políticos o económicos sobre Ciencia).

convirtiendo al PC (Personal Computer) en un electrodoméstico de consumo. En primer lugar. debido a la proliferación de páginas web personales e institucionales (grupos de investigación. gracias a la . a través de las cuales los científicos y las entidades en que éstos trabajan intentan difundir los productos de su actividad académica. si Internet. han supuesto la popularización y democratización de la búsqueda y evaluación de la información académica. creó una auténtica aldea global al conectar el mundo y la sociedad derribando las fronteras espaciales e incorporó a los circuitos del saber a toda la población dando voz a los que no la tenían y altavoz a los que ya la poseían. El número de documentos científicos circulantes en Internet y en acceso abierto crece de manera exponencial gracias a la conjunción de distintos fenómenos. En segundo lugar. las nuevas herramientas de búsqueda. La irrupción de Internet a partir de la década de los noventa del siglo XX supuso un hito extraordinario pues revolucionó las formas de comunicación humana. si los programas de tratamiento de textos (WordPerfect. acceso y evaluación de la información científica (Google Scholar y su familia así como los productos derivados de los mismos que son objeto de este libro). departamentos. Desencadenó una serie de cambios tecnológicos y metodológicos que han derivado en la creación de una serie de herramientas que han abierto enormes posibilidades para la búsqueda de información académica y medición del rendimiento científico. Simples y sencillos de entender y usar . Word) sacaron el arte de la tipografía de las imprentas llevándola a nuestras mesas de escritorio. institutos). han penetrado en el tejido científico a toda velocidad.Conclusiones Google Scholar: la caja de pandora académica Si el ordenador lanzado al mercado por IBM a principios de los 80 del siglo pasado supuso la entrada de la informática en nuestra vida cotidiana.la divisa de estas nuevas herramientas -. y si Google significó la búsqueda fácil y rápida de información (bastaba con asomarse a una simple ventana alejada de las complejas pantallas de búsqueda de las bases de datos y catálogos bibliotecarios). así como de acceso libre y gratuito. A saber: —— Espectacular crecimiento de la literatura académica en acceso abierto en Internet.

artículos de revistas científicas. —— Creación de nuevas herramientas para la búsqueda masiva. . muchas de las cuales proceden de las fuentes de referencia académica para el universo de las Humanidades y Ciencias Sociales. repertorios bibliográficos y directorios de publicaciones científicas de todas clases. el tratamiento y la medición de la información bibliográfica indizada por Google Scholar. Desde un primer momento Google Scholar se convirtió en un buscador de documentos académicos y de las citas que éstos reciben. material docente. El nacimiento a finales de 2004 de Google Scholar marcó una auténtica innovación en la búsqueda. Google Scholar se ha convertido ya (y teniendo en cuenta su ritmo de crecimiento vertiginoso lo será más en el futuro inmediato) en una mina de información científica prodigiosa. y capaces de sintetizar las dos dimensiones de la actividad científica: producción e impacto. —— Extraordinario crecimiento y mejora en la indización de la literatura científica a través de los buscadores. informes…) y al hacerlo en todos los países e idiomas. bibliotecas. comunicaciones a congresos…). por la presencia en la Web de catálogos de editoriales. capítulos. tesis. Pero es especialmente de utilidad para los científicos de Humanidades y Ciencias Sociales porque controla como nadie lo ha hecho hasta ahora la literatura no anglosajona y aquella transmitida por medios distintos a las revistas científicas. ponencias y comunicaciones en congresos. Al rastrear en la Web toda la variopinta tipología de documentos de corte académico generados por los profesores e investigadores en su actividad cotidiana (libros. tesis. recuperación y acceso universal a las publicaciones científicas. deviene en una herramienta de suma utilidad para medir la producción y el impacto académico en el sentido más amplio del término. libros. recoge documentos en todos los idiomas sin restricción y recupera un porcentaje muy elevado de citas. que es la peor controlada por los sistemas de información dominantes en el mundo académico. —— Creación de índices bibliométricos (h-index) simples y sencillos de construir y entender.250 La revolución Google Scholar multiplicación de repositorios institucionales y temáticos. nacidos al calor del movimiento open access. de los cuales el programa “Publish or Perish” es el más representativo. informes. A lo largo de todos los trabajos y estudios comentados en esta obra se ha puesto de relieve que Google Scholar cubre muchísimos más documentos que cualquiera de los sistemas de información científica tradicionales. indiza mayor variedad de géneros documentales (artículos de revistas. Y en tercer lugar.

falta de transparencia en la selección de fuentes. en las Humanidades y Ciencias Sociales quedaron relegados a un segundo plano cuando no abiertamente rechazados. carencia de control y normalización de sus registros). es tan masiva y rica la información académica que procesa que no podemos mirar hacia otro lado. casi imposible dada la naturaleza universal de la empresa). 251 . actas de congresos o editoriales de monografías. —— Publican fundamentalmente en medios nacionales. Pues bien. y a que desconozcamos con precisión y no controlemos sus entrañas (algo. todos ellos ampliamente discutidos en el capítulo 7. A efectos evaluativos ofrece luz donde antes había sombras. —— Utilizan su lengua vernácula como principal medio de expresión. Scopus. Conviene recordar que mientras que los indicadores bibliométricos fueron adoptados inmediatamente como herramientas evaluativas en las disciplinas científico-técnicas. Las razones no fueron otras que la propia idiosincrasia de la investigación en estos campos: —— Publican en una amplia variedad de medios. bien sean revistas. aunque tienen una especial predilección por las monografías (libros y capítulos de libros). como son las Humanidades y Ciencias Sociales. Las peculiaridades de los investigadores de Humanidades y Ciencias Sociales en sus prácticas de comunicación científica hacen inservibles las bases de datos bibliográficas tradicionales que ofrecen tanto recuentos de publicaciones como de citas (Web of Science. Google Scholar puede ayudar a abrir definitivamente la caja de Pandora académica. se orientan fundamentalmente a las disciplinas científico-técnicas y poseen un marcado sesgo anglosajón en cuanto a la procedencia e idioma de los documentos que indizan. Google Scholar y los productos gestados en su interior abren posibilidades insospechadas y que debemos explorar. —— Citan fundamentalmente monografías. trabajos publicados en su lengua nativa y en medios nacionales. Dichas bases de datos cubren casi exclusivamente artículos de revistas. No podemos ignorar o menospreciar ni mucho menos desaprovechar esta oportunidad para indagar en el análisis métrico de la información científica y académica de campos inéditos hasta el momento. aunque a veces sean de brocha gorda. Psychinfo…).Conclusiones · Google Scholar: la caja de pandora académica A pesar de los problemas técnicos y metodológicos que pueda actualmente presentar Google Scholar como fuente de información (errores en la identificación de documentos y citas. son mejores que la nada. por otra parte. Gracias a Google Scholar se puede llegar a lugares antes insospechados para ofrecer retratos que.

2015) comienza de hecho a dejar entrever esta corriente de cambio desde una posición institucional y no meramente como un ejercicio intelectual. evitando en la medida de lo posible las meras opiniones o prejuicios. cuyas características bibliográficas (en tanto documentos citantes y/o citados) están destinadas a modificar ciertos axiomas y prejuicios en la evaluación académica. confirmará el bajo cuando no nulo rendimiento de otros investigadores. inaccesibles e inexpugnables. como son las de los científicos de los campos humanísticos y sociales. Esperamos por tanto contribuir y ayudar de este modo a la comunidad científica a dudar acerca de la supuesta verdad de un mundo académico visto exclusivamente desde la punta de un elitista iceberg. que se dirigen complementariamente a comprobar el grado de aceptación de productos de esta naturaleza en comunidades académicas. El reciente informe “The Metric Tide” (Wilsdon et al. informes y capítulos de libro) hasta ahora ocultas. aportando para ello datos empíricos (contra data non argumenta. . deseamos que esta obra pueda servir de ayuda tanto para comprender el funcionamiento de Google Scholar como para vislumbrar las enormes posibilidades que su uso promete. colocando el impacto de sus trabajos en órdenes de magnitud similares a los de otras disciplinas. Permitirán desvelar y aflorar el rendimiento de investigadores hasta ahora infravalorados. propias de otras actividades profesionales no científicas. observemos y describamos esos nuevos paisajes y decidamos entonces si preferimos quedarnos solamente con la superficie. hasta ahora protegidos por la ausencia de instrumentos y prácticas de evaluación. Por todo ello. reclamado por unos pocos y confinado en el mejor de los casos en resultados de investigación. No hay que olvidar por otra parte el carácter experimental de todos los productos mostrados en el segundo bloque del libro. es una de nuestras divisas). sin olvidar por supuesto las importantes amenazas que su uso y abuso pueden implicar. Exploremos al menos las profundidades. programas de financiación o incluso estructuras y políticas de investigación. Un investigador tiene el deber de dudar. Quizás todo ello permita por fin replantear ciertos sistemas de evaluación y promoción.252 La revolución Google Scholar La apertura definitiva de esta caja liberará a tipologías documentales (especialmente monografías. tesis. manifiestamente perjudicados (o directamente olvidados) en las bases de datos bibliométricas tradicionales. con mayor o menor impacto. Por el contrario. pero sin aplicación ni repercusión práctica. tan alejadas de ejercicios y prácticas bibliométricas de este calibre.

55(5). Índice H de las revistas científicas españolas según Google Scholar Metrics (2008-2012).M. Orduña-Malea. A. Wang. Delgado López-Cózar.. 17. Budgets Stretched.M.. (2012). Amara. Williams. Ruiz-Pérez. C. Alonso.. K. L. (2007). Bauer..... J. E. 578-583. Bar-Ilan.S. S. 257-271. A. 31(6). Counting citations in the field of business and management: why use Google Scholar rather than the Web of Science. Ayllón. (2010).. Arlitsch. E.P. Delgado LópezCózar. Ayllón. J. Web of Science. (2009).S. F.. M.. 273-289. (2010). EC3 Reports. 553-581. (2013). E.. J. 60-81. Bar-Ilan. J. (2014).. E. Martín-Martín.M. 3(1).. (2011). Delgado López-Cózar. (2015). Ruiz Pérez. (2012). Citations to the ‘Introduction to informetrics’ indexed by WOS. Scopus and Web of Science. Martín-Martín. Staff Stressed. Scopus and Google Scholar. Orduña-Malea. Bakkalbasi. Is Google Scholar useful for bibliometrics? A webometric analysis.. Landry. Biomedical digital libraries. 82(3). . Scientometrics. computation and standardization for different scientific fields. Respiratory care. Invisible institutional repositories: Addressing the low indexing ratios of IRs in Google Scholar. Three options for citation tracking: Google Scholar. Which h-index? — A comparison of WoS. F. (2012). 727744. EC3 Reports. Rensleigh. D. R. Isidro F. Usage Stalled. E. 495-506. Comparison of PubMed and Google Scholar literature searches..Bibliografía Adriaanse. Cabrerizo. The Electronic Library.. Herrera. Anders.. (2013). J. P. M. J. 30(1). 93(3). H-Index: A review focused in its variants.. Herrera-Viedma. 91(2). Índice H de las revistas científicas españolas según Google Scholar Metrics (2009-2013).. (2006). Something’s Gotta Give! En Proceedings ofthe Charleston Library Conference. 3(4). N. E. K. Scientometrics. 7. Ayllón.. Índice H de las revistas científicas españolas según Google Scholar Metrics (2010-2014). 343-351. Glover. Scopus and Google Scholar. S. Scientometrics. 13. R.E. EC3 Reports. 74(2). Scientometrics.. N. Aguillo. Journal of Informetrics.J. L. R. Library Hi Tech. Scopus and Google Scholar: A content comprehensiveness comparison. O’Brien. 7. Evans. Baggett.

M. (2015). L. Schier.S.. (2013). Googlization of Libraries (pp. Thor. S. En Proceedings of the 12th International Conference on Scientometrics and Informetrics (ISSI’09). 13(131).. D-Lib magazine. 230-241. Daniel. L. Smolinsky.J. Pellen (Ed. J. D. Beel. Gipp. J. Marx.. (2009). 27-35. 115. (2014). 41 (2). (2005). M.J. (2010). Journal of Informetrics. 1.F. B. Journal of Scholarly Publishing.D. H. (2010).. (2009). Powerlaw distributions.J. Bramer. 3(1). E. E. H. Academic Search Engine Optimization (ASEO): Optimizing Scholarly Literature for Google Scholar and Co. 11(9). Science Direct-ly into Google. Beel.M. B.. Journal of Informetrics. Giustini.254 La revolución Google Scholar Bar-Ilan. (2009)..K. . Systematic reviews.. Convergent validity of bibliometric Google Scholar data in the field of chemistry—Citation counts for papers that were accepted by Angewandte Chemie International Edition or rejected but published elsewhere. Daugherty. Katz. A. The application of bibliometrics to research evaluation in the humanities and social sciences: an exploratory study using normalized Google Scholar data for the publications of a research institute. Bauer. (2005). Who Holds the Keys to the Web for Libraries? En Willian Miller y Rita M. W.. 176-190. L. Motschall. Belew.. K. 1(1).. 54-65). L. Rahm. (3 July 2007).. Science Citation Index. A. D.).. H. 13(3). London: Routledge Boeker. Some measures for comparing citation databases. (2007). E. A. Smolinsky. E. Marx. the h-index... Bakkalbasi. (2013).M. Bornmann. B. An examination of citation counts in a new scholarly communication environment. Sc. 26-34. B. J. Journal of electronic publishing. Google Scholar as replacement for systematic literature searches: good relative recall and precision are not enough. Levene. Wilde. and Google Scholar (GS) citations: a test of their relationship with economics Nobelists. BMC Medical Research Methodology. 2(1). Bornmann. using Google Scholar. (2014). Beel. D.S.. A... R.. Vach. Bensman. Gipp. P... W. Schier. N. W. Lin.. Gipp. Kramer.. J. Comparison of the Research Effectiveness of Chemistry Nobelists and Fields Medalist Mathematicians with Google Scholar: The Yule-Simon Model Blankenship. S. Google Scholar’s ranking algorithm: an introductory overview. Brantley. Tools of change for publishing.R. J. Scientific impact quality and quantity: Analysis of two sources of bibliographic data. Sage. Anderson.. Academic Search Engine Spam and Google Scholar’s Resilience Against it.F.J. Bensman.S. Sage.. The comparative recall of Google Scholar versus PubMed in identical searches for biomedical systematic reviews: a review of searches used in systematic reviews. W.. Thor.. P.

Delgado López-Cózar. S. Callicott. (2013). J. Carr. Superficiales: ¿Qué está haciendo Internet con nuestras mentes? Madrid: Taurus. 56(18). A. Is Google Enough? Comparison of an Internet Search Engine with Academic Library Resources. Brophy. A. (2012). 3825-3833. 12 [English version]. Cabezas-Clavijo. S. 423.. Delgado López-Cózar. Cecchino. Reprint of: The anatomy of a large-scale hypertextual web search engine. (2012a). 343-354. Aslib Proceedings. 3-17. Cabezas-Clavijo.. and Google: the strenghs and weaknesses of federated search engines compared with Google. Butler D. 57(6). 71-88. EC3 Working Papers. Cabezas-Clavijo.. Computer networks. A. Swan. (2004). Brin. A. Google Scholar Metrics 2013: nada nuevo bajo el sol. Delgado López-Cózar. D. 98(4). 498-512. (2015). Delgado-López-Cózar. Researchers of Tomorrow: The research behaviour of Generation Y doctoral students. Online Information Review 30(4). RIN & CURL. Library Scholar: Testing the Performance of Schoogle. N. Vaughn. NISO whitepapers. College Students’ Perceptions: Libraries & Information Resources. 255 . (2012c). 2. Scholar Metrics: the impact of journals according to Google. B. Chen. 432(7016). Google Scholar e índice h en biomedicina: la popularización de la evaluación bibliométrica. Science searches shift up a gear as Google starts Scholar engine. (2011). The future of library resource discovery.Bibliografía Breeding.. Nature. Delgado-López-Cózar. J. ¿están todas las que son? EC3 Working Papers. 1. N. (2010). (2005). L. Internet Reference Services Quarterly. (2012). Medicina intensiva. E.. Las revistas españolas de Ciencias Sociales y Jurídicas en Google Scholar Metrics. E. Information Services and Use. E. (2005). A. Bawden. A.. Page. M. 10(3). X.. EC3 Working Papers. Baltimore: NISO. OCLC: Reports.. Cathy De Rosa et al. Metalib. (2012). Researchers’ use of academic libraries and their services: a report commissioned by the Research Information Network and the Consortium of Research Libraries. Cabezas-Clavijo. Google Scholar. 320-321. E. E. just an amusement or a valid scientific tool? EC3 Working Papers. Journal of the Medical Library Association. (2007). (2005). (2006). 32(1). Webfeat. 37(5). ¿Es posible usar Google Scholar para evaluar las revistas científicas nacionales en los ámbitos de Ciencias Sociales y Jurídicas? El caso de las revistas españolas. Carpenter.. Brown. 413-427. Cabezas-Clavijo. D. 3. Google Scholar vs. (2013).

E. and Central Search. Christianson.. R. E. 21(4). 4. (2011). (2009). ETDEWEB versus the World-Wide-Web: A Specific Database/Web Comparison (No. Cabezas-Clavijo. Ecology articles in Google Scholar: levels of access to articles in core journals. R. Cybermetrics. R. (2012a).. E. T. X. paper 2. M. 36(4). Energy Technology Data Exchange (ETDE Operating Agent). Journal of Academic Librarianship. Oak Ridge. Live Search Academic. 2011-2013. Serials Review. (2009).. C. limitations and its relation with other bibliometric indicators at the micro level. (2013). Donlan. E. 31-42. 8. D. EC3 Working Papers. Davis. Google Scholar Metrics revisado: Ahora empieza a ir en serio. Elsevier Compendex and Google Scholar: A Quantitative Comparison of Two Resources for Engineering Research and an Update to Prior Comparisons. Delgado López-Cózar. M.. J. J. Marcos Cartagena. (2013). Google Scholar Metrics: An unreliable tool for assessing scientific journals. Handling self-citations using Google Scholar. USDOE/OSTI (Office of Scientific and Technical Information).256 La revolución Google Scholar Chen. A. (2007). Ayllón. Cook. P. 13(1). 2014). Learned publishing. Issues in Science and Technology Librarianship. 2ª edición. Disponible en: Cusker.. E.. M. Cothran. Cutler. Cabezas-Clavijo. Pesquita. 26(2). 101-114. G.. Journal of Library Administration. Roebuck. El profesional de la información. Ruiz-Pérez. T. Bordons. Ranking journals: could Google Scholar Metrics be an alternative to Journal Citation Reports and Scimago Journal Ranks. LibQual+ 2009 Survey. Delgado López-Cózar. Google Scholar acceptance and use among graduate students: A quantitative study. C. ETDE/OA--237). Thinking Inside the Box: Comparing Federated Search Results from Google Scholar. Association of Research Libraries. EC3 Informes.M.. (23 agosto. Disponible en: Cooke. A.M. 1(3). Google da un lavado de cara a sus Google Scholar Profiles = Google Scholar Citations. Cabezas-Clavijo. Heath. JOURNAL SCHOLAR: Una alternativa inter- . Delgado López-Cózar. 3. Google Scholar’s Dramatic Coverage Improvement Five Years after Debut. 33(4). (2007). Índice H de las revistas científicas españolas según Google Scholar Metrics (2007-2011). M. 193-203. F. (2010). Grego. (2008).. 221-226. Orduña Malea. Library and Information Science Research.. (2012). R. (2012b). Ruiz Pérez. B. A.. D. The h-index: Advantages. 419-427. Delgado López-Cózar. 293301. (2013). Jiménez Contreras.. Verissimo.. Delgado López-Cózar.. Journal of Informetrics. F.. E.. TN (United States). 39(3). E. Costas. R. Couto.. Thomson. (49).. E. Delgado López-Cózar. (2010).. Kyrillidou. 46(3).

Lauderdale. Accuracy and completeness of publication and citation records in the Web of Science. E. 257 . Jiménez-Contreras. S. M. 65(3). 43(3). A comparison of bibliometric indicators for computer science scholars and journals on Web of Science and Google Scholar. Delgado López-Cózar. Detlor. (2009). The triumph of expediency: The impact of Google Scholar on library instruction. V. 82(2). L. 65-72. Lewis.. E. 2070-2085. E. 83(1). (2008). 45-52. The Triumph of Expediency: the impact of Google Scholar on Library instruction. Delgado López-Cózar. En Miller. Repiso-Caballero.Bibliografía nacional. 61(10). M.. Theory and practise of the g-index. New York: Routledge. Web of Science and Scopus. Delgado López-Cózar. Etxebarria. (2009). Scientometrics. D. Ettinger. 87-94. 446-454. Dubicki... Journal of Academic Librarianship. Pellen. García-Pérez. R. (2013). PsycINFO. Gomez-Uranga. Scientometrics. Delgado-López-Cózar.. 46(3-4).. D. G. N. W. Orduña-Malea. Journal of the American Society for Information Science and Technology. Scientometrics.. (2006). Repositories in Google Scholar Metrics or what is this document type doing in a place as such? Cybermetrics. (2010). El profesional de la información.). 131-152. Journal of Library Administration. (2006). Kendrach. Reference Services Review.. paper 4. Ruiz-Pérez. (ed. Franceschet.K. M. 478-484. Research behavior patterns of business students. M. (2014). T. H Index Scholar: el índice h de los profesores de las universidades públicas españolas en humanidades y ciencias sociales. N. 32(3). (2010). Woolley. Journal of the American Society for Information Science and Technology..A.. 243-258... M. The Impact of Scientific Journals of Communication: Comparing Google Scholar Metrics. 16(1). E. Egghe. Ettinger. 333-349. E. Freeman. 360-384. Use of Scopus and Google Scholar to measure social sciences production in four major Spanish universities. 38(3). Robinson-García. B. The Google Scholar Experiment: how to index false papers and manipulate bibliometric indicators. Annals of Pharmacotherapy. D. 23(1). E. Robinson-García. (2012). 69(1). E. 5. 41. (2009). EC3 Working Papers. R. Academic library web sites: current practice and future directions. Torres-Salinas.. R. Comunicar.A.G. gratuita y de libre acceso para medir el impacto de las revistas de Arte. (2010). Google Scholar versus PubMed in locating primary literature to answer drug-related questions. 251-258.W. (2014). Google Scholar and more: new Google applications and tools for Libraries and Library users. Humanidades y Ciencias Sociales. and Google Scholar: A case study for the computation of h indices in Psychology.

(2005). (2008). Jillian R. S. M.. Renew Training. Rollin.F. Giustini. 545. (2013). (2013). 61-73.. R. Haglund. and Scirus: comparisons and recommendations. S. (2005). 109(5/6). (2013). Boulos.. Google Scholar and academic libraries: an update. 565-575. 172(12). Google Scholar is not enough to be used alone for systematic reviews. (2005). Journal of Academic Librarianship. Harzing. Hartman. Van der Wal. E. Scientometrics. Scientometrics.. Nygren. Wikipedia. Library Trends. Griffiths. Darmoni. Is the coverage of Google Scholar enough to be used alone for systematic reviews. Tarma Software Research [HTML edition]... Science in the web age: start your engines. Harzing. 8(1). 331(7531). (2005). 1057-1075. 365-375. 98(1).. 31(3). P. (2013a).W. (2008). 1487-1488. A preliminary test of Google Scholar as a source for citation data: a longitudinal study of Nobel prize winners. (2013b).. Metalib and Google Scholar: A user study. 52. 94(3).258 La revolución Google Scholar Gardner.W. Journal of the Canadian Health Librairies Association. Online journal of public health informatics.W. 1549-50.. Gardner. New Library World.. (2008). Henderson.K. Giles. A. W. L. P. Google Scholar. BMJ. J. L. 13(7). 8(1). 438(7068). R. D. A. . Haya. Barsky. BMC Medical Informatics and Decision Making. Ethics in Science and Environmental Politics. How Google is changing medicine. 53(4). W. Olsson. Gehanno. G. 34(1). J. The publish or perish book. Ethics in science and environmental politics. Brophy. 42-45. The Impact on University Libraries of Changes in Information Behavior among Academic Researchers: A Multiple Case Study. Harzing.N. (2005). A. Comparing the Changing User Behaviour between 2005 and 2012 and its Impact on Publisher Web Site Design and Function. 214. J. Google Scholar as a new source for citation analysis.. Inger. S. Google Scholar: the democratization of citation analysis. S. 61-73. 554555. Nature. Van der Wal. Bowering Mullen.. 211-222. Widmark. 26(3). E. L.. D. Library Hi Tech News. A look at Google Scholar. Giustini. 85-89 Giustini. Student Searching Behavior and the Web: Use of Academic Resources and Google. Gaga over Google? Scholar in the Social Sciences. How Readers Discover Content in Scholarly Journals.W. Abindon. (2014). Eng. (2007). Harzing. Karen A. A. (2005). A longitudinal study of Google Scholar coverage between 2012 and 2013. 22(8). PubMed. Google Scholar: A Source for Clinicians? Canadian Medical Association Journal. A. D. Harzing.. (2007). Online Information Review. 5(2). T.

Google Scholar Author Citation Tracker: is it too little. 126-141. 208-214. inflated. P. A citation analysis of Serbian Dental Journal using Web of Science. 604-619. and phantom citation count. CNET News. Jacsó. C. 30(3). Online Information Review. W.. Živković. Library Trends. C. As we may search–comparison of major features of the Web of Science. (2010). P. (2006). Wright. Jacsó. Jacsó. R. R. and Web of Science for F. and Google Scholar. Testing the Calculation of a Realistic h-index in Google Scholar. How scholarly is Google Scholar? A comparison to library databases.. Jacsó. S. Google Scholar and its competitors: accessing scholarly resources on the web. (2005b). 32(3). Shifting Sands: Science researchers on Google Scholar. 36(4). Jacsó. 259 . Online Information Review. L. Online information review.Bibliografía Herrera. Boughan. P. Roger C. The pros and cons of computing the h-index using Google Scholar. Hightower. (2008a). and PubMed. (2012b). (2013). (2012c). P. Oxford: Chandos. G. Google Scholar Users and User Behaviors: An Exploratory Study.. C. J. M. 297-309. Jacsó. An interview with Anurag Acharya. 32(1). Hines. Deflated. Petrović. 1537-1547. Scopus and Google Scholar. Online Information Review.. (2004). Jacsó. 89(9). (2008b). P. Roberts. 56(4). with implications for library collections budgets. College & Research Libraries. Scopus. 227-234. 57(4). UK Survey of Academics 2012. 462-478. 63(4). 36(1). P. Online Information Review.. C. Online Information Review. Google Scholar Metrics for Publications: The software and content features of a new open access bibliometric service. R. Jacsó. Wulfson. 34(1). Itaka S+R. (2010). Hughes. (2008c). J. Schonfeld. 784815. Web of Science. P. Current Science. Google Scholar: the pros and the cons. 329. Google Scholar revisited. (December 2006). Housewright. Google hit with trademark suit over ‘Scholar’. P. Lancaster. College & Research Libraries. 437-452. Google Scholar lead engineer. (2011). Using Google Scholar for journal impact factors and the h-index in nationwide publishing assessments in academia – siren songs and airraid sirens. too late?. (2012a). (2005a). 36(3). I. Metadata mega mess in Google Scholar. (2015). K. 175-191. Stomatoloski glasnik Srbije. 70 (3). 72(4). Online Information Review. B. T. Jacsó.. 102-14. P.. Google Librarian Central. (2010). T. (2009). A. Howland. Caldwell. Hsieh-Yee. Jacsó. 201-211. Issues in Science and Technology Librarianship. JISC & RLUK.. Scopus. 29(2). P. Online Information Review. Disponible en: Jaćimović.

Assessing the citation impact of books: The role of Google Books. 105(3). and Google Scholar for articles published in general medical journals. Kaur. Busse. G. L.. International Society for Scientometrics and Informetrics Newsletter. An automatic method for extracting citations from Google Books. Open access and sources of full-text articles in Google Scholar in different subject fields.. Ike Antkare one of the great stars in the scientific firmament. Kaur. S.. 6(2). (2009). . K.. Yanar. 9(1). En: Proceedings of the 2014 ACM conference on Web Science. Shams. I. Google Scholar. Y. JafariAsbagh. (2015). (2014). E. K. S. Şenol. MALIS Praxisprojekte 2013: Projektberichte aus dem berufsbegleitenden Masterstudiengang Bibliotheks.. (2015). 38(6).. T. J. J. H. 140-157. (2011).. Thelwall. (2008). M. (2012). Scientometrics.V. Sun. 1092-1096. F. Comparisons of citations in Web of Science.. Sources of Google Scholar citations outside the Science Citation Index: A comparison between four science disciplines. S. M.. Jones. F. Kaluza. 74(2).260 La revolución Google Scholar Jamali.M.. 924-932. C. JafariAsbagh. Nabavi. Kilgour. JAMA. Journal of Informetrics. 7(9). 302(10). Biology Article Retrieval from Various Databases: Making Good Choices with Limited Resources. Finding Citations to Social Work Literature: The Relative Benefits of Using Web of Science.. Kulkarni. A.. K.. F. Journal of the American Society for Information Science. 59-79. (2010). (1989)..W. Issues in Science and Technology Librarianship. 285-286. Journal of Academic Librarianship. M. Kesen. 114(19). (2013). Menczer.. 62(11). Scopus. M. H. Hoang. or Google Scholar. (2012)..und Informationswissenschaft der Fachhochschule Köln. and Scopus. Scopus. 7(4). M. Toward 100-percent availability.. PloS one. 309-320. M. B. Lasda Bergman. 370-379. 66(2). Possamai. Labbé. Aziz. Kousha. J. F. J. Universality of scholarly impact metrics.. Journal of the Association for Information Science and Technology. Thelwall. X. F. D. Scientometrics.. (2013). Menczer. Radicchi. 1635-1651. Kaur. C. Thelwall. Information World Bilgi Dunyasi. 48-52. Scholarometer: a system for crowdsourcing scholarly impact metrics. Rezaie.. Library Journal. F. 273-294. R. Google Scholar versus EBSCO Discovery Service : ein vergleichender Retrieval-Test. Kousha. Kousha... Menczer. 5053. Radicchi. Z. (2005). An Evaluation of Google Scholar and Scirus Search Engines Using Turkish Search Queries. 44. e43235. (2008). Scholarometer: A social framework for analyzing impact across disciplines. Patil. 2147-2164.

Coverage and up-to-dateness of the Google Scholar index. A. CNET News. Yang. Google Scholar Metrics 2014: a low cost bibliometric tool. Meho. Kraus. Lewandowski. (2015). Ayllón.K. College & Research Libraries.. K. Ayllón. Rossi. A. McCullagh.. and Communications according to Google Scholar Metrics (2009-2013). Information Wissenschaft und Praxis.Bibliografía Lercher. A.M. (2008). 814-830.. Google. Impact of data sources on citation counts and rankings of LIS faculty: Web of Science versus Scopus and Google Scholar. 34(5). “Back channel” on Medium. Online Information Review. (2007). Delgado López-Cózar. The gentleman who made Scholar. A Comparative Citation Analysis of Web of Science. S. 70(5). 21052125. Google Scholar as a tool for discovering journal articles in library and information science. Journal of Business & Finance Librarianship. Mayr. Journal of Academic Librarianship.. L. A Citation Analysis of College & Research Libraries Comparing Yahoo. (2014). Martín-Martín. A.R. Orduña-Malea.. E. 460-472. Online Information Review. Leslie M. and Google Scholar. An Exploratory Study of Google Scholar. Gil. Science & Technology Libraries. Conkling. (2008). Finding Chemistry Information Using Google Scholar. 57(3). EC3 Reports. J. Orduña-Malea. 32-46. Mayr. (2004). 34(2). 306(5702). BMC research notes. Scopus. 261 . A. A Google for academia. 58(13). (2007).. Martell. Martín-Martín. 17.. 2004). A. 3(1).M. Proceedings Scholar Metrics: H Index of proceedings on Computer Science.. (2009). D. Literature search on risk factors for sarcoma: PubMed and Google Scholar may be complementary sources. Fadda. Walter.L. 201. (2007). 12. M. L. Buja. and ISI Web of Knowledge with Implications for Promotion and Tenure. Google Scholar’s Coverage of the Engineering Literature: An Empirical Study. Journal of the American Society for Information Science and Technology.I.. Levine-Clark. J. A survey of attitudes about digital repositories among faculty at Louisiana State University at Baton Rouge. 2006). E. (2006). Google Scholar. Levy. (2010). EC3 Working Papers.. (2008). (2015). M. Cegolon. P. Science. E. 3-17. Electrical & Electronic Engineering. Zamprogno. Thomas W. 250-262. ACS takes legal action against Google: Google search service is said to infringe SciFinder Scholar trademark. A. (2010). (10 Diciembre. Delgado López-Cózar. (July 19. Mastrangelo. Walter. E.. 31(6).. C. Metha. E. 408-415. 131.. C.. 14(1).K. D.. Chemical & Engineering News. P. E. Meier John J. A. G.. 27(4). E. 1661-1663. Google Scholar trademark case ends.. 34(3). Journal of Academic Librarianship. J. Levine-Clark.

W. Libri: International Journal of Libraries & Information Services. Rowland. (2006).. 709-715. A.. Namei. Miller. G. Google Scholar and more: new Google applications and tools for Libraries and Library users.. Journal of the American Society for Information Science and Technology. Google Scholar Links with Libs.. 6(2). 55(4). Nugent. F. Google Scholar: The New Generation of Citation Indexes. Young. (2012). e183. Nugent. K. (2013). (2005). Portal: Libraries and the Academy. Borrego. S. The depth and breadth of Google Scholar: an empirical study. Methods for estimating the size of Google Scholar. Do open-access journals in library and information science have any scholarly impact? A bibliometric study of selected open-access journals using Google Scholar. Measuring our relevancy: comparing results in a web-scale Discovery tool. (ed.. H. Journal of Academic Librarianship. New York: Routledge. A. 29(4) 39-41. (2013). 25-28 marzo. E..) (2009). A qualitative study of the impact of electronic journals on scholarly information behavior. C. Croft. Comparing Google Scholar and ISI Web of Science for Earth Sciences. 32(3). Martín-Martín. Citations and the h index of soil researchers and journals in the Web of Science. 221-228.. Delgado López-Cózar. . Christal A. Norris. Neuhaus. Pellen. 17-18. E. Neuhaus. (2015).. Scientometrics. En ACRL Conference 2015. Scholarly Web Searching: Google Scholar and Scirus. 82(2). Medical literature searches: a comparison of PubMed and Google Scholar. (2005). 127-141.. 32(6). 214-222.. B. 7(1-2). Hartemink. Cevik. Discovery layers and the distance student: Online search habits of students. Asher. Oppenheim. Ollé. R. 130. Wang. A. C. Online Information Review. 931-949. A. McBratney. 18-39. J. E. A...E. Jang. Health Information & Libraries Journal. Oregón (Estados Unidos). Library Journal.. (2008). R. H. 1. (2008). A. R. E. (2015). 321-331. Nourbakhsh. Ayllón. PeerJ. Oder. (2009). Minasny.262 La revolución Google Scholar Mikki. Asher. 29(3).. C. 581-594. C. Mukherjee. and Google Scholar. C. M. Mussell. 34(1). E. B.. (2010). Journal of Library & Information Services in Distance Learning. E.. N. A. 104(3). (2005). Google Scholar Goes to School: The Presence of Google Scholar on College and University Web Sites. J. 60(3). Noruzi. Scopus. Online.. Wrede. Neuhaus. OAIster and OpenDOAR.. Scientometrics. Google Scholar. 174.. Notess. C.. Library & Information Science Research. Google & Google Scholar. (2009). M. Orduna-Malea. Finding open access articles using Google.. 39-51 Neuhaus.

Hemminger. Ortega. Orduna-Malea. D.. First Monday. Scientometrics 2. K. 65(6).M. Ethics in Science and Environmental Politics. Institutional and country collaboration in an online service of scientific profiles: Google Scholar Citations.. Costas. J.. Lloret-Romero. (2014). Academic search engines: A quantitative outlook. E.. 33-35. E. Orduna-Malea. Ortega.. E. 2370-2377.. 104(1). Priem. (August 27.I. J. T. Repiso-Caballero.. Equivalence of results from two citation analyses: Thomson ISI’s citation index and Google’s scholar service. L. H Index of scientific Nursing journals according to Google Scholar Metrics (2007-2011). Journal of Informetrics.M. Reina Leal. Prins. E. H Index of scientific Nursing journals according to Google Scholar Metrics (2008-2012). 1-18. (2014). Delgado López-Cózar.. Oxford: Chandos. Ortega. Using Google Scholar in research evaluation of social science programs.. Stergiou.L.M. Delgado López-Cózar. 8. Ayllon. J. Ortega. R. Infotoday. 936-953. The silent fading of an academic search engine: the case of Microsoft Academic Search. (2014). Delgado López-Cózar. E. with a comparison with Web of Science data. A. E. Repiso-Caballero. Pomerantz. El Profesional de la Informacion. Google Scholar and 100 percent availability of information. J. 63(12). Ortega. B..H.L. EC3 Reports. Martín-Martín. 434-433). Google Scholar Metrics evolution: an analysis according to languages. Pauly. Quint. J.L. En: STI 2014 Proceedings (pp. Scientometrics. (2006). 38(7). Aguillo. Scopus Comes of Age. R. Science is all in the eye of the beholder: Keyword maps in Google scholar citations.. 7(2). Microsoft academic search and Google scholar citations: Comparative analysis of author profiles. Aguillo. Aguillo. EC3 Reports. (2013). (2013). Isidro F.Bibliografía Orduna-Malea..L. J. 18(5).L.0: New metrics of scholarly impact on the social Web. 2353-2367. Scientometrics. N. Information Technology and Libraries. (2010). J. Reina Leal. 15(7). (2014). R. L. How is an academic social site populated? A demographic study of Google Scholar Citations population. E. J. Changes at Google Scholar: A Conversation with Anurag Acharya. (2005). 1149-1156.. Delgado López-Cózar. Journal of the American Society for Information Science and Technology. (2012). B... Las universidades públicas españolas en Google Scholar: presencia y evolución de su publicación académica web. Serrano-Cobos. Journal of the Association for Information Science and Technology. 263 . A. (2014). Online Information Review.. Reed Elsevier (2004). 493-500.. 25(2). 394-403. 98(3). Van Leeuwen. 52-56. P. Isidro F.. (2014). (2009). 2007). Wouters. Isidro F. 5. J. (2015).

(2010). 110-113.A. B.264 La revolución Google Scholar Repiso-Caballero. Schroeder. E. Smith. Aslib Proceedings. Fieldhouse. D. Measuring the impact of accounting journals using Google Scholar and the g-index.X. M... Mary L.. (2013). J. Scientometrics.. Croatian Medical Journal Citation Score in Web of Science.. Šember. 41(1).. Rosenstreich. (2011). C. M. 74(2). Repiso-Caballero.. Withey. 10. 41(3).. (2010). (2007). A. Benchmarking Google Scholar with the New Zealand PBRF research assessment exercise. EC3 Reports. R.. S. H Index Communication Journals according to Google Scholar Metrics (2009-2013). E. 60(4). JMLA. H Index Communication Journals according to Google Scholar Metrics (2008-2012).... Cobertura de las editoriales científicas del Book Citation Index en ciencias sociales y humanidades: ¿la historia se repite? Anuario ThinkEPI. 23-248. 51(2). P. Garg. Robinson. D. (2008). Portal: Libraries and the Academy. Bejaimal. I.D. Retrieving Clinical Evidence: A Comparison of PubMed and Google Scholar for Quick Clinical Searches.. Weir. Journal of Academic Librarianship. Publishers. 7(2). S. S. (2007). The utility of Google Scholar when searching geographical literature: comparison with three commercial bibliographic databases.V. A. Putting Google Scholar to the Test: A Preliminary Study. Shariff. J.. Pointing users toward citation searching: using Google Scholar and Web of Science. A. Hamid R. 99-103. 227-239. 309-316. . 322-329. (2007). 15(8). Schonfeld. P. Croatian Medical Journal. 95(4). M.... J. Journal of medical internet research. Williams. S. Haynes. 71-80. Haesbroeck. R. R. R. Wooliscroft. Iansavichus. Sontrop. 26(3)..G.M. Utrobičić. EC3 Reports. Housewright. and Google Scholar. Dobrowolski. Hamid R.. Greco. Rowlands. Petrak.. M.B. 139-144. Știrbu. Gunter. (2013). Delgado López-Cózar. Program: Electronic Library and Information Systems. (2009). The British Accounting Review. Tober. Faculty Survey 2009: Key Strategic Insights for Libraries.. Delgado López-Cózar. Comparing test searches in PubMed and Google Scholar. D.. Wusteman. PubMed. (2013). P. Medical Laser Application. Ithaka S+R. Nicholas. Shultz. Roger C. G.. (2014). 442-445. Delgado López-Cózar.. Schmitz. T. ScienceDirect.. 6. 7. M. and Societies.. R. E.. Huntington. Journal of the Medical Library Association. B. Torres-Salinas. Thirion..A. (2007). The Google generation: the information behaviour of the researcher of the future. N. (2015). R. A. Tenopir. Scopus or Google Scholar – Which is the best search engine for an effective literature research in laser medicine?.Z. Scopus. 290-310. 41(4).

(2010). Kain. (2014).. 84(2). Journal of the American Society for Information Science and Technology. P. P. 512(7513). R... Nature News. M. Thelwall. 2014).. Google Scholar coverage of a multidisciplinary field. 501-510. Cabezas-Clavijo. (2007). Van Aalst. S.. Henderson. A. Jiménez-Contreras. Van Noorden.. The Metric Tide: Report of the Independent Review of the Role of Metrics in Research Assessment and Management. Google Scholar como herramienta para la evaluación científica. J. Waltman. S. Delgado López-Cózar. Van Eck. Ruiz-Perez. Jones. Vine.. Towards a ‘Book Publishers Citation Reports’. (2012). 63(2). (2008). D. 126-169. Nature. Allen. Scientometrics.. Software survey: VOSviewer... 6(2). P. I. 43. R. Educational Researcher. (2015). Van Noorden. Robinson-García. Scientometrics. Scientometrics. N. Online collaboration: Scientists and the social network. Journal Medical Library Association. On the Shoulders of Giants: The Growing Impact of Older Articles. El profesional de la información. Y. Vine... A.. 7... R. 971-1006. 317-330. 2014). L. D. Google Scholar is a full year late indexing PubMed content. 39(5). Torres-Salinas. 94(1). (2006). 2113-2127. book series and publisher types in the book citation index. (2012). N.Bibliografía Torres-Salinas. (2005). D. L.. W. Portal: Libraries and the Academy. E. A. Belfiore. Kerridge.J. Journal of Web Librarianship. (7 noviembre. D. 98(3). 94-108. L.. Wang.. (2009). Google Scholar.. Google Scholar Pioneer on search engine’s future. A new look at evidence of scholarly citation in citation indexes and from web sources. 11(4). First approach using the ‘Book Citation Index’. E.. Acharya. 406-415. a computer program for bibliometric mapping. R. 97-99.. Walters. 523-538.. Wilsdon. W. Y. Robinson-García. (2014). Lin. S. Walters. Johnson. 1121-1132. Information Processing and Management. Vaughan. N. J. 18(5). (2012).. S.H. Shaw. J.. 265 . Suzuki. H. Shetty. (2011).. (13 agosto. B.H. Hill. 387-400. (2010). E. Emilio. M. Tinkler.. Waltman... The inconsistency of the h-index. Van Eck. R. Verstak. N. Using Google Scholar to Estimate the Impact of Journal Articles in Education. L. EC3 Working Papers. UK: HEFCE.J. N. Analyzing the citation characteristics of books: edited books. Howard.. Torres-Salinas. J. C. Viney.. Chiung. Curry. R. Sitelines-Ideas about Web Searching.. Campbell.. R. Google Scholar Usage: An Academic Library’s Experience. Comparative recall and precision of simple and expert searches in Google Scholar and eight other databases. Wouters. Hill. Delgado-López-Cózar. Iakhiaev. 74(2).

20(2). Sadeghi. Comparison of ISI web of knowledge. (2012b). Sadeghi.F.. (2006). J. Zhang. and Web of Science. Meho. 43(1). A30..266 La revolución Google Scholar De Winter. K. A. Zadpoor.I.C. User-centered evaluation of a discovery layer system with google scholar. User Experience. L. L. Proceedings of the American Society for Information Science and Technology. Maurice C. Scopus. More than 100 Colleges Work with Google to Speed Campus Users to Library Resources. SCOPUS. 20(1). J. The Chronicle of Higher Education. (2012a). Calling the scholars home: Google Scholar as a tool for rediscovering the academic library. . Zarifmahmoudi. The expansion of Google Scholar versus Web of Science: a longitudinal study. Citation analysis of Iranian journal of nuclear medicine: Comparison of SCOPUS and Google scholar.. (2013). Iranian Journal of Nuclear Medicine. York. 8015. 1-4. Yang. T. Dodou. En Design. D. L. (2005).. R. (2014). 50.. (2005). Web. Mobile. 10(3/4). 1-15. Citation Analysis: A Comparison of Google Scholar. Scientometrics. 15471565. Iranian Journal of Nuclear Medicine. Young. and Product Design Lecture Notes in Computer Science. R. 313-322. Internet reference services quarterly. and Usability. and Google scholar h-indices of Iranian nuclear medicine scientists. 1-7. 118. 98(2). Zarifmahmoudi.